Ollama Throughput 實測報告：揭開不同作業系統下大型語言模型的運行效率

Linux 勝出！Ollama 執行效能背後的作業系統影響因素分析

May 11, 2025

一、Benchmark 數據總覽

以下是三個作業系統在執行相同大型語言模型（如 deepseek-r1:14b）時的 Throughput 表現：

Linux

最高 Throughput：約 122.26 tokens/sec
硬體配置：AMD Ryzen 9 9950X、NVIDIA GeForce RTX 5090、187.27 GB RAM
作業系統版本：Arch Linux、Ubuntu Linux
Ollama 版本：0.5.12 aidatatools.com

Windows

最高 Throughput：約 110.09 tokens/sec
硬體配置：Intel Core Ultra 9 285K、NVIDIA GeForce RTX 5090、63.38 GB RAM
作業系統版本：Windows 11 Pro
Ollama 版本：0.5.11 aidatatools.com

macOS

最高 Throughput：約 44.65 tokens/sec
硬體配置：Apple M2 Ultra、192 GB RAM
作業系統版本：macOS 14.4
Ollama 版本：0.5.7aidatatools.com

二、效能差異分析

1. Linux 相較於 Windows 的優勢

驅動程式與資源管理：Linux 提供更直接且高效的硬體資源存取，特別是在 GPU 加速方面。這使得在相同或相似硬體配置下，Linux 能夠發揮更佳的效能。
系統開銷：Linux 的背景服務和系統開銷通常較低，這有助於將更多資源分配給運行中的模型推論任務。
開發者社群與優化：Linux 擁有活躍的開發者社群，許多深度學習框架和工具首先在 Linux 上進行優化，這也促進了其在 AI 任務中的效能表現。

2. Windows 的表現略遜於 Linux

驅動程式層級的限制：儘管 Windows 支援 CUDA 和 NVIDIA GPU，但在某些情況下，其驅動程式的效率可能不如 Linux，特別是在高效能運算任務中。
系統資源分配：Windows 的資源管理機制可能導致在高負載情況下，部分資源被其他系統進程佔用，影響模型推論的效能。

3. macOS 的效能限制

硬體架構差異：Apple 的 M 系列晶片使用的是 ARM 架構，與主流的 x86 架構有所不同。這可能導致某些模型或框架在 macOS 上的效能不如在其他作業系統上的表現。雖然是省電，但效能就是不行。
GPU 支援限制：目前，許多深度學習框架對 Apple GPU 的支援仍在發展中，這限制了模型在 macOS 上的加速能力。
軟體生態系統：某些優化工具或驅動程式在 macOS 上的可用性較低，這也可能影響整體效能。

三、結論與建議

綜合上述分析，Ollama 在 Linux 上的 Throughput 表現最佳，其次是 Windows，macOS 的效能則相對較低。

建議：

選擇作業系統：若追求最佳的模型推論效能，建議使用 Linux 作業系統，特別是針對需要大量運算資源的任務。
硬體配置：確保使用高效能的 CPU 和 GPU，並配備足夠的 RAM，以支援大型模型的運行。
軟體優化：定期更新驅動程式和相關框架，並考慮使用針對特定作業系統優化的工具，以提升效能。

透過深入了解不同作業系統在運行大型語言模型時的效能差異，使用者可以根據自身需求和資源，選擇最適合的環境，以達到最佳的運算效能。

Discussion about this post

No posts

#nojs-banner { position: fixed; bottom: 0; left: 0; padding: 16px 16px 16px 32px; width: 100%; box-sizing: border-box; background: red; color: white; font-family: -apple-system, "Segoe UI", Roboto, Helvetica, Arial, sans-serif, "Apple Color Emoji", "Segoe UI Emoji", "Segoe UI Symbol"; font-size: 13px; line-height: 13px; } #nojs-banner a { color: inherit; text-decoration: underline; } This site requires JavaScript to run correctly. Please turn on JavaScript or unblock scripts