AUTOBUY購物中心

Intel Arc Pro B70 在 windows 下部署 ollama 的方式

  • 2026-06-03 14:03:11

    Intel Arc Pro B70 擁有 32GB VRAM,對於想要部署本地大型語言模型(LLM)的玩家來說,確實是一張相當有吸引力的顯示卡。畢竟在目前的消費級顯示卡市場中,要找到擁有 32GB 顯示記憶體的產品並不容易。

    不過在實際部署時,最大的挑戰並非硬體本身,而是軟體生態。

    以 Windows 環境下的 Ollama 為例,由於預設優先使用 NVIDIA CUDA,因此安裝完成後往往無法直接利用 Intel Arc Pro B70 進行推論。許多人測試後看到模型完全沒有載入 GPU,便誤以為顯示卡不支援。

    事實上,要突破這道「CUDA 長城」並不困難,只需要在 Windows 中新增一個系統環境變數:

    OLLAMA_VULKAN=1

    設定完成後重新啟動 Ollama,即可強制使用 Vulkan 後端,讓 Arc Pro B70 正常參與模型推論。

    另外,安裝驅動程式時也有一個常見陷阱需要留意。

    Intel Arc 與 Intel Arc Pro 雖然同屬 Arc 架構,但兩者使用的驅動程式並不相同。Arc Pro B70 必須安裝 Arc Pro 專用驅動,若誤裝一般 Arc 顯示卡驅動,可能會導致功能異常或效能不如預期。

    驅動安裝完成後,如果系統同時啟用了 Intel 內建顯示核心,在 Windows 裝置管理員中通常會看到兩個顯示卡裝置:

    • Intel Arc Pro B70
    • Intel 內建顯示核心(iGPU)

    這屬於正常現象。

    若想確認模型是否真的由 B70 進行推論,可以在執行模型時開啟 Windows 工作管理員,切換至「效能(Performance)」頁面觀察 GPU 狀態。

    當模型開始載入與推論時,可以看到:

    • GPU Compute 引擎產生明顯負載
    • 專屬 GPU 記憶體(Dedicated GPU Memory)持續增加
    • 模型越大,占用的 VRAM 越高

    如果上述數值都有變化,就代表 Ollama 已成功使用 Arc Pro B70 執行推論,而非退回 CPU 運算。

    整體而言,雖然 Intel 在 AI 軟體生態方面仍不如 NVIDIA 成熟,但對於追求大 VRAM、希望以較低成本部署本地 AI 的使用者來說,Arc Pro B70 仍然是一個相當值得關注的選擇。只要完成驅動與環境變數設定,在 Windows 下使用 Ollama 執行本地模型其實並沒有想像中困難。