目前位置:首頁>專題報導>

AKiTio Node 跨越了微型系統擴充之籓籬

綜觀個人電腦問世後三十餘年之歷史,人們對於電腦其微型化以及可便利攜帶之意念從未停歇。而經過數個世代的技術傳承與演進,時至今日,NUC 或筆記型電腦已可與傳統桌上型主機分庭抗禮,並各自擁有其固有市場與使用族群。

微型主機或可攜式筆電之優點不言而喻,它大幅減少了空間負荷,降低了使用者之重量負擔,亦拉近了電腦與人類之距離——讓主機不再是僅有少數人能夠馴化之巨型方塊。

然而若要深究桌上型主機為何仍無法完全被微型系統所取代,以目前之技術力而言,其最主要的門檻在於顯示晶片因應大量運算需求之特性,以此產生高耗能與衍生之散熱問題。於其中又以顯示卡基於散熱需求,必需佔用大量體積來進行熱交換,而致生電腦微型化之技術瓶頸。

妥協之結果為犧牲顯示性能來降低能耗,而得以換取散熱裝置所佔用之空間。其結果為當下無論微型主機或筆記型電腦,甚或是標榜顯示性能導向之電競筆電,都必須將就於較低之顯示性能表現,且不可避免地仍令使用者需面對散熱不易之困擾。

Thunderbolt™ 技術跨越了擴充不易之門檻

eGPU(外部顯卡)顧名思義,透過外部接續顯卡之技術,而讓微型系統或筆記型電腦在保有其小量體與可攜之特性上,又能兼顧高效能之圖形運算能力。此為一基於上述折衷方案下之彈性運用,eGPU 技術讓我們保有僅需單一主機,即可於需求之場合擴展其顯示效能,而完成需要大量圖形運算之目標。換言之,使用者不需要因不同需求而建置多部主機,也不需要於主機群中進行資料同步或終端切換等操作。單一系統有其便利性,勝過多重設備之額外管理。

面對 eGPU 需求之解決方案,曾經存在的技術有:透過 mPCIe(mini PCI Express)、Expresscard 或 M.2 介面令系統與顯示晶片進行接續與溝通。但這些技術皆背負著其自身之限制與瓶頸(接腳較多限制訊號長度、擴充裝置有其物理空間限制,以及頻寬不足等問題),以此透過以上技術之顯示卡擴充方案一直無法普及。而 Thunderbolt™ 的現身令技術瓶頸有所轉機。

Thunderbolt™ 技術是由 Intel 所推展之新一代個人電腦制式接頭標準。眾所周知,USB 接頭取代了原有之 COM 埠、LPT 埠、PS/2 埠等等不同之規格,亦成為外接儲存裝置之通用連接型式,然而 USB 面對顯示訊號之部分目前尚力有未逮。而面對此一領域,Intel 提出了更泛用、更有企圖性之新標準——Thunderbolt™。

第三代 Thunderbolt™ 技術(稱為 Thunderbolt™ 3)相較於其前身以及目前最新之 USB 3.1 而言,Thunderbolt™ 3 提供了更高的頻寬以及供電能力。此外,Thunderbolt™ 3 可取代現有之 DVI/HDMI 或 DisplayPort 來提供影音訊號之傳輸。更進一步地,Thunderbolt™ 可用來傳送 PCIe 訊號,這使得原先 mPCIe(mini PCI Express)、Expresscard 或 M.2 所遭遇之技術頻頸得以迎刃而解。

在實際應用層面,透過 Thunderbolt™ 技術我們可將主機之 PCIe 插槽外部化,而讓透過 Thunderbolt™ 連接之 PCIe 裝置令系統視其為一內接之原生裝置,而不需要針對這些 PCIe 裝置另外開發驅動程式或軟體。當然,不可避免地,透過 Thunderbolt™ 技術所傳遞之 PCIe 訊號必須經過晶片之轉換,且目前 Thunderbolt™ 3 所提供之頻寬為 PCIe 3.0*4,如此相較於原生內接之條件,其性能將有所減損。

AKiTiO Node——透過 Thunderbolt™ 3 技術讓微型系統大幅增進其顯示效能

我們特別由艾客優品(AKiTiO)取得其最新產品:AKiTiO Node,此一特別設計之 PCIe 外接盒藉由 Thunderbolt™ 3 界面與 NUC 或筆記型電腦相連,從而令其擁有將外接 PCIe 裝置轉換為原生系統裝置之能力。在應用層面上,我們可以透過 AKiTiO Node 擴充 PCIe SSD 或獨立顯卡,而其中又以高效能之顯卡,其所帶來的整體效能提升最為令人神往。

AKiTiO Node 其外觀設計極其簡潔,後方的提把設計十分利於使用者之挪移需求。

後方唯一之訊號插座為 USB-C 型式之 Thunderbolt™ 3 介面埠。輸入電壓為 AC 100-240V。

提供一個 PCIe*16 擴充插槽(實際支援傳輸速度最高為 PCIe 3.0*4),為配合顯示卡之擴充需求,外接盒提供兩組介面卡檔板與鎖孔。

主要電路設計亦十分簡潔:為一 Thunderbolt™ 3 主板,附加一塊 PCIe 轉接板。

AKiTiO Node 使用 Intel Alpine Ridge-DP(DSL6540) 作為其 Thunderbolt™ 3 解決方案,支援 2 條 40Gbps 頻寬。

前方裝置一 12 公分風扇以因應 PCIe 裝置之散熱需求。

提供兩組 6+2 pin 供電接頭,最大供電能力為 34A/400W。

可安裝全高全長之 PCIe 介面卡(最大長度為12.6 英吋,最大高度6.7 英吋),一般之顯示卡皆不需顧慮卡長問題。

測試環境與項目

於此測試特別準備了 Intel NUC 第六代之旗艦級產品:Skull Canyon NUC6i7KYK 做為微型系統平台。此外,為了比較相同顯示卡裝置於桌上型主機與 AKiTiO Node 外接盒之效能差異,另行建置一組桌上型電腦環境作為對照組來取得相對基準。

NUC 測試平台之規格:

桌上型測試平台之規格:

為探討 Thunderbolt™ 3 現行所提供之 PCIe 頻寬為 PCIe 3.0*4 是否會造成齊頭式瓶頸,為此特別準備不同等級之顯示卡分別進行效能測試。茲將測試中所使用之顯示卡表列如下:

繪圖晶片顯示記憶體廠牌型號
GTX 750Ti2GB華碩 GTX750TI-PH-2GD5
GTX 9602GB微星 GTX960 GAMING 2G
GTX 9704GB微星 GTX970 GAMING 4G
GTX 1050Ti4GB華碩 DUAL-GTX1050TI-4G
GTX 10606GB華碩 DUAL-GTX1060-O6G
GTX 10708GB技嘉 GV-N1070WF2OC-8GD
GTX 10808GB華碩 ROG STRIX-GTX1080-A8G-GAMING
GTX 1080Ti11GB華碩 ROG STRIX-GTX1080TI-O11G-GAMING

於測試中採用 Futuremark 公司所推出之 3DMark 進行顯示性能之評測。分別針對於 Time Spy 項目(DirectX 12)、 Fire Strike Ultra 項目(DirectX 11,4K解析度)、 Fire Strike Extreme 項目(DirectX 11,2K解析度)、 Fire Strike 項目(DirectX 11)、 Sky Diver 項目(DirectX 11,膝上型系統)、 Cloud Gate 項目(DirectX 10,家用文書機)來進行測試。

Thunderbolt™ 3 之安裝與設定

當首度於 Intel NUC6i7KYK 測試平台進行 AKiTiO Node 之初步接續時,遭遇 Windows 無法順利自行偵測與安裝驅動程式之情事。

究其原因,係因雖然最新版之 Windows 10 於表面上已能偵測與驅動 NUC6i7KYK 之全數裝置,然而實際上 Thunderbolt™ 3 之驅動程式仍需要另行於原廠網站下載並安裝。

順利安裝原廠 Thunderbolt™ 3 驅動程式之後,於首次接上 AKiTiO Node 時,系統將會提示「已經接上新的 Thunderbolt™ 裝置」。

基於系統安全之考量,作業系統將詢問使用者是否允許此一 Thunderbolt™ 裝置之運行,而提供使用者三種選項:拒絕運行、只允許運行一次,永遠允許運行。

當使用者接受 Thunderbolt™ 裝置之運行連接之後,系統將會開始一一安裝硬體裝置所需用之驅動程式。

比較安裝前後裝置管理員之內容,AKiTiO Node 其硬體主要包含六組PCI-to-PCI橋接器,以及一組 Thunderbolt™ 控制器。而外接之顯示卡亦會如同原生裝置般呈現於裝置管理員之中。

3DMark 不同測試項目之效能差異

3DMark Time Spy

首先進行針對 DirectX 12 效能之 Time Spy 項目評測。於此其中,搭配華碩 ROG STRIX-GTX1080-A8G-GAMING 之 AKiTio Node 獲得 6136 分。

相同顯示卡裝置於桌上型對照組時,於 3DMark Time Spy 項目獲得 6326 分。

將不同顯示卡於 3DMark Time Spy 項目所得之總分表列如下:

繪圖晶片NUC w/eGPUPC w/GPU對照組得分比
Iris™ Pro Graphics 580806----
GTX 750Ti1292134496.13%
GTX 9601990242482.10%
GTX 1050Ti2298241195.31%
GTX 9703146357588.00%
GTX 10603673410189.56%
GTX 10704664541386.16%
GTX 10806136632697.00%
GTX 1080Ti7004780689.73%

比較 Intel NUC6i7KYK 搭配 AkiTio Node,以及桌上型對照組於 3DMark Time Spy 項目之測試結果,可得知外接顯卡於整體得分部分會約略低於桌上型主機。針對同一顯卡於不同平台之效能差異,顯卡外接時其效能約為內接時之 82.10% 至 97%,而此一效能差異於不同顯卡會呈現不同之落差分布。

此外,於 3DMark 測試中,影響整體得分之一大因素為測試平台中央處理器其運算能力,由下圖可得知因 Intel NUC6i7KYK 其所配置之 i7-6770HQ 之效能明顯高於桌上型對照組之 i5-6500,以此反而彌補了外接顯卡之整體效能差異。

進一步將各顯卡於 Time Spy 項目所得之繪圖得分表列如下:

繪圖晶片NUC w/eGPUPC w/GPU對照組得分比
Iris™ Pro Graphics 580707----
GTX 750Ti1151121594.73%
GTX 9601821230978.87%
GTX 1050Ti2129229692.73%
GTX 9703016361283.50%
GTX 10603599424884.72%
GTX 10704765603678.94%
GTX 10806680747789.34%
GTX 1080Ti79951018378.51%

而排除中央處理器之影響,直接比較繪圖晶片本身之性能差異,可得知於外接環境其繪圖效能約為內接時之 78.51% 至 94.73%,且此一效能差異與顯卡本身效能表現並未呈現明顯之相關性。

原本考量 Thunderbolt™ 3 所提供之頻寬為 PCIe 3.0*4,以此假設將可能於高階顯示卡產生效能封頂現象。而實際測試結果則推翻了以上效能瓶頸之假說,且顯現了不同顯卡其 eGPU/GPU 效能比各有所不同之事實。

究其原因,推測因 3D 顯示程序為 CPU/GPU/RAM 間複雜之分工運算作業,於此其中,PCIe 頻寬並非影響最終繪圖效能之主要及唯一因素。此外,測試內容與驅動程式對於運算資料之調控,亦存在顯著之影響力。

3DMark Fire Strike Ultra

Fire Strike Ultra 主要為測試 4K 解析度下顯示卡 DirectX 11 之效能。其中華碩 GTX750TI-PH-2GD5 與微星 GTX960 GAMING 2G 因其顯示記憶體不足,以此不進行此項目之評測。由測試之結果得之,搭配華碩 ROG STRIX-GTX1080-A8G-GAMING 之 AKiTio Node 獲得 4949 分。

相同顯示卡裝置於桌上型對照組時,於此項目獲得 5106 分。

將不同顯示卡於 Fire Strike Ultra 項目所得之總分相較,可獲得以下之得分比結果:

繪圖晶片NUC w/eGPUPC w/GPU對照組得分比
Iris™ Pro Graphics 580452----
GTX 1050Ti1706177696.06%
GTX 9702654271597.75%
GTX 10602961304697.21%
GTX 10704153432795.98%
GTX 10804949510696.93%
GTX 1080Ti6410665196.38%

由以上結果相較於之前 DirectX 12 之測試,可知外接顯卡於 DirectX 11 4K 之整體得分,其亦會約略低於桌上型對照組。比較相同等級顯示卡於不同平台之效能差異,顯卡外接時其效能約為內接時之 95.98% 至 97.75%,此得分比較之前 Time Spy 之 DirectX 12 項目為佳。

同樣地,測試平台中央處理器本身之能力亦造成補償效應。

進一步將不同顯示卡於 Fire Strike Ultra 項目所得之繪圖得分相較,而可獲得實際繪圖效能之得分比:

繪圖晶片NUC w/eGPUPC w/GPU對照組得分比
Iris™ Pro Graphics 580433----
GTX 1050Ti1658174395.12%
GTX 9702609271796.03%
GTX 10602909305595.22%
GTX 10704156447692.85%
GTX 10805008537593.17%
GTX 1080Ti6598721991.40%

在排除中央處理器其影響之後,直接比較外接與內接其繪圖效能之差異,可得知外接時其性能比約為內接時之 91.40% 至 96.03%,此表現仍較 DirectX 12 項目為之理想。

3DMark Fire Strike Extreme

Fire Strike Extreme 其主要為測試 2K 解析度下系統之 DirectX 11 效能。各顯示卡於 Fire Strike Extreme 項目所得之總分表列如下:

繪圖晶片NUC w/eGPUPC w/GPU對照組得分比
Iris™ Pro Graphics 580892----
GTX 750Ti1939201596.23%
GTX 9603300341496.66%
GTX 1050Ti3255340595.59%
GTX 9704941560697.53%
GTX 10605443571795.21%
GTX 10707239769594.07%
GTX 10808606910494.53%
GTX 1080Ti106451148492.69%

由測試結果可得知外接顯卡於整體得分亦會約略低於桌上型對照組。比較相同等級顯示卡於不同平台之效能差異,於外接時其效能約為內接時之 92.69% 至 97.53%,此一表現仍較 Time Spy 之 DirectX 12 項目為佳,但整體而言,其較前項 4K 解析度 DirectX 11 之表現要略低。

同樣地,測試平台中央處理器本身亦造成物理運算之落差。

進一步將不同顯示卡於 Fire Strike Extreme 項目所得之繪圖得分表列如下:

繪圖晶片NUC w/eGPUPC w/GPU對照組得分比
Iris™ Pro Graphics 580895----
GTX 750Ti1944205094.83%
GTX 9603440364294.45%
GTX 1050Ti3379361593.47%
GTX 9705205552594.21%
GTX 10605794637790.86%
GTX 10707846893887.78%
GTX 108094791091286.87%
GTX 1080Ti121831462483.31%

而排除中央處理器之影響,直接比較繪圖晶片本身性能表現之差異,可得知外接時其繪圖效能約為內接時之 83.31% 至 94.83%,此表現雖較 4K 解析度條件要略低,但仍較 DirectX 12 項目要來得理想。

3DMark Fire Strike

Fire Strike 一般而言為測試標準狀態 DirectX 11 之效能(預設解析度為 1080p)。茲將各顯示卡於此一標準項目所得之總分表列如下:

繪圖晶片NUC w/eGPUPC w/GPU對照組得分比
Iris™ Pro Graphics 5801954----
GTX 750Ti3845402095.65%
GTX 9606116653493.60%
GTX 1050Ti6084647693.95%
GTX 9708914959992.86%
GTX 106095321038991.75%
GTX 1070121261339990.50%
GTX 1080136851498591.32%
GTX 1080Ti154481700090.87%

由測試結果可得知外接顯卡之整體得分相同地會約略低於桌上型對照組。比較相同等級顯示卡於不同平台之效能差異,顯卡外接時其效能約為內接時之 90.50% 至 95.65%,此表現較 DirectX 11 4K 及 2K 解析度之項目皆要略低,但部分顯卡之表現仍較 DirectX 12 項目為佳。

同樣地,測試平台中央處理器本身效能亦造成物理運算之落差。

各顯示卡於 Fire Strike 項目所得之繪圖得分表列如下:

繪圖晶片NUC w/eGPUPC w/GPU對照組得分比
Iris™ Pro Graphics 5802044----
GTX 750Ti4111440393.37%
GTX 9606925783888.35%
GTX 1050Ti6871773288.86%
GTX 970103101214584.89%
GTX 1060112171360782.44%
GTX 1070147861886578.38%
GTX 1080175252307475.95%
GTX 1080Ti215963004571.88%

而排除中央處理器之影響,直接比較繪圖晶片本身性能表現之差異,可得知外接時其繪圖效能約為內接時之 71.88% 至 93.97%。

3DMark Sky Diver

Sky Diver 設計為測試膝上型/筆記型電腦其繪圖效能,以此在測試中會較不側重繪圖功能,測試運算對顯卡之負擔亦會較少。不同顯示卡於此項目所得之總分與得分比表列如下:

繪圖晶片NUC w/eGPUPC w/GPU對照組得分比
Iris™ Pro Graphics 5808116----
GTX 750Ti127921293598.89%
GTX 9601882318259103.09%
GTX 1050Ti1850517913103.30%
GTX 9702382222413106.29%
GTX 10602469523405105.51%
GTX 10702826626354107.26%
GTX 10803051327877109.46%
GTX 1080Ti3253928218115.31%

由測試結果可得知外接顯卡於整體得分出現逆轉,反向領先於桌上型對照組。比較相同等級顯示卡於不同平台之效能差異,顯卡外接時其效能約為內接時之 98.89% 至 115.31%。

究其原因,在於外接平台中央處理器之表現較桌上型平台要佳,又此測試項目對於繪圖表現之比重較物理運算為低,以此補償效應反而造就逆轉之結果。

再將各顯示卡實際於 Sky Diver 項目所得之繪圖得分表列如下:

繪圖晶片NUC w/eGPUPC w/GPU對照組得分比
Iris™ Pro Graphics 5807879----
GTX 750Ti132721462490.75%
GTX 960223232579986.53%
GTX 1050Ti216712491886.97%
GTX 970331573974883.42%
GTX 1060352884417279.89%
GTX 1070468206178775.78%
GTX 1080554897319775.81%
GTX 1080Ti656597854883.59%

而排除中央處理器之影響,直接比較繪圖晶片本身性能表現之差異,可得知外接時其繪圖效能約為內接時之 75.81% 至 90.75%。造成落差加劇之因素為顯示性能過剩,且外接平台其中央處理器分擔了一部分之運算,以此反令顯示晶片負荷降低,而導致圖形分數亦隨之下降。

3DMark Cloud Gate

Cloud Gate 基於 DirectX 10,主要為針對於家用文書機之顯示測試項目,測試中對於繪圖功能之要求將會更低。各顯卡於此項目所得之總分及得分比列表如下:

繪圖晶片NUC w/eGPUPC w/GPU對照組得分比
Iris™ Pro Graphics 58012861----
GTX 750Ti1693415050112.52%
GTX 9602019617220117.28%
GTX 1050Ti2025517368116.62%
GTX 9702340219265121.47%
GTX 10602318019487118.95%
GTX 10702514220290123.91%
GTX 10802603820713125.71%
GTX 1080Ti2687020601130.43%

由測試結果可得知外接顯卡其整體得分亦如同前一項目所呈現,反向領先桌上型對照組。比較相同等級顯示卡於不同平台之效能差異,外接時其效能約為內接時之 112.52% 至 130.43%。

造成逆轉原因與前一項目相同,因外接平台中央處理器之表現較桌上型平台要佳,以此在加權計算後之結果反而領先。

各顯示卡實際於 Cloud Gate 項目所得之繪圖得分表列如下:

繪圖晶片NUC w/eGPUPC w/GPU對照組得分比
Iris™ Pro Graphics 58016445----
GTX 750Ti265463214482.58%
GTX 960389534965878.44%
GTX 1050Ti386265117075.49%
GTX 970588587902874.48%
GTX 1060610479031567.59%
GTX 10707773911743666.20%
GTX 10808964313074668.56%
GTX 1080Ti10399113787875.42%

而排除中央處理器之影響,直接比較繪圖晶片本身性能表現之差異,可得知外接時其繪圖效能約為內接時之 66.20% 至 82.58%。愈高階之顯卡其落差愈大。其原因除了外接平台其中央處理器分擔了一部分之運算,另外因 Cloud Gate 項目對於顯卡之需求實際並不高,以此高階顯卡皆無需全力運算,而造成效能差異之加大。

解析度愈高效能差異愈小

誠然以上之測試結果並未凸顯出 PCIe 頻寬所造成「效能之牆」之效應,而各顯卡之圖形效能比,於不同之條件下各有其不同之分布。吾人仍可從 DirectX 11 之 Fire Strike 項目於不同解析度下之得分比分布,觀察出 eGPU 之效能特性。

比較各顯卡基於 Fire Strike 項目不同解析度中,其圖形分數(亦即,排除中央處理器之影響)於外接平台與桌上平台之差異百分比。可觀察出當解析度愈加提升時,測試項目對於顯卡本身之負荷愈高,於此時測試結果之效能差異則愈小。而原則上愈高階之顯示卡因於低解析度效能過剩之故,亦會凸顯此一趨勢。

Thunderbolt™ 3 令微型系統增加其擴充彈性與性能表現

由以上一系列交叉測試之結果可得知,AKiTiO Node 基於 Thunderbolt™ 3 之 PCIe 擴充技術,確能令微型系統擁有貼近桌上型系統甚或超越後者之性能表現。而 Thunderbolt™ 3 之 PCIe 3.0*4 頻寬並不會造成性能之齊頭式瓶頸。而因循系統運行之特性,外接顯卡擁有「用進廢退」之相依表現。以此若使用者於高繪圖負荷之運行環境下,外接顯卡之性能表現將會十分貼近於內接系統。而於低繪圖負荷條件下,外接系統本身中央處理器之能力則會對整體表現產生決定性的影響。

兼具可攜性與高繪圖效能之結合

藉由內建 Thunderbolt™ 3 之膝上型電腦或準系統,配合 AKiTiO Node 之外接解決方案,我們可以建立出單一微型系統即可滿足全方位需求之運行模式。小電腦仍然可以進行高度繪圖運算,或展現電競娛樂需求。而不再需要面對於不同地點之不同主機中進行例行操作切換或資料同步等日常瑣事。此外,Thunderbolt™ 3 簡易之接續方式亦可令使用者於多平台中共用單一高效能顯卡,從而有效降低其硬體購置成本。