首頁 > 軟體

卓越生產力工具!NVIDIA RTX A6000專業顯示卡測試

2021-03-20 07:30:25

【前言】

NVIDIA在1999年8月釋出首款真正意義上的可程式設計GPU——GeForce 256,從此奠定了顯示卡在PC中的重要地位。同年11月再度推出基於GeForce 256核心、定位生產力工具的Quadro產品線,以90%以上的市場佔有率霸佔該領域至今。通過強勁的效能以及完善的生態環境,推動設計和視覺化產業的快速發展。

NVIDIA新一代Ampere架構的橫空出世再一次將GPU效能推向了新的高度,其中面向專業領域有3款——NVIDIA A40、A100與RTX A6000,前者針對高效能運算、後者主攻圖形渲染。本人有幸拿到了RTX A6000,今天就為大家分析它究竟有什麼特點。

【RTX A6000硬體特性】

Ampere架構全新的SM多單元流處理器,單精度浮點 (FP32) 運算處理速度提升1倍,優化的效能功耗比,顯著提高圖形和模擬工作流程的效能,例如複雜的3D計算機輔助設計 (CAD) 和計算機輔助工程 (CAE)。

第2代RT Core的吞吐量是上代的2倍,並能同時運行光線追蹤和著色或降噪功能,大幅加快工作負載的運行速度,例如電影內容的逼真渲染、建築設計評估和產品設計的虛擬原型創建。這項技術還可加速渲染具有光線追蹤效果的動態模糊畫面,更快獲得視覺準確性更高的結果。

第2代Tensor Core提供的人工智慧訓練吞吐量達到上代5倍,而且無需更改程式碼即可加速AI和資料科學模型的訓練。從硬體上支援結構稀疏度使推理吞吐量提升一倍。Tensor Core 還通過DLSS、AI降噪等功能將AI引入到圖形處理中,並增強了特定應用程式的編輯功能。

第4代PCI-E匯流排,相比PCI-E 3.0頻寬增加1倍,能夠更快地執行AI和資料科學等資料密集型任務。第3代NVIDIA NVLink,高達112GB/s的GPU互聯頻寬提供一體式可擴展視訊記憶體,可加速圖形和計算工作負載,並能處理更大的資料集。

RTX A6000採用完整GA102核心,內含10752個CUDA單元,配備48GB 384bit GDDR6 ECC視訊記憶體,頻寬768GB/s(GDDR6X沒有如此的儲存密度,發熱量和功耗略高),可通過NVLink擴展到高達96GB。輸出介面是4個DisplayPort 1.4a,連線多臺8K顯示裝置,實現大型洞穴式自動虛擬環境 (CAVE)、視訊牆等應用場景。

【外觀賞析】

NVIDIA RTX A6000定位生產力工具,採用簡約實用的方正造型,正面為鏡面黑色面板,側面通過金色的鋸齒形進行裝飾。傳統公版渦輪式散熱有利於組建多卡的高效能運算平臺。

渦輪風扇的風道有能增加風壓的收腰設計,顯著提高整卡運行起來的散熱效率並降低風扇高速旋轉時產生的風噪。產品型號雕刻在顯示卡靠近IO擋板的前部,並使用金漆上色,彰顯高階。

雙路NVLINK介面搭配橋接器連線另一塊RTX A6000擴展視訊記憶體和效能,實現高達112GB/s頻寬和96GB的共享GDDR6視訊記憶體,滿足最大視覺計算工作負載的需求。

SYNC介面用於連線Quadro Sync同步卡,輕鬆部署和管理多個顯示裝置,最多同步32個4K顯示裝置,確保顯示裝置的輸出幀保持一致,不產生任何影象偽影。

RTX A6000背面加入全尺寸鋁合金背板,保護PCB元器件、增加強度的同時,渦輪風扇也可以通過背部來進風,避免多卡運行時風道過於密集的問題。

輸出介面方面,RTX A6000共使用4個DisplayPort 1.4a介面,單卡即可連線4屏8K 60fps同步輸出,打造炫目的超高解析度畫面,來滿足各行各業的視覺化和展示需求。

RTX A6000標稱功耗高達300W,但僅有1個8PIN供電介面,為了相容更多的電源,附贈1條雙8 Pin電源轉接線。

【內部拆解】

由於RTX A6000搭配48GB超大容量GDDR6視訊記憶體,PCB兩面共有24顆視訊記憶體顆粒,對視訊記憶體散熱提出更高要求,所以鋁合金材質背板上貼了大量視訊記憶體導熱貼。

散熱模組採用大尺寸均熱板,並且表面經過鏡面拋光處理,更加高效的將熱量傳遞到鰭片上。視訊記憶體和供電的位置也都貼上了導熱貼。

RTX A6000的PCB看起來是不是有似曾相識的感覺?密集的元器件佈滿了尺寸不大的PCB,看上去非常養眼,GPU核心處電容選用對高頻效能更友好的MLCC陣列。

RTX A6000核心代號是GA102-875-A1,三星8nm工藝製程,內部擁有高達10752個CUDA核心、84個第2代RT Core、336個第3代Tensor Core。同時PCI-E 4.0得到支援,通過x16獲得高達64GB/S的強大頻寬,要比PCI-E 3.0高了一倍之多。

視訊記憶體來自三星2000MHz頻率GDDR6,單顆容量2GB,正面與背面各12顆組成384bit位寬48GB容量。之所以沒有采用GDDR6X視訊記憶體,主要原因是目前的單顆容量只能做到1GB,無法實現48GB規模,要知道很多專業應用是對視訊記憶體容量極為苛刻。

【效能測試】

通過GPUZ 2.37.0版本能夠準確識別出NVIDIA RTX A6000的規格資訊,測試使用的驅動版本為461.72 DCH,系統環境Win10 64。

「AIDA64 GPGPU」

得益於最新的Ampere架構,RTX A6000在GPGPU通用計算中具有非常出色的表現,通過AIDA64測試,單精度浮點34384 GFLOPS,雙精度浮點604.8 GFLOPS。

「Blender」

Blender是一款開源的跨平臺全能三維動畫製作軟體,提供從建模、動畫、材質、渲染、到音訊處理、視訊剪輯等一系列動畫短片製作解決方案。Blender擁有內建有基於GPU技術Cycles渲染器。並以Python為內建指令碼,支援多種第三方渲染器。

在Blender 2.90或更高版本中,能夠開啟OptiX GPU渲染選項,從而充分利用到RTX A6000的強勁效能和多達48GB的高速視訊記憶體空間,大大減少渲染時間。

RTX A6000的48GB大視訊記憶體允許GPU同時為最終幀渲染和互動式渲染會話載入場景資料,從而獲得更好的創作體驗,僅需32.95秒就能輸出一幀高品質的3D影象。

「V-Ray」

V-Ray是知名的3D渲染器,支援NVIDIA顯示卡硬體加速。最新版中能夠選擇基於CUDA渲染加速或是RTX光線追蹤渲染。CUDA模式得分為1420,切換成RTX渲染得分2014。

「3DMark」

雖然RTX A6000是高階生產力工具,仍舊可以降維打擊作為旗艦級遊戲顯示卡使用。3DMark測試結果:Time Spy圖形分17647、Time Spy Extreme圖形分9141,運行大型遊戲毫無壓力。

【Quadro Experience】

Quadro Experience是NVIDIA針對圖形工作站推出的專用程式,能提供必要的生產力工具,讓工作更加快捷、更為智慧化。包含 4K錄製功能、新版驅動更新提醒和遊戲優化等內容。

隨著眾多團隊的地理分散程度越來越高,以及上市時間壓力不斷壓縮項目時間,如今的專業工作流程比以往更注重互動和協作。Quadro Experience提供本地螢幕截圖和4K桌面錄製功能。內建的錄製工具可優化工作流程,從而加快產品開發週期,以及提升設計評審等工作的速度。

在Quadro Experience中,還可以直接訪問NVIDIA RTX桌面管理器,從而輕鬆管理單顯示器或多顯示器工作空間。藉助靈活的視窗快照、使用者配置檔案、視窗管理和熱鍵支援等功能,可以完全控制螢幕有效使用區域,以實現持續工作不間斷。

【全文總結】

總的來說,NVIDIA RTX A6000憑藉Ampere架構的諸多技術革新,不僅在專業生產力工具軟體中達到不可思議的效能成倍提升。同時產業生態的完善,讓越來越多軟體應用到NVIDIA提供的新特性,充分實現創新突破,實現前所未有的工作成果。


IT145.com E-mail:sddin#qq.com