NVIDIA Blackwell 創下首個 AI 硬體基準測試紀錄:能源效率超越 H200x,表現優於 AMD

BBlockBeats
評估機構 Artificial Analysis 發布了業界首個智慧代理硬體基準測試 AA-AgentPerf。傳統評估就像一次性的「短跑衝刺」,只關注回應速度;而智慧代理任務則像是「接力賽跑」,AI 需要自主拆解目標,在讀寫檔案、重寫程式碼、執行測試等任務中反覆循環。頻繁的互動對伺服器記憶體容量和調度效率提出了嚴峻挑戰。 該基準測試透過重播真實的程式設計追蹤,以「每兆瓦功耗支援的並發智慧代理規模」作為核心能效指標,直接解決了資料中心電力和資金瓶頸。在首次測試中,使用了 1.6 兆參數的開源模型 DeepSeek V4 Pro。 結果顯示,NVIDIA Blackwell 液冷全機架系統 GB300 NVL72 每兆瓦功耗可支援 61,400 個並發智慧代理,而上一代 Hopper HGX H200 僅能支援 2,600 個,能效提升超過 20 倍。單個 GPU 的並發能力也提升了 41 倍。這使得資料中心在相同的電力預算內,能夠支援 20 倍大的並發智慧代理規模,顯著降低了自動程式設計和客戶服務等應用的落地成本。 在初步結果中,AMD Instinct MI355X 暫時落後。評估機構指出,AMD 和 H200 的配置均採用通用開源 vLLM 框架構建,未進行深度優化;隨著服務框架和核心運算子的更新,AMD 的效能仍有提升空間。目前,Together AI 等推理廠商已在 Blackwell 上部署了 DeepSeek V4 Pro,為 Cursor 等智慧代理程式設計工具提供即時推理支援。 [動態洞察擊敗]