NVIDIA Blackwell 創下首個 AI 硬體基準測試紀錄：能源效率超越 H200x，表現優於 AMD

BBlockBeats

2026年06月13日 14:19

評估機構 Artificial Analysis 發布了業界首個智慧代理硬體基準測試 AA-AgentPerf。傳統評估就像一次性的「短跑衝刺」，只關注回應速度；而智慧代理任務則像是「接力賽跑」，AI 需要自主拆解目標，在讀寫檔案、重寫程式碼、執行測試等任務中反覆循環。頻繁的互動對伺服器記憶體容量和調度效率提出了嚴峻挑戰。該基準測試透過重播真實的程式設計追蹤，以「每兆瓦功耗支援的並發智慧代理規模」作為核心能效指標，直接解決了資料中心電力和資金瓶頸。在首次測試中，使用了 1.6 兆參數的開源模型 DeepSeek V4 Pro。結果顯示，NVIDIA Blackwell 液冷全機架系統 GB300 NVL72 每兆瓦功耗可支援 61,400 個並發智慧代理，而上一代 Hopper HGX H200 僅能支援 2,600 個，能效提升超過 20 倍。單個 GPU 的並發能力也提升了 41 倍。這使得資料中心在相同的電力預算內，能夠支援 20 倍大的並發智慧代理規模，顯著降低了自動程式設計和客戶服務等應用的落地成本。在初步結果中，AMD Instinct MI355X 暫時落後。評估機構指出，AMD 和 H200 的配置均採用通用開源 vLLM 框架構建，未進行深度優化；隨著服務框架和核心運算子的更新，AMD 的效能仍有提升空間。目前，Together AI 等推理廠商已在 Blackwell 上部署了 DeepSeek V4 Pro，為 Cursor 等智慧代理程式設計工具提供即時推理支援。 [動態洞察擊敗]