英偉達Blackwell登頂首個智慧體硬體基準:能效超H200達20倍,力壓AMD
律律动
評測機構 Artificial Analysis 釋出行業首個智慧體(Agent)硬體基準 AA-AgentPerf。傳統評測如同單次問答「短跑」,只看響應速度;智慧體任務則像「接力跑」,AI 需自主拆解目標,在讀寫檔案、改寫程式碼、執行測試中反覆流轉。頻繁互動對伺服器記憶體容量和排程效率挑戰極高。
基準通過重放真實程式設計軌跡,以「每兆瓦功耗支援併發智慧體規模」為核心能效指標,直擊資料中心電力與資金瓶頸。首期測試執行 1.6 萬億引數開源模型 DeepSeek V4 Pro。
結果顯示,英偉達 Blackwell 液冷整櫃系統 GB300 NVL72 每兆瓦功耗可承載 6.14 萬個併發智慧體,而上一代 Hopper HGX H200 僅能支援 2600 個,能效提升超 20 倍。單顯示卡併發容量也提升了 41 倍。這使得在同等電力預算下,資料中心可多承載 20 倍智慧體併發規模,大幅拉低自動程式設計和客服等應用落地成本。
首批成績中,AMD Instinct MI355X 暫時落後。評測機構指出,AMD 與 H200 配置均使用通用開源 vLLM 框架搭建,未作深度優化;隨著服務框架與核心運算元適配跟進,AMD 效能仍有提升空間。目前,Together AI 等推理商已率先在 Blackwell 部署 DeepSeek V4 Pro,為智慧體程式設計工具 Cursor 提供實時推理支援。
[動察 Beating]