獨立評估顯示 MiniMax M2.7 在核心智慧體任務上媲美閉源前沿模型
MMetaEra
4 月 5 日(UTC+8),根據 LangChain 的獨立評估,開放權重模型 MiniMax M2.7 在檔案操作、工具呼叫和指令遵循等核心智慧體任務上已達到與閉源前沿模型相當的水平。
文中觀點認為,其優勢在於成本顯著降低約 20 倍,速度提升 2-4 倍。以每日輸出 1000 萬令牌為例,使用 Opus 4.6 的成本約為 250 美元/天,而 MiniMax M2.7 僅需約 12 美元/天。
這一進展得益於 SWE-Rebench 和 Terminal Bench 2.0 等開放基準的推動,使得開放模型成為生產環境中部署智慧體的可行選擇,並可與閉源模型協同使用。
[ME News]