小米凌晨官宣MiMo-V2系列模型:Pro逼近Opus 4.6定價僅其1/5,TTS支援粵語唱歌
律律动
小米今日凌晨正式釋出 MiMo-V2 系列,涵蓋旗艦推理模型 Pro、全模態基座 Omni 和語音合成 TTS。昨日本頻道已報道,以「Hunter Alpha」身份匿名執行於 OpenRouter 的模型被確認為 MiMo-V2-Pro;此次為三款模型同步官宣,並首次公佈定價。
MiMo-V2-Pro 總引數量超 1 萬億(42B 啟用引數),支援 100 萬 Token 超長上下文,專為 Agent 工作場景設計。在 Artificial Analysis 排行榜位列全球第八、國內第二,在 OpenClaw 標準評測 PinchBench 和 ClawEval 上均居全球第三。團隊稱整體使用體感超越 Claude Sonnet 4.6、逼近 Opus 4.6,輸入定價僅為後者 1/5:256K 上下文以內輸入 $1、輸出 $3/百萬 tokens,1M 上下文以內輸入 $2、輸出 $6/百萬 tokens。MiMo Claw 模組已打通金山 WebOffice 生態,WPS 靈犀同步接入。
MiMo-V2-Omni 是全模態基座,支援文字、影象、音訊、視訊四路輸入,256K 上下文,定價輸入 $0.4、輸出 $2/百萬 tokens。音訊方面支援超 10 小時連續長音訊理解,綜合評測超越 Gemini 3 Pro;影象理解超越 Claude Opus 4.6、逼近 Gemini 3 Pro。
MiMo-V2-TTS 基於自研 Audio Tokenizer,經上億小時語音資料預訓練並引入多維度強化學習,支援從整體風格到區域性情緒的多粒度控制,同一句話內可完成語氣轉折和情感遞變,並可合成高質量歌聲。方言覆蓋東北話、四川話、河南話、粵語和臺灣腔。
三款模型現已接入 Xiaomi miclaw、MiMo Studio、金山辦公和小米瀏覽器,並可通過 OpenClaw、OpenCode、KiloCode、Blackbox、Cline 五大 Agent 開發框架呼叫,限時免費一週。
[1M AI News]