Agent能力緊追Opus4.6,價格只要4%:Arcee開源Trinity Large Thinking
律律动
美國 AI 模型公司 Arcee 釋出 Trinity-Large-Thinking,一款面向長時間 Agent 任務的開源推理模型。模型採用稀疏混合專家(MoE)架構,總引數 400B,啟用引數僅 13B,以 Apache 2.0 許可證在 Hugging Face 開放權重下載。
與前代 Trinity-Large-Preview(純指令微調)不同,Trinity-Large-Thinking 在回答前先執行推理思考,多輪工具呼叫、長上下文連貫性和指令遵循能力均有提升,核心設計目標是在長時間 Agent 迴圈中保持穩定輸出。
在 Kilo 開發的 Agent 能力基準 PinchBench 上得分 91.9,排名第二,僅次於 Opus 4.6 的 93.3;在 Agent 任務基準 Tau2-Airline 上得分 88.0,為所有對比模型中最高。不過通用推理基準表現一般:GPQA-D 得分 76.3,低於 Kimi-K2.5(86.9)和 Opus 4.6(89.2);MMLU-Pro 得分 83.4,同樣排在末位。據 Arcee 官方表述,該模型在「許多維度上是中國以外最強的開源模型」。
Arcee API 定價為輸出 $0.90/百萬 token,據 Arcee 稱較 Opus 4.6 便宜約 96%。模型同步上線 AI 模型路由平臺 OpenRouter,前 5 天在 OpenClaw 中免費使用。前代 Preview 自 1 月底釋出以來在 OpenRouter 上已服務超過 3.37 萬億 token,是 OpenClaw 收錄的美國使用量第一、全球第四的開源模型,Preview 將繼續在 OpenRouter 免費提供。
[1M AI News]