27B引數模型在16GB視訊記憶體GPU上執行,據稱推理能力接近Claude 4 Opus

MMetaEra
4 月 1 日(UTC+8),近日有訊息稱,一個 27B 引數規模的模型在本地 16GB 視訊記憶體的 GPU 上以 4 位量化執行時,在 SWE-bench 基準測試中表現優於 Claude Sonnet 4.5。 據文中觀點,該模型能提供與 Claude 4 Opus 相當的推理能力,但資源需求更低。該模型的 v2 版本將思維鏈(chain-of-thought)的冗餘減少了 24%,同時保持了 96.91% 的 HumanEval 準確率。 [InFoQ]