27B引數模型在16GB視訊記憶體GPU上執行，據稱推理能力接近Claude 4 Opus

MMetaEra

2026年03月31日 21:00

4 月 1 日（UTC+8），近日有訊息稱，一個 27B 引數規模的模型在本地 16GB 視訊記憶體的 GPU 上以 4 位量化執行時，在 SWE-bench 基準測試中表現優於 Claude Sonnet 4.5。據文中觀點，該模型能提供與 Claude 4 Opus 相當的推理能力，但資源需求更低。該模型的 v2 版本將思維鏈（chain-of-thought）的冗餘減少了 24%，同時保持了 96.91% 的 HumanEval 準確率。 [InFoQ]