ByteSeed 2.1 Pro Preview 揭曉:衝擊程式競技場前端前八名,逼近 Claude Opus 4.6
BBlockBeats
基準測試平台 Arena.ai 已正式發布字節跳動尚未推出的全新模型 Seed 2.1 Pro Preview 的基準分數。在專注評估 AI 建構真實 Web 應用程式及多檔案協同編輯能力的「Code Arena:Frontend」基準測試中,該模型取得 1539 分,全球排名第 8,與 Anthropic 的旗艦模型 Claude Opus 4.6 並駕齊驅。
該模型在 React 開發及前端 UI/UX 設計方面展現出強大實力,在 7 個子類別中,有 5 個躋身全球前十(包括:React 第 7 名、HTML 第 14 名、品牌與行銷(Branding & Marketing)第 6 名、內容創作工具與資料分析(Content Creation Tools & Data Analysis)第 9 名、基於參考的設計與消費性產品(Reference-based Design & Consumer Products)第 10 名)。在這些優勢領域中,其表現僅次於少數頂尖模型,例如 Anthropic 的 Claude 系列以及 SmartMind AI 近期開源的 GLM-5.2。
官方透露,Seed 2.1 Pro 將於未來數週內正式向公眾發布。這標誌著字節跳動繼今年二月中旬推出 Seed 2.0 Pro 後,在程式碼生成與 AI 驅動型智能體(AI-powered agent)建構領域的最新進展。
[脈搏跳動]