Claude Fable 5 反彈聲浪日益擴大,用戶指 Anthropic「限制」其旗艦 AI

bbeincrypto
Anthropic 的 Claude Fable 5 在 7 月 1 日重新發布後,面臨越來越多的強烈反彈。用戶聲稱更嚴格的安全護欄已削弱了該旗艦模型的編碼、調試和代理性能。基準測試組織 BridgeMind 報告稱,其 BridgeBench 套件的分數急劇下降。與此同時,Anthropic 維持底層模型未變,並將這種摩擦歸因於更嚴格的安全分類器。 BridgeMind 重新運行了 7 月 1 日版本的 Fable 5,並記錄了顯著的下降。調試從 86.2 分降至 25.9 分,重構從 73.6 分降至 38.4 分,幻覺處理從 75.9 分降至 61.7 分。這些數字背後的機制很重要;在 12 項調試任務中,只有 3 項任務能夠在不回退到 Claude Opus 4.8 的情況下完成,而每一次回退都得零分。因此,這種崩潰反映的是任務被阻止,而不是推理能力減弱。BridgeMind 強調,當任務能夠順利完成時,Fable 5 的表現與 6 月份相當。 時間線解釋了這種緊張關係。Anthropic 於 6 月 9 日推出了 Fable 5,華盛頓在三天後將其下線。監管機構於 6 月 30 日取消了其出口管制,這是在恢復了約 100 家美國機構對 Mythos 5 的訪問權四天後。恢復訪問也帶有限制:Fable 5 在 7 月 7 日之前僅使用每週使用上限的 50%,然後轉為付費使用積分。 Anthropic 在 6 月 30 日的一份聲明中解決了這種權衡。該公司表示,他們故意擴大了安全邊界,這意味著分類器現在會阻止可能良性的請求。亞馬遜研究人員報告稱,改進的過濾器在超過 99% 的嘗試中阻止了繞過技術。被阻止的請求會路由到 Opus 4.8,用戶會收到通知。然而,Anthropic 承認,該過濾器比以前標記了更多合法的編碼和調試工作。 其自身的測試也表明 Fable 5 並未構成獨特的風險。包括 GPT-5.5 和 Kimi K2.7 在內的競爭對手模型也識別出了相同的漏洞。Anthropic 表示,美國商務部研究人員測試了這兩個安全版本,並認為它們非常強大。 其影響遠不止一個產品週期。此次暫停促使歐洲與 Anthropic 接洽,而中國的 AI 模型則在美國前沿實驗室中不斷取得進展。Anthropic 目前正與 Amazon、Microsoft 和 Google 合作制定一個越獄嚴重性框架。分類器能否迅速消除誤報,可能會決定高級用戶是留下還是轉投他處。