Claude Fable 5 反彈聲浪日益擴大，用戶指 Anthropic「限制」其旗艦 AI

bbeincrypto

2026年07月02日 21:30

Anthropic 的 Claude Fable 5 在 7 月 1 日重新發布後，面臨越來越多的強烈反彈。用戶聲稱更嚴格的安全護欄已削弱了該旗艦模型的編碼、調試和代理性能。基準測試組織 BridgeMind 報告稱，其 BridgeBench 套件的分數急劇下降。與此同時，Anthropic 維持底層模型未變，並將這種摩擦歸因於更嚴格的安全分類器。 BridgeMind 重新運行了 7 月 1 日版本的 Fable 5，並記錄了顯著的下降。調試從 86.2 分降至 25.9 分，重構從 73.6 分降至 38.4 分，幻覺處理從 75.9 分降至 61.7 分。這些數字背後的機制很重要；在 12 項調試任務中，只有 3 項任務能夠在不回退到 Claude Opus 4.8 的情況下完成，而每一次回退都得零分。因此，這種崩潰反映的是任務被阻止，而不是推理能力減弱。BridgeMind 強調，當任務能夠順利完成時，Fable 5 的表現與 6 月份相當。時間線解釋了這種緊張關係。Anthropic 於 6 月 9 日推出了 Fable 5，華盛頓在三天後將其下線。監管機構於 6 月 30 日取消了其出口管制，這是在恢復了約 100 家美國機構對 Mythos 5 的訪問權四天後。恢復訪問也帶有限制：Fable 5 在 7 月 7 日之前僅使用每週使用上限的 50%，然後轉為付費使用積分。 Anthropic 在 6 月 30 日的一份聲明中解決了這種權衡。該公司表示，他們故意擴大了安全邊界，這意味著分類器現在會阻止可能良性的請求。亞馬遜研究人員報告稱，改進的過濾器在超過 99% 的嘗試中阻止了繞過技術。被阻止的請求會路由到 Opus 4.8，用戶會收到通知。然而，Anthropic 承認，該過濾器比以前標記了更多合法的編碼和調試工作。其自身的測試也表明 Fable 5 並未構成獨特的風險。包括 GPT-5.5 和 Kimi K2.7 在內的競爭對手模型也識別出了相同的漏洞。Anthropic 表示，美國商務部研究人員測試了這兩個安全版本，並認為它們非常強大。其影響遠不止一個產品週期。此次暫停促使歐洲與 Anthropic 接洽，而中國的 AI 模型則在美國前沿實驗室中不斷取得進展。Anthropic 目前正與 Amazon、Microsoft 和 Google 合作制定一個越獄嚴重性框架。分類器能否迅速消除誤報，可能會決定高級用戶是留下還是轉投他處。