《華爾街日報》報導:AI 巨星表示「Vibe Slop」危機即將來臨

WWSJ

作者:克里斯多福‧米姆斯

兩位參與建構廣受歡迎的 OpenClaw AI 代理核心的工程師發出嚴厲警告:本應能夠取代高薪軟體開發人員的人工智慧,正在向世界傾瀉大量糟糕的、甚至可能危險的程式碼。

他們稱之為「vibe slop」的現象——是「vibe coding」(用簡單的英語描述人工智慧工具來創建軟體)和「AI slop」(社交媒體上無窮無盡的低價值人工智慧生成內容)的結合。

他們說,當程式設計師用人工智慧快速產生程式來取代設計和測試系統的繁瑣工作時,就會出現「軟體品質低劣」的問題,而最終產生的軟體經不起時間的考驗。這個問題已經非常嚴重,以至於全球主要的開源程式庫——GitHub——已經制定了新的政策和功能來應對它。

「基礎設施正在崩潰,軟體也比以前漏洞百出,」OpenClaw 內部智慧體框架 Pi 的創建者 Mario Zechner 說。 “我們或許還能再玩幾個月,甚至幾年,但最終它會讓我們付出代價。”

澤克納和他的合作夥伴阿明·羅納赫爾並非認為人工智慧毫無用處。他們兩人都在自己的專案中利用人工智慧處理繁瑣的工作。而且,他們對人工智慧充滿信心,以至於開發了一款如今已被數百萬人使用的AI程式設計工具。

他們的核心觀點是:這些系統本應大幅提升資深工程師的生產力,從而使公司能夠裁減初級工程師,但實際上,許多公司卻為了短期的生產力而犧牲了長期的利益。不僅初級人才儲備枯竭,還會帶來許多後續影響,例如軟體漏洞百出、服務中斷、安全隱患以及技術債不斷累積。

人類被排除在外

身為有聲望但又不依賴大型科技公司的獨立程式設計師,這兩位正在軟體界激烈爭論中發表意見——而此時,OpenAI 和 Anthropic 這兩家巨頭公司正著眼於它們的首次公開發行 (IPO)。

支持者認為,人工智慧可以徹底改變公司處理數十年來遺留程式碼的方式,而且在某些情況下確實如此。即使是那些沒有將人工智慧應用於公司核心軟體的開發人員也表示,他們找到了一個平衡點,即利用人工智慧創建軟體測試或快速原型。許多頂尖人工智慧實驗室的專家堅信,人工智慧本身就是評估和改進人工智慧生成程式碼的解決方案,無需人工逐行審查。

「如果你認為它開箱即用,那它很可能不會,」領導 OpenAI 團隊建立其編碼工具 Codex 的 Rohan Varma 說。

他補充說,為了讓人工智慧產生的程式碼能夠真正部署到客戶手中,工程師現在可以直接使用 Codex 來檢查這些程式碼。目前,該系統已經能夠像人一樣查看和測試網站,檢查程式碼是否遵循公司特定的最佳實踐,並檢測是否有安全問題。

然而,他表示,對於服務數百萬人的關鍵基礎設施而言,即使在 OpenAI,人類工程師最終也負責審查人工智慧產生的任何程式碼,並對這些系統的成功或失敗負責。

人工智慧編碼的局限性

Alphabet 執行長 Sundar Pichai 在最近的一篇文章中寫道,Google所有新程式碼中 75% 是由人工智慧產生的,高於去年秋季的 50%。一年前,Meta 執行長 Mark Zuckerberg 預測,到 2026 年底,人工智慧將負責編寫和審查公司內部人工智慧開發團隊的大部分程式碼。

很難將這種說法與批評者的疑慮調和起來。但澤克納表示,這正好說明人們對當今人工智慧代理的能力範圍有誤解。

例如,人工智慧編碼工具更擅長產生新程式碼,而不是評估和升級現有軟體,尤其是成熟公司內部存在的大量現有軟體。

利用人工智慧代理進行產品概念編碼的新創公司可以快速創建新程式。但澤克納補充說,一旦他們的系統達到一定規模和複雜度,他們就會發現自己與大型企業面臨著同樣的困境,即人工智慧代理的用途有限。

人因工程及其克勞德程式碼工具是這些矛盾的一個案例研究。

澤克納讚揚該公司「自研」自家軟體的做法——也就是用自己的軟體建立內部系統。但他並不喜歡這款工具。

「Claude Code是我這輩子用過的最爛的軟體之一,」他說道,並列舉了螢幕畫面閃爍、功能臃腫以及內存佔用過高等問題。澤克納將這些問題歸咎於開發者使用人工智慧技術進行開發。

Anthropic公司旗下Claude Code的產品負責人Catherine Wu表示,視覺閃爍是軟體團隊快速開發、優先推出新功能所導致的副作用。過去一年,Claude Code的用戶平均使用時間長度從每天20分鐘增加到每週20小時。她補充說,閃爍問題已基本解決。

吳女士表示,人工智慧工具使初級工程師能夠對他們開發的功能承擔更多責任,從概念設計到最終交付給客戶。她補充說,雖然 Anthropic 公司不斷更新其向人工智慧發出的指令,以幫助其避免過去的錯誤,但「最終責任仍然在於人」。

Anthropic 擁有全球頂尖的人工智慧工程師,因此,採用人工智慧驅動型方案對他們來說或許可行,但這種方案可能不會適用於該公司的所有客戶。撰寫時事通訊《理解人工智慧》(Understanding AI)的電腦科學家 Timothy B. Lee 指出,許多公司在處理內部軟體系統時,依賴程式設計師多年累積的隱性知識——而這些知識並不會以訓練資料的形式用於人工智慧代理。

李說:“這些模型很容易出錯,必須有人注意到這一點。”

帳單到期時

澤克納認為,清算即將到來。他認為,大型公司很快就會意識到,過度依賴人工智慧產生的程式碼正在推高成本,並導致軟體品質下降。他認為,許多依賴直覺式程式設計的小型新創公司將會倒閉。他也認為,像GitHub這樣的雲端軟體工具庫將繼續充斥著人工智慧產生的垃圾程式碼。

就在澤克納和羅納赫從奧地利的家中辦公室撥入我們的視訊採訪之前,澤克納不得不禁止一位(人類)程式設計師向他在GitHub上的一個程式碼庫提交程式碼。這位程式設計師毫不知情,他的AI代理程式卻不斷地提交虛假的錯誤報告。

澤克納搖了搖頭,說:“我的意思是,我們到底在做什麼?”

請致函克里斯多福‧米姆斯,信箱為[email protected]