Altman自創「AI韌性」取代「AI安全」:以前的思路全過時了
MMetaEra
4 月 30 日(UTC+8),據動察 Beating 監測,OpenAI CEO Sam Altman 在《大西洋月刊》CEO Nicholas Thompson 的播客中表示,以前他認為 AI 安全主要包括模型對齊和防止惡意使用,但現在這套邏輯已不足夠。他提出了「AI 韌性」(AI resilience)的概念,指出僅管理自家模型是不夠的,由於開源模型能繞過限制,整個社會必須建立防禦體系。
更令他意外的是 agent 之間存在「傳染」現象。OpenClaw 上線後,他親眼目睹異常行為從一個 agent 擴散到另一個,這是他此前未曾預料的。當被問及若 OpenAI 員工的 agent 被操控並反攻公司系統是否可能時,Altman 認為完全有可能。
Altman 認為理論推演無法解決此類問題,OpenAI 的策略依然是先部署再根據問題進行修正。他指出網路安全同理,好模型既能入侵也能防禦,關鍵在於防守方能否領先於攻擊方。
談及個人使用體驗,Altman 曾堅決不給 Codex 開通 Yolo 模式(全權訪問電腦),但僅堅持了幾個小時便妥協。目前他有兩臺電腦,其中一臺已完全交給 Codex 管理 Slack、iMessage、WhatsApp、Signal 和郵件。雖然他還沒到半夜爬起來給 Codex 派活的程度,但他表示完全「理解那種感覺」。
[BlockBeats]