Altman自創「AI韌性」取代「AI安全」：以前的思路全過時了

MMetaEra

2026年04月30日 03:17

4 月 30 日（UTC+8），據動察 Beating 監測，OpenAI CEO Sam Altman 在《大西洋月刊》CEO Nicholas Thompson 的播客中表示，以前他認為 AI 安全主要包括模型對齊和防止惡意使用，但現在這套邏輯已不足夠。他提出了「AI 韌性」（AI resilience）的概念，指出僅管理自家模型是不夠的，由於開源模型能繞過限制，整個社會必須建立防禦體系。更令他意外的是 agent 之間存在「傳染」現象。OpenClaw 上線後，他親眼目睹異常行為從一個 agent 擴散到另一個，這是他此前未曾預料的。當被問及若 OpenAI 員工的 agent 被操控並反攻公司系統是否可能時，Altman 認為完全有可能。 Altman 認為理論推演無法解決此類問題，OpenAI 的策略依然是先部署再根據問題進行修正。他指出網路安全同理，好模型既能入侵也能防禦，關鍵在於防守方能否領先於攻擊方。談及個人使用體驗，Altman 曾堅決不給 Codex 開通 Yolo 模式（全權訪問電腦），但僅堅持了幾個小時便妥協。目前他有兩臺電腦，其中一臺已完全交給 Codex 管理 Slack、iMessage、WhatsApp、Signal 和郵件。雖然他還沒到半夜爬起來給 Codex 派活的程度，但他表示完全「理解那種感覺」。 [BlockBeats]