OpenAI宣佈推出ChatGPT Images2.0影象模型，顯著提升複雜視覺任務處理能力

律律动

2026年04月21日 23:45

4 月 22 日，OpenAI 推出 ChatGPT Images 2.0 影象模型，顯著提升複雜視覺任務處理能力，在指令理解、物件擺放與關係表達、以及高密度文字渲染方面實現升級。該模型支援多語言文字生成，能夠在影象中準確呈現非英文內容，並提升整體語義連貫性。在生成能力方面，ChatGPT Images 2.0 可實現更精細的細節控制，包括小字型、圖示、UI 元素及複雜構圖，最高支援 2K 解析度輸出。同時在風格表現與寫實能力上進一步增強，可穩定生成照片級畫面、影視風格、畫素風及漫畫等多種視覺型別，適用於遊戲開發、分鏡設計與營銷素材製作等場景。具備端到端任務處理能力，可完成從文案生成到設計構圖的完整流程。 ChatGPT Images 2.0 已向所有 ChatGPT 與 Codex 使用者開放，其中具備「思考能力」的影象功能面向 Plus、Pro 與 Business 使用者開放（Enterprise 即將支援）。底層模型 gpt-image-2 亦已開放 API 接入。 [BlockBeats]