OpenAI宣佈推出ChatGPT Images2.0影象模型,顯著提升複雜視覺任務處理能力

律动
4 月 22 日,OpenAI 推出 ChatGPT Images 2.0 影象模型,顯著提升複雜視覺任務處理能力,在指令理解、物件擺放與關係表達、以及高密度文字渲染方面實現升級。該模型支援多語言文字生成,能夠在影象中準確呈現非英文內容,並提升整體語義連貫性。 在生成能力方面,ChatGPT Images 2.0 可實現更精細的細節控制,包括小字型、圖示、UI 元素及複雜構圖,最高支援 2K 解析度輸出。同時在風格表現與寫實能力上進一步增強,可穩定生成照片級畫面、影視風格、畫素風及漫畫等多種視覺型別,適用於遊戲開發、分鏡設計與營銷素材製作等場景。具備端到端任務處理能力,可完成從文案生成到設計構圖的完整流程。 ChatGPT Images 2.0 已向所有 ChatGPT 與 Codex 使用者開放,其中具備「思考能力」的影象功能面向 Plus、Pro 與 Business 使用者開放(Enterprise 即將支援)。底層模型 gpt-image-2 亦已開放 API 接入。 [BlockBeats]