前OpenAI研究員釋出Flipbook原型:跳過HTML,用AI視訊模型直接生成每個畫素

MMetaEra
4 月 23 日(UTC+8),據動察 Beating 監測,前 OpenAI 研究員 Zain Shah 及團隊釋出 Flipbook,一個用 AI 模型直接生成螢幕畫素的實驗性原型,取代 HTML、CSS 等傳統網頁技術。 使用者看到的每個「頁面」都是一張 AI 生成的影象,點選影象中任意區域即生成新影象繼續深入,整個介面無 HTML 程式碼、無固定連結、無預定義按鈕,連文字也是圖中畫素。 視訊模式基於以色列公司 Lightricks 的開源 DiT(擴散 Transformer)視訊生成模型 LTX Studio,經優化後可以 1080p 24fps 通過 WebSocket 實時流式傳輸到使用者螢幕,後端接 Modal Labs 的無伺服器 GPU。 Shah 稱目前 Flipbook 功能有限,團隊圍繞視覺解釋來設計,但展示了更大的方向:隨著模型更準確、更有狀態,未來可擴充套件到結構化 UI,包括程式設計場景。 Shah 曾在 OpenAI 從事 AI 與機器人研究,之後任三星創意技術專家,也是 YC S13 校友。團隊成員還包括前 Humane 和 Slack 工程師 Eddie Jiao、前蘋果工程師 Drew O'Carr。 [BlockBeats]