Yann LeCun轉推的世界模型規劃器GRASP代碼開源
MMetaEra
4 月 1 日(UTC+8),由 Michael Psenka 釋出、Yann LeCun 轉推的新世界模型規劃器 GRASP 程式碼已開源。
GRASP 是一種用於學習世界模型的並行隨機梯度規劃器,其核心思想是在提升的軌跡空間中同時優化動作和中間“虛擬”狀態。它通過動力學一致性懲罰確保與學習到的動態模型保持一致,並實現高效的並行化規劃。
關鍵設計包括引入可平行計算的虛擬狀態、通過噪聲進行狀態空間探索、使用停止梯度技術防止梯度流向高維視覺模型狀態輸入,以及結合目標塑造和週期性的序列展開同步步驟以確保穩定性。
該規劃器構建於 DINO-WM 專案之上,但也可通過介面卡與其他世界模型(如 LeWorldModel、JEPA-WMs)整合,適用於 PushT、TwoRoom 等多種環境。程式碼庫提供了核心演算法實現及介面卡安裝指令碼。
[InFoQ]