OpenAI首個行業專用模型GPT-Rosalind瞄準製藥,RNA預測超過95%人類專家

律动
OpenAI 釋出 GPT-Rosalind,這是該公司首個針對特定行業構建的前沿推理模型,面向生物學、藥物發現和轉化醫學。模型以對揭示 DNA 結構做出關鍵貢獻的科學家 Rosalind Franklin 命名,目前作為研究預覽版在 ChatGPT、Codex 和 API 上線,僅面向通過資質稽核的美國企業客戶開放,預覽期間不消耗現有額度。 選擇生命科學作為第一個垂直行業,本身就是一個戰略訊號。OpenAI 給出的理由是:一款新藥從靶點發現到獲批上市平均需要 10 至 15 年,AI 在早期發現階段的提速會向下遊複利式傳導,更好的靶點選擇、更強的生物學假設、更高質量的實驗設計,最終提高整條管線的成功率。 效能方面,GPT-Rosalind 在生物資訊學基準 BixBench 上取得已公開模型中的最高分。在涵蓋文獻檢索、序列操作、實驗方案設計等 11 項研究任務的 LABBench2 基準上,6 項超過 GPT-5.4,提升最顯著的是分子克隆實驗設計(CloningQA)。與 AI 基因治療公司 Dyno Therapeutics 合作的評測使用了未公開、未被訓練資料汙染的 RNA 序列,模型十次提交中的最優結果在序列功能預測上排在人類專家歷史成績的第 95 百分位以上,序列生成排在第 84 百分位左右。 OpenAI 同時在 GitHub 開源了 Codex 生命科學研究外掛,接入超過 50 個公共多組學資料庫、文獻源和生物工具,覆蓋人類遺傳學、功能基因組學、蛋白質結構、生物化學等領域。外掛所有使用者均可免費使用,不限於 GPT-Rosalind,也可搭配通用模型。Amgen、Moderna、Allen Institute、Thermo Fisher Scientific 等已參與早期合作,OpenAI 還與洛斯阿拉莫斯國家實驗室探索 AI 引導的蛋白質和催化劑設計。GPT-Rosalind 是其生命科學模型系列的首個版本,後續將持續擴充套件生化推理能力。 [動察Beating]