解讀 Karpathy 突然轉投 Anthropic:為何以員工身份加入競爭對手?
Original Title: "In Depth | Why Did Karpathy Suddenly Join Anthropic and Have to Be Dario's '-2'?"
Original Source: Synced
5 月 19 日晚上 11 點,Andrej Karpathy 親自宣布加入 Anthropic。
這個名字的分量無需贅述。
OpenAI 的共同創辦人、Tesla 前 AI 總監、「Vibe Coding」之父,以及世界上最具影響力的 AI 教育家。
他在 AI 領域的地位,大致相當於籃球界的 LeBron James,無論走到哪裡都會成為頭條新聞。
他只在 X 上發布了三句話。
第一句話提到,LLM 的未來在未來幾年「特別成形」。第三句話提到他對教育的持續熱情。中間最關鍵的一句話只有五個字:「重返研發」。
他是過去兩年裡,從 OpenAI 陣營轉到 Anthropic 的第三位關鍵人物。
他也是一位即將年滿 40 歲、功成名就、經濟獨立的個體,主動選擇成為別人的下屬。
他為什麼離開?為什麼是 Anthropic?Anthropic 為什麼堅持招募他?
每個問題背後都隱藏著值得深入探究的東西。
他要做什麼
本週,Karpathy 已經開始工作,並加入了 Anthropic 的預訓練團隊。
這個團隊由 Nick Joseph 領導,負責 Claude 的所有大規模訓練運行。
Anthropic 的一位發言人向 TechCrunch 證實,Karpathy 將組建一個新的子團隊,專注於利用 Claude 本身來加速預訓練研究。
Nick Joseph 也在 X 上補充說:「他將組建一個團隊,專注於利用 Claude 本身加速預訓練研究。」
TechCrunch 的評估指出:「Karpathy 是少數能夠彌合 LLM 理論與大規模訓練實踐之間差距的研究人員之一。」
Axios 將此事件描述為「Anthropic 在人才引進方面的一大勝利」。
同一天宣布加入 Anthropic 的還有網路安全專家 Chris Rohlf,前 xAI 創始成員 Ross Nordeen 也在本月早些時候加入。人才的流動趨勢正變得越來越明顯。
來自 Polymarket 的數據可以作為市場情緒的代表——交易員將 Anthropic 在 6 月底擁有最佳 AI 模型的可能性定價為 65%,而 OpenAI 則為 4%。
Karpathy 的加入進一步強化了這一評估。
定義者 Karpathy
要理解這次加入的意義,必須掌握 Karpathy 作為個體的稀有性。
他的稀缺性不在於技術能力,因為頂尖的研究人員有很多。
他的稀有性在於他有能力用一個詞改變整個行業對某件事的理解。
他於 1986 年出生於斯洛伐克,15 歲時移民到加拿大多倫多。
在多倫多大學攻讀本科學位期間,他選修了 Geoffrey Hinton 的課程,並參加了他的讀書會。
Hinton 是深度學習復興的精神領袖,2018 年圖靈獎的獲得者,以及 2024 年未來的諾貝爾物理學獎得主。
Karpathy 是被這場運動點燃的早期年輕人之一。
後來,他在史丹佛大學師從另一位傳奇人物李飛飛,並在攻讀博士學位期間,創建了 CS231n 課程。
從 2015 年的 150 名學生,到 2017 年的 750 名學生。所有影片講座都在網路上公開提供,成為全球無數工程師自學深度學習的第一站,特別是在電腦視覺方面無與倫比的大師班。
2015 年,他成為 OpenAI 的創始研究科學家。
2017 年,他被 Musk 招募加入 Tesla,擔任 AI 高級總監,推動了基於純視覺的自動駕駛方法的開發。
在這個招聘過程中,Musk 面臨著巨大的壓力。
同年,Karpathy 在 Medium 上發表了一篇文章,介紹了「Software 2.0」的概念,主張神經網路權重是新的程式碼,資料集是新的原始碼,梯度下降是新的編譯器。
這個框架重塑了整個行業對「什麼是程式設計」的理解。
2022 年離開 Tesla 後,他在 YouTube 上創建了「Neural Networks: Zero to Hero」系列,該頻道迅速突破了 100 萬訂閱者。
同時,他的開源專案 micrograd、nanoGPT 和 nanochat,以最少的程式碼準確地指出了核心概念,被譽為「可運行的教科書」。
2025 年 2 月,他創造了「Vibe Coding」一詞,該詞被柯林斯詞典選為年度詞彙。
6 月,在 YC AI Startup School 的一次講座中,他介紹了「Software 3.0」和「Decade of the Agent」框架,成為當年討論最廣泛的 AI 講座之一。
2024 年,《TIME》雜誌將他評為「AI 領域 100 位最具影響力的人物」之一。
從 Hinton,到李飛飛,到 Ultraman,再到 Musk,他始終處於每個節點的最前沿。
但他留下的最持久的遺產不是任何產品或論文,而是那些概念框架。
Software 2.0、Vibe Coding、LLM OS。這些術語改變了人們對 AI 的看法。
為什麼選擇成為「-2」
Karpathy 的職業生涯有一條清晰的主線——他一直追求的不是頭銜。
他曾是 Hinton 和李飛飛的學生,Ultraman 的同事,以及 Musk 的直接下屬。
在他旅程的每個階段,他的組織地位都處於頂端。
現在,加入 Anthropic,他的直接上級是預訓練主管 Nick Joseph。
Nick Joseph 向 Dario Amodei 報告。
Karpathy 在組織結構中位於第三層。
Nick Joseph 是 Anthropic 的 11 位創始人之一,之前曾在 Vicarious 和 OpenAI 工作。
在 OpenAI 工作期間,他曾在安全團隊研究程式碼模型,看到 GPT-3 在微調後可以編寫程式碼,意識到 AI 的自我改進能力,然後與安全團隊負責人一起離開,創建了 Anthropic。
他的團隊訓練了全系列的 Claude 模型,包括 Mythos。
Karpathy 願意在 Nick Joseph 的領導下進行研究,原因很簡單:這個職位最接近他想做的事情。
回顧每一次職業變動,驅動力始終如一:「現在最大的實驗發生在哪裡?」
2017 年,他加入 Tesla,因為自動駕駛是 Software 2.0 中最大的實驗。
2022 年,他離開是因為架構已經確定,只剩下工程優化。
2023 年,他回到 OpenAI,因為 ChatGPT 隨著 GPT-4 的發布所帶來的繁榮是最具刺激性的前沿。
2024 年,他創立了 Eureka Labs,以驗證 AI 原生教育的假設。
2026 年,他加入 Anthropic,因為「使用 AI 研究 AI」的預訓練革命正在那裡發生。
每一次離開都不是因為不滿,而是因為目前的位置不再是最大的實驗發生的地方。
他為什麼沒有回到 OpenAI?人才流動提供了答案。
OpenAI 前對齊負責人 Jan Leike 於 2024 年 5 月加入 Anthropic。
OpenAI 共同創辦人 John Schulman 於同年 8 月效仿。
現在輪到 Karpathy 了。
兩年,三個人,都是單向流動,沒有可比的反向案例。
OpenAI 的戰略重點已從純粹的研究轉向平台化和收購。從 Chat.com,到 io Products、Windsurf、TBPN,收購間隔越來越短,金額越來越大。
這是一家正在轉變為「AI 時代消費者巨頭」的公司。
對於一位希望「重返研究」的研究人員來說,Anthropic「以研究品質取勝」的道路更具吸引力。
Anthropic 為什麼如此渴望他
Anthropic 的招募動機可以分為幾個層面。
表面上是技術需求。
無論 Anthropic 的計算預算有多大,它都無法與 Microsoft 和 Google 以 TPU 為後盾的 OpenAI 相提並論。
在純粹的計算能力競賽中,Anthropic 無法獲勝。
它必須找到一種方法,以更少的計算能力訓練出更好的模型。
「使用 Claude 加速預訓練研究」就是這條道路,而 Karpathy 是極少數擁有深入的預訓練理論、大規模工程經驗和 AI 輔助研究直覺的人之一。
更深層次的是人才信號。
兩年內,三位 OpenAI 核心人物單向流入 Anthropic,「前線研究人員用腳投票」的說法已經形成。
Karpathy 級別的每一次加入都會降低下一個頂尖人才加入的心理障礙。人才吸引人才,飛輪效應開始運轉。
還有 IPO 前的品牌背書。
Anthropic 正在討論一輪 3000 億美元的融資,估值為 9000 億美元,並且正在為 IPO 做準備。
Karpathy 是 AI 領域最受公眾認可的技術人物之一,擁有數百萬 YouTube 訂閱者、年度詞素發明者,以及一個擁有 22 萬個 GitHub 星星的 CLAUDE.md 儲存庫。
他的名字出現在 Anthropic 的員工名單上,給了投資銀行一句可以直接插入招股說明書的話。
但最有趣的一層可能是 Anthropic 沒有明確招募,但注定會獲得最大回報的東西,Karpathy 定義範例的能力。
他在 Anthropic 進行的任何技術探索都會透過推文、部落格和 YouTube 影片公開討論。
當他以獨特的方式命名正在發生的事件時,Anthropic 自然就成為了該範例的發源地。
他們聘請了一位頂級的預訓練研究人員,同時也獲得了業界最具影響力的技術講故事者。
飛輪的轉折點
從更大的背景來看這次的人事變動,它標誌著一個技術轉折點。
2026 年 4 月,Anthropic 發布了 Mythos Preview,這是迄今為止最強大的 AI 模型。
Mythos 非常強大,只能透過 Project Glasswing 進行邀請制的 Beta 測試。
在沒有經過專門的網路安全訓練的情況下,Mythos 自主發現並利用了 FreeBSD 中一個有 17 年歷史的遠端程式碼執行漏洞,發現了 OpenBSD 中跨越 27 年的漏洞,並識別了 FFmpeg 中超過 16 年的缺陷。
英國 AI 安全研究所的一項獨立評估證實,它是第一個從頭到尾完成 32 步企業網路攻擊模擬的模型。
Anthropic 本身也承認,這些能力並非刻意訓練的結果,而是通用推理和軟體工程能力改進的「下游湧現」。
預訓練越好,湧現的能力就越超出預期。
Mythos 不僅是目前最強大的模型,也是目前最強大的工具。
Karpathy 來到 Anthropic 所做的事情就是拿起這個最強大的錘子,並改進錘子本身的製造方式。
使用 Mythos / Claude 來發現更好的訓練架構、資料比例和實驗方向,加速模型改進的速度,超越人類研究人員的線性節奏,啟動「AI 改進 AI」的進化飛輪。
這也是 Anthropic 最期待的結果。
隨著這個飛輪真正啟動,「AI 自我改進預訓練」將不再只是一個研究方向,而是通往 AGI 甚至 ASI 的快速通道。
目前,計算能力、資料壁壘和人才競爭的所有維度都可以被這個變數改寫。
三年內,OpenAI 將三位關鍵人物輸給了同一個競爭對手。
這個事實的影響可能大於任何融資數字。
計算能力可以用錢買到,資料可以隨著時間的推移而累積,但那些能夠啟動 AI 進化飛輪的人卻寥寥無幾。
Karpathy 選擇放棄他的自由球員身份,並在這一刻重返前線。他相信機會就在眼前。