亞馬遜的AI回歸:透過銷售Claude代幣,AWS的利潤率超越微軟與谷歌
SemiAnalysis認為,AWS正在用一套獨特的結構性邏輯,在雲端計算利潤戰中悄然拉開差距。Bedrock平臺僅佔AWS總收入4%,卻貢獻同比新增毛利額的30%,EBIT利潤率高達55%。背後的核心邏輯是:從賣算力的IaaS模式,躍遷為拿模型分銷權益的TaaS模式。Anthropic季度淨新增ARR達210億美元、API收入同比暴增13倍,成為這套槓桿結構的核心燃料。
AI雲業務普漲的時代,利潤率成了真正的分水嶺。AWS憑藉一套將Claude token需求轉化為經營槓桿的獨特結構,正在與Azure、Google Cloud拉開差距。
最新資料顯示,AWS在2026年一季度EBIT利潤率環比提升213個基點,而同期Azure利潤率走弱,Google Cloud利潤率改善有限且存在會計口徑差異。亞馬遜是唯一一家將代幣即服務 (TokenaaS) 作為其人工智慧業務主要組成部分的雲服務提供商 (CSP)。
研究機構SemiAnalysis分析師Jeremie Eliahou Ontiveros將這一分化歸因於三點:"AWS在第三方模型API支出中的更高份額、Anthropic/Bedrock交易結構,以及Anthropic在2026年一季度ARR超預期。"這不是"AI需求強,所以利潤好"的簡單邏輯,而是一套從算力出租商向模型分銷平臺躍遷的結構性轉變。
關鍵訊號在於:Bedrock目前約為55億美元run-rate規模,僅佔AWS總收入約4%,卻貢獻了AWS同比新增毛利額的30%。只要Anthropic需求持續爆發,這一槓杆效應將繼續放大。
結構差異:AI佔比低,利潤率反而更高
雲廠商都在吃AI需求,但分化發生在利潤率,而非收入增速。
從AI收入佔總收入比例來看,AWS並不領先。測算顯示,AWS的AI收入佔比從2024年一季度的2%升至2026年一季度的10%,而同期GCP和Azure分別達到36%和27%。
但高AI佔比沒有自動帶來高利潤率。Azure和GCP的AI業務仍以AI IaaS為主,佔各自AI業務組合超過80%。AWS的結構則在發生變化:Bedrock佔AWS AI收入的比例從2025年一季度的9%,升至2026年一季度的37%。
這解釋了一個表面矛盾——AWS的AI收入佔比遠低於競爭對手,利潤率卻跑出來了。問題不在"AI多不多",而在"AI收入是哪一種"。
Bedrock模式:從賣算力到拿分銷權益
Bedrock是AWS的模型呼叫平臺,客戶可通過統一賬單、安全合規框架接入Claude等前沿大模型。它的競爭對手包括Microsoft Foundry、Google Gemini Enterprise Agent Platform,以及TogetherAI、Fireworks等偏開源模型的平臺。
這類平臺的核心差異不在模型數量或延遲指標,而在能否接入前沿模型。前沿大模型貢獻了AI API行業的大部分收入,AWS、微軟、谷歌相較其他endpoint平臺的優勢,正在於此。
但接入模型只是第一步。Bedrock對AWS利潤率的真正意義,在於其交易結構。在AWS通過Bedrock分銷Claude token的安排下,Anthropic作為seller of record確認完整的token銷售收入;客戶由AWS開票,模型部署在AWS基礎設施上;AWS則獲得兩部分收益:類似EC2/IaaS的基礎設施費用,以及分銷或收入分成。
相比五年期take-or-pay式的IaaS合同,這類Token-as-a-Service(TaaS)業務收入鎖定性更低,但利潤率更厚。對Anthropic/Bedrock安排的測算顯示,固定IaaS費用、收入分成與超量績效門檻疊加,使Bedrock在2026年一季度實現了約55%的EBIT利潤率。代價也很明確:若Claude token消費下滑,AWS承擔的需求風險高於傳統IaaS。
目前,亞馬遜、微軟、谷歌的TaaS業務ARR均已達到百億美元以上量級,Oracle和neocloud在這一層幾乎沒有規模——這是超大雲廠商與其他AI算力提供商差距被拉大的關鍵所在。
Anthropic爆發:AWS利潤槓桿的核心燃料
Bedrock高度繫結Anthropic需求。測算顯示,Bedrock 80%至90%以上的客戶使用Anthropic模型,Bedrock實質上是一個由Claude需求驅動的業務。
Anthropic自身的增長資料極為突出。其2026年一季度淨新增ARR為210億美元,總ARR達到300億美元;API收入同比約增長13倍,年底ARR有可能遠超1000億美元。Claude Code在企業客戶中的快速鋪開是重要驅動,消費者側流量也開始向Claude遷移。
利潤率同樣大幅改善。Anthropic推理毛利率已升至60%中段,相比2025年的38%和2024年的-94%實現大幅修復。Anthropic越快增長,Bedrock上Claude token消費越大,AWS拿到的基礎設施費和分銷分成也越多。
這種借力關係在財務資料上已有體現。2026年二季度的路徑假設更為激進:Bedrock佔AWS AI收入比例有望升至53%,併為AWS總收入增長額外貢獻9個百分點。
容量佈局:提前鎖電,才接得住TaaS需求
TaaS要做大,前提是有足夠的推理算力按時交付。AWS在這一點上比多數同行更為激進。
資料中心模型顯示,AWS在2025年至2027年的新增容量上持續領先;微軟在2024年至2026年節奏接近,但到2027年被明顯拉開。更重要的是,微軟內部AI專案消耗的算力高於亞馬遜,且大量AI算力通過長期合同鎖定給了OpenAI——僅OpenAI相關積壓訂單規模,就是Azure全年收入的2.5倍。
AWS則更早將電力和容量當作市場份額問題處理,與Talen、Vistra、NiSource等獨立電力生產商簽下數十億美元級PPA,並在印第安納和密西西比推進接近2GW規模的建設。微軟此前曾經歷約一年的資料中心建設暫停,拉低了2027年容量預測;威斯康星大型AI叢集進展也慢於AWS同類專案。若要追趕,微軟只能從neocloud購買更多容量,成本更高,利潤率也將承壓。
AWS還在推進更高模組化和預製化比例的新資料中心設計。對AI推理業務而言,這直接關係到收入的交付能力。
自研晶片:在分銷費之外壓低底層成本
Bedrock模式對自研晶片天然友好——客戶購買的是token,不關心底層跑的是英偉達GPU還是Trainium。這給了AWS一個額外的成本槓桿。
Trainium在高batch推理、強化學習等對記憶體頻寬敏感的工作負載中具備較好的效能/總擁有成本表現。AWS CEO Matt Garman在2025年11月披露,Trainium已支撐超過50%的Amazon Bedrock token使用量。
CPU側同樣值得關注。前沿大模型訓練和推理對CPU需求上升,尤其在強化學習和agentic工作負載中。AWS的Graviton4、Graviton5在效能/總擁有成本上具備優勢,並將作為Trn3的head node整合,也可單獨用於強化學習和agentic任務。AWS已與Anthropic、OpenAI、Meta簽下大型CPU及Graviton相關合作,Bedrock客戶基礎越大,向其追加銷售Graviton能力的摩擦越小。
同行落後:不是AI收入不夠,而是結構沒變
Azure的核心問題是AI收入仍高度IaaS化,Microsoft 365 Copilot和GitHub相關業務尚未形成同等規模的利潤率拉動。
Google Cloud的Gemini API表現尚可,但沒有複製Anthropic在編碼市場的強勢。更重要的是,Google Cloud存在會計口徑差異——DeepMind的訓練成本未計入GCP分部,導致其利潤率與AWS不完全可比。
Oracle和neocloud的處境更為直接:主要在AI IaaS和算力租賃層競爭,TaaS幾乎沒有規模。一旦雲業務利潤低於預期,批發算力模式的脆弱性即刻暴露。
AWS這輪跑贏,依賴幾條線同時成立:Anthropic需求爆發提供收入基礎,Bedrock交易結構提供利潤率,電力與資料中心容量提供交付能力,Trainium和Graviton壓低底層成本。只要這幾條線保持連線,AWS的AI業務邏輯就不只是"資本開支換增長",而是"模型需求換經營槓桿"。