樂天釋出“日本最大高效能AI模型”,其配置檔案顯示基於DeepSeek V3架構

OOdaily
樂天集團釋出開源模型 Rakuten AI 3.0,並稱其為“日本最大高效能 AI 模型”。該模型採用 MoE 架構,總引數 6710 億,每次推理啟用 370 億引數,上下文視窗為 128K,針對日語場景進行優化,在多項日語基準測試中表現優於 GPT-4o。 該模型為日本經濟產業省與新能源產業技術綜合開發機構(NEDO)推進的 GENIAC 專案成果之一,獲得部分算力支援。樂天未披露基礎模型來源,僅表示基於開源社群成果構建。 社群在 HuggingFace 模型檔案中發現,其 config.json 包含“deepseek_v3”及相關架構欄位,且引數規模與上下文配置與 DeepSeek V3 一致,顯示該模型或基於 DeepSeek V3 進行日語微調。 [Odaily星球日報]