微軟釋出免費語音輸入工具Vibing,基於自家VibeVoice模型,對標付費產品WisprFlow

律动
微軟釋出桌面語音輸入工具 Vibing,基於自家開源語音 AI 模型 VibeVoice,支援 macOS 和 Windows,免費使用。按下快捷鍵(Mac 右 Option / Windows Ctrl+Win)即可在任意應用中喚起錄音,結束後自動輸出文字。 AI/ML 社群測評者 @realmrfakename 親測後稱轉錄準確、速度快,評價為「WisprFlow 的免費替代品」。Vibing 不只是語音轉文字,它通過 LLM 將口語重寫為適合當前場景的書面文字,支援在輸入過程中用自然語言直接修改、刪除、整理已有內容。其他功能包括單次 5 分鐘以上連續錄音、50+ 語言自動識別、同一句話內中英文混合輸入、自定義熱詞以及實時翻譯。 底層的微軟 VibeVoice 是 MIT 協議開源的語音 AI 模型家族,GitHub 星標超 2.8 萬,包含 7B 引數的 ASR 模型(單次處理 60 分鐘音訊)、1.5B 的 TTS 模型(生成 90 分鐘多人語音)和 0.5B 的實時模型(300ms 延遲)。WisprFlow 是目前 Mac 上最受歡迎的 AI 語音輸入工具之一,按月訂閱收費,Vibing 直接以免費 + 開源的方式進入同一賽道。 [1M AI News]