小米集團-W(01810.HK)：開源首個原生端到端語音模型

新時空 · 2025/09/19 09:20 · 作者：港陸通

2025年9月19日，小米正式開源首個原生端到端語音模型——Xiaomi-MiMo-Audio，它基於創新預訓練架構和上億小時訓練數據，首次在語音領域實現基於ICL的少樣本泛化，並在預訓練觀察到明顯的“湧現”行爲。市場公......

2025年9月19日，小米正式開源首個原生端到端語音模型——Xiaomi-MiMo-Audio，它基於創新預訓練架構和上億小時訓練數據，首次在語音領域實現基於ICL的少樣本泛化，並在預訓練觀察到明顯的“湧現”行爲。

市場公開信息顯示，在通用語音理解及對話等多項標準評測基準中，MiMo-Audio大幅超越了同參數量的開源模型，取得7B最佳性能；在音頻理解基準MMAU的標準測試集上，MiMo-Audio超過Google閉源語音模型Gemini-2.5-Flash；在面向音頻復雜推理的基準Big Bench Audio S2T任務中，MiMo-Audio同樣超越了OpenAI閉源的語音模型GPT-4o-Audio-Preview。

新時空聲明： 未經授權，不得復制、轉載或以其他方式使用本內容。新時空及授權的第三方信息提供者竭力確保數據準確可靠，但不保證數據絕對正確。本內容僅供參考，不構成任何投資建議，交易風險自擔。

關鍵詞：小米集團-W 01810.HK 大模型

每日最新、最全的新股申購指南與深度剖析，請立即前往新股頻道

相關資訊