阿裏發佈千問旗艦模型Qwen3-Max-Thinking,高階推理能力比肩國際頂尖
新時空訊,阿裏1月26日正式推出千問系列旗艦推理模型Qwen3-Max-Thinking,總參數量超萬億,憑借自適應工具調用能力與測試時擴展技術兩大核心升級,在19項權威基準測試中媲美GPT-5.2-Thinking、Gemini 3 Pro等國際頂尖模型,高階推理表現實現反超。
新時空訊:阿裏於2026年1月26日晚發佈千問系列旗艦推理模型Qwen3-Max-Thinking,該模型以超萬億參數量、36T Tokens預訓練數據爲基礎,經大規模強化學習打磨,在高階推理領域實現國產大模型的重要突破,性能比肩國際頭部產品。
據悉,該模型核心改進聚焦兩大技術創新。其一爲自適應工具調用能力,現已上線Qwen Chat,可在對話中自主判斷並調用內置搜索、記憶及代碼解釋器功能,有效降低AI“幻覺”風險;其二是測試時擴展技術,通過“經驗提取”式反思避免冗餘計算,在相同算力下聚焦難點突破,使GPQA科學知識測試得分從90.3升至92.8,LiveCodeBench編程測試從88.0提升至91.4,關鍵推理性能超越Gemini 3 Pro。
性能比拼中,該模型表現亮眼。在HLE工具調用基準測試中以58.3分遠超GPT-5.2-Thinking(45.5分)及Gemini 3 Pro(45.8分);IMO級數學推理測試獲91.5分登頂,預覽版曾拿下AIME 25與HMMT 25雙滿分。
新時空聲明: 本內容爲新時空原創內容,復制、轉載或以其他任何方式使用本內容,須注明來源“新時空”或“NewTimeSpace”。新時空及授權的第三方信息提供者竭力確保數據準確可靠,但不保證數據絕對正確。本內容僅供參考,不構成任何投資建議,交易風險自擔。
Google Play下載
API 訂閱
App Store下載
郵件訂閱
AppGallery下載