9月29日,中國人工智能實驗室DeepSeek正式發佈DeepSeek-V3.2-Exp模型並全面開源,該版本在V3.1-Terminus基礎上引入自研DeepSeek Sparse Attention稀疏註意力機制,針對長文本訓練和推理效率進行探索性優化驗證。技術創新直接推動商業策略調整,DeepSeek同步宣佈大幅下調官方API價格,新價格已即刻生效,其中輸出令牌價格從12元降至3元,降幅超過50%,輸入令牌緩存命中價格更是低至0.2元/百萬,預計開發者調用成本將降低50%以上。
此次更新延續了DeepSeek近期快速疊代的技術路線。早在9月22日,DeepSeek線上模型已升級至V3.1-Terminus版本,而8月21日發佈的V3.1版本則首次實現混合推理架構,使單壹模型同時支持思考與非思考模式。最新V3.2-Exp模型採用適配國產晶片結構的參數精度,華為雲與寒武紀等廠商已率先完成適配,支持160K長序列上下文處理,為國產軟硬協同生態奠定基礎。
DeepSeek通過持續技術優化構建成本優勢,新稀疏註意力機制在幾乎不影響輸出效果的前提下顯著提升長文本場景效率。
新時空聲明: 未經授權,不得復制、轉載或以其他方式使用本內容。新時空及授權的第三方信息提供者竭力確保數據準確可靠,但不保證數據絕對正確。本內容僅供參考,不構成任何投資建議,交易風險自擔。