首页 > 科技 > 正文

DeepSeek技术迭代加速,9月末密集发布模型升级与降价组合拳

9月29日,中国人工智能实验室DeepSeek正式发布DeepSeek-V3.2-Exp模型并全面开源,该版本在V3.1-Terminus基础上引入自研DeepSeek Sparse Attention稀疏注意力机制,针对长文本训练和推理效率进行探索性优化验证。技术......

9月29日,中国人工智能实验室DeepSeek正式发布DeepSeek-V3.2-Exp模型并全面开源,该版本在V3.1-Terminus基础上引入自研DeepSeek Sparse Attention稀疏注意力机制,针对长文本训练和推理效率进行探索性优化验证。技术创新直接推动商业策略调整,DeepSeek同步宣布大幅下调官方API价格,新价格已即刻生效,其中输出令牌价格从12元降至3元,降幅超过50%,输入令牌缓存命中价格更是低至0.2元/百万,预计开发者调用成本将降低50%以上。

此次更新延续了DeepSeek近期快速迭代的技术路线。早在9月22日,DeepSeek线上模型已升级至V3.1-Terminus版本,而8月21日发布的V3.1版本则首次实现混合推理架构,使单一模型同时支持思考与非思考模式。最新V3.2-Exp模型采用适配国产芯片结构的参数精度,华为云与寒武纪等厂商已率先完成适配,支持160K长序列上下文处理,为国产软硬协同生态奠定基础。

DeepSeek通过持续技术优化构建成本优势,新稀疏注意力机制在几乎不影响输出效果的前提下显著提升长文本场景效率。

新时空声明: 未经授权,不得复制、转载或以其他方式使用本内容。新时空及授权的第三方信息提供者竭力确保数据准确可靠,但不保证数据绝对正确。本內容仅供参考,不构成任何投资建议,交易风险自担。

新时空
×
分享到微信

打开微信,使用 “扫一扫”,分享到我的朋友圈