DeepSeek-V3.1正式发布:思考时间变短,但API调用价格涨了

音符科技网

界面新闻记者 | 宋佳楠

DeepSeek用户没能等到传闻中的R2模型,但V3.1版先来了。

8月21日,界面新闻从DeepSeek官方公众号获悉,其最新大语言模型DeepSeek-V3.1正式发布。此时距离DeepSeek-V3-0324推出已过去5个月时间。

据DeepSeek介绍,新升级版本的变化主要体现在三个方面:混合推理架构、更高的思考效率、更强的Agent(智能体)能力。如果仅从命名来看,DeepSeek-V3.1更像是前一代DeepSeek-V3模型的小版本迭代。

DeepSeek-V3.1实现了一个模型同时支持思考模式与非思考模式。它就像一个拥有两种工作模式的超级大脑,当面对简单问题时,能以非思考模式快速给出答案。而在处理复杂问题时,可切换到思考模式,给出更具深度和逻辑的解答。用户可通过官方App或网页端的“深度思考”按钮切换这两种模式。

官方数据显示,与DeepSeek-R1-0528相比,DeepSeek-V3.1在思考模式下效率大幅提升,能在更短时间内给出答案,且经过思维链压缩训练,token(大模型文本处理的最小单位)消耗量可减少20%至50%,各项任务的平均表现与R1-0528持平。R1-0528是DeepSeek于今年5月发布的旗舰推理模型DeepSeek R1的升级版本。

R1-0528与V3.1-Think的token消耗量对比图

同时,V3.1在非思考模式下的输出长度也得到了有效控制,相比于DeepSeek-V3-0324,能够在输出长度明显减少的情况下保持相同的模型性能。

通过Post-Training(后训练,大语言模型训练流程中的关键阶段)优化,新模型在工具使用与编程、搜索等智能体任务中的表现大幅提升。在代码修复和命令行终端任务测试中,DeepSeek-V3.1相较以往模型进步明显。

社区第三方测试数据显示,在Aider多语言编程基准测试中,V3.1取得了71.6%的高分,超越了Anthropic的Claude 4 Opus等多个知名模型,且完成一次编程任务的成本仅为1.01美元,成本效益优势显著。

随着V3.1发布,DeepSeek也同步调整了API接口调用价格,并取消夜间优惠。自北京时间2025年9月6日凌晨起,输入价格方面,缓存命中时为0.5元/百万tokens,缓存未命中时则涨至4元/百万tokens(此前V3为2元/百万tokens);输出价格调整为12元/百万tokens(此前V3为8元/百万tokens)。

DeepSeek-V3.1 API调用价格

值得注意的是,DeepSeek还在评论区中提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。另外,V3.1对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。DeepSeek官微在置顶留言里表示,UE8M0 FP8是针对即将发布的下一代国产芯片设计。

此前有第三方数据显示,DeepSeek用户使用率和官网流量回落。据之一财经报道,360集团创始人周鸿祎对此表示,DeepSeek官网流量下降是因为DeepSeek没有花心思,但现在很多第三方云服务上都有DeepSeek的服务,用了DeepSeek的大模型流量一直很高。在中国,许多公司包括360智能体的基座模型等都使用DeepSeek来改,相当于很多公司的“武器装备”都是DeepSeek提供的。

DeepSeek(深度求索)是2023年成立于杭州的人工智能公司,由幻方量化孵化。创始团队由梁文锋领衔,成员来自顶尖高校与国际机构技术专家。

截至目前,DeepSeek推出了DeepSeek-V3、DeepSeek-R1等模型,具备混合专家架构(MoE)、多头潜在注意力(MLA)等技术优势,在数学推理、代码生成等任务上表现出色,且训练和推理成本较低。其部分模型采用MIT许可开源(一种广泛使用的开源软件许可证),已在金融、医疗等领域落地应用。

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 光证资管申请公募牌照按下“暂停键”
  • 虚假摆拍“女子悬赏20万寻救命恩人”,2人被行拘
  • 财务人员遭电诈致公司损失20余万元,法院:两涉事员工赔10万元
  • 多家银行公告提示贵金属价格波动风险
  • 房屋中介遭“跳单”状告买家及业主,法院:支付2.7万中介费
  • 报道:代码错误致美国疾控中心部分员工遭误裁
  • 他俩已正式离婚,“分手费”或达34亿元,神州数码再现天价离婚
  • 这些症状可能是呼吸道合胞病毒感染 哪些人群易感、如何防治?
  • 多家银行关停旗下App,啥原因?
  • 法学博士万容任重庆市荣昌区委书记,“网红书记”高洪波已到市政协任职
  • 面向重点行业,2025年“秋招”已推出283场特色服务活动
  • 20世纪的战争与环境:一种全球性的分析
  • 《在笼中》:作为再铭写的代码
  • 从竞赛擂台到产业高地,三明“以赛引才”驱动氟新材料“点石成金”
  • 东北父女在新加坡住所双亡女儿曾写博客回忆东北扫雪
  • 报道:澳大利亚正考虑与美国达成关键矿产协议
  • 万容已任重庆市荣昌区委书记,高洪波赴市政协工作
  • 党中央决定:郭斌同志任鞍钢集团有限公司董事、总经理、党委副书记
  • 万科现任董事长被查,这算是半官宣了?
  • 李玟账号被异常登陆!网友担心“二次放号”风险,最新解读
  • 部分信托公司债券交易业务开展排查,正逆回购超限风险引关注
  • 航行警告:渤海海峡黄海北部执行军事任务
  • 体坛联播|C罗失点+中柱,葡萄牙完成绝杀,哈兰德帽子戏法
  • 襄阳16岁少年在未管所遭殴打致死:被伤害的与被惩罚的
  • 下周关注丨CPI、PPI数据将公布,这些投资机会最靠谱
  • 今年我国快递业务量突破1500亿件
  • 九旬老太将房产存款全部留给“干儿子”,死后骨灰却被撒荒山……
  • 特朗普又要干一件大事
  • 豪掷3.6亿元买下徐翔母亲股权的神秘女子李蓉蓉,资金来源曝光
  • 再见,流动儿童学校
  • 伊朗军官:是否封锁霍尔木兹海峡取决于外部对伊施压程度
  • 布局顺周期!朱少醒、杨锐文等,最新动向
  • 3家A股公司火了!超百家机构前往调研!
  • 在深圳一带一路音乐季,上海爱乐首演交响曲《上海》
  • 《X医生》主演米仓凉子被爆因涉毒接受调查
  • 业绩“冰火两重天”!来看这些钢企的“增长秘籍”
  • 动荡中的娃哈哈:许思敏接任总经理,董事长空缺,多省市办事处电话无人接听或停机
  • 关于伍尔夫有重大发现,“一间自己的房间”比我们知道的早了20年
  • 给你上门修电脑的师傅,是怎么把200块的活收到2000的?
  • 最新!伊朗方面发声 提及霍尔木兹海峡!原油、有色金属大跌的原因找到了
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码