DeepSeek V3.1再更新:缓解中英文混杂,智能体输出更稳定

音符科技网

DeepSeek-V3.1已更新至DeepSeek-V3.1-Terminus版本。

9月22日晚间,据DeepSeek介绍,此次更新在保持模型原有能力的基础上,针对用户反馈的问题进行了改进,包括:语言一致性:缓解中英文混杂、偶发异常字符等情况。在Agent(智能体)能力方面,进一步优化Code Agent与Search Agent的表现,DeepSeek-V3.1-Terminus的输出效果相比前一版本更加稳定。

目前,官方App、网页端、小程序与DeepSeek API模型均已同步更新为DeepSeek-V3.1-Terminus。不过,记者看到这款大模型名为Terminus,意思是“终极版”,或许这也是V3.1最后一次更新。外界观望下一次大版本更新到底是V4还是R2的到来。

在公开的基准测试成绩中,V3.1-Terminus整体较V3.1有所提升,不过其中部分分数也有下滑,不过在“人类最后考试”(Humanity’s Last Exam)基准上进步较为突出,分数从 15.9大幅提升至21.7,根据官网数据,这一成绩仅次于 Grok 4(25.4)和GPT-5(25.3),并略微超越 Gemini 2.5 Pro(21.6)。

值得注意的是,DeepSeek在中英文混杂方面的改进尤为受到欢迎。澎湃新闻记者在社交媒体上看到,不少用户点赞:“中英文混杂问题在思考时间很长的时候确实会出现,遇到过几次,还在想这是什么问题,这下子正好给解决了。”

资深AI投资人郭涛向澎湃新闻记者分析称,本次DeepSeek-V3.1-Terminus版本更新聚焦工程化落地与场景适配,核心突破体现在两大核心竞争提升:一方面,通过语义层降噪技术显著改善语言一致性,有效抑制中英文混杂、异常字符等干扰,提升文本生成纯净度;另一方面,深度重构Agent执行框架,针对Code Agent的语法解析精度、Search Agent的信息检索召回率进行专项优化,使智能体输出稳定性提升。

此次全渠道(App/网页/小程序/API)同步升级,展现国产大模型从算法创新向工程可靠性演进的关键跨越,标志着国产模型在复杂任务处理、多模态协同等工业化应用层面迈出重要一步,为后续垂直领域深度赋能奠定更坚实基础。

作为国产大模型的风向标,DeepSeek的动态都广泛被外界关注。

此前9月18日,梁文锋带着DeepSeek-R1的研究,登上最新一期国际顶级期刊《自然》(Nature)封面。

今年1月份,国产大模型公司深度求索(DeepSeek)在预印本平台arxiv公布论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》,创始人梁文锋位于署名之列。

《自然》杂志指出,如此总结DeepSeek-R1带来的进步:如果训练出的大模型能够规划解决问题所需的步骤,那么它们往往能够更好地解决问题。这种“推理”与人类处理更复杂问题的方式类似,但这对人工智能有极大挑战,需要人工干预来添加标签和注释。

DeepSeek的研究人员揭示了他们如何能够在极少的人工输入下训练一个模型,并使其进行推理。DeepSeek-R1模型采用强化学习进行训练。在这种学习中,模型正确解答数学问题时会获得高分奖励,答错则会受到惩罚。

DeepSeek团队也首次对外回应“蒸馏”相关质疑。论文中表示,对于深度求索V3基础版(DeepSeek-V3-Base)的训练数据仅使用普通网页和电子书,未纳入任何合成数据,“不过,我们注意到部分网页包含大量由OpenAI模型生成的答案,这可能会让基础模型间接地从其他强大模型获取知识。但在预训练冷却阶段,我们并未刻意加入由OpenAI生成的合成数据;该阶段使用的所有数据都是通过 *** 爬取自然获取的。预训练数据集包含大量与数学和代码相关的内容,这表明深度求索V3基础版接触到大量的推理轨迹数据。”

今年1月20日,中国AI初创公司深度求索(DeepSeek)推出大模型DeepSeek-R1引爆AI行业,作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAIo1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。春节假期后,国内多个行业龙头公司均宣布接入DeepSeek。

伴随AI大模型行业的日新月异,DeepSeek已经更新出R1以外的新版本,但万众期待的R2尚未面世。此前8月21日DeepSeek正式发布DeepSeek-V3.1,称其为“迈向Agent(智能体)时代的之一步”。

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 第二日谈判结束,哈马斯拒绝以分阶段撤军
  • 美国货币市场压力敲响警钟,美联储缩表或近终点
  • 英伟达(NVDA.US)豪掷数十亿入股 马斯克xAI融资额冲刺200亿美元
  • 1.54亿元收入背后的WTT赛事商业弧线
  • 中信证券:蜜雪集团未来增长确定性强 维持“买入”评级
  • 美政府停摆进入第二周,给多少人造成了多少损失?
  • 日本薪资增长骤然失速 高市早苗上任先迎“冰冷现实”
  • 交银国际:维持百威亚太“买入”评级 降目标价至9.50港元
  • 招商证券香港:首次覆盖和誉-B予“增持”评级 目标价32.5港元
  • 田延评《生活就是反抗》|一个“真实”的葛兰西?
  • 宏利投资:美国政府停摆对市场影响有限 投资者宜保持稳健取态
  • 云南铁路迎来国庆假期返程高峰,今日预计发送旅客59万人次
  • 资本下乡与农民进城:村庄社会如何变迁?
  • 国庆节,逆行者堵死了通往景区的路
  • 港股,突发!一则“报道”引爆?
  • 全球可再生能源发电首次超过煤炭,中国贡献过半清洁能源增长
  • 王曼昱夺得WTT中国大满贯女单冠军
  • “在互学互鉴中赓续文明薪火”(高端访谈)——访纳米比亚前总统姆本巴
  • 10月金股出炉!13只个股获重点推荐
  • 现货金价突破4000美元大关 美国政府停摆为黄金热潮再添一把火
  • 纽约期银日内涨幅达1%
  • 老的多重奏|把自己作为方法的老龄化传播研究
  • AI“闭环”继续:马斯克旗下xAI接近募资200亿美元,英伟达出资20亿入股且“挂钩芯片”
  • 让观赛热情为文旅消费再添“一把火”
  • 卡在“手”上!报道称特斯拉不断下调“擎天柱”机器人产量目标,夏天已降至2000台
  • 当“最大传统金融交易所”入股“最大链上预测市场”,“资产代币化”进入主流视野
  • 印尼股市一度上涨0.7%,至8,224.645点纪录高位
  • 再创历史新高!现货黄金突破4000美元,是顶点还是新起点?
  • 9省份有大到暴雨!北京、天津等地机场或受影响
  • “民告官”,十堰市市长出庭应诉
  • 假期接近尾声,前方堵“红”怎么办?自驾返程攻略来了
  • 越南股市盘前上涨3% 此前富时指数将越南升级为次级新兴市场
  • 莎莎国际盘中涨超8% 集团第二财季营业额同比增长8.4%
  • 现货黄金突破4000美元/盎司大关 续创历史新高
  • 现货黄金突破4000美元/盎司,为史上首次
  • 台交所加权股价指数低开0.8%
  • 现货黄金突破4000美元/盎司大关,续创新高
  • 富时中国A50指数期货日内跌超1%
  • 港股人工智能概念股走弱,汇量科技跌超6%
  • 港股三大指数低开低走,恒指跌超1.5%,科指跌超2%
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码