DeepSeek-V3.1发布!“FP8 精度”如何赋能国产AI?

音符科技网

  近期,DeepSeek正式发布DeepSeek-V3.1,官方称其为“迈向Agent(智能体)时代的之一步”。DeepSeek新模型的升级亮点有哪些?备受关注的“FP8精度”意味着什么?对我国AI产业链将产生怎样的影响?(资料参考:澎湃新闻《国产算力芯片打开千亿市场:“FP8精度”意味着什么?产业链底气何在?》,2025.8.26)

  DeepSeek-V3.1的三大核心升级

  本次升级主要有三大亮点,包括混合推理架构、更高的思考效率,以及更强的Agent能力。

  1、混合推理架构
不同于传统模型需维护多个专家模型,DeepSeek-V3.1在单一架构内可同时支持思考模式与非思考模式,用户可通过“深度思考”按钮实现无缝切换,在复杂任务中启用链式推理,在简单任务中快速响应。

  (资料参考:IT时报《涨价了!DeepSeek发布V3.1》,2025.8.21)

  2、思考效率提升

  在思考效率层面,DeepSeek-V3.1 较前代模型(DeepSeek-R1-0528)取得显著提升。通过“思维链压缩训练技术”,新模型在输出Token(词元)数量减少20%至50%的前提下,核心任务表现仍与前代持平。

  (资料参考:金融界《DeepSeek发布V3.1版本,专为国产芯片优化,支持双模式推理架构》,2025.8.21)

  DeepSeek-V3.1与前代模型对比

  注:在各项评测指标得分基本持平的情况下(AIME 2025: 87.5/88.4, GPQA: 81/80.1,liveCodeBench: 73.3/74.8),R1-0528与V3.1-Think的token消耗量对比图;资料参考:深度求索《DeepSeek-V3.1发布,迈向Agent时代的之一步》,2025.8.21

  3、Agent能力增强

  通过后训练优化,DeepSeek-V3.1的智能体(Agent)能力实现跨越式提升,尤其在工具使用、编程任务以及复杂搜索等智能体相关任务中表现出色。在代码修复测评SWE与命令行终端环境测试中,该模型展现出更强的处理能力。(资料参考:金融界《DeepSeek发布V3.1版本,专为国产芯片优化,支持双模式推理架构》,2025.8.21)

  从技术到算力:国产AI迎来新动能!

  DeepSeek-V3.1的发布不仅是单个模型的升级,更从“技术性能”与“算力适配” 两大维度,为我国AI行业发展注入新动能。

  1、性能突破:保持开源领先优势

  一方面,DeepSeek-V3.1虽然是增量更新,却在关键指标上实现了突破。这次升级使DeepSeek在中国AI企业的开源热潮中重新获得领先优势。(资料参考:虎嗅APP《DeepSeek V3到V3.1,走向国产算力自由》,2025.8.24 )

  DeepSeek V3.1在多领域性能领先

编程领域

在Aider编程基准测试中,模型以71.6%的高分“霸榜”开源模型阵营,超越Claude Opus 4,且推理与响应速度更快。

多模态任务

在SVGBench测评中,性能仅次于 GPT-4.1-mini,远超前代模型 DeepSeek R1。

语言理解

多任务语言理解(MMLU)得分达88.5%,与GPT-5 的表现不相上下。

  资料参考:中邮证券《DeepSeek V3.1提振国产算力和应用》,2025.8.26

  2、算力适配:赋能国产芯片生态

  DeepSeek-V3.1的另一大关键突破,是该模型支持FP8 精度格式,专业分析称其具有三大核心优势:

  • 降本降耗,性能翻倍:相比FP16格式,FP8在同等芯片面积下能够实现翻倍性能,且功耗和带宽需求更低。
  • 国产适配:新精度格式针对即将发布的下一代国产芯片设计,意味着未来基于DeepSeek模型的训练与推理有望更多应用国产AI芯片,助力国产算力生态加速建设。

  (资料参考:澎湃新闻《国产算力芯片打开千亿市场:“FP8精度”意味着什么?产业链底气何在?》,2025.8.26)

  从行业背景来看,截至今年6月底,我国日均Token(词元)日均Token消耗量已经突破30万亿,1年半时间增长了300多倍。而据机构预测,随着国内算力消耗快速增长,预计国内各家大型云厂商在日均token消耗达到30万亿token时会感受到算力紧张,在达到60万亿token时会开始出现一定算力缺口。基于此,今年国产芯片有望将迎来发展大年。(资料参考:澎湃新闻《国产算力芯片打开千亿市场:“FP8精度”意味着什么?产业链底气何在?》,2025.8.26)

  随着国产算力芯片与开源大模型的深度融合,中国人工智能产业或正在迎来拐点。投资者不妨关注银华旗下港股科技30ETF(513160)及其联接基金(A类:024037,C类:024038,I类:024039)科创板人工智能ETF(588930)及其联接基金(A类:023550,C类:023551,I类:023552),通过指数化投资方式,力争把握AI行业的长期增长红利。

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 传比亚迪正考虑将西班牙作为其第三家欧洲汽车工厂选址
  • 纳斯达克中国金龙指数跌幅扩大至3%
  • 高盛通知员工 今年计划进行新一轮裁员
  • Orion将收购Capstone圣多明各和北山项目25%股权
  • 日本男足让二追三,成为本世纪首支击败巴西的亚洲球队
  • 爱立信三季度GAAP每股收益超预期,但营收未达预期
  • 美联储监管副主席鲍曼:新的压力测试改革方案很快将公布
  • 刚果(金)政府与反政府武装签署协议,建立停火监测与核查机制
  • 消费一线观察:金价这么高,到底谁在买?
  • Telix制药三季度营收同比增长53%
  • 富国银行三季度营收214.4亿美元,同比增长5.3%
  • 阳狮集团三季度营收35.3亿欧元
  • 伦敦市场白银挤兑现象显现缓解迹象,银价回落
  • 餐饮品牌国际旗下Popeyes正加速全球扩张
  • “华尔街一哥”罕见预警:美国信贷泡沫浮现!坏账或只是冰山一角?
  • 300051,终止重大资产重组!涉及中兴系!
  • 私人资产业务加速增长,贝莱德吸金2050亿美元
  • Navitas宣布为英伟达AI平台开发800VDC功率器件取得进展
  • MEMS惯性传感器需求放量 芯动联科前三季度净利预增至高91%
  • PotlatchDeltic正与Rayonier(RYN)进行价值超70亿美元的合并谈判
  • 6人开奔驰去餐馆消费370元逃单,“追出去只扫了50元,司机驾车跑了,3人下车分头逃”,老板:已报警,还未给钱
  • 传MSC集团可能发起收购易捷航空要约
  • 沃尔玛与OpenAI合作 推出ChatGPT内购物功能
  • 中铁十九局副总经理孙强接受纪律审查和监察调查
  • 分析师预计福特2025财年息税前利润将减少5-10亿美元
  • 白宫预算办公室称将继续裁员以应对政府停摆
  • 美银调查:全球衰退担忧降至两年半低点
  • 通用汽车将计提16亿美元费用
  • 摩根大通三季度计提34亿美元信贷损失拨备
  • 电子行业的“全壁江山”,为什么都来了vivo?
  • 谷歌将在印度投资100亿美元建设数据中心和AI中心
  • 教育部:支持各地举办一批综合高中引导高中阶段学校多样化发展
  • IMF警告全球市场无序修正风险上升
  • 刚刚!芯片,传来重大利好!
  • 中期协:黄金白银期货成交额暴涨 警惕黄金白银价格技术性回调
  • 创新药板块震荡 BD行情告一段落了吗?港股再迎创新药企递表小高峰 贝达药业、百利天恒等多家知名药企冲刺“A+H” | 掘金创新药
  • 帝科股份拟3亿元收购江苏晶凯62.5%股权 拓展存储芯片业务产业链
  • 神州数码:累计回购公司股份5458362股
  • 美联储鲍曼:将很快公布压力测试机制调整
  • 白宫:政府“停摆”期间将继续裁员
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码