DeepSeek“点燃”国产芯片 FP8能否引领行业新标准?

音符科技网

  炒股就看,权威,专业,及时,全面,助您挖掘潜力主题机会!

  (来源:财联社)

  国产大模型企业DeepSeek“点燃”资本市场。

  近日,DeepSeek宣布其新一代模型DeepSeek-V3.1采用了UE8M0 FP8 Scale参数精度,并明确指出该精度标准是针对即将发布的下一代国产芯片设计。这一消息迅速在资本市场引发强烈反应,等芯片类上市企业股价集体拉升。

  不过,在近两日举办的2025算力大会上,据《科创板日报》记者的现场采访和观察来看,大家在聚焦国产算力时,DeepSeek的FP8精度标准虽被讨论,但业内人士的情绪显然没有资本市场那么高亢。技术派更关注FP8在模型训练、推理及生态标准化上的实际价值与挑战。

  ▍FP8是什么,有哪些提升?

  在AI训练与推理过程中,为提升计算效率,数值精度的降低是一个常见的技术路径。

  摩尔线程AI Infra总监陈志向《科创板日报》记者称,过去,大模型训练推理普遍使用FP32(32位浮点数),随后逐步过渡到FP16(16位浮点数)混合精度,以减少存储和通信开销,FP8则进一步将数据宽度压缩至8位

  “FP8最直接的优势是算力效率翻倍,另一个好处是降低降低训练和推理过程中 *** 带宽的通信量。”陈志称,比如原本传输一个FP32数值需4字节,现在仅需FP8仅需要1字节,虽然 *** 物理带宽本身未必扩大,但单位时间内可传输信息是增加的,同时也让存储要求降低。这意味着在相同功耗下,AI芯片可训练更大的模型或缩短训练时间。

  不过,FP8也不是万能的。

  在2025算力大会现场,另一名不愿具名的国产芯片厂商从业人员告诉《科创板日报》记者,用类似FP8低精度训练推理虽然快,但也容易因数值范围太小导致计算出错。而且,不同计算对精度要求不同,像矩阵乘法这类操作对精度不敏感,可以用较低的精度(如FP8)计算;而像累加或某些函数则需要较高精度。因此,业内通常采用“混合精度训练”,根据计算类型动态选择不同的精度,兼顾效率与准确。

  ▍Deepseek能否推动新标准

  DeepSeek-V3.1使用UE8M0 FP8 Scale 的参数精度,被视为国产AI芯片即将迈入新阶段的信号。受此 *** ,寒武纪等芯片类上市公司股价大幅上涨,但产业界人士态度更为审慎。

  在业内看来,DeepSeek此举无疑给了国内算力厂商的机会,FP8代表了算力优化的正确方向,大模型训练推理不只是堆砌硬件,但它也并非“灵丹妙药”,更需要关注的是实际落地效果。此外DeepSeek的这一动作,后续是否会成为大模型训练与推理的新标准。

  在陈志看来,大模型对精度的容忍度越来越高,从FP32到FP16,再到FP8,是整个行业逐步验证过的路径。DeepSeek这次验证了FP8在大规模模型上的可行性,未来在FP8这一标准乃至更高精度上去做研究或者做训练也是一个很重要的方向。

  当然,这一趋势也意味着,国产算力生态需要同步升级,包括芯片、框架、算力平台到应用层的闭环适配。

  陈志表示,精度标准一旦变化,上下游厂商也需要联动优化。摩尔线程已提前布局FP8研究,既是技术储备,也是为了在生态调整中占据主动。

  他进一步说到,大模型训练推理的核心瓶颈不仅是算力规模,还包括能耗、稳定性和集群利用,“国内万卡规模集群已有部署,但还要向大智算集群演进,解决效率与容错问题,确保集群可靠性。简单‘堆卡’并不能完全满足需求,提高单卡效率与集群调度优化同样关键”

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • AI推理芯片概念上演涨停潮:挖掘潜力股
  • 开启更多大陆“看见”之旅(观沧海)
  • 俄罗斯莫斯科市中心一儿童商店发生燃气爆炸
  • 中信证券:维持黄金珠宝行业“强于大市”评级
  • 为何“老赖”还能坐一等座出行?
  • 大理苍山采蘑菇爆火,一天超万名游客进山!挖了扔、随意埋、菌丝裸露……专家警告:一旦破坏,蘑菇就“断子绝孙”了
  • 张家辉自编自导自演《赎梦》:刘德华的角色是为续集做准备
  • 涉嫌作伪证等韩检方对前国务总理韩德洙提出拘留申请
  • “32:0”完败,赖清德开始检讨了?蓝营32字送他
  • 俄罗斯国家杜马主席将访华
  • 酷暑里莫言和马未都穿上的毛背心,这件鲁迅同款是怎么爆火的
  • 美国官员:美国防部阻止乌使用远程导弹打击俄罗斯
  • 已致12人遇难4人失联,中国中铁:尖扎黄河特大桥施工事故原因正在调查中
  • “你被炒了”!特朗普的“报复”接二连三
  • 朱立伦:请接棒,卢秀燕:谢邀
  • “CT检测脑部出血”,河北孟村一女子去世,与丈夫家暴有关?多方回应
  • 十大机构看后市:贸易战仍处僵持阶段,维持“高低切换”的思路,不贪胜、待时机
  • 暴雨涨水车辆被困“孤岛”?广西一地通报事件详情
  • 剧透!英伟达明天公布人形机器人“黑科技”
  • 中国中铁:尖扎黄河特大桥事故原因正在调查中,公司将妥善处理相关后续工作
  • 开源证券:市值扩张路上机会频现
  • 东吴证券:居民存款搬家的两个认知偏差
  • 韩国内乱特检组对韩德洙提出拘留申请
  • 固收名将王登峰重回公募,贝莱德基金能否打造自己的“余额宝”?
  • 中国中铁:尖扎黄河特大桥施工事故原因正在调查中
  • 首创证券:估值安全边际下的“红利+”
  • 浙商证券:坚定“系统性‘慢’牛”思维 以战略视角继续持仓
  • 中信证券:此轮行情持续到现在主要的发起者和推动者并非散户
  • 湖北继续发布高温橙色预警,局地可达39℃以上
  • 国信证券:优先配置股票类资产
  • 中泰证券:市场新高后或如何演绎?
  • 韩国内乱特检组对前国务总理韩德洙提出拘留申请
  • 悦达投资上半年减收增利,新能源转型收益难抵债务高压
  • 中工国际:签署尼加拉瓜蓬塔韦特国际机场配套道路工程项目商务合同
  • 光大证券:3800点后 继续看多市场
  • 以色列前防长呼吁内塔尼亚胡组建临时政府
  • 85种语言!总台将向全球转播纪念大会和阅兵盛况
  • 中信建投:3800点后 哪个方向收益最高?
  • 国内外产业政策周报:政策性金融工具有望近期落地 美国政府考虑入股英特尔
  • 中国中铁:尖扎黄河特大桥事故原因正在调查中
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码