华为发布AI推理创新技术UCM:实现高吞吐、低时延推理体验,降低每Token推理成本

音符科技网

  新浪科技讯 8月12日下午消息,在2025金融AI推理应用落地与发展论坛上,华为联合中国银联共同发布AI推理创新技术UCM(推理记忆数据管理器),实现高吞吐、低时延的推理体验。

  在当今数字化时代,AI发展日新月异。大模型训练的热潮尚未消退,AI推理体验却已悄然成为AI应用的关键。在2025WAIC期间发布的白皮书指出,AI正从训练向推理的结构性转变而快速增长。在这样的大背景下,AI推理体验的重要性愈发凸显。

  推理体验直接关系到用户与AI交互时的感受,包括回答问题的时延、答*度以及复杂上下文的推理能力等方面。资料显示,国外主流模型的单用户输出速度已进入200 Tokens/s区间(时延5ms),而我国普遍小于60Tokens/s(时延50 - 100ms),如何解决推理效率与用户体验的难题迫在眉睫。

  据介绍,华为此次发布的AI推理创新技术UCM(推理记忆数据管理器),作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 胖东来国庆假期销售额已达6.81亿,今年已超180亿,此前于东来称2025年要控制在200亿内
  • 俄称乌克兰无人机攻击新沃罗涅日核电站,未造成实质破坏
  • 美国证券交易委员会就 AppLovin 数据收集行为展开调查
  • 河南焦作红白事路口相逢拉起红布让婚车先行,白事主家回应
  • 印尼学校建筑物坍塌事故致67人死亡搜救工作结束
  • 30年后摘得诺奖,一个叛逆“东亚小孩”的胜利
  • 宜家收购美国物流科技公司Locus,助力线上业务扩张
  • 巴布亚新几内亚莱城附近发生6.6级地震
  • 洲际交易所将向博彩平台Polymarket投资20亿美元
  • 美国财长贝森特任命Derek Theurer履行副财长职责
  • 三十载耕耘,252颗星:青年写作如何回应时代?
  • 摩根大通美债客户调查显示净多头占比创一年新低
  • 特朗普称加征进口税将推动本土生产,肯塔基州经济与美国贸易政策博弈
  • 突发!泰国宣布:救市!
  • 纽约证交所母公司洲际交易所入股Polymarket,投资20亿美元
  • 巴布亚新几内亚发生6.6级地震,震源深度100千米
  • 矿产勘探公司Trilogy Metals盘前股价暴涨超220% 美国政府入股10%
  • 四中全会前,人民日报连发八篇钟才文,传递什么信号
  • 美国股指期货暂时难觅方向 对科技股泡沫的担忧渐强
  • 俄乌称击落对方大量无人机
  • 黑龙江齐齐哈尔市泰来县发生3.2级地震,震源深度10千米
  • IBM股价盘前大涨 与Anthropic达成企业级人工智能软件合作协议
  • 比特币挖矿股盘前上涨 受比特币价格和数据中心推动
  • 美联储戴利:AI泡沫暂不威胁金融稳定
  • 卡塔尔外交部:谈论新一轮加沙停火谈判结果为时尚早
  • 美可能供乌“战斧”导弹,俄方:或成俄乌局势重大升级节点
  • 假期返程最后一天降雨+降温!北方同期少见的秋雨来了
  • 对话珠峰暴雪亲历者:嘎玛沟300多游客如何脱困?
  • ETF爆发式增长!“打包式”投资趋势显现
  • 万人说新疆·图说新疆|穿越六代国门看百年口岸变迁
  • 最高法征求意见!上市公司财务造假,高管要退回高薪酬
  • 重磅消息,暴涨超200%!关税突发,11月1日起生效!
  • 法国国债市场已在多大程度上消化重新选举风险 高盛与花旗各执己见
  • 赛事“发令”经济“开跑”国庆黄金周体育消费成增长新引擎
  • 美国政府关门将如何结束?
  • 共赏同一轮明月诉说同一份思念
  • 巴勒斯坦记者机构:加沙已成现代史上最大记者坟场
  • 巴以停火谈判首日,氛围积极但分歧难弥
  • 美政府停摆导致经济数据真空 凯雷数据揭示美国就业市场疲态
  • 很重要!香港最近规范了“内地”的英文翻译
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码