英伟达,发布新GPU

音符科技网

全球人工智能算力芯片龙头英伟达周二宣布,推出专为长上下文工作负载设计的专用 GPU Rubin CPX,用于翻倍提升当前 AI 推理运算的工作效率,特别是编程、视频生成等需要超长上下文窗口的应用。

英伟达 CEO 黄仁勋表示,CPX 是首款专为需要一次性处理大量知识(数百万级别 tokens),并进行人工智能推理的模型而构建的芯片。

需要说明的是,Rubin 就是英伟达将在明年发售的下一代顶级算力芯片,所以基于 Rubin 的 CPX 预计也要到 2026 年底出货。下一代英伟达旗舰 AI 服务器的全称叫做 NVIDIA Vera Rubin NVL144 CPX ——集成 36 个 Vera CPU、144 块 Rubin GPU 和 144 块 Rubin CPX GPU。

(NVIDIA Vera Rubin NVL144 CPX 机架与托盘,来源:公司博客)

英伟达透露,搭载 Rubin CPX 的 Rubin 机架在处理大上下文窗口时的性能,能比当前旗舰机架 GB300 NVL72 高出最多 6.5 倍。

据悉,下一代旗舰机架将提供 8exaFLOPs 的 NVFP4 算力,比 GB300 NVL72 高出 7.5 倍。同时单个机架就能提供 100TB 的高速内存和 1.7PB/s 的内存带宽。

言归正传,英伟达之所以要在 Rubin GPU 边上再配一块 Rubin CPX GPU,自然是为了显著提升数据中心的算力效率——用户购买英伟达的芯片将能赚到更多的钱。英伟达表示,部署价值 1 亿美元的新芯片,将能为客户带来 50 亿美元的收入。

为何需要不同的 GPU?

作为行业首创之举,英伟达的新品在硬件层面上分拆了人工智能推理的计算负载。

英伟达介绍称,推理过程包括两个截然不同的阶段:上下文阶段与生成阶段,两者对基础设施的要求本质上完全不同。

上下文阶段属于计算受限(compute-bound),需要高吞吐量的处理能力来摄取并分析大量输入数据,从而生成首个输出 token。相反,生成阶段则属于内存带宽受限(memory bandwidth-bound),依赖高速的内存传输和高带宽互联(如 NVLink),以维持逐个 token 的输出性能。

当前顶级的 GPU 都是为了内存和 *** 限制的生成阶段设计,配备昂贵的 HBM 内存,然而在解码阶段并不需要这些内存。因此,通过分离式处理这两个阶段,并针对性地优化计算与内存资源,将显著提升算力的利用率。

据悉,Rubin CPX 专门针对 " 数百万 tokens" 级别的长上下文性能进行优化,具备 30petaFLOPs 的 NVFP4 算力、128GB GDDR7 内存

英伟达估计,大约有 20% 的 AI 应用会 " 坐等 " 首个 token 出现。例如解码 10 万行代码可能需要 5-10 分钟。而多帧、多秒的视频,预处理和逐帧嵌入会迅速增加延迟,这也是为什么当前的视频大模型通常仅用于 *** 短片。

英伟达计划以两种形式提供 Rubin CPX,一种是与 Vera Rubin 装在同一个托盘上。对于已经下单 NVL144 的用户,英伟达也会单独出售一整个机架的 CPX 芯片,数量正好匹配 Rubin 机架。

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 中国保险投资基金等在厦门成立新合伙企业,出资额50亿元
  • 日本决定关闭所有在俄罗斯的改革技术援助中心
  • iPhone Air牵手联通推出eSIM手机!电信移动亦有准备,哪些A股厂商有望受益
  • 0910热点追踪:矿端复产预期升温,碳酸锂回归8月初低位
  • 道氏技术:已签订年产1000吨硅碳负极项目投资协议
  • 超200亿主力资金狂涌!苹果新品发布,果链含量42%的电子ETF(515260)猛拉3.4%!基金经理火线解读!
  • 伟大胜利光耀千秋——中国人民抗日战争暨世界反法西斯战争胜利80周年纪念活动启示录(一)
  • 日韩股市收创历史新高 日经225指数收涨0.9% 韩股涨1.7%
  • 年度网络爆梗,为什么是一碗丝瓜汤
  • 台积电8月销售额增长34% 再次彰显AI芯片需求强劲
  • Bernstein:市场严重低估诺和诺德(NVO.US)减肥药潜力 上调评级至“跑赢大盘”
  • 北京援藏指挥部党委书记王明哲提名海淀区人大常委会主任人选
  • 沙特二季度经济增速达3.9% 非油部门贡献2.7个百分点
  • AI初创公司Reflection最新融资估值或达55亿美元,背后有英伟达撑腰!
  • 炒股看盘软件排行榜前十名:新浪财经APP、同花顺、东方财富等居前三
  • 自然资源部: 对极端天气增多事件加强研究,提高预警及时性和有效性
  • 苹果的特殊照顾:iPhoneAir韩国官网没有捏合手势动画
  • 中国移动:已支持eSIM手机业务办理,开放服务后将另行告知
  • 军工新质生产力利好频出,菲利华、海格通信领涨!国防军工ETF(512810)回暖涨逾1%
  • 资金加仓低位板块!全市场唯一地产ETF(159707)获净申购1150万份!机构建议逢低配置地产股
  • 澳新银行全球市场负责人离职 是最新一位受到大规模改组影响的高管
  • 抖音:加码扶持线下中小餐饮商家
  • 腾鸿精密现涨近12% 公司积极拥抱AI时代机构称盈利增长可期
  • AI预见未来 新浪财经携手经济学家走进中控技术 揭秘时间序列大模型如何变革流程工业
  • 最重大再平衡!全球央行黄金储备29年来首超美债
  • 易会满公子的大瓜
  • 黄金价格短期整理或回调 3600美元构成初步支撑
  • 胜宏科技成交额达200亿元,现涨超14%
  • 赵韵东出席服贸会第七届中国金融科技论坛
  • “小核酸第一股”圣诺医药首席执行官独家回应华熙生物入股
  • 韩国宣布设立150万亿韩元基金,支持对人工智能等先进产业的投资
  • 化工ETF(516020)午后跌幅收窄,近10日吸金超10亿元!机构看好景气周期或至
  • 寒武纪又行了?近40亿定增获批,国产AI王者归来!科创人工智能ETF(589520)盘中拉升2.6%,买盘资金强势!
  • 起飞!运-20赴韩接英雄回家
  • 香飘飘奶茶珍珠保质期内发霉变绿,官方回应
  • 27省份青年入乡调研:还需更多制度性支持与政策性保障
  • 市场风向骤变!日本央行“鹰声”盖过政治风险,对冲基金加大押注日元反弹
  • “旗手”躁动,顶流券商ETF(512000)高频溢价,近20日“疯狂吸金”超60亿元
  • 涉及交通、原料药等民生行业,最高法发布反垄断典型案例
  • 邦达亚洲:多重利空因素打压 美元日元小幅收跌
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码