中国移动“芯易”存算一体通用软件计算引擎入选“中央企业算力 *** 创新联合体十大成果”

音符科技网

10月12日上午,在全球合作伙伴大会算力 *** 联合创新分论坛上,“中央企业算力 *** 创新联合体十大成果”正式发布,中国移动“芯易”存算一体通用软件计算引擎成功入选“中央企业算力 *** 创新联合体十大成果”并在论坛发布。

存算一体技术通过器件、计算范式、架构等方面的革新,大幅提升算力和能效水平,同时降低对先进工艺的依赖,为提升我国先进算力自主可控提供了一条可选路径。中国移动聚焦存算一体软件生态薄弱痛点,自主研发“芯易”存算一体通用软件计算引擎,联合清华大学、后摩智能、知存科技完成RRAM、SRAM、NOR-Flash三大技术路线芯片的兼容适配,无缝对接Pytorch和TensorFlow 主流AI框架,引领产业加速构建存算一体软件生态。

在AI时代全球算力需求呈爆炸式增长的背景下,存算一体技术突破冯·诺依曼架构瓶颈,为AI计算提供高性能、低成本的算力解决方案。当前存算一体多技术路线并行发展,存算一体软件存在软硬件强耦合及“孤岛式”开发问题,导致软件生态薄弱,同时AI模型与存算一体芯片适配难度大,面临集成规模受限、计算效率饱和、精度鲁棒性低、模型编排复杂等问题,加上应用牵引不足,最终阻碍了存算一体技术的应用推广。

针对上述问题,中国移动自主研发“芯易”通用存算一体软件计算引擎,创新提出了面向存算一体架构的模型裁剪量化、模型推理优化、协同精度优化、权重智能编排等优化算法,软硬协同发挥芯片性能,并在智能推荐、端侧大模型、巡检等场景率先完成应用验证,加速存算一体技术成熟。

在架构创新方面,中国移动提出面向异构存算一体芯片的通用计算架构,向上兼容Pytorch、Tensorflow通用AI框架,向下适配RRAM、SRAM、FLASH三种主流技术路线的存算一体芯片,研发编译器、运行时、优化器等核心组件,为存算一体芯片提供模型编排、部署、优化、推理等全流程服务,极大降低模型部署、应用、迁移的门槛,推动产业生态发展。

“芯易”EasyCIM存算一体通用软件计算引擎架构图

在算法创新方面,针对存算一体阵列集成规模受限、器件支持位宽低的问题,提出一种面向存算一体架构的模型裁剪量化算法,基于剪枝、量化和局部残差策略,将语义分割 *** 参数从近2800万个精简至不超过50万个,近一半模型参数使用超低比特表示,大幅降低模型尺寸与计算量。

面向存算一体架构的模型裁剪量化算法结构及结果

针对存算一体计算效率饱和、模型适配难的问题,提出一种面向存算一体芯片的模型推理优化算法,通过引入多分支参数结构、利用大卷积核替代级联小卷积核并结合结构重参数化策略,提升AI模型与存算一体芯片的适配度,优化后的ResNet50 *** 在存算一体芯片的推理速率提升40%、精度提升1.5%。

向存算一体架构的模型推理优化算法结构及结果

针对存算一体器件、电路非理想特性导致精度鲁棒性低的问题,提出一种面向存算一体芯片的AI模型协同精度优化 *** ,在模型训练阶段引入存算一体芯片上的推理结果进行反向传播并更新模型权重,基于该 *** 优化的图像识别算法准确率提升10%。

面向存算一体架构的模型协同精度优化算法框架及结果

针对存算一体芯片模型编排复杂度高、阵列利用率低的问题,提出一种面向存算一体架构的模型权重智能编排算法,基于序列到序列的指针 *** 生成AI模型分层排序,编排效率相比传统人工蜂群算法(ABC)提升10倍以上。

面向存算一体架构的模型权重智能编排算法结构及结果

在应用创新方面,中国移动基于“芯易”存算一体通用软件计算引擎实现了智能推荐、端侧大模型、巡检机器人等一系列存算一体创新应用,牵引应用落地。

在RRAM方面,中国移动联合清华大学将RRAM存算一体向量检索芯片应用到智能视频推荐场景,基于存算一体软件计算引擎实现视频向量在VD200 RRAM存算一体向量检索芯片的部署和查询,支持百万级向量部署和检索,视频推荐召回服务吞吐率达2万次/秒,检索性能达到传统服务器4倍。

基于RRAM存算一体芯片的视频推荐应用

在SRAM方面,中国移动联合后摩智能将存算一体芯片应用到大模型端侧推理场景,基于“芯易”存算一体软件计算引擎实现ChatGLM-6B、Qwen-7B、LLAMA2-7B大语言模型在M30 SRAM存算一体芯片上的优化推理,推理速度达15Tokens/s,相比传统架构计算芯片token生成速度提升1倍、计算能效提升50%。

基于SRAM存算一体芯片的端侧大模型推理应用

在NOR-FLASH方面,中国移动联合知存科技将存算一体芯片应用到智能巡检机器人场景,基于“芯易”存算一体软件计算引擎实现轻量化语音AI模型在WTM2101 NOR-FLASH存算一体芯片的协同精度优化和自动化编排,支持语音控制机器人启停、移动、转向,提升巡检机器人作业效率50%以上。

基于NOR-Flash存算一体芯片的巡检机器人应用

中国移动存算一体团队深耕技术创新,依托自主研发的"“芯易"”存算一体通用软件引擎及核心算法,已形成显著学术与产业影响力,在《IEEE/CAA Journal of Automatica Sinica》(IF=11.8)《IEEE Transactions on Mobile Computing》(IF=9.2)等国际顶级期刊,以及ISCA、UbiComp、EMNLP等国际顶级会议发表论文10余篇;累计申请发明专利70余项、软著10余项。相关成果先后入选2024论坛重大科技成果、2023年“科创中国”先导技术榜、2023年世界互联网大会领先科技成果,并斩获2024数字中国创新大赛智能科技赛道一等奖、2024年第二届全国先进计算技术创新大赛二等奖,获得业界高度认可。与此同时,团队积极联动产业生态,联合后摩智能、知存科技等存算一体芯片厂商,在先进计算产业发展联盟牵头推进存算一体通用软件工具链研究,于2024年11*第二届全体会议上完成《存算一体软件工具链研究报告》结项及成果发布,为存算一体软件架构与接口标准化建设注入关键推力。

未来,中国移动将持续攻关存算一体软硬件协同技术,拓展基于存算一体的创新应用场景,积极推进存算一体软件标准建设,持续引领产业加速构建存算一体软件生态。

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • OpenAI与博通签署芯片和网络设备合作协议 博通股价应声上涨
  • 花有已任外交部驻香港特别行政区特派员公署副特派员
  • 厄瓜多尔发生袭击事件,已致6死15伤
  • 吉伦沃特因兴奋剂违规被中国篮协禁赛3个月
  • 突然,库克现身上海!苹果重大官宣!
  • 水利部专题部署长江黄河流域秋汛防御工作
  • 律师解读成都天府大道车祸法律责任,称车门打不开或可向车企索赔
  • 餐饮店鸭腿套餐吃出活蛆?市监部门:对相关情况正进一步调查核实
  • 诺奖得主菲利普·阿吉翁:技术革命会导致大规模失业吗?
  • 三位诺奖得主破解持续增长谜题,技术创新与开放是“王道”
  • 诺贝尔经济学奖获得者:发财不一定需要知识,但经济增长需要
  • 国足有望下月重组,足协加紧物色热身对手
  • 现货黄金向上触及4090美元/盎司
  • 中国人寿:实施半年度A股利润分配 股权登记日10月16日
  • 贵州一珠宝店价值百万黄金被盗?店方:900多克黄金被窃,价值90余万
  • OPEC在持续增加供应之际维持石油市场展望不变
  • 云南荒野之国景区致歉,已拆除争议作品
  • 库克在中国“直播带货”,宣布iPhoneAir将于10月22日开售
  • 丽江荒野之国致歉:已拆除部分有争议艺术作品
  • 2025金融街论坛年会将于10月27日至30日举行
  • 晚间突发!A股公司董事被拘留
  • 2025可持续全球领导者大会将在沪举行,诺奖得主等参会
  • eSIM手机来了!苹果iPhone Air定于10月22日发售,三大运营商均支持
  • 丽江一景区“人体蜈蚣”等作品被指观感不适,回应:已拆除
  • 法国新内阁举行首次工作会议,渡过政治危机成首要任务
  • 官方通报鸭腿套餐被发现有“活蛆”:涉事经营户已自行停业整改
  • 开盘:美股周一高开 特朗普释放愿意谈判信号
  • 刚刚!逼空!
  • 今年诺奖理论的中国启示:让资源配置从“内卷”转向“颠覆”
  • 青春华章丨人这一辈子,一定要赴一场江苏的江河湖海之约!
  • 国内期货夜盘开盘涨跌不一,沪金涨1.66%
  • 创年内次高!本周52只公募新基开启募集,权益基金占主导
  • Salesforce计划五年内向旧金山投资150亿美元
  • OpenAI携手博通打造首款自研人工智能芯片,达成最新芯片合作协议
  • 巴勒斯坦总统与法国总统举行会谈,讨论加沙停火协议问题
  • 夜读|暗夜微光
  • 广东一男子坚持AA制,妻子手术费、孩子学费都要写欠条,律师解读
  • 未按规定履行信披义务,北方稀土收警示函
  • 山西多个服务区被指厕所正面不开门得绕道,交控集团:想让大家多停留
  • 居然智家实际控制人变更为杨芳 通过继承等方式合计控制43.93%股份
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码