硅基流动业务提速,小厂如何在大模型行业搏空间?

音符科技网

界面新闻记者 | 伍洋宇

界面新闻编辑 | 文姝琪

2025年初,凭借在DeepSeek V3及R1爆火前后的迅速反应,硅基流动赶在2月1日上线了基于国产芯片服务的前述两款模型,赚得了市场一 *** 关注及用户。

彼时,硅基流动的更多目标用户指向C端(消费者端),认为企业端用户的大模型部署场景和需求还不甚明朗。近半年时间过去,公司透过已注册的700万用户、1万余家企业用户观察到了变化。

硅基流动联合创始人胡健告诉界面新闻记者,团队发现多数企业从最开始的尝试心态逐渐变为发现了更多可落地的场景(例如智能办公、能源领域系统级优化等),并且走到了可以批量部署的阶段。

在这个时间点,公司正式推出了企业级MaaS(模型即服务)平台,涉及异构算力纳管、模型训练、推理部署等一系列环节。平台预集成了一批主流开源与闭源大模型,提供多种算力卡推理加速包,新模型可在1-3天完成适配并同步至企业私有环境。

自AI大模型成为创业风口以来,在模型层与应用层的热点接续中,一批提供MaaS平台的中间层企业找准定位成长起来,意图成为这片领域稳固的基础设施。硅基流动正是其中一家。

在此之前,企业部署大模型的难题已经得到了总结,模型筛选成本高、适配周期长、性能成本高、模型升级导致的作业不顺畅等等。硅基流动的核心目标,就是通过公有云的方式加快对模型和用户需求的感知,同时弥补国产芯片软件生态,提升算力运营效率,支持企业对大模型能力的“开箱即用” 。

面对同样提供MaaS服务的云厂商们,硅基流动绕不开的是差异化竞争话题。 

异构算力是其中一个重要维度。胡健提到,现有企业客户中国企占比相对较高,通常掌握大量国产芯片,模型部署往往要建立在异构算力基础上,而国产芯片从能用到好用还存在优化空间。因此,针对国产芯片进行模型适配与推理加速,以达到英伟达等海外厂商同等规格的GPU表现,成为MaaS平台的主要任务之一。 

硅基流动为此构建了闭源的大模型推理引擎,覆盖英伟达、AMD、昇腾、沐曦、摩尔等主流芯片厂商,其能力尤为体现在新模型的适配速度上。 

例如,国产卡从前被诟病对新模型适配周期较长,从数周到数月不等。对此,胡健表示,如果是基于硅基流动的国产芯片公有云,一个72B的稠密模型可以做到当天上线,MoE架构模型最快可以在1-2天内上线。 

对模型层和算力层的理解,以及对其产品的洞察,可能很大程度上决定了中间层公司的先发优势。胡健回忆称,DeepSeek V3和R1上线之前,对方团队曾建议配备40台H100机器,出于成本考量,硅基流动决定与华为昇腾合作,及时为市场提供了适配国产芯片的V3及R1模型。

回头看,这个决策无比正确且重要。“我们最开始的时候用户基数可能不到50万,一个月不到的时间涨到了500多万,翻了10倍左右。”胡健说。但与R1的爆火难以复制是一样的,这样的时机在业内也很难再出现了。

当前更常规的做法还是采取市场思维,在新模型出现后及时测评,如果达到要求,先快速适配一两台机器验证流量,随着规模的扩大再做弹性跟进。“但其实市面上永远是二八定律,百分之二三十的模型占据了百分之八十的流量。”

在商业模式上,MaaS平台还有需要摸索的路。目前,项目制收费和token消耗计费是两大主流付费模式,但前者存在一定规模化的限制,而后者则要考虑token价格会越来越便宜。胡健推测,参考电力模式,未来token费用或许会根据不同行业、不同应用出现类似工业用电、农业用电的分级收费制度。在此基础上,他认为市场还在不断加速扩张。

IDC数据显示,2024年12月,中国公有云大模型日均tokens调用量9522亿,是2024年6月日均调用量963亿次的近10倍。随着模型层的推陈出新,以及应用层的新产品不断涌现,行业普遍认为AI算力的消耗长期仍呈现大幅上升趋势。

在这么大增长的情况之下,我们一个小厂,有自己的使命,也有自己的生存空间。”胡健认为,市场远未到竞争的态势,而是属于大模型应用服务的偏中早期阶段。

并且,随着模型和应用走向多元化,中间层公司也有采取纵向发展的机会,就某一个领域的具体场景将模型、功能以及行业特性绑定更深,最终形成差异化的生存路径。

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 特朗普称加沙人质将于周一或周二获释
  • 欧洲债市:法国总统物色新总理之际 法国国债利差趋稳
  • 国家防总办公室向广西调拨2.3万件中央应急抢险救灾物资
  • 达拉斯联储研究:移民放缓令劳动力市场再平衡 就业降温非疲软信号
  • 1522米的深海“源火”,点燃了什么?
  • 前谷歌CEO埃施密特警告人工智能模型可被黑客攻击,称 “它们会学会杀人方法”
  • 特朗普对H-1B签证的改革如何影响大型科技公司
  • 午盘:美股小幅下滑,此前纳指与标普创盘中新高
  • 黄金年度大涨背后的另一面
  • 以色列推迟内阁会议2小时,停火协议投票延后
  • 加沙停火协议生效,红海危机警报有望解除
  • 欧盟将调查匈牙利涉嫌进行间谍活动的指控
  • 美国财长贝森特称赞赤字占GDP比率下降 预计退税潮将至
  • 网友凭地铁延误证明免迟到,客服:证明仅作情况说明,采纳权在单位
  • 陈仓:我是土豆
  • 国内商品期市夜盘收盘多数上涨,黑色系涨幅居前
  • 结交政治骗子,对抗组织审查,李明月被“双开”
  • 叙利亚北部停火后再次爆发冲突
  • “币圈老人”贾跃亭
  • 刘和平:赖清德自作聪明又出怪招,却一巴掌拍在了特朗普的马蹄上
  • 深圳半导体新王诞生
  • 男子高速开车时,金项链被孩子一把扯断甩出车外!夫妻俩直接停车,冲向绿化带埋头找,交警:命重要还是东西重要?
  • 十八军老战士黄继辉:难忘西藏公学的峥嵘岁月
  • 长安汽车:阿维塔科技已向华为支付完毕购买引望10%股权的全部价款总金额115亿元
  • 谷歌云进军AI办公市场 对标微软和OpenAI企业版产品
  • 长安汽车:阿维塔科技已向华为支付完毕购买引望10%股权的全部价款,总金额115亿元
  • 两名中国游客在马来西亚一海岛失联5天,失联前画面曝光
  • 花旗上调拖拉机供应公司评级至"买入"并提高目标股价
  • 特斯拉“完全自动驾驶”再遭联邦安全调查
  • 纽约联储行长威廉姆斯称支持今年进一步降息
  • 天合光能:已回购1867.98万股,使用资金总额3.1亿元
  • 鲍威尔在社区银行会议上致开幕辞,未提及货币政策议题
  • 阿斯麦宣布任命新任首席技术官
  • 再掰手腕,中美祭出各自的王炸
  • 部分股票折算率调整为0?系常规操作,无需过度解读
  • 天润乳业:拟使用不超过3.2亿元闲置募集资金进行现金管理
  • 10月9日晚间重要公告集锦
  • Netflix正将视频游戏引入电视屏幕以拓展游戏业务
  • 半导体板块午后跳水!中芯国际收跌 华虹公司炸板 发生了什么
  • 加拿大辛塔纳能源同意收购挑战者能源公司
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码