DeepSeek R2有望8月下旬发布?内部人士:不属实

音符科技网

近日有市场传言称,国产大模型公司深度求索旗下DeepSeek R2有望在8月15日至30日期间发布。

8月13日,DeepSeek内部人士向澎湃新闻记者表示,上述消息不属实。

早在今年4月,就有传言称,深度求索可能将在5月推出下一代AI大模型DeepSeek-R2。当时有报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合更加智能的门控 *** 层(Gating Network)以优化高负载推理任务的性能。

不过,上述内部人士曾向记者坦言,该传言真实度不高。

此后,DeepSeek官宣推出R1新版本,业内普遍认为这是取代了R2的发布。

5月29日,据DeepSeek公告,DeepSeek R1模型已完成小版本升级,当前版本为DeepSeek-R1-0528。用户通过官方网站、APP或小程序进入对话界面后,开启“深度思考”功能即可体验最新版本。API也已同步更新,调用方式不变。

公告指出,DeepSeek-R1-0528使用2024年12月所发布的DeepSeek V3 Base模型作为基座,但在后训练过程中投入了更多算力,显著提升模型的思维深度与推理能力。更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。

相较于旧版R1,新版模型在复杂推理任务中的表现有显著提升。例如在AIME2025测试中,新版模型准确率由旧版的70%提升至87.5%。这一进步得益于模型在推理过程中的思维深度增强:在AIME2025测试集上,旧版模型平均每题使用12K tokens,而新版模型平均每题使用23Ktokens,表明其在解题过程中进行了更为详尽和深入的思考。

大模型行业的内卷正在加剧。7月31日,据国际开源社区Hugging-Face最新趋势热榜显示,前十名模型中,有9个是国产大模型,其中排名之一的是智谱最新发布的新一代旗舰大模型GLM-4.5,排名第二的是阿里旗下通义千问模型Qwen3,而腾讯混元最新发布的3D模型则排行第三。

但据排名数据显示,DeepSeek R1在Hugging-Face趋势热榜中并不靠前,不过其依然是目前点赞最多的大模型,DeepSeek R1收到了1.25万个赞(like),远超其他国产大模型。

在年初成为大模型产业王炸黑马后,DeepSeek成为国内大模型厂商的集体竞标对手,包括MiniMax、月之暗面等知名大模型公司或明或暗都提出了对标DeepSeek的目标,且在更新迭代上进展迅速。作为中国开源大模型的“风向标”,DeepSeek正在面临更激烈竞争。

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 叙利亚政权武装宣布与“叙利亚民主力量”达成全面停火协议
  • 世卫组织发布烟草趋势报告,强调应加强监管电子烟
  • 欧洲议会议员讲述被以色列拘禁经历遭议长打断
  • 辞去法国总理的勒科尔尼只有48小时能谈出什么?
  • 铜价逼近2024纪录高位!供应中断+美元走弱+黄金带飞,还能涨多久?
  • 胖东来国庆假期销售额已达6.81亿,今年已超180亿,此前于东来称2025年要控制在200亿内
  • 俄称乌克兰无人机攻击新沃罗涅日核电站,未造成实质破坏
  • 美国证券交易委员会就 AppLovin 数据收集行为展开调查
  • 河南焦作红白事路口相逢拉起红布让婚车先行,白事主家回应
  • 印尼学校建筑物坍塌事故致67人死亡搜救工作结束
  • 30年后摘得诺奖,一个叛逆“东亚小孩”的胜利
  • 宜家收购美国物流科技公司Locus,助力线上业务扩张
  • 巴布亚新几内亚莱城附近发生6.6级地震
  • 洲际交易所将向博彩平台Polymarket投资20亿美元
  • 美国财长贝森特任命Derek Theurer履行副财长职责
  • 三十载耕耘,252颗星:青年写作如何回应时代?
  • 摩根大通美债客户调查显示净多头占比创一年新低
  • 特朗普称加征进口税将推动本土生产,肯塔基州经济与美国贸易政策博弈
  • 突发!泰国宣布:救市!
  • 纽约证交所母公司洲际交易所入股Polymarket,投资20亿美元
  • 巴布亚新几内亚发生6.6级地震,震源深度100千米
  • 矿产勘探公司Trilogy Metals盘前股价暴涨超220% 美国政府入股10%
  • 四中全会前,人民日报连发八篇钟才文,传递什么信号
  • 美国股指期货暂时难觅方向 对科技股泡沫的担忧渐强
  • 俄乌称击落对方大量无人机
  • 黑龙江齐齐哈尔市泰来县发生3.2级地震,震源深度10千米
  • IBM股价盘前大涨 与Anthropic达成企业级人工智能软件合作协议
  • 比特币挖矿股盘前上涨 受比特币价格和数据中心推动
  • 美联储戴利:AI泡沫暂不威胁金融稳定
  • 卡塔尔外交部:谈论新一轮加沙停火谈判结果为时尚早
  • 美可能供乌“战斧”导弹,俄方:或成俄乌局势重大升级节点
  • 假期返程最后一天降雨+降温!北方同期少见的秋雨来了
  • 对话珠峰暴雪亲历者:嘎玛沟300多游客如何脱困?
  • ETF爆发式增长!“打包式”投资趋势显现
  • 万人说新疆·图说新疆|穿越六代国门看百年口岸变迁
  • 最高法征求意见!上市公司财务造假,高管要退回高薪酬
  • 重磅消息,暴涨超200%!关税突发,11月1日起生效!
  • 法国国债市场已在多大程度上消化重新选举风险 高盛与花旗各执己见
  • 赛事“发令”经济“开跑”国庆黄金周体育消费成增长新引擎
  • 美国政府关门将如何结束?
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码