DeepSeek论文登上《自然》封面,R1成为首个严格学术审查大模型

音符科技网

9月18日,由DeepSeek(深度求索)团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然(Nature)》的封面。

DeepSeek R1成为首个通过同行评议的主要大语言模型,发表在《自然》杂志的新版DeepSeek-R1论文,与今年1月未经同行评审的初版有较大差异。

在同行评议过程中,DeepSeek团队根据评审意见减少了对模型的拟人化描述,并增加了模型训练的技术细节说明,包括模型训练数据类型和安全性考虑等,并回应了此前关于知识蒸馏的质疑。

DeepSeek明确否认了此前关于其使用OpenAI模型输出进行训练的质疑。在长达64页的同行评审文件中,DeepSeek介绍,DeepSeek-V3 Base(DeepSeek-R1的基座模型)使用的数据全部来自互联网,虽然可能包含GPT-4生成的结果,但绝非有意而为之,更没有专门的蒸馏环节。

DeepSeek还透露,为了防止基准测试数据污染,对DeepSeek-R1的预训练和后训练数据都实施了全面的去污染措施。

开源之后,R1在Hugging Face下载量破1090万次,成为全球更受欢迎的开源推理模型。

DeepSeek首次公开了仅靠强化学习,就能激发大模型推理能力的重要研究成果,从而启发全球AI研究者。DeepSeek R1的核心创新在于采用了“纯强化学习”这一自动化试错 *** ,R1通过奖励模型达到正确答案的行为来学习推理策略,而非传统模仿人类预设的推理模式。

在补充材料中,DeepSeek团队还首次公开了R1训练成本仅为29.4万美元。这个金额即使加上约600万美元的基础模型成本,也远低于OpenAI、谷歌训练AI的成本。

今年1月,当DeepSeek R1模型发布时,其卓越的推理能力和极低的开发成本曾引发全球科技股大幅下跌。

作为全球首个通过同行评审的主流大语言模型,《自然》期刊不但将该篇论文作为封面论文,还在评论报道文章中用了“里程碑式论文揭示 DeepSeek AI 模型的秘密”、“创造历史”表达赞赏和肯定,此次论文发表标志着中国在大模型基础研究领域取得重要突破。

在AI行业快速发展中,未经证实的说法和炒作不在少数。《自然》杂志认为,随着AI技术日渐普及,大模型厂商们无法验证的宣传可能对社会带来真实风险。依靠独立研究人员进行的同行评审,是抑制AI行业过度炒作的一种有效方式。而DeepSeek所做的一切,是非常值得欢迎的先例。

8月21日,DeepSeek正式发布了最新大语言模型DeepSeek-V3.1。

据DeepSeek介绍,新升级版本的变化主要体现在三个方面:混合推理架构、更高的思考效率、更强的Agent(智能体)能力。DeepSeek-V3.1实现了一个模型同时支持思考模式与非思考模式。

DeepSeek是2023年成立于杭州的人工智能公司,由幻方量化孵化。创始团队由梁文锋领衔,成员来自顶尖高校与国际机构技术专家。

 

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 小鹏汽车销量回升,带动广州一季度GDP增长3%
  • 半导体圈惊叹:荷兰“抢劫”闻泰科技
  • 王洪飞已任中央纪委国家监委驻中储粮纪检监察组组长
  • 爆发“激烈战斗”!乌军出动远程无人机
  • 闻泰科技突遭“黑天鹅”,核心半导体子公司控制权被暂时架空
  • 泽连斯基同特朗普通电话,继续讨论加强乌防空系统
  • 以方称以军已撤离至“黄线”,以被扣押人员预计于13日凌晨获释
  • 【财富周刊】ETF总规模再创历史新高,9月以来黄金ETF规模增长超209亿元
  • 新华社评论员:共同谱写全球妇女事业发展新篇章
  • 601615,拟在苏格兰投资142亿元,建设海上风电项目!
  • 黄河即将发生2025年第1号洪水
  • 以色列代表将不会出席在埃及举行的和平峰会
  • 赏秋色品文化逛小城“加长版”假期再掀文旅热潮
  • 又一家18C章特专科技企业通过聆讯,滴普科技2025年上半年营收同比大增118.4%
  • 姚明满45岁正式领NBA养老金:每年2.2万美元50岁3.3万62岁18万
  • 智驾最后的窗口期,冲出AI新玩家
  • 房价下跌后经营贷套利链条断裂,多张罚单曝银行审查漏洞
  • 英伟达盼了5个月,盼来一场政治算计
  • 加沙停火协议生效后的48小时:人质释放、民众返乡、援助物资涌入
  • 传承党的新闻工作者优良传统,《肖鸣锵文集》出版
  • ETF总规模再创历史新高,9月以来黄金ETF规模增长超209亿元
  • 资格赛选手瓦舍罗夺得上海网球大师赛单打冠军
  • 闻泰科技147亿资产被冻结背后,荷兰为何突然出手这么狠
  • 巴基斯坦与阿富汗在边境地区交火
  • 梁志敏,严重违纪违法
  • 5岁男童在幼儿园被戳伤眼睛处于失明状态,被告知“监控坏了”,男童妈妈:联系不上对方家长和园方,希望公开监控明确责任
  • 韩国大学生在柬埔寨被折磨致死,李在明发声
  • 跨省份履新后,韦朝晖已任湖南怀化市政府党组书记
  • 未成年人检察题材悬疑微短剧《少年田野》在京举行看片交流会
  • 夜读|140年的坚守
  • 冲突以来数量最多400辆援助物资卡车将进入加沙
  • 小伙溺伤索赔271万案庭审,涉案公司提供证据:有人“偷砂”?
  • 【专访丨“希望中国继续发挥引领作用”──访联合国教科文组织前总干事博科娃】
  • 关键时刻!最新研判
  • 1.8nm vs 2nm:一场决定未来十年的芯片制程大战,刚刚开场!
  • 冲突以来数量最多,400辆援助物资卡车将进入加沙
  • 郭峰任中央团校(中国青年政治学院)党委书记
  • 全球白银市场正经历一场“流动性风暴”
  • 三天爆拉20%后,云南铜业紧急“泼冷水”:阴极铜等产品能否继续上涨存不确定性
  • 千人被困珠峰暴雪背后:疯狂徒步与失控的“内啡肽”
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码