OpenAI再次“Open”,开源模型GPT-oss有什么可以学?

音符科技网

界面新闻记者 | 伍洋宇

界面新闻编辑 | 文姝琪

过去几个月,OpenAI没有出现过什么激动人心的好新闻:新模型不再惊艳、重要人才流失,就连斥巨资想要收购的明星创业公司Windsurf,也被谷歌截了胡。

但这些问题还是要回到根本层面来解决,比如说再次发布一个足以受到普遍认可的新模型——这就是GPT-oss在这个节点出现的意义之一。

图片来源:OpenAI官网

8月6日凌晨,OpenAI宣布推出开源推理模型Gpt-oss,包含Gpt-oss-120B(激活参数5.1B)和Gpt-oss-20B(激活参数3.6B)两个参数大小,支持上下文128K。值得注意的是,这是OpenAI时隔六年再次开放权重。

从性能表现上来说,Gpt-oss-120B模型在核心推理基准测试中与OpenAI o4-mini几乎持平,Gpt-oss-20B则与OpenAI o3-mini取得类似结果。 

图片来源:OpenAI官网

就国产模型而言,综合公开数据,两款模型对比DeepSeek-R1、通义千问(Qwen3-235B-A22B)、智谱GLM4.5-Air、月之暗面Kimi K2等,除了个别维度,在AIME24/25、GPQA、MMLU等常规基准测试上普遍表现更好。

不仅如此,Gpt-oss-120B据称能够在单个80GB GPU上运行,Gpt-oss-20B可在仅配备16GB内存的设备上运行,这意味着两款模型或将迅速占领端侧设备本地推理的需求市场。

OpenAI还开门见山说明了两款模型均采用Apache 2.0许可证,也就是既可商用也可改造,基本没有使用限制。

开源决策与性能表现之外,本地部署的高效是Gpt-oss此次赢得业界认可的主要原因。 

OpenAI提到,两款模型的权重均可在Hugging Face上免费下载,且在后期训练阶段已原生量化为MXFP4格式——Mixed Format 4-bit Precision,是一种专为大模型推理打造的混合精度量化格式,目的在于保留关键信息的同时,把参数用更聪明的方式压缩成低精度。 

对比更为常见的FP16、FP8等,MXFP4能够在接近8-bit量化效果的同时,保留4-bit低精度量化速度快、内存小的特性,综合达成更好的模型性能表现。也就是说,它将一个“满血版”推理模型的本地部署门槛又大幅降低了。

一名AI领域实验室研究人员对界面新闻记者表示,他在本地部署了20B版本的Gpt-oss后,直接替换了同样本地部署的Gemma 3(12B),理由就是前者“快很多”,基本可以每秒输出45个token左右,而Gemma 3的速度在每秒30个token左右。并且在一些基础的思考题上,OpenAI可以给出更标准的答案。

他没有给予Gpt-oss过高的评价,因为现阶段的大模型彼此之间的性能差异已经很小,“谁免费,谁快,我就用谁。

不过,凭借Gpt-oss这款模型,OpenAI可能还是把DeepSeek-R1出现之后,它在开源世界缺乏的声量弥补了一些回来,也顺带轻轻回击了“CloseAI”这个持续已久的昵称。

复旦大学计算机科学技术学院教授张奇对界面新闻记者表示,根据其内部评测,他认为Gpt-oss在效果层面领先目前的DeepSeek和Qwen,这体现的还是OpenAI对模型的理论理解能力以及工程实现能力。 

他同时指出,这也说明了一个问题,即OpenAI还是没有从模型架构上实现巨大突破,而按照现有架构去实现AGI几乎没有可能性。

大模型成为全球科技领域焦点以来,中美之间的闭源模型竞争一直是更核心的话题,直到DeepSeek将开源模型的地位推至新高。而OpenAI在Gpt-oss上的补课,明显对既有局面有所扭转。眼下,国产开源模型可能有新的内功可供学习打磨了。

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 苹果继任计划:约翰·特努斯有望接替蒂姆·库克
  • 在太空过中秋!神二十乘组从“天宫”发来宇宙级祝福
  • AI战略又一重要布局将落地!联想(00992)收购高端存储企业Infinidat事宜或于年底前完成
  • 这场血腥战争,终于要打不下去了
  • 日经225指数首次站上47000点
  • 返程客流来了,铁路上海站今天预计到达旅客67.1万人次
  • “加沙刚发生轰炸”,美国务卿称以军暂停攻势遭美媒打脸
  • 快讯:恒指低开0.5% 科指跌1.12% 科网股走弱 黄金股普涨
  • 普京强硬警告:“战斧”若出,俄美翻脸!
  • 折磨人类的验证码,已经拦不住人机了?
  • 日经225指数日内涨超4%
  • OPEC+小幅增产的决定缓解部分市场担忧 油价上涨
  • 美国一地发生大规模枪击事件,多人死伤!警察局长发声
  • 报告:前三季度房企融资规模3072亿元
  • 体坛联播|巴萨1比4惨败于塞维利亚,米兰与尤文互交白卷
  • 勇立潮头向未来(奋勇争先,决战决胜“十四五”)
  • 日经指数暴涨超4.2%,日本未来首位女首相高市早苗主张“负责任的积极财政”
  • 中经评论:科技为笔,绘就“三农”新图景
  • 因撞脸周杰伦爆火的“粥饼伦”如今怎样了?
  • 富时中国A50指数期货开跌0.2%
  • 美军没钱发,特朗普照样庆典开花
  • 公明党敲警钟:高市早苗若参拜靖国神社,联合政府难组
  • 日本40年期国债价格暴跌 此前高市早苗在自民党党首选举中获胜
  • 台风“夏浪”向西偏北方向移动,强度逐渐增强
  • 上海非遗里的中秋节
  • 财富管理五大增长点曝光!山西证券韩丽萍最新发声
  • 复兴亚洲公布接获复牌指引
  • 野村证券策略师称“高市交易”可能不会持续太久
  • 中国新零售供应链:恢复公众持股量
  • 贝壳-W于10月3日斥资500万美元回购79.67万股
  • 中通快递-W于10月3日斥资197.35万美元回购10.39万股
  • 王俊凯父母开的奶茶店总店将停业:因租约到期,曾1天卖出600杯,有粉丝凌晨排队4小时购买
  • 【在这片辽阔的土地上92】沈白高铁驶入林海雪原
  • 哈马斯提放人条件,要求以色列全面停火
  • 月背的月幔有点“冷”!中国人研究月球土特产又有新成果
  • 发现夜上海|璀璨之外,万千“夜”态还有哪些值得期待?
  • 从跟跑到领跑,这名造船者让“中国制造”成为“世界领先”
  • 特朗普,突发!国际金价在今日开盘后再度爆发
  • 港股概念追踪|中国科研人员在固态锂电池应用取得新突破 市场规模或迅速增大(附概念股)
  • 日元兑欧元一度跌至纪录低点 此前高市早苗在自民党党首选举中获胜
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码