OpenAI再次“Open”,开源模型GPT-oss有什么可以学?

音符科技网

界面新闻记者 | 伍洋宇

界面新闻编辑 | 文姝琪

过去几个月,OpenAI没有出现过什么激动人心的好新闻:新模型不再惊艳、重要人才流失,就连斥巨资想要收购的明星创业公司Windsurf,也被谷歌截了胡。

但这些问题还是要回到根本层面来解决,比如说再次发布一个足以受到普遍认可的新模型——这就是GPT-oss在这个节点出现的意义之一。

图片来源:OpenAI官网

8月6日凌晨,OpenAI宣布推出开源推理模型Gpt-oss,包含Gpt-oss-120B(激活参数5.1B)和Gpt-oss-20B(激活参数3.6B)两个参数大小,支持上下文128K。值得注意的是,这是OpenAI时隔六年再次开放权重。

从性能表现上来说,Gpt-oss-120B模型在核心推理基准测试中与OpenAI o4-mini几乎持平,Gpt-oss-20B则与OpenAI o3-mini取得类似结果。 

图片来源:OpenAI官网

就国产模型而言,综合公开数据,两款模型对比DeepSeek-R1、通义千问(Qwen3-235B-A22B)、智谱GLM4.5-Air、月之暗面Kimi K2等,除了个别维度,在AIME24/25、GPQA、MMLU等常规基准测试上普遍表现更好。

不仅如此,Gpt-oss-120B据称能够在单个80GB GPU上运行,Gpt-oss-20B可在仅配备16GB内存的设备上运行,这意味着两款模型或将迅速占领端侧设备本地推理的需求市场。

OpenAI还开门见山说明了两款模型均采用Apache 2.0许可证,也就是既可商用也可改造,基本没有使用限制。

开源决策与性能表现之外,本地部署的高效是Gpt-oss此次赢得业界认可的主要原因。 

OpenAI提到,两款模型的权重均可在Hugging Face上免费下载,且在后期训练阶段已原生量化为MXFP4格式——Mixed Format 4-bit Precision,是一种专为大模型推理打造的混合精度量化格式,目的在于保留关键信息的同时,把参数用更聪明的方式压缩成低精度。 

对比更为常见的FP16、FP8等,MXFP4能够在接近8-bit量化效果的同时,保留4-bit低精度量化速度快、内存小的特性,综合达成更好的模型性能表现。也就是说,它将一个“满血版”推理模型的本地部署门槛又大幅降低了。

一名AI领域实验室研究人员对界面新闻记者表示,他在本地部署了20B版本的Gpt-oss后,直接替换了同样本地部署的Gemma 3(12B),理由就是前者“快很多”,基本可以每秒输出45个token左右,而Gemma 3的速度在每秒30个token左右。并且在一些基础的思考题上,OpenAI可以给出更标准的答案。

他没有给予Gpt-oss过高的评价,因为现阶段的大模型彼此之间的性能差异已经很小,“谁免费,谁快,我就用谁。

不过,凭借Gpt-oss这款模型,OpenAI可能还是把DeepSeek-R1出现之后,它在开源世界缺乏的声量弥补了一些回来,也顺带轻轻回击了“CloseAI”这个持续已久的昵称。

复旦大学计算机科学技术学院教授张奇对界面新闻记者表示,根据其内部评测,他认为Gpt-oss在效果层面领先目前的DeepSeek和Qwen,这体现的还是OpenAI对模型的理论理解能力以及工程实现能力。 

他同时指出,这也说明了一个问题,即OpenAI还是没有从模型架构上实现巨大突破,而按照现有架构去实现AGI几乎没有可能性。

大模型成为全球科技领域焦点以来,中美之间的闭源模型竞争一直是更核心的话题,直到DeepSeek将开源模型的地位推至新高。而OpenAI在Gpt-oss上的补课,明显对既有局面有所扭转。眼下,国产开源模型可能有新的内功可供学习打磨了。

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 私募人员“跳槽”骤减,去年离职的400多位从业者去向如何?
  • 医药商业上市公司董秘PK:董秘年薪平均值为72.65万元 润达医疗张诚栩年薪162.42万行业第二
  • 金风科技早盘涨近8% 花旗重申其“买入”评级
  • 医药商业上市公司董秘PK:超4成董秘薪酬低于50万 上海医药钟涛年薪203.73万元行业第一
  • 港股创新药概念股大幅回撤,和黄医药跌超15%,机构看好医药板块投资价值
  • 【宁波北仑区新增8例确诊病例,宁波北仑区新型肺炎病例】
  • 医药商业上市公司董秘PK:硕士学历董秘占比近五成 国发股份李勇为业内唯一博士董秘
  • 劳工放缓美联储转鸽 黄金涨势获双重支撑
  • GPT-5正式发布+鸿蒙智能体即将上线!信创ETF基金(562030)随市回调,跌超2%, 资金迎逢跌介入机会?
  • 猪肉股异动拉升,正虹科技直线涨停
  • 医药商业上市公司董秘PK:小于等于40岁董秘占比32% 达嘉维康蒋茜为最年轻女董秘
  • 医药商业上市公司董秘PK:40-50岁董秘占比近6成 柳药集团徐扬为行业最年轻男董秘
  • 加密货币ETF及相关概念股走高 博雅互动涨超6%嘉实以太币涨超5%
  • 青岛市档案馆馆长、莱西市委原书记周科落马
  • 腾景科技终止收购迅特通信100%股权,一月内暂不筹划重大资产重组
  • 社保新规靴子落地,餐饮业要“变天”了?
  • 东风集团股份盘中涨超7% 上半年纯利同比下滑超90% 环比实现扭亏为盈
  • 上半年广州11区GDP:黄埔突破2000亿,越秀、番禺增速垫底
  • 这位经理 被吐槽“亏到只剩零头” 东方基金“迷你基”扎堆 多只权益基金面临清盘风险
  • 七名路人暴雨天东莞街头合力砸车救人,已被认定见义勇为
  • 恒大汽车:未能满足港交所上市规则要求,股票将继续停牌
  • 特朗普提名白宫经济顾问委员会主席米兰任美联储理事,影响几何
  • 菏泽疫情(菏泽疫情炸街)
  • 协鑫能科陈珅:新能源发展存在“数据迷雾”“资产固化”痛点
  • 新疆维吾尔自治区博尔塔拉蒙古自治州人大常委会副主任陈健接受审查调查
  • 美媒:以安全内阁批准占领加沙城
  • 以媒称以安全内阁批准占领加沙
  • 袭击外国人背后,日本的衰老与沮丧
  • 新化最新防疫政策(新化最新防疫政策电话)
  • 软银股价飙升至纪录高位 对人工智能的押注推动财季转为盈利
  • “绿锁”塔克拉玛干后,沙漠变大还是变小了?
  • 贯彻落实民营经济促进法,最高法发布25条指导意见
  • GPT-5快抢走打工人饭碗了
  • 美团:年内将为10万家餐饮小店发放最高5万元助力金
  • 中芯国际:产能较满但未主动涨价
  • 2025最美退役军人|阿依拉提·吾斯曼:烈焰丹心,守护安全
  • 若羽臣要在港股上市?现实可能比理想更残酷 业绩下滑 股东一边减持 公司一边回购
  • 美团宣布“秋天的第一杯奶茶”收官:请300万名骑手喝奶茶,邀请超2万名奶茶店员按摩
  • 世卫组织:苏丹新一轮霍乱疫情已致近10万人感染
  • 有人在318国道放特制铁块,多车“中招”爆胎?西藏警方:开展调查
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码