大模型下一个飞跃?OpenAI的“新突破”:通用验证器

音符科技网

  炒股就看,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:网易科技)

在下一代大模型GPT-5备受期待之际,一项名为“通用验证器”的新技术正浮出水面,揭示了OpenAI可能用于拉开竞争差距的“秘密武器”。

OpenAI的“通用验证器”或将直接影响GPT-5模型的市场竞争力,8月4日据科技媒体The Information援引知情人士消息报道,这项技术已被应用于GPT-5的开发过程中。

该技术的核心机制,被比作一场“证明者-验证者游戏”。简而言之,它让一个AI模型扮演“验证者”的角色,去检查和评判另一个“证明者”模型生成的答案。通过这种内部对抗和反馈,系统性地提升模型的输出质量。这一自动化流程旨在解决强化学习(RL)在创意写作等主观领域或数学证明等复杂领域难以验证的瓶颈。

OpenAI内部研究人员已在社交平台X上间接证实了相关 *** 的有效性。研究员Noam Brown表示,这些技术是“通用的”,能让大模型“在难以验证的任务上表现得更好”。这也标志着OpenAI正试图攻克AI商业化应用中的核心痛点——可信度。

“证明者-验证者”的对抗游戏

“通用验证器”的技术细节,最早在OpenAI于2024年7月发表的一篇题为《证明者-验证者游戏提升大语言模型可读性》的论文中被阐述。该 *** 构建了一个精巧的内部对抗训练框架,背后是一种“证明者-验证者博弈”模型。

该框架中“证明者和验证者”两种角色,如同让一个模型内部分裂出两个“人格”:

在训练过程中,“验证者”模型通过学习区分正确与错误的解决方案,不断提升其“打假”能力。同时,“证明者”模型则根据“验证者”的反馈进行优化,学习如何生成更具说服力且不易被伪造的正确答案。论文明确指出,该验证器规模足够小,适合大规模部署,并“为未来的GPT部署而设计”。

有研究人员向The Information表示,这种机制类似于生成对抗 *** (GANs),即通过一个“判别器”来区分真实数据与AI生成的数据,从而倒逼“生成器”不断进步。

超级对齐团队的“技术遗产”?

值得注意的是,这项关键技术被指为OpenAI前“超级对齐”团队的“技术遗产”。发表《证明者-验证者游戏提升大语言模型可读性》这篇论文的六位作者中,目前仅有Yining Chen和Nat McAleese两人仍留在OpenAI。

据悉,该团队由公司联合创始人Ilya Sutskever主导成立,旨在研究如何控制未来可能出现的超级智能,但在Sutskever和另一位负责人Jan Leike离职后被迅速解散。

这为这项技术的应用增添了一层复杂的公司内部动态背景。尽管团队已不复存在,但其技术成果显然已被整合进OpenAI的核心产品研发路径中,用于解决当前模型的对齐和可靠性问题。

GPT-5期望高企

这项技术突破与备受瞩目的GPT-5直接相关。社交媒体上的信息显示,有观点认为,曾在GPT-4代码辅助功能中进行试点的模型自我批判系统,如今已被正式整合进GPT-5这个“下一个主线模型”中。这使得外界对GPT-5的期望达到了新的高度。

OpenAI首席执行官Sam Altman本人也在近期一档播客节目中为GPT-5造势,称其“在几乎所有方面都比我们更聪明”,进一步加剧了市场的期待。与此同时,包括xAI和谷歌在内的竞争对手也已将强化学习作为提升模型能力的关键技术路径并加倍投入。在此背景下,“通用验证器”不仅是OpenAI的一项技术创新,更被视为其在白热化的人工智能竞赛中保持领先优势的核心资产,其最终效果将在GPT-5发布后接受市场的检验。

突破与挑战并存

“通用验证器”最重要的价值在于其“通用性”。据报道,这项技术不仅帮助OpenAI模型在可轻松验证答案对错的软件编程等领域取得进步,也在创意写作等更主观的领域展现了改进。这意味着AI的能力正在从客观领域向主观领域渗透。

例如,在复杂的数学证明中,验证器可以确保每一步都遵循形式逻辑规则且相互一致,而不仅仅是检查最终答案。据报道,OpenAI模型最近在国际数学奥林匹克竞赛中取得的突破性成绩,很可能就得益于包括“通用验证器”在内的技术。OpenAI高级研究员Alexander Wei在社交平台X上称,公司所使用的强化学习 *** 是“通用目的”的,暗示其可以验证更主观类别的答案质量。

然而,通往技术飞跃的道路并非坦途。据媒体早前爆料,GPT-5的研发面临着严峻挑战,包括高质量训练数据的日益稀缺,以及大规模预训练带来的性能提升收益正在下降。此外,模型从内部测试到面向公众部署后的性能衰减问题依然存在,例如内部测试中表现强大的“o3”模型,在实际应用中性能便出现大幅下降。这些因素都为GPT-5最终能否实现预期的突破,带来了不确定性。

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 普京:若美向乌提供“战斧”导弹,将摧毁俄美关系
  • 预制菜风波后,实探西贝北上广深门店:有门店需等位半小时,黄牛开始倒卖代金券
  • 2025年国庆档电影总票房破13亿
  • 打麻将能抗抑郁?大学教授研究:真的有用,但仅限这类人
  • 谁在为“赔钱”的王家卫买单
  • 公安局副局长李虎遗体,已被找到
  • 日本女首相要来了,一个“背锅侠”?
  • 海口发布复运公告:出租车、网约车、公交和客运逐步恢复运营
  • 再创新高!双节假期前半程交通出行人数约12.43亿人次
  • 贾樟柯在人民日报发文
  • 西班牙称遭以方扣押的首批西班牙船员将回国
  • 金观平:持续增强发展动力和社会活力
  • WTT中国大满贯赛:王楚钦晋级男单决赛
  • 印尼学校建筑物倒塌事故死亡人数升至37人,约25人下落不明
  • 乌克兰能源部:俄对乌多地能源设施发动打击,导致大量用户断电
  • 台风“麦德姆”逐渐远离,澳门生产生活秩序有序恢复
  • 广东湛江发风暴潮蓝色警报:沿岸或将出现60-380cm风暴增水
  • 乌称遭俄50枚导弹500架无人机袭击
  • 男子多次恶意别车自称是公安人员
  • 尼泊尔持续降雨引发山体滑坡和洪水已致39人死亡
  • 乌称遭俄逾50枚导弹和约500架无人机袭击
  • 台风预警和防汛防风应急响应降级,海南最新通知
  • 拉面哥喊话鸡排哥,会是一种怎样的交流?
  • 国家发展改革委紧急安排2亿元中央预算内投资支持广东省、海南省台风灾害灾后应急恢复
  • 高市早苗或成日本首位女首相,将如何影响中日关系
  • 古建变得“潮”起来(大地风华)
  • 尼泊尔持续降雨引发山体滑坡和洪水,已致39人死亡
  • 专访丨全球治理倡议是迈向建立更加公平国际体系的重要一步——访土耳其国际经济专家阿克布卢特
  • 通讯|“中国制造”工艺品“焕新”亮相智利
  • 科普|胰腺神经内分泌肿瘤是胰腺癌吗?有哪些治疗方式?
  • 魔都眼·国庆|享受夜上海“松弛感”,市集引燃双节消费热
  • 胡塞武装称使用导弹袭击耶路撒冷多处目标
  • 哈马斯高官哈亚遭袭后首次公开露面,将率团赴开罗谈判
  • “我的铁路风景”文学征文|枕木上的年轮
  • 最大“肉签”超6万元!新股赚钱效应飙升
  • 台风“麦德姆”携14级大风登陆广东徐闻,多地发生海水倒灌
  • 一小时售罄!年轻人涌入医院抢面包
  • 国联民生香港子公司,获批重要业务牌照
  • 毕业后,我只想在胖东来做一个有尊严的收银员
  • 国家发改委紧急安排2亿元中央预算内投资,支持粤琼台风灾后应急恢复
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码