大模型下一个飞跃?OpenAI的“新突破”:通用验证器

音符科技网

  炒股就看,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:网易科技)

在下一代大模型GPT-5备受期待之际,一项名为“通用验证器”的新技术正浮出水面,揭示了OpenAI可能用于拉开竞争差距的“秘密武器”。

OpenAI的“通用验证器”或将直接影响GPT-5模型的市场竞争力,8月4日据科技媒体The Information援引知情人士消息报道,这项技术已被应用于GPT-5的开发过程中。

该技术的核心机制,被比作一场“证明者-验证者游戏”。简而言之,它让一个AI模型扮演“验证者”的角色,去检查和评判另一个“证明者”模型生成的答案。通过这种内部对抗和反馈,系统性地提升模型的输出质量。这一自动化流程旨在解决强化学习(RL)在创意写作等主观领域或数学证明等复杂领域难以验证的瓶颈。

OpenAI内部研究人员已在社交平台X上间接证实了相关 *** 的有效性。研究员Noam Brown表示,这些技术是“通用的”,能让大模型“在难以验证的任务上表现得更好”。这也标志着OpenAI正试图攻克AI商业化应用中的核心痛点——可信度。

“证明者-验证者”的对抗游戏

“通用验证器”的技术细节,最早在OpenAI于2024年7月发表的一篇题为《证明者-验证者游戏提升大语言模型可读性》的论文中被阐述。该 *** 构建了一个精巧的内部对抗训练框架,背后是一种“证明者-验证者博弈”模型。

该框架中“证明者和验证者”两种角色,如同让一个模型内部分裂出两个“人格”:

在训练过程中,“验证者”模型通过学习区分正确与错误的解决方案,不断提升其“打假”能力。同时,“证明者”模型则根据“验证者”的反馈进行优化,学习如何生成更具说服力且不易被伪造的正确答案。论文明确指出,该验证器规模足够小,适合大规模部署,并“为未来的GPT部署而设计”。

有研究人员向The Information表示,这种机制类似于生成对抗 *** (GANs),即通过一个“判别器”来区分真实数据与AI生成的数据,从而倒逼“生成器”不断进步。

超级对齐团队的“技术遗产”?

值得注意的是,这项关键技术被指为OpenAI前“超级对齐”团队的“技术遗产”。发表《证明者-验证者游戏提升大语言模型可读性》这篇论文的六位作者中,目前仅有Yining Chen和Nat McAleese两人仍留在OpenAI。

据悉,该团队由公司联合创始人Ilya Sutskever主导成立,旨在研究如何控制未来可能出现的超级智能,但在Sutskever和另一位负责人Jan Leike离职后被迅速解散。

这为这项技术的应用增添了一层复杂的公司内部动态背景。尽管团队已不复存在,但其技术成果显然已被整合进OpenAI的核心产品研发路径中,用于解决当前模型的对齐和可靠性问题。

GPT-5期望高企

这项技术突破与备受瞩目的GPT-5直接相关。社交媒体上的信息显示,有观点认为,曾在GPT-4代码辅助功能中进行试点的模型自我批判系统,如今已被正式整合进GPT-5这个“下一个主线模型”中。这使得外界对GPT-5的期望达到了新的高度。

OpenAI首席执行官Sam Altman本人也在近期一档播客节目中为GPT-5造势,称其“在几乎所有方面都比我们更聪明”,进一步加剧了市场的期待。与此同时,包括xAI和谷歌在内的竞争对手也已将强化学习作为提升模型能力的关键技术路径并加倍投入。在此背景下,“通用验证器”不仅是OpenAI的一项技术创新,更被视为其在白热化的人工智能竞赛中保持领先优势的核心资产,其最终效果将在GPT-5发布后接受市场的检验。

突破与挑战并存

“通用验证器”最重要的价值在于其“通用性”。据报道,这项技术不仅帮助OpenAI模型在可轻松验证答案对错的软件编程等领域取得进步,也在创意写作等更主观的领域展现了改进。这意味着AI的能力正在从客观领域向主观领域渗透。

例如,在复杂的数学证明中,验证器可以确保每一步都遵循形式逻辑规则且相互一致,而不仅仅是检查最终答案。据报道,OpenAI模型最近在国际数学奥林匹克竞赛中取得的突破性成绩,很可能就得益于包括“通用验证器”在内的技术。OpenAI高级研究员Alexander Wei在社交平台X上称,公司所使用的强化学习 *** 是“通用目的”的,暗示其可以验证更主观类别的答案质量。

然而,通往技术飞跃的道路并非坦途。据媒体早前爆料,GPT-5的研发面临着严峻挑战,包括高质量训练数据的日益稀缺,以及大规模预训练带来的性能提升收益正在下降。此外,模型从内部测试到面向公众部署后的性能衰减问题依然存在,例如内部测试中表现强大的“o3”模型,在实际应用中性能便出现大幅下降。这些因素都为GPT-5最终能否实现预期的突破,带来了不确定性。

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 非法收受财物6794万余元李勇一审被判十四年
  • 广西桂林净瓶山桥头污水排放?官方通报:生活污水排入江中
  • 强脑科技据悉以超13亿美元的估值寻求IPO前融资
  • 乘联分会上调2025年全年销量预测,乘用车零售增长6%
  • 在岸人民币兑美元收盘报7.1876
  • 过度申请权限、违规收集个人信息……145款APP(SDK)被通报
  • 龙湖集团:8月7日到期的“20龙湖06”9.5亿元兑付款已拨款,年内到期信用债全部偿还完毕
  • 45折,信达资管8.86亿在上海“捡漏”烂尾近九年的佳程广场
  • 非法收受财物6794万余元,李勇一审被判十四年
  • 国务院办公厅印发《关于逐步推行免费学前教育的意见》
  • 中国财险:选举李玲为职工董事,将不再设立监事会
  • 国家疾控局联合多部门发布健康环境促进行动实施方案
  • 华创证券张瑜:7月全球投资十大主线
  • 湖南郴州发布国土空间管理技术规定:高层住宅限高26层,容积率不得高于3.1
  • 7月全国期货市场成交量同比增长48.89%
  • 华泰证券行知推出上市公司价值提升解决方案,企业服务再升级
  • 一民营企业状告江西万安县政府索要4000万元兜底补偿款,称其已拖欠多年
  • 0805热点追踪:新低!鸡蛋为何旺季不旺?
  • 临沂疫情最新数据消息,临沂疫情最新报道
  • 英伟达狂飙,苹果特斯拉“失速”,美股科技巨头为何走向分化?
  • 一群人可以走得更远:推动电竞产业发展,完美电竞搞了大动作
  • 中宣部等四部门联合发布“最美拥军人物”
  • 红旗连锁股价大跌超4%,股东永辉超市抛出减持计划
  • 奥巴马政府“捏造特朗普通俄”证据?美司法部已启动调查
  • 疲软非农令降息预期飙升 美银“泼冷水”:美联储今年或按兵不动!
  • 上海老克勒明星足球队走进榕江村超:为了情怀,回“家”看看
  • 秦洪看盘|多头斗志昂扬,后市仍有新高点
  • 中国机电商会:反对不正当竞争,维护光伏行业对外贸易高质量发展
  • 竞彩湃|马尔默能否迎来八连胜,格拉斯哥流浪者数据示弱?
  • 【点石成金】豆油内外价差存在收敛的机会
  • 证券期货业标准实施情况专项调研启动,涉及20余项关键内容
  • 网传“广西桂林净瓶山桥头污水排放”,官方通报:系生活污水排入江中
  • 中金:料比亚迪股份今年海外销量或超指引 评级“跑赢行业”
  • 【临沂费县疫情最新消息,临沂费县新冠状病毒】
  • 全面关停,盒马折戟会员店业态
  • 巡视结束,县委书记主动投案
  • 贝因美回应奶粉涨价:公司所有产品都没有涨价
  • 事关金融支持新型工业化,央行等七部门重磅发布18条意见
  • 美银证券:料药明康德继续抢占市场份额 升目标价至123港元
  • 大摩:华润医疗上半年初步利润逊预期 评级“减持” 目标价3港元
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码