OpenAI华人研究员姚顺雨离职,开启个人的AI下半场

音符科技网

henry 发自 凹非寺

量子位 | 公众号 QbitAI

为大模型开启 " 下半场 " 的姚顺雨,也开启了个人 AI 的下半场。

就在最近,这位明星 OpenAI 华人研究员的动态,开始被火热关注。

之前有人说他出现在小扎的必挖名单上,也有人最近爆料他即将加盟其他的巨头——而且是中国科技巨头," 转会费 " 也有了惊人传闻。以及还有一种说法,姚顺雨选择个人创业……

姚顺雨去哪儿?还不知道。

但姚顺雨离职 OpenAI,得到了不同渠道的证实,只差个人官宣。

他似乎就此要开启个人 AI 的下半场了。

这个刚刚 29 岁的年轻人,合肥一中毕业、NOI 奥赛银牌、高考 704 分以安徽探花进入清华姚班,最后在普林斯顿获得计算机博士(语言和强化学习方向),毕业就加入了 OpenAI ……

而且更早之前,姚顺雨就有着突出而知名的科研成果,比如:

思维树(Tree of Thoughts):让 LLM 反复思考,大幅提高推理能力

SWE-bench:一个大模型能力评估数据集。

SWE-agent:一个开源 AI 程序员。

ReAct …

甚至还有超越年龄的哲思,一篇 "AI 下半场 " 的博文,在 AI 圈内外洛阳纸贵。

所以姚顺雨,究竟是一个怎样的年轻人?

在 2024 年刚加入 OpenAI 不久,姚顺雨在一次采访中推荐了一本书——《哥德尔、艾舍尔、巴赫:集异璧之大成》。

这部由人工智能先驱侯世达撰写的经典著作,将哥德尔的不完备定理、艾舍尔的错觉绘画和巴赫的复调卡农巧妙融汇,展现了这些看似无关的元素如何在计算机的通用递归系统中彼此呼应,并留下了一句意味深长的话:觅之,便有所获

正如这本书所启发的那样,跨学科的眼光与对复杂信息的开放态度,似乎贯穿着姚顺雨的整个求学生涯,并逐渐形成一种个人的风格特质。

和所有的学霸一样,姚顺雨初中就读于合肥更好的学校之一——合肥 45 中(2009 — 2012),初中毕业后升入合肥市之一中学

2014 年,他在全国信息学奥林匹克竞赛(NOI)中以 495 分斩获银牌;次年高考以理科704 分的成绩位列安徽省第三,进入清华交叉信息研究院姚班,主修计算机科学。

而这看似 " 标准学霸 " 的开局背后,其实孕育着一颗不太一样,甚至稍有反叛的气质。

△来自清小华

姚顺雨在采访中透露,相较其他清华姚班的同学专注于一点,不断深挖的品质,他更爱看很多数学,历史,乃至各种各样乱七八糟的东西。

而他对嘻哈音乐的热爱,也早已不是什么新闻。

艾米纳姆、蛋堡、热狗、Jcole 等说唱歌手伴随着他的初高中,而在清华他还是清华大学学生说唱社联合创始人。

值得一提的是,在清华大学 2019 年各类型自主选拔复试的开营仪式上,姚顺雨就给未来的学弟学妹们甩出了一句堪称 "freestyle" 的理由,解释自己为什么选清华:

但是对于我来说,选择清华、北大并不是问题,因为北大没有我姓氏命名的班级。

除了担任说唱社联合创始人外,姚顺雨还担任清华的招生志愿者和姚班联席会主席。在谈及姚班对他的影响时,他提到:

姚班很注重理论基础课程的学习,像操作系统或电路设计相关的课,看上去和科研好像没有任何关系,但是现在看来还是有些帮助的。它能使你对计算机科学的全貌有基本了解。

△(姚班合影,清华招生公众号)

这种兼容各类信息、涉猎不同学科并从中寻找乐趣的跨界气质,在姚顺雨身上表现得尤为明显。用以赛亚 · 伯林的话来说,他更像是一只 " 狐狸 ",而不是一只 " 刺猬 ",而这也体现在他后续的研究中。

(注:柏林的 " 刺猬 " 比喻那些专注于单一核心理念的人,他们把所有经验都套用到这个中心观点上;而 " 狐狸 " 则指那些涉猎广泛、善于灵活应对不同问题的人,更依赖多样化的策略和视角)

让人颇感惊讶的是,在大三下学期之前,姚顺雨既没有接触过 AI,甚至连科研也没有做过。

一次交换的机会让他去了 MIT,在此之后,他才开始跟着吴佳俊做一些计算机、视觉以及认知科学的研究。

姚顺雨表示,在跟随吴佳俊和学长 Jun-Yan Zhu 学习时,他不仅掌握了实验、汇报等研究入门的基本功,更受到思想上的深刻影响,他由此认识到心理学与人工智能的交叉,学会了从更高维度和整体框架去思考问题。

结束姚班四年的学习后,2019 年,他正式前往普林斯顿攻读博士,跨界气质再次显现。

本科阶段他主要研究计算机视觉,而博士阶段,本来被计算机视觉方向录取的他,却因为兴趣转向,自行联系了自然语言处理(NLP)领域的导师。最终,他因机缘巧合加入了Karthik Narasimhan的团队,开始从事自然语言处理与强化学习的研究。

这等于是从视觉转到了语言,但 " 觅之,便有所获 "。姚顺雨在事后回想到,这种跨界也是他的幸运之处,因为彼时正逢 GPT-2 兴起。因此,在博士的之一年,他就已经开始想着如何让 language model 变成 Agent.

而对(通用)Agent 的关注贯穿着他的研究。

姚顺雨博士生涯的之一个工作叫 CALM(2020),研究如何用语言模型来作为 Agent 来玩语言游戏。

在 CALM 中,语言就像媒介:它把人类经验和语义模式转化为可操作的动作候选,同时承载上下文信息,使智能体在庞大的动作空间中高效决策。

姚顺雨表示,虽然这篇工作并不像 swebench、ReAct 或思维树那么有名,但对他来说具有重要意义。

在张小珺的对谈中,我们发现姚顺雨对语言的关注早在这篇 5 年前的论文中就已萌芽。

换句话说,用语言来玩游戏是无限的,Agent 可以凭借语言进行推理和组合,在不同的上下文中找到合适的动作,泛化就由此而来。

换句话说,Agent 也需要具备 " 跨界 " 能力,而语言则是绝佳的媒介。

然而,姚顺雨也意识到,如果没有一个好的任务或环境,即使把 " 游戏 " 玩得再高分,也毫无意义。

基于这一思考,他的第二篇工作WebShop构建了一个大规模模拟电商环境,使智能体通过理解复杂文本指令,在网页中进行导航和操作,从而推动语言理解与决策能力在真实世界任务中的应用与验证。

同样的,后来的经典工作SWE-BenchSWE-agent也是针对一个有意义的任务(现实编程)展开对 Agent 能力的验证。

而当时间到了 2022 年,GPT-3.5的出现改变了一切。

众所周知,让一张白纸反复试错的效率极低,而在传统强化学习中,这种低效尝试却屡见不鲜:智能体通常要么被限制只做单一任务,比如下围棋,要么在庞大的动作空间中盲目探索。

GPT-3.5 让人们意识到,之前缺失的是先验知识:通过强大的语言预训练,将常识和语言知识融入模型,再通过微调,它才能成为具备跨界气质、拥有泛化能力的 Agent。

正如姚顺雨所说:如果你的 Pre-Training(预训练)已经包含了所有事情,那么 RL(强化学习)只是激发出这些能力的 skill(技能)。

在受到 GPT-3.5 的启发后,姚顺雨就做了 ReAct(ReAct: Synergizing Reasoning and Acting in Language Models),让大语言模型在与外部环境交互时,同时进行 " 推理 " 和 " 行动 "。

姚顺雨后来评价到这是他最喜欢的工作(也是他目前被引次数更高的工作)。基于此,他的研究逐渐转向于两个核心,一是怎么去做一些有价值、和现实世界更相关的任务和环境;二是怎么去做一些简单、但又通用的 *** 。

不过,为了实现通用,泛化,必须学会推理。而语言模型刚好提供了一个足够强的先验(prior),这个先验让你可以推理,而推理又能在不同的环境间泛化。

于是,在 GPT、思维链等工作的基础上,思维树(Tree of Thoughts, ToT)让语言模型通过多路径探索和自我评估,从而实现比传统左到右推理更高效的复杂问题解决能力。

回顾姚顺雨的求学与研究,不难发现,无论是他对通用智能体的追求,还是对语言作为认知与决策媒介的热忱,都是对跨界思维与泛化能力的持续探索。

28 岁的九局下半

相比于热狗的 23 岁,28 岁博士毕业进入 OpenAI 的姚顺雨,才真正迎来自己的 " 九局下半 "。

2024 年 8 月 1 日,姚顺雨宣布加入 OpenAI,一时间,说是万众瞩目也毫不为过。

PS:在说到姚顺雨与 OpenAI 的渊源时,一个不太冷的冷知识是姚顺雨的导师 Karthik Narasimhan 是 GPT ‑ 1 第二作者。

在加入 OpenAI 的一年多时间,姚顺雨最出圈的莫过于今年 4 月发表的博文《The Second Half》,宣告 AI 主线程的游戏已进入下半场。

(是的,AI 也迎来了自己的九局下半)

姚顺雨表示:AI 发展分为上下两阶段。上半场以模型和 *** 为中心,核心构建了模型和训练 *** ;随着 AI 技术成熟,下半场的重点转向如何定义有现实意义的任务、如何有效评估 AI 系统的表现。

新的评估应该贴近现实世界任务、优化模型配方解决任务,形成新的正向循环。

在这,我们不难看出姚顺雨姿态的转变:从专注求解的科研工作者,逐渐成长为善于发现需求的 " 产品经理 "。

据刚刚曝光的一次与张小珺的访谈中,姚顺雨也谈到了创业的底层逻辑:

毕业前我想得多的是,怎么创造一个爱因斯坦?我那时是比较 academia(学院派)的人——你在普林斯顿,你的偶像是冯诺依曼、爱因斯坦——很自然,能想到最有意思的任务是,我能不能发现下一个相对论?这毫无疑问能标志,AGI 或 ASI(超人工智能)实现了。后来,我到了硅谷,到了加州,进入公司之后,我发现人类的组织也是一个有意思的事情。如果能创造一家新的公司,创造一个 one trillion dollar(一万亿美元)、基于 Agent 的公司,是很有意思的。而当谈到是否会出去创业时,姚顺雨更是坦率地表示:OpenAI 大多数人都会考虑创业。他需要去做更有挑战的事情,去创业是很自然的。当然,还是应该找到一个好的事情。他喜欢把事情想得清楚一点再去做。

当然,从 OpenAI 离职也不一定非得创业,比如姚顺雨的导师 Karthik Narasimhan,就在 OpenAI 呆了一年后,选择了离开,并去普林斯顿继续象牙塔科研了。

如今,姚顺雨加入 OpenAI 也过了整整一个年头。

有爆料说 " 姚顺雨上亿薪资入职腾讯 ",但被腾讯官方对外辟谣否认了。

还有一家全新的创业公司刚刚被注册,法人代表正是 " 姚顺雨 " ——

但目前依然难以确定这个 " 姚顺雨 " 是不是就是我们谈论的姚顺雨,毕竟叫 " 尧舜禹 " 这种好名字的,仅仅 AI 领域,不止一位…

总之,祝福姚顺雨开启下半场。

参考链接

[ 1 ] https://openreview.net/profile?id=~Shunyu_Yao1&utm_source=chatgpt.com

[ 2 ] https://ysymyth.github.io/?utm_source=chatgpt.com

[ 3 ] https://x.com/shunyuyao12?lang=en&utm_source=chatgpt.com

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 香港证监会寻求法庭颁令以冻结涉嫌操纵环球智能控股股份的人士高达8240万港元的资产
  • 上海崇明海警局查获破坏海底光缆案件,多由渔船违章抛锚、拖网所致
  • 广发银行被罚6670万元,回应称已完成处罚相关问题的整改
  • 权威专家解读货币政策、宏观政策:结构性工具继续发挥牵引作用,宏观调控思路转向惠民生、促消费
  • 报告:2024年多边开发银行气候融资1370亿美元创纪录
  • 上海9月20日进行防空活动警报试鸣,开展防空演练和集中宣传
  • 甘肃白银市委常委、政法委书记贾志升履新酒泉市领导
  • 地方新闻精选 | 北京PM2.5来源中区域传输占57% 贵州“挖眼虐猫”事件系AI编造
  • 10岁女孩突然失联!警方发现日记本:“我走了,只给你们48小时破案时间”
  • 医药医疗再聚焦!创新药高位熄火,金笑非、赵蓓、葛兰怎么说,怎么做?
  • 哪吒汽车账面仅剩1500万,已确认债权约51亿
  • 阿富汗难民返乡叠加地震危机,联合国难民署呼吁资金援助
  • 华夏理财回应被罚1200万元:已严格按照监管意见,全面落实了整改工作要求
  • 工信部发布小鹏汽车首款增程车公告,预计明年一季度上市
  • 刚刚,集体大涨!多则消息,突然引爆!
  • 影石要靠新业务提高利润?大疆不答应
  • 视频|建信基金亮相服贸会:“梧桐巴士”再启程 打造沉浸式科技感体验空间
  • 天风证券净稳定资金率最低且触及预警线 中银证券未披露风险覆盖率是否违规?|券商半年报
  • 星展上调恒指目标至28000点 南向资金连续11日净买入港股
  • 蚂蚁保发布智能保险顾问:无销售和佣金导向,已有370万用户使用
  • 2025年中央国库现金管理商业银行定期存款(九期)定于9月17日招投标 本期操作量1500亿元
  • 中国石油贵州销售分公司原副总经理袁瑞森接受审查调查
  • “百万英才汇南粤”N城联动秋季招聘活动启动!深圳将携超20000个优质岗位,赴上海、山东高校精准引才
  • 白俄罗斯:波兰升级局势,欧盟埋单
  • 4个月,12.06亿!他带着一帮“华为老兵”再战IPO
  • 俄称波兰升级局势是为“抬高筹码”,已提议联合调查无人机事件
  • 第50届南丁格尔奖颁奖大会在京举行,韩正为中国获奖者颁奖
  • 稳增长政策显著发力将对后续进口形成支撑|宏观晚6点
  • 直通部委|国家财政安排1000亿元发放育儿补贴 宫颈癌发病率快速上升势头得到有效遏制
  • 彻底闹大了!西贝贾国龙和罗永浩战火升级,曾“用人头担保”预制菜
  • 博时基金亮相第二十五届投洽会 展示开放实力与创新实践
  • 白酒中报|白酒企业回款转弱 贵州茅台、泸州老窖、山西汾酒、洋河股份经营现金流净额均在减少
  • 宋迎东任哈尔滨工程大学党委书记,殷敬伟任校长
  • 金融监管总局发布《信托公司管理办法》
  • 高管因涉嫌职务犯罪被带走?大润发回应!
  • 泰康基金:以客户为中心,坚定落实高质量发展行动方案
  • “以色列领导层极端傲慢”
  • 招商银行被罚60万元,涉及数据安全管理不到位
  • 对话黄浦江资本赵博文:用“金篮子”投出42家千亿市值龙头 | 财之道
  • 央行:今年前八个月社会融资规模增量累计为26.56万亿元,比上年同期多4.66万亿元
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码