AI专家:对AI的质疑是对“指数级增长趋势”的“自欺欺人”

音符科技网

  华尔街见闻

  AI研究员Julian Schrittwieser认为,当前的“AI泡沫论”,是未能理解技术指数级增长趋势的表现,与新冠疫情初期的误判类似。研究显示,AI在软件工程、跨行业职业任务等领域的性能正呈指数级增长,并预测到2026年中,AI将能自主完成8小时工作,并在年底前在多个行业达到人类专家水平。

  一位来自AI研究前沿的专家坚定反驳了当前普遍存在的“AI泡沫论”。

  AI明星公司Anthropic的研究员Julian Schrittwieser在其个人博客中撰文警告,当前对AI“泡沫”或“平台期”的普遍质疑,是对技术指数级增长趋势的严重误读,这种心态与新冠疫情初期对指数级传播的忽视如出一辙。

当前围绕AI进步和所谓“泡沫”的讨论,让我想起了新冠疫情的最初几周。当指数趋势已经清晰预示了全球大流行的到来及其规模时,政客、记者和大多数公众评论员却仍将其视为一种遥远的可能性或局部现象。

  他指出,尽管AI在执行编程或网站设计等任务时仍会犯错,但人们因此断言其无法达到人类水平或影响甚微是“一种奇怪的现象”,正如几年前人们还认为AI编程是“科幻小说”。

人们注意到,虽然AI现在可以编写程序、设计网站等,但它仍然经常犯错或走向错误的方向,然后他们不知何故就得出结论,认为AI永远无法在人类水平上完成这些任务,或者只会产生微小的影响。

  Schrittwieser的核心论点基于两项关键研究:METR和OpenAI的GDPval。数据显示,AI模型自主完成复杂任务的时长正以指数级速度翻倍,最新的模型已能处理超过两小时的软件工程任务。更重要的是,在覆盖44个职业的GDPval评估中,顶尖AI的表现已“惊人地接近”人类水平,甚至开始挑战行业专家的能力。

  在这篇题为《再次未能理解指数级》的博客文章中,Schrittwieser将当前对AI的怀疑论调比作“自欺欺人”,认为人们因关注当下的不完美而低估了即将到来的变革规模。

  软件任务能力:每7个月翻一番

  为反驳AI“平台期”论调,Schrittwieser首先引用了独立评估机构METR发布的《衡量AI完成长任务的能力》研究。该研究衡量AI模型能自主执行软件工程任务的长度,结果显示出“清晰的指数级趋势”。

  根据该研究,7个月前的模型Sonnet 3.7已能以50%的成功率完成长达一小时的任务。而METR网站上的最新图表则进一步证实了这一趋势的延续性。

  Schrittwieser指出,包括Grok 4、Opus 4.1和GPT-5在内的新模型不仅延续了趋势,“这些最新模型实际上略高于趋势,现在能执行超过2小时的任务!

  跨越代码:在44个职业中追赶人类专家

  针对“AI仅在软件工程领域表现出色”的质疑,Schrittwieser引用了OpenAI发布的另一项名为GDPval的评估。该研究旨在衡量模型在更广泛经济活动中的表现,涵盖了9个行业的44个职业,任务由平均拥有14年经验的行业专家提供。

  结果再次呈现相似趋势。Schrittwieser写道,最新的GPT-5已“惊人地接近人类表现”。

  更有说服力的是,早于GPT-5发布的Claude Opus 4.1在该项评估中表现更佳,其性能“几乎与行业专家的表现相匹配”。Schrittwieser特别对此评论:“我在这里要特别赞扬OpenAI发布了一项评估,显示了另一家实验室的模型超越了他们自己的模型——这是诚信和关心有益AI成果的好迹象!”

  展望2026:AI经济整合的“关键一年”

  基于上述跨越多年和多个行业的指数级增长数据,Schrittwieser认为,若这些改进突然停止将是“极其令人惊讶的”。他给出了一个基于趋势外推的清晰预测:

  • 到2026年中,模型将能够自主工作一整个工作日(8小时)。

  • 到2026年底,至少有一个模型将在许多行业中达到人类专家的表现水平。

  • 到2027年底,模型在许多任务上将频繁超越专家。

  他总结道,未来的模型可能会比专家更好。

这听起来可能过于简单,但通过推断图表上的直线进行预测可能会给你一个比大多数“专家”更好的未来模型——甚至比大多数实际领域专家更好

  风险提示及免责条款

  市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 数据黑箱期:没有NFP的周五,黄金如何定价风险?
  • 陕西旅游拟在上交所主板上市,募资金额约15.55亿元
  • 港股小幅回调:恒科指收跌0.9%,中芯国际再创历史新高
  • 仍是日乒的“叹息之墙”!王曼昱横扫张本美和晋级大满贯四强
  • 国庆中秋“双节”相遇,外媒:中国旅游业蓬勃发展,民众热情出游
  • 晶科能源:各省机制电价竞标结果公布后,可能刺激光伏年终需求
  • 盘前:纳指期货涨0.18% 因政府关门非农无法公布
  • 一美籍男子在解放军舰队附近放无人机,已被港警逮捕
  • 国家治理效能得到新提升(新时代画卷·决战决胜“十四五”)
  • 安倍晋三遇刺案本月开庭,年内预计审理18次
  • 被中国卡脖子直击痛处,特朗普团队腔调软了
  • 捷克举行2025年议会众议院选举投票
  • 国庆中秋假期第三天全国道路交通平稳有序
  • 女子在周杰伦演唱会丢失11万手镯,发帖求助后出现奇迹!最新进展
  • 曝知名车评人陈震同学开劳斯莱斯闪灵发生车祸:逆行超速撞飞一白车
  • 匈塞铁路塞尔维亚段全线开通运营
  • 上海点亮文旅消费“新夜态”
  • 受台风“麦德姆”影响,琼州海峡客滚船明日16时起停运
  • 普京:某国有准备进行核试验的迹象
  • 本轮巴以冲突已致加沙地带66288人死亡
  • 欧盟延长对部分俄罗斯相关个人的制裁措施至2026年
  • 国庆档票房破9亿:《志愿军》领跑,市场等待“黑马”
  • 2025年国庆档电影总票房破9亿
  • 人民日报评论员:激发只争朝夕、永不懈怠的奋斗精神
  • 俄罗斯一安-2飞机坠毁,致2人死亡
  • 天津峰会是上合组织发展的重要里程碑(国际论坛)
  • 郁江洪峰将至 广西南宁部分区域进入紧急防汛期
  • 美国政府停摆持续,民主党对特朗普解雇威胁不屑一顾
  • 官方就业报告缺位,这些途径可观察美国劳动力市场
  • 如何平衡教与研?万米深海“寻宝”归来,她说“学生常常能提出珍贵问题”
  • 贝莱德接近达成400亿美元数据中心交易,押注人工智能领域
  • 受台风影响,海口“三港”明日16时起停运
  • 险成“老赖”的王健林,到底还剩多少钱?
  • 标普涨势进入“狂热”区间,股市多头依旧追捧
  • 特朗普政府冻结芝加哥21亿美元的基建项目资金
  • 开源数据库初创公司Supabase新一轮融资后估值达50亿美元
  • 放假回微信不算加班?法院判了!
  • 世卫组织报告:加沙地带逾4万人因冲突受重伤,卫生系统濒临崩溃
  • 郁江洪峰逼近,南宁邕江大桥今晚8点禁止双向通行
  • 看好中国科技股AI叙事 “木头姐”本周持续加仓阿里、百度
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码