历经两年研发,GPT-5终亮相!奥特曼:这是全球更先进的AI模型

音符科技网

北京时间 8 月 8 日凌晨 1 点,OpenAI 推出其最新大型人工智能模型 GPT-5,这是公司迄今最智能、快速且实用的 AI 系统。

OpenAI 首席执行官萨姆 · 奥特曼(Sam Altman)称,GPT-5 如同博士级专家团队,内置推理能力,能在编码、数学、写作、医疗和视觉感知等领域提供专家级回答,显著超越前代模型。

GPT-5 现通过 ChatGPT 向所有用户开放,包括免费、Plus、Pro 和 Team 用户。免费用户首次体验推理模型,达到限额后切换至 GPT-5 mini。Plus 用户享有更高使用限额,Pro 用户可无限制访问 GPT-5 及更强大的 GPT-5 Pro。企业版和教育版用户将在约一周后获得访问权限。OpenAI 还为开发者提供 GPT-5、GPT-5 mini 和 GPT-5 nano 三种 API 版本,满足不同需求。

AIME

GPT-5 在多项基准测试中创下新高:数学(AIME 2025 无工具得分 94.6%)、编码(SWE-bench Verified 74.9%,Aider Polyglot 88%)、多模态理解(MMMU 84.2%)和医疗(HealthBench Hard 46.2%)。

GPT-5 显著减少 " 幻觉 ",在匿名 ChatGPT 流量测试中,回答包含事实错误的概率比 GPT-4o 低 45%,推理模式下比 OpenAI o3 低 80%。

在 LongFact 和 FActScore 等事实性基准测试中,GPT-5(带推理)的幻觉率约为 o3 的六分之一,确保长篇内容更准确。OpenAI 引入 " 安全完成 " 训练,模型在处理模糊或双重用途问题时提供高层次、安全的回答,并透明解释拒绝原因,欺骗率从 4.8% 降至 2.1%。

OpenAI 在 GPT-5 开发过程中进行了广泛的安全评估,包括 5000 小时的测试。OpenAI 称,GPT-5 不会直接拒绝回答可能存在风险的问题,而是采用 " 安全完成 " 策略,提供符合安全限制的高层次回答,以避免潜在危害。

在简报会上,OpenAI 展示了 GPT-5 的 " 氛围编码 " 功能,即用户通过简单的文字提示即可生成软件。OpenAI 的研究人员要求 GPT-5 开发一个帮助英语使用者学习法语的网页应用,需具备吸引人的主题,包括闪卡、测验和每日进度跟踪功能。

OpenAI 在两个 GPT-5 窗口中输入相同提示,模型在几秒内生成了两个不同的应用。OpenAI 的研究人员表示,这些应用 " 有些粗糙 ",但用户可根据需要进一步调整 AI 生成的软件,例如更改背景或添加新标签。

微软首席执行官萨蒂亚 · 纳德拉(Satya Nadella)周四在 X 平台发帖称:" 难以相信当前距奥特曼在雷德蒙德向世界首次展示 GPT-4 仅过去两年半时间,技术进步之快令人惊叹。" 他指的是 2023 年 2 月奥特曼在微软华盛顿总部展示 GPT-4 的场景。

根据微软的博客文章,GPT-5 将迅速集成到微软产品中,包括 Microsoft 365 Copilot、面向消费者的 Copilot 以及供开发者将 AI 模型融入第三方应用的 Azure AI Foundry。

企业文件管理公司 Box 近几周对 GPT-5 进行了广泛测试。Box 首席执行官亚伦 · 列维 ( Aaron Levie ) 表示,以往 AI 模型在处理复杂数学或长文档逻辑时常失败,但 GPT-5 是 " 彻底的突破 "。他在接受 CNBC 采访时表示:" 该模型能保留更多信息,并运用更高水平的推理和逻辑能力进行决策。"(文 / 腾讯科技特约编译无忌,编辑 / 博阳)

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 哈塞特:若政府停摆谈判无进展,将开始裁员(金十数据APP)
  • 哈马斯代表团已抵达埃及,将与以色列谈判
  • 印尼学校建筑物倒塌事故遇难人数升至53人
  • 通讯丨“铁杆友谊”写在钢轨上——塞尔维亚总统武契奇高度评价匈塞铁路
  • 法国总理勒科尔尼正式组阁,内阁成员名单公布
  • 墨西哥总统辛鲍姆:对达成有利贸易协定有信心,多项科技项目筹备就绪
  • 消费新观察|在上海,看见入境消费升级的“世界窗口”
  • 汉诺威再保险上调股息目标
  • 月饼简史:起源于何时?有哪些寓意?
  • 荷兰举行大规模示威活动声援巴勒斯坦
  • 特稿丨让开放的阳光温暖世界经济——从国际展会看中国机遇
  • 【中外对话】中国对外承包工程商会会长:“我们对中国未来对外投资充满信心”
  • “同中国伙伴打交道就像朋友一样亲切”
  • 今年第21号台风“麦德姆”的中心在广西防城港市沿海登陆
  • 格鲁吉亚总理称抗议者意图推翻政府,指责欧盟干预内政
  • 阿尼西莫娃首夺中网女单冠军
  • 记者手记丨意大利月光下的中国味道
  • OPEC+同意11月增产13.7万桶/日
  • 决胜“十四五”打好收官战丨驭风集光控水架网——新疆全力打造能源资源战略保障基地见闻
  • 泰勒・斯威夫特专辑发布派对为影院创收3300万美元
  • 美政府停摆期间美国纳税人已为不工作的官员支付12亿美元工资
  • 西藏定日县受降雪影响游客全部取得联系,已有350名安全抵达接应点
  • 美国亚拉巴马州发生大规模枪击案,致2死12伤
  • 国家防总向粤桂琼调拨中央应急抢险救灾物资,支持做好防汛防台风工作
  • 深中通道上一小车突然起火,3名路过司机当机立断停车灭火,火灭后驾车悄然离开
  • 民生福祉达到新水平(新时代画卷·决战决胜“十四五”)
  • 八国外长重申将共同努力立即结束加沙战争
  • 一女子在山西登山不慎滑落悬崖,多方回应
  • 香港一公园发生割颈伤人事件,嫌犯被捕
  • 通讯丨不懈努力打造“中国名片”——记奋战在刚果(布)和刚果(金)工地上的中国建设者
  • 光明日报:“鸡排哥”火了后,“晓华们”何以长青?
  • 一周新车盘点 | 宾利发布新GT预告 极氪9X正式上市
  • “肥娟夫妇”将于月底举办婚礼丈夫称俩人相识10年,婚礼将宴请300人
  • 国家防总向粤桂琼调拨中央应急抢险救灾物资,支持防汛防台风工作
  • 厄瓜多尔10个省因严重内部动荡进入紧急状态
  • 记者手记丨“这条铁路就像是我的孩子一样”
  • 主要产油国宣布11月维持增产措施
  • 台风“麦德姆”今夜将擦过北海,广西拉响台风二级预警
  • 海南文昌发生海水倒灌!部分居民家断水断电
  • 华裔新生代丨纸短情长这位华裔青年在侨批中读懂家国情
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码