历经两年研发,GPT-5终亮相!奥特曼:这是全球更先进的AI模型

音符科技网

北京时间 8 月 8 日凌晨 1 点,OpenAI 推出其最新大型人工智能模型 GPT-5,这是公司迄今最智能、快速且实用的 AI 系统。

OpenAI 首席执行官萨姆 · 奥特曼(Sam Altman)称,GPT-5 如同博士级专家团队,内置推理能力,能在编码、数学、写作、医疗和视觉感知等领域提供专家级回答,显著超越前代模型。

GPT-5 现通过 ChatGPT 向所有用户开放,包括免费、Plus、Pro 和 Team 用户。免费用户首次体验推理模型,达到限额后切换至 GPT-5 mini。Plus 用户享有更高使用限额,Pro 用户可无限制访问 GPT-5 及更强大的 GPT-5 Pro。企业版和教育版用户将在约一周后获得访问权限。OpenAI 还为开发者提供 GPT-5、GPT-5 mini 和 GPT-5 nano 三种 API 版本,满足不同需求。

AIME

GPT-5 在多项基准测试中创下新高:数学(AIME 2025 无工具得分 94.6%)、编码(SWE-bench Verified 74.9%,Aider Polyglot 88%)、多模态理解(MMMU 84.2%)和医疗(HealthBench Hard 46.2%)。

GPT-5 显著减少 " 幻觉 ",在匿名 ChatGPT 流量测试中,回答包含事实错误的概率比 GPT-4o 低 45%,推理模式下比 OpenAI o3 低 80%。

在 LongFact 和 FActScore 等事实性基准测试中,GPT-5(带推理)的幻觉率约为 o3 的六分之一,确保长篇内容更准确。OpenAI 引入 " 安全完成 " 训练,模型在处理模糊或双重用途问题时提供高层次、安全的回答,并透明解释拒绝原因,欺骗率从 4.8% 降至 2.1%。

OpenAI 在 GPT-5 开发过程中进行了广泛的安全评估,包括 5000 小时的测试。OpenAI 称,GPT-5 不会直接拒绝回答可能存在风险的问题,而是采用 " 安全完成 " 策略,提供符合安全限制的高层次回答,以避免潜在危害。

在简报会上,OpenAI 展示了 GPT-5 的 " 氛围编码 " 功能,即用户通过简单的文字提示即可生成软件。OpenAI 的研究人员要求 GPT-5 开发一个帮助英语使用者学习法语的网页应用,需具备吸引人的主题,包括闪卡、测验和每日进度跟踪功能。

OpenAI 在两个 GPT-5 窗口中输入相同提示,模型在几秒内生成了两个不同的应用。OpenAI 的研究人员表示,这些应用 " 有些粗糙 ",但用户可根据需要进一步调整 AI 生成的软件,例如更改背景或添加新标签。

微软首席执行官萨蒂亚 · 纳德拉(Satya Nadella)周四在 X 平台发帖称:" 难以相信当前距奥特曼在雷德蒙德向世界首次展示 GPT-4 仅过去两年半时间,技术进步之快令人惊叹。" 他指的是 2023 年 2 月奥特曼在微软华盛顿总部展示 GPT-4 的场景。

根据微软的博客文章,GPT-5 将迅速集成到微软产品中,包括 Microsoft 365 Copilot、面向消费者的 Copilot 以及供开发者将 AI 模型融入第三方应用的 Azure AI Foundry。

企业文件管理公司 Box 近几周对 GPT-5 进行了广泛测试。Box 首席执行官亚伦 · 列维 ( Aaron Levie ) 表示,以往 AI 模型在处理复杂数学或长文档逻辑时常失败,但 GPT-5 是 " 彻底的突破 "。他在接受 CNBC 采访时表示:" 该模型能保留更多信息,并运用更高水平的推理和逻辑能力进行决策。"(文 / 腾讯科技特约编译无忌,编辑 / 博阳)

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 《辽宁省博物馆藏敦煌文献》新书首发,90%以上为首次公布
  • 黄纯艳评《中国古代史三论》|古代中国走向近代中国的内在理路
  • 脱贫攻坚成果持续巩固拓展
  • 第三届全球伦理会议|文明与暴力:全球伦理视角下的对话
  • 三方会谈变两方,特朗普:普京无需同意和泽连斯基会面
  • 关联机构“切割”假院士阮少平,称其“以志愿者身份参与公益活动”
  • 一年多出售五笔低效资产包!这一次,甘肃银行卖了153亿元
  • 马斯克:日本今年将减少近100万人口,人工智能是扭转局面的唯一希望
  • 打脸“新鲜”! 野人先生被曝料包保质半年,外卖还减量 | BUG
  • 【保定最新限号,保定最新限号通知】
  • 日本央行会议意见摘要称今年底前或退出观望模式
  • 港股黄金股盘初拉升 赤峰黄金涨超3%
  • 赤峰黄金早盘高开近5% 老挝最大矿山新发现金铜矿
  • “牛市旗手”券商ETF(512000)连续5日吸金4.2亿元,机构:四重逻辑战略看多券商
  • 印度国有炼油企业据悉暂停采购俄罗斯原油 转从其他国家进口
  • 普京特朗普世纪会晤倒计时!俄股汇市狂飙,泽连斯基急召欧洲盟友,俄乌冲突迎来终极转折?
  • 苏州新增本土确诊病例6例(苏州新增新冠肺炎病例)
  • 南非总统与俄总统通话,讨论俄乌和平进程问题
  • 有人在318国道放特制铁块致多车爆胎?警方:高度重视,开展调查
  • 体育的力量|在不同时代,我与万体馆交会的故事
  • 国内商品期货早盘开盘,氧化铝跌超2%
  • 央行今日开展1220亿元7天逆回购操作
  • 光大期货:8月8日软商品日报
  • 央行今日开展7000亿元买断式逆回购操作,释放数量型货币政策工具加力信号
  • OpenAI发布最强模型GPT-5,免费向所有用户开放
  • 光大期货:8月8日能源化工日报
  • 黄金突然“大变脸”的原因在这!金价大涨26美元
  • 光大期货:8月8日矿钢煤焦日报
  • All in 医药的场外指基来了!唯一药ETF联接基金(024985 /024986)8月8日起重磅首发
  • 快讯:恒指低开0.45% 科指跌0.83% 科网股普跌 黄金股普涨 脑机接口概念高开
  • 甘肃榆中强降雨引发山洪,4000余人被困
  • 光大期货:8月8日金融日报
  • 太火爆!茅台五星商标纪念酒上线5分钟即售罄,销售额高达1.79亿!
  • 人民币兑美元中间价报7.1382,下调37点
  • 人民币兑美元中间价报7.1382
  • 54岁农民工如厕被误当猎物遭枪击身亡,家属:单位不认可工亡
  • 白宫:将派遣联邦执法人员协助华盛顿特区警务
  • 光大期货:8月8日农产品日报
  • 山东启动防汛四级应急响应
  • 光大期货:8月8日有色金属日报
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码