【友财网讯】-OpenAI 上周宣布了其最先进的人工智能模型 GPT-5.2,并表示这是迄今为止最适合日常专业使用的产品。

OpenAI 表示,该模型在创建电子表格、构建演示文稿、感知图像、编写代码和理解长上下文方面优于之前的模型。它将于周四开始在 OpenAI 的 ChatGPT 聊天机器人及其应用程序编程接口(API)中提供。
就在几周前,OpenAI 发布了 GPT-5.1 模型。竞争对手 Anthropic 和谷歌上个月也推出了新模型,促使 OpenAI 宣布 " 红色警报 " 努力改进 ChatGPT,并搁置其他项目。
随着消费者和企业越来越多地将人工智能融入日常生活和工作流程,领先的科技公司之间正在进行一场高风险的战斗,以创造最广泛使用的模型。OpenAI 正指望其 GPT 系列模型来定义未来,因为该公司试图证明其 5000 亿美元的估值和超过 1.4 万亿美元的计划支出是合理的。
OpenAI 应用程序首席执行官斐济 · 西莫(Fidji Simo)在周四的新闻发布会上告诉记者:" 我们宣布这一红色警报是为了向公司发出一个信号,即我们想要在一个特定领域部署资源,这是一种真正定义优先级和定义可以被取消优先级的事情的方式。"
" 总的来说,我们在 ChatGPT 上投入的资源有所增加,我想说这有助于这个模型的发布,但这并不是它本周特别推出的原因。"
OpenAI 首席执行官萨姆 · 奥特曼(Sam Altman)上周四告诉 CNBC, 谷歌发布 Gemini 3 模型对公司指标的影响没有最初担心的那么大。他说,他预计 OpenAI 将在明年 1 月退出红色警报状态。
" 我相信,当竞争威胁发生时,你会想要专注于它,迅速应对它。" 奥特曼说。
OpenAI 表示,GPT-5.2 将提供即时版、思考版和专业版。OpenAI 表示,即时版在写作和信息搜索方面速度更快,思考版在编码和规划等结构化工作方面表现更好,专业版将为难题提供最准确的答案。
该模型在多项行业基准测试中表现顶尖:在评估智能编码能力的 SWE-Bench Pro、研究生级科学推理测试 GPQA Diamond 中均排名前列;在 OpenAI 今年推出的 GDPval 测试中(涵盖 44 种职业的知识型任务评估),GPT-5.2 在 70.9% 的明确任务中表现优于或持平顶尖行业专业人士。
西莫说:" 这已经准备了好几个月了。虽然我们为能够快速发布模型而感到自豪,但这种特殊的整合已经进行了一段时间。"
Anthropic 的最新模型 Opus 4.5 在评估人工智能系统软件编码能力的测试集 SWE-Bench Verified 上的得分高于 GPT-5.2。OpenAI 告诉记者,与 SWE-Bench Pro 相比,该基准测试的 " 抗污染性、挑战性、多样性和工业相关性 " 较差。
OpenAI 于 10 年前以研究实验室身份成立,2022 年 ChatGPT 推出后,迅速成长为全球增长最快的商业实体之一。目前,其聊天机器人的周活跃用户已超 8 亿。


登录后才可以发布评论哦
打开小程序可以发布评论哦