萨姆·奥特曼预计OpenAI将在明年1月推出GPT-5.2模

【友财网讯】-OpenAI 上周宣布了其最先进的人工智能模型 GPT-5.2，并表示这是迄今为止最适合日常专业使用的产品。

OpenAI 表示，该模型在创建电子表格、构建演示文稿、感知图像、编写代码和理解长上下文方面优于之前的模型。它将于周四开始在 OpenAI 的 ChatGPT 聊天机器人及其应用程序编程接口（API）中提供。

就在几周前，OpenAI 发布了 GPT-5.1 模型。竞争对手 Anthropic 和谷歌上个月也推出了新模型，促使 OpenAI 宣布 " 红色警报 " 努力改进 ChatGPT，并搁置其他项目。

随着消费者和企业越来越多地将人工智能融入日常生活和工作流程，领先的科技公司之间正在进行一场高风险的战斗，以创造最广泛使用的模型。OpenAI 正指望其 GPT 系列模型来定义未来，因为该公司试图证明其 5000 亿美元的估值和超过 1.4 万亿美元的计划支出是合理的。

OpenAI 应用程序首席执行官斐济 · 西莫（Fidji Simo）在周四的新闻发布会上告诉记者：" 我们宣布这一红色警报是为了向公司发出一个信号，即我们想要在一个特定领域部署资源，这是一种真正定义优先级和定义可以被取消优先级的事情的方式。"

" 总的来说，我们在 ChatGPT 上投入的资源有所增加，我想说这有助于这个模型的发布，但这并不是它本周特别推出的原因。"

OpenAI 首席执行官萨姆 · 奥特曼（Sam Altman）上周四告诉 CNBC，谷歌发布 Gemini 3 模型对公司指标的影响没有最初担心的那么大。他说，他预计 OpenAI 将在明年 1 月退出红色警报状态。

" 我相信，当竞争威胁发生时，你会想要专注于它，迅速应对它。" 奥特曼说。

OpenAI 表示，GPT-5.2 将提供即时版、思考版和专业版。OpenAI 表示，即时版在写作和信息搜索方面速度更快，思考版在编码和规划等结构化工作方面表现更好，专业版将为难题提供最准确的答案。

该模型在多项行业基准测试中表现顶尖：在评估智能编码能力的 SWE-Bench Pro、研究生级科学推理测试 GPQA Diamond 中均排名前列；在 OpenAI 今年推出的 GDPval 测试中（涵盖 44 种职业的知识型任务评估），GPT-5.2 在 70.9% 的明确任务中表现优于或持平顶尖行业专业人士。

西莫说：" 这已经准备了好几个月了。虽然我们为能够快速发布模型而感到自豪，但这种特殊的整合已经进行了一段时间。"

Anthropic 的最新模型 Opus 4.5 在评估人工智能系统软件编码能力的测试集 SWE-Bench Verified 上的得分高于 GPT-5.2。OpenAI 告诉记者，与 SWE-Bench Pro 相比，该基准测试的 " 抗污染性、挑战性、多样性和工业相关性 " 较差。

OpenAI 于 10 年前以研究实验室身份成立，2022 年 ChatGPT 推出后，迅速成长为全球增长最快的商业实体之一。目前，其聊天机器人的周活跃用户已超 8 亿。

宙世代

一起剪

相关标签