就在上次重大事件发生几周后发布OpenAI 正积极地将其旗舰产品 ChatGPT 从面向消费者的新奇产品转型为不可或缺的企业强大工具。
周四,该公司发布了GPT-5.2它声称,新的大型语言模型速度更快、更可靠,并且旨在处理复杂的专业工作流程。
OpenAI 的最新动态表明,它正超越作业辅导和一般咨询的范畴,转而致力于将其技术打造成为商业世界中不可或缺的日常工具,这一点从其与众多企业的丰厚交易中可见一斑。美国政府和迪士尼.
OpenAI在一份声明中表示:“我们设计GPT-5.2的目的是为了给人们创造更大的经济价值。它在创建电子表格、制作演示文稿、编写代码、感知图像、理解长篇上下文、使用工具以及处理复杂的多步骤项目方面都做得更好。”
为了彰显 GPT-5.2 的性能,该公司推出了专有的评估基准 GDPval,该基准模拟了 44 种职业中的任务。
该公司声称,GPT-5.2 在约 71% 的比较中达到或超过了人类员工的绩效。
OpenAI 应用首席执行官 Fidji Simo 表示:“在 GDPval 测试中,该思维模型在 70.9% 的常见专业任务(例如电子表格、演示文稿和文档创建)中,表现优于或与人类专家持平。”写道X 表示:“它在通用智能、编写代码、工具调用、视觉和长期上下文理解方面也更胜一筹,因此可以为人们释放更大的经济价值。”
目前尚不清楚该基准是否经过外部审查,业内专家只能等待对这些说法进行独立核实。
GPT-5.2 于周四面向所有付费订阅用户推出,API 访问权限也于当日开放。开发者现在可以从三个不同的版本中进行选择,每个版本都针对不同的专业需求进行了优化。
API 定价为每百万个输入代币 1.75 美元,每百万个输出代币 14 美元。
除了 GDPval 基准测试之外,GPT-5.2 在其他既定的技术测试中也表现出色,在 GPQA Diamond 和 FrontierMath 测试中取得了更高的分数。据报道,它还展现出了更高的可靠性。结果在编码、数据分析和实验设计等高要求任务中。
在公告中,该公司展示了早期测试者的一些高度评价。
更强大的工作场所人工智能的发布,正值劳动环境本已紧张之际。
企业高管们似乎普遍乐观,最近Just Capital的一项报告也印证了这一点。民意调查调查显示,93%的商业领袖认为人工智能是一种积极的力量。然而,同一项研究也发现,近一半的美国人预计这项技术会导致失业,而据报道,企业高管们对此担忧的程度较低。