加州大学尔湾分校

【导读】号称满分屠榜的GPT-5.2,一发布就降智了?许多网友现身表示,似乎确实比开始弱了很多。但提前实测的网友表示,它的确很强,甚至当得起GPT-6之称!

昨夜,OpenAI放出了GPT-5.2炸弹。

根据官方公布的基准测试,它几乎完全碾压Gemini 3 Pro。

GPT-5.2最擅长帮人们完成有经济价值的任务,比如做电子表格、做PPT、写代码和审查代码、分析长文档等等。

而且号称在GDPval等基准测试中,有70.9%的时间能追赶甚至吊打专业人士。

可以说,这是OpenAI进入红色预警,甚至不惜改变AGI目标,都要完成的一个产品,而且还身负着狙击Gemini 3的重任。

所以,GPT-5.2实测起来,体感究竟如何?

GPT-5.2实测:一上线就降智?

出乎意料都是,一个GPT-5.2实测翻车的帖子,在X上火了。

如果向它提问:「garlic」中有多少个R?它会回答:0个。

相比之下,其他模型的表现就要稳定得多。

归根结底,这是LLM的一个底层问题:因为tokenization而无法统计字母数量。

不过,只要强制选到Thinking版本,GPT-5.2就能答对这个问题了。

在reddit上,也有很多网友表示:在GPT-5.2刚发布的时候,似乎功能还很强。

结果几个小时后,它紧接着就降智了。

有人表示,自己早上八点半开始用的时候还好好的,喝完一杯咖啡后,GPT-5.2忽然就不行了。

似乎每次新模型一发布,几小时后就会被削弱,OpenAI这是什么操作?

大佬现身说法:还是挺强的

不过这点小插曲,还是没有影响坊间的正面评论。

昨晚GPT-5.2一发布,网友们就被震撼了。

比如有人说,ARC-AGI 2的这次飞跃属实疯狂,OpenAI究竟是怎么做到的?

本来大家还以为OpenAI已经落后谷歌了,看来并没有!

看起来,OpenAI内部还捂着不少厉害的东西没发布。

而且,领略过GPT-5.2超强满血版的用户,对它是一致好评。

沃顿商学院教授Ethan Mollick表示,自己有幸提前使用了GPT-5.2,它的性能还是令人印象很深刻的。

比如下面这个任务:创建一个视觉上有趣的着色器,可以在twigl-dot-app中运行,使其看起来像一座无限的新哥特式塔楼城市,部分淹没在波涛汹涌的海洋中。

对于这个视频,很多网友大加赞叹:GPT-5.2不仅遵循了指令,还在代码中选择了非常合理的审美和结构。

然后,教授又让GPT-5.2绘制一张人类历年考试成绩的图表。

这个任务十分复杂,因为需要在过程中查找和交叉引用大量资料,然后一次性就生成有用的结果。

可以看到,GPT-5.2的表现十分惊艳。

这个Twigl代码的实例,显出了GPT-5.2的强大编码能力。

推理、数学、编程的重大飞跃

Magicpathai的CEO表示,自己已经测试GPT-5.2有一段时间了。

他对于这个模型的评价是——「复杂推理、数学、编程和模拟方面的一次重大飞跃」。

在实例中,它在单个文件中就构建了一个完整的3D图形引擎,还支持交互式控制,分辨率达到4K。

在这个视频中,他还用GPT-5.2进行了高难度推理。

有人质疑道:这个图形引擎会不会是GPT-5.2调库完成的?CEO表示,所有代码和图形完全是从0开始写的。

也就是说,GPT-5.2的进步不是渐进式的,而是编码助手功能的彻底范式转变。

网友们惊呼:这种进步的速度,实在是令人头晕目眩。

这位CEO对于GPT-5.2的评价是:它是OpenAI推出的最佳智能体模型,可以连续运行大量工具而不会出现问题,并且比其前代产品速度更快。

为了测试它的功能,他构建了一个智能体,可以同时使用GPT-5.2、5.1和5。

结果显示,GPT-5.2调用工具时无需任何前导码,而且即使在长时间会话中,也不会迷失方向。

还有人让GPT-5.2用ASCII写出了自己的内心世界,答案很震撼。

总之,在大多数人的反馈中,GPT-5.2能稳定地处理实际工作,条理清晰,工作流程顺畅。

相比于会出现小中断的旧模型,GPT-5.2对于任务的理解更强,完成得也更顺利。

ARC Prize表示,GPT-5.2 Pro(X-High)的最新SOTA得分为90.5%,这就意味着,AI在一年内效率已经提高了约390倍。

背后神秘华人,浮出水面

同以往一样,这次GPT-5.2的幕后功臣,依然有不少华人。

比如,最早预告GPT-5.2的OpenAI华人研究员、北大校友Yu Bai。

他本科在北大学习数学,在斯坦福获得统计学博士学位。

负责后训练的Yun Dai,本科来自清华大学,在加州大学尔湾分校获得了计算机科学硕士学位。

另一位OpenAI华人研究员Zuxin Liu,从事推理模型后训练工作。

他本科毕业于北航,在CMU攻读硕士和博士学位。

Aston Zhang来自在伊利诺伊大学厄巴纳-香槟分校攻读博士学位,现在是OpenAI的研究员。

他感谢了团队,尤其强调了GPT-5.2 Thinking的处理多步骤任务能力。

总之,昨晚的AI大战,OpenAI给出了强烈一击。

接下来,谷歌又会拿出什么来应对呢?

参考资料:

https://x.com/skirano/status/1999182295685644366

https://x.com/emollick/status/1999185085719887978

本文来自微信公众号“新智元”,编辑:Aeneas,36氪经授权发布。

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/68737.html

(0)
上一篇 2025年12月23日
下一篇 2025年12月23日

相关推荐

  • 股价大涨!AI芯片重磅消息 OpenAI将量产自研AI芯片

    OpenAI,有大动作! 今日(9月5日),有消息称,为减少对芯片巨头英伟达的依赖并应对激增的算力需求,OpenAI将与博通合作,从明年开始量产其自研的AI芯片。这标志着,科技巨头自主研发高性能计算芯片已成为行业新趋势。 在周四的财报电话会上,博通首席执行官陈福阳提到,已从一家新客户那里获得了100亿美元的定制AI芯片订单。虽然陈福阳没有透露这家“神秘大客户…

    2025年9月5日
  • 内布拉斯加州

    9月30日15:00,内布拉斯加州兰开斯特县登顿山小镇举行一场婚礼,62岁的迈克尔-加德尼尔担任婚礼主持人,为了增加气氛,他准备了一把1860式“火炮左轮发令枪”。 婚礼时间到了,正准备发令,老枪却不听使唤,一不小心没有射向空中,却跑偏打在自己12岁的孙子左肩上,所幸没有造成致命伤。 警方称迈克尔当然不是故意伤害自己的孙子,但是伤人事件已经发生了,还是要将他…

    2023年12月12日
  • 利兹大学社会文化与媒体学历认证

    相比其他英国名校,利兹大学的世界排名没有非常高,但这所学校的人气却一直都非常高。不管是211/985,还是双非院校的学生几乎都问过这所学校,备选的院校里面也基本都有利兹。 为什么中国留学生如此偏爱利兹大学? 让我们先了解一下利兹大学。 NO.1 利兹大学初印象 1、利兹大学QS排名 利兹大学虽然不是英国G5这种大牛校,但是与国内的学校相比的话,仅次于清北复交…

    2024年7月24日
  • 英国的克兰菲尔德大学怎样

    在可持续发展日益成为全球焦点的当下,英国克兰菲尔德大学(Cranfield University)再次用实力证明了其在该领域的领先地位。在最新发布的2025年《泰晤士高等教育影响力排名》(THE Impact Rankings)中,克兰菲尔德不仅实现总分连续三年提升,更在全球2318所参评高校中稳居世界前200强,展现出在研究、教学与校园运营层面对可持续发展…

    2025年7月22日
  • 英国服装设计研究生学校

    一、 如何在英国众多留学中介中做出选择? 许多计划留学的英国学生与家长常常面临相似的困惑:市场上机构众多,宣传各异,如何辨别其真实服务水平?签约后服务是否透明?文书质量能否得到保障?尤其对于目标定位于英美港新等热门地区的同学,更希望找到一家对这些地区申请有深度理解和丰富成功案例的机构。作为拥有十年经验的国际教育规划师,我常被问及这些问题。我的回答是,选择中介…

    2026年1月13日
  • 哈佛大学申请信英文

    (〜 ̄△ ̄)〜 每天晚上一篇英语知识普及 英语罐头 本文是我的第349篇英语知识文章 昨天罐头菌看到这样一个新闻,说一个高考生高考235分,却伪造清华录取证书,以此骗家长。俗话说得好,人争一口气佛受一炷香,考上好大学,相信是高考生都有的梦想吧。然而,上了大学之后,可能不少大学生也会有不顺畅的事情呢,例如说“挂科”“补考”“退学”等等… 1.mak…

    2024年9月7日
  • 伯克希尔对比亚迪H股持股比例降至7.98%

    【伯克希尔对比亚迪H股持股比例降至7.98%】据港交所文件,10月25日,巴菲特旗下伯克希尔 哈撒韦以每股245.86港元的价格完成出售82.05万比亚迪H股,持股比例从8.05%降至7.98%。

    2023年10月31日
  • 爱尔兰三一学院图书馆门票

    4月23日,在爱尔兰首都都柏林,人们在都柏林三一学院图书馆参观。 当日是世界读书日,爱尔兰都柏林三一学院图书馆吸引了众多当地民众和游客。该图书馆始建于1592年,馆藏600余万册图书和许多极具历史价值的文献文物。 新华社发 4月23日,在爱尔兰首都都柏林,一名参观者在都柏林三一学院图书馆内观赏古老的爱尔兰竖琴。 当日是世界读书日,爱尔兰都柏林三一学院图书馆吸…

    2025年7月10日
  • 英国接受预科的大学

    英国,向来是众多留学生心仪的求学之地,其硕士课程学制短且在全球享有极高的认可度。对于部分学术或语言基础有待提升的学生来说,硕士预科是通往硕士学习的有效路径。然而,如何挑选性价比高的硕士预科呢?不如来看看英国纳维教育的硕士预科课程,不仅涵盖多所英国名校,部分学院的硕士预科全程费用不到5000英镑就能读完,可以说非常经济实惠了。话不多说,接下来一起来看看国际学院…

    2025年7月31日
  • 托福成绩查询(托福成绩查询入口官网)

    在申请国外院校时,语言成绩是很重要的一部分,属于申请时的“硬性”要求。 那么语言成绩要考到多少分,才能达到出国留学的水平,申请到心仪的高校呢? 近日,ETS 和 IELTS 官方分别发布了< 2022 年托福全球考生成绩报告>和< 2022 年雅思全球考生成绩数据>,分析了在 2022 年参加考试的考生情况。 馆长在本文的最后,也为大…

    2023年11月14日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信