加州大学尔湾分校

【导读】号称满分屠榜的GPT-5.2,一发布就降智了?许多网友现身表示,似乎确实比开始弱了很多。但提前实测的网友表示,它的确很强,甚至当得起GPT-6之称!

昨夜,OpenAI放出了GPT-5.2炸弹。

根据官方公布的基准测试,它几乎完全碾压Gemini 3 Pro。

GPT-5.2最擅长帮人们完成有经济价值的任务,比如做电子表格、做PPT、写代码和审查代码、分析长文档等等。

而且号称在GDPval等基准测试中,有70.9%的时间能追赶甚至吊打专业人士。

可以说,这是OpenAI进入红色预警,甚至不惜改变AGI目标,都要完成的一个产品,而且还身负着狙击Gemini 3的重任。

所以,GPT-5.2实测起来,体感究竟如何?

GPT-5.2实测:一上线就降智?

出乎意料都是,一个GPT-5.2实测翻车的帖子,在X上火了。

如果向它提问:「garlic」中有多少个R?它会回答:0个。

相比之下,其他模型的表现就要稳定得多。

归根结底,这是LLM的一个底层问题:因为tokenization而无法统计字母数量。

不过,只要强制选到Thinking版本,GPT-5.2就能答对这个问题了。

在reddit上,也有很多网友表示:在GPT-5.2刚发布的时候,似乎功能还很强。

结果几个小时后,它紧接着就降智了。

有人表示,自己早上八点半开始用的时候还好好的,喝完一杯咖啡后,GPT-5.2忽然就不行了。

似乎每次新模型一发布,几小时后就会被削弱,OpenAI这是什么操作?

大佬现身说法:还是挺强的

不过这点小插曲,还是没有影响坊间的正面评论。

昨晚GPT-5.2一发布,网友们就被震撼了。

比如有人说,ARC-AGI 2的这次飞跃属实疯狂,OpenAI究竟是怎么做到的?

本来大家还以为OpenAI已经落后谷歌了,看来并没有!

看起来,OpenAI内部还捂着不少厉害的东西没发布。

而且,领略过GPT-5.2超强满血版的用户,对它是一致好评。

沃顿商学院教授Ethan Mollick表示,自己有幸提前使用了GPT-5.2,它的性能还是令人印象很深刻的。

比如下面这个任务:创建一个视觉上有趣的着色器,可以在twigl-dot-app中运行,使其看起来像一座无限的新哥特式塔楼城市,部分淹没在波涛汹涌的海洋中。

对于这个视频,很多网友大加赞叹:GPT-5.2不仅遵循了指令,还在代码中选择了非常合理的审美和结构。

然后,教授又让GPT-5.2绘制一张人类历年考试成绩的图表。

这个任务十分复杂,因为需要在过程中查找和交叉引用大量资料,然后一次性就生成有用的结果。

可以看到,GPT-5.2的表现十分惊艳。

这个Twigl代码的实例,显出了GPT-5.2的强大编码能力。

推理、数学、编程的重大飞跃

Magicpathai的CEO表示,自己已经测试GPT-5.2有一段时间了。

他对于这个模型的评价是——「复杂推理、数学、编程和模拟方面的一次重大飞跃」。

在实例中,它在单个文件中就构建了一个完整的3D图形引擎,还支持交互式控制,分辨率达到4K。

在这个视频中,他还用GPT-5.2进行了高难度推理。

有人质疑道:这个图形引擎会不会是GPT-5.2调库完成的?CEO表示,所有代码和图形完全是从0开始写的。

也就是说,GPT-5.2的进步不是渐进式的,而是编码助手功能的彻底范式转变。

网友们惊呼:这种进步的速度,实在是令人头晕目眩。

这位CEO对于GPT-5.2的评价是:它是OpenAI推出的最佳智能体模型,可以连续运行大量工具而不会出现问题,并且比其前代产品速度更快。

为了测试它的功能,他构建了一个智能体,可以同时使用GPT-5.2、5.1和5。

结果显示,GPT-5.2调用工具时无需任何前导码,而且即使在长时间会话中,也不会迷失方向。

还有人让GPT-5.2用ASCII写出了自己的内心世界,答案很震撼。

总之,在大多数人的反馈中,GPT-5.2能稳定地处理实际工作,条理清晰,工作流程顺畅。

相比于会出现小中断的旧模型,GPT-5.2对于任务的理解更强,完成得也更顺利。

ARC Prize表示,GPT-5.2 Pro(X-High)的最新SOTA得分为90.5%,这就意味着,AI在一年内效率已经提高了约390倍。

背后神秘华人,浮出水面

同以往一样,这次GPT-5.2的幕后功臣,依然有不少华人。

比如,最早预告GPT-5.2的OpenAI华人研究员、北大校友Yu Bai。

他本科在北大学习数学,在斯坦福获得统计学博士学位。

负责后训练的Yun Dai,本科来自清华大学,在加州大学尔湾分校获得了计算机科学硕士学位。

另一位OpenAI华人研究员Zuxin Liu,从事推理模型后训练工作。

他本科毕业于北航,在CMU攻读硕士和博士学位。

Aston Zhang来自在伊利诺伊大学厄巴纳-香槟分校攻读博士学位,现在是OpenAI的研究员。

他感谢了团队,尤其强调了GPT-5.2 Thinking的处理多步骤任务能力。

总之,昨晚的AI大战,OpenAI给出了强烈一击。

接下来,谷歌又会拿出什么来应对呢?

参考资料:

https://x.com/skirano/status/1999182295685644366

https://x.com/emollick/status/1999185085719887978

本文来自微信公众号“新智元”,编辑:Aeneas,36氪经授权发布。

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/68737.html

(0)
上一篇 12小时前
下一篇 11小时前

相关推荐

  • 哥伦比亚大学硕士德校长

    据美国有线电视新闻网(CNN)报道,当地时间3月28日,哥伦比亚大学宣布,该校临时校长卡特里娜·阿姆斯特朗即将辞职。 阿姆斯特朗 美联社 哥大董事会联合主席大卫·格林沃尔德说:“阿姆斯特朗在大学充满不确定性的时刻接受了临时校长的职务,并不懈努力推动我们的利益。” 哥大在声明中称,该校董事会联合主席希普曼被任命为代理校长,直到董事会完成对校长的遴选。 希普曼自…

    2025年8月26日
  • 日本常春藤大学什么意思

    编译 | 辛雨 两年前,在人们对日本大学的国际排名感到担忧之际,受美国常春藤联盟启发,日本建立了一个10万亿日元的大学捐赠基金,旨在支持日本的研究和教育,打造一批可与美国常春藤盟校相媲美的精英大学。 日本内阁府在宣布成立该基金时表示,计划在25年内每年向遴选委员会选出的4~6所大学分配基金总额的3%,相当于3000亿日元。 然而,这一政府基金却有一个令人惊讶…

    2024年7月31日
  • 985中最差的学校名单

    在我国高等教育体系中,“985工程”院校代表着顶尖的教育资源和学术水平,是无数学子梦寐以求的目标。然而,在这39所精英院校中,从不同的角度考量,如综合排名、分数线等因素,总会有几所大学处于相对靠后的位置。本文将基于最新的资料,探讨这些排名相对较低的985大学及其录取分数线,为2024年的考生们提供参考。 首先,我们应当澄清一个概念:“最差”的985大学这一说…

    2024年11月10日
  • 横琴哈罗公学国际学校_横琴哈罗公学国际学校学费

    珠海最贵的学校学费究竟有多离谱? 珠海最贵的学校可以让普通的家庭直接倾家荡产,你信吗?让你们看一下真正的吞金兽是怎么耗资百万的。 ·第三名:横琴容闳公学,一年学费最高是15万。从小学到中学九年,普通家庭每年不吃不喝也难以凑够学费。 ·第二名:横琴哈罗礼德,学校一年最高29万9,从四年级以上可以提供住校服务。哈罗公学成立于伦敦,九年超200万的学费。说一下高中…

    2024年3月11日
  • 2023美国大学最新排名

    编辑:武穆 桃子 【新智元导读】USNews全美大学2023排名近日公布,其中哥伦比亚大学从第2名跌到第18名。由此,在美国的高校圈里引发了诸多争议。 USNews全美大学2023排名公布了! 9月12日,世界最权威排名机构之一U.S. News & World Report官方最新发布了2023年美国大学排名。 此次排名可是引起了不少争议。 MIT…

    2024年10月6日
  • 马来西亚泰莱大学博士毕业要求

    博士毕业难度第一梯队 马来亚大学:毕业要求至少1篇SCI国际核心期刊+至少8-10w字毕业论文+毕业答辩 为什么是“至少”,是因为导师可能会作为第二作者让你多发一篇期刊。在国外,博导也是有要求的,作为导师申请科研经费等的评判条件。 SCI作为世界通用的顶刊,录刊周期少则6个月,多则1年。 博士毕业难度第二梯队 博特拉大学:毕业要求至少1篇SCI或者2篇SCO…

    2024年12月3日
  • 利物浦大学在中国认可度高吗

     利物浦大学作为英国老牌大学,办学历史悠久,教育水平位于世界前列,吸引着众多国际 学子的到来,那么利物浦大学受到国内认可度怎么样? 利物浦大学实力介绍    利物浦大学成立于1881年,1903年由皇家政府特许成立。是一所久负盛名的全日制综合性 公立大学,是罗素盟校会员之一。利物浦大学已经八次获得诺贝尔奖,包括1902年第一次获得 英国的诺贝尔奖。中国许多学…

    2025年1月8日
  • 纽约州立大学布法罗分校就读的感受

    伍国在长期的教学实践和在地观察中,笔者一再意识到,中国文化对外传播,并不仅仅是“中”对“外”的单向模式。美国是一个移民国家,生活着来自世界各地的移民及其后裔。在展示各自传统文化时,这些群体之间隐含着某种既友善又存在一定竞争的关系,他们都希望将各自文化中最具代表性的部分呈现出来,以在美国这个充满多元文化的国家占据一席之地。在这种以美国为观察原点的多元文化情境中…

    2025年9月12日
  • qs亚洲大学排名300强

    中新网11月7日电 综合港媒报道,国际高等教育信息机构(Quacquarelli Symonds,QS)6日公布2025年亚洲大学排名,香港有11所院校上榜,其中,香港大学蝉联亚洲第二,香港中文大学较去年上升4位、排第6位,香港城市大学首次进入前十、排名第10。 11家上榜的香港大学中,有5家跻身前50位,包括香港大学(第2位)、香港中文大学(第6位)、香港…

    2025年6月25日
  • 耶鲁大学最好专业是什么

    前言:这是来自公众号留美申请专家关于耶鲁哪个专业最强?13个专业世界前10,这4个领域不能错过的一篇文章。 耶鲁大学(Yale University)作为一所世界一流的学府,拥有众多各具特色的专业。尽管每个专业都有自身的优势和特点,以下是耶鲁大学在13个专业中,世界前10的4个领域,这些领域被认为在学术声誉、教学质量和研究产出等方面表现出色: 1. 法学:耶…

    2024年1月9日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信