圣彼得堡交通大学排名

智东西9月18日消息,今天凌晨,OpenAI和谷歌前后脚宣布,自家模型在全球知名编程竞赛ICPC 2025(第49届国际大学生程序设计竞赛)总决赛获得金牌级别的表现。

OpenAI推理系统答对了全部12道题目,并且一次性答对11道题,最难的题目提交了9次后成功,与人类团队相比可排第一;Gemini 2.5 Deep Think高级版本在677分钟内解出10道题,与人类团队相比可位列第二。

如果将AI列入ICPC的总排名中,前三名应该是OpenAI推理系统、圣彼得堡国立大学、谷歌Gemini 2.5 Deep Think高级版本。

ICPC的要求是参赛者在5个小时内解出12道复杂算法问题,解题方案是否完美、解题耗时都会影响积分。

最终139支队伍中获得金牌的为前四名,分别为圣彼得堡国立大学、东京大学、北京交通大学、清华大学,解出题目最多的是圣彼得堡国立大学,共11道。

ICPC拿下金牌的人类团队

这是继2个月前,OpenAI推理系统、谷歌Gemini 2.5 Deep Think在国际数学奥林匹克竞赛(IMO)之后,又一次在顶尖国际竞赛中证明了自己的实力。

谷歌Gemini 2.5 Deep Think高级版本参加ICPC总决赛的代码已经在GitHub开源。

GitHub地址:

https://github.com/google-deepmind/gemini_icpc2025

01.OpenAI拿下满分谷歌错两道

ICPC是全球公认的历史最悠久、规模最大、最负盛名的大学级算法编程竞赛,每年来自近3000所大学和超过103个国家的参与者竞相解决现实世界的编程问题。

OpenAI和谷歌都参与并获得金牌级别表现,OpenAI推理系统解答了12道题,谷歌Gemini 2.5 Deep Think高级版本答出10道题,最好的人类团队答出11道题。

1、OpenAI:拿下满分,11道题一次就做对

OpenAI推理系统获得满分。

OpenAI提到并没有专门为ICPC训练模型,其采用通用推理模型组合的方式参赛。

比赛中,GPT-5与一款实验性推理模型共同生成解题方案,由该实验性推理模型负责筛选待提交的方案。最终,GPT-5正确解答了11道题目,而最后一道也是难度最高的一道题目由这款实验性推理模型解决。

其模型一次性答对了11道题,最难的问题在第9次提交时成功了。

2、谷歌:答对10道题,45分钟解出8道题

Gemini 2.5 Deep Think高级版本按照ICPC规则在远程在线环境中进行现场比赛,比人类参赛者晚10分钟开始。Gemini总共花费677分钟,解决了12个问题中的10个,其中8个花费45分钟,另外2个问题花费3个小时。

下图是2025年ICPC总决赛中解决每个问题所用的时间,Gemini所花的时间以蓝色显示,最快的大学生团队的时间以灰色显示。

Gemini在3道题目上的解题时间都超过了人类。

ICPC总决赛中解决每个问题所用的时间

此外,谷歌DeepMind还提到一道困住所有人类团队的难题,被Gemini在半小时内成功解答。

问题C要求团队设计一套解决方案,通过相互连接的管道网络将液体输送至一组储液罐,目标是找到一种管道配置,以最快速度将所有储液罐注满。

该问题存在无限多种可能的配置,因为每条管道均可处于开启、关闭甚至部分开启的状态,这使得寻找最优配置的难度极大。

问题C简介

Gemini找到了有效的解决方案:它首先假设每个水库都有一个“优先级值”,代表每个水库与其他水库相比应该获得的优先程度。

当给定一组优先级值时,可以使用动态规划算法找到管道的最佳配置。

Gemini发现,通过应用极小极大定理(Minimax Theorem),原问题可转化为寻找能使最终流量受到最大约束的优先级数值。

借助优先级数值与最优流量之间的关联,Gemini在类似碗状的凸性解空间中,通过嵌套三分搜索(Nested Ternary Searches)快速找到最优优先级数值,最终解决了C题。

目前订阅Google AI Ultra的Gemini用户已经可以在Gemini App中使用轻量级版本的Gemini 2.5 Deep Think。

02.ICPC金牌水平展现大模型抽象推理能力

谷歌DeepMind的博客中提到,Gemini的表现得益于其在预训练、训练后、强化学习技术、多步骤推理和平行思维方面的技术创新。

例如,在强化学习过程中,研究人员训练Gemini为编程人员面临的一些最困难的问题进行推理和生成代码,从结果反馈中学习并改进其方法。为了解决一个问题,多个Gemini Agent会各自提出自己的解决方案,使用终端执行代码和测试,然后根据所有尝试迭代解决方案。

谷歌DeepMind的内部研究表明,Gemini 2.5 Deep Think高级版本也能在2023年和2024年ICPC世界总决赛中取得金牌级别的表现,表现不亚于全球前20名竞技开发者。

在ICPC上获得金牌水平对软件开发具有直接的实际影响,如果将比赛中最好的AI和人类解决方案结合起来,所有12个问题都会得到彻底和正确的解决。这表明AI有潜力提供独特思路,为人类专家提供补充。

除了数学和编程外,Gemini 2.5 Deep Think高级版本还展示了在抽象推理方面的能力。

这是因为,ICPC的问题需要模型理解复杂的问题、设计多步骤的逻辑计划、完美实施,这一过程与许多科学和工程领域所需的技能相同,包括设计新药或微芯片等领域。

OpenAI的研究人员在X上发布帖子称,他们采用同一组模型参加IMO和IOI竞赛,展示了模型性能以及通用型。

03.结语:大模型复杂抽象问题解决能力提升

从国际数学奥林匹克竞赛(IMO)到此次的编程竞赛,OpenAI以及谷歌的模型在解决更具挑战的数学、推理难题上迸发出巨大潜力。ICPC全球执行董事Bill Poucher博士称,ICPC一直致力于在解决问题方面设定最高标准,Gemini在这一领域取得的成绩,标志着定义下一代所需AI工具和学术标准的关键时刻。

这些在竞争性编程和数学推理方面的突破共同证明了大模型在抽象推理问题解决方面的性能飞跃,或能与人类专家结合,解决更加复杂的难题。

本文来自微信公众号“智东西”(ID:zhidxcom),作者:程茜,编辑:李水青,36氪经授权发布。

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/67126.html

(0)
上一篇 2025年11月27日
下一篇 2025年11月27日

相关推荐

  • 伯克利大学专业排名

    伯克利音乐学院是一个非营利性的,根据马萨诸塞州联邦的一般规律,成立高等教育的男女同校的机构。学院是新英格兰学校和学院协会认可,并根据联邦法律授权招收非移民学生和退伍军人培训GI比尔根据人权。那么伯克利音乐学院有哪些专业处于世界顶尖水平?接下来美藤国际教育为你解答。 伯克利音乐学院优势专业 伯克利音乐学院最最最招牌的三大音乐类型是爵士,流行和摇滚乐。当然,爵士…

    2025年10月28日
  • 温彻斯特大学真实水平

    择校标准千千万,院校排名参考不一般。 作为网络‍选手的乐子人,必然了解的无论是QS、USNEWS、THE还是ARWU,近期统统都要给「虎扑高校评分」让位bushi 这几天虎扑社区的高校评分无疑成为了大学生的整活儿基地,随时随地发疯,处处都是梗的评语迅速火遍全网。 不止国内高校的评分评语让人笑拥了,虎扑英国高校排名更是成为了留子们的大型团建 话不多说,请看图 …

    2025年2月28日
  • 广东文理职业学院垃圾学院

    广东是中国经济最发达的省份,连续几十年占据国内GDP省市第一名。作为改革开放最前沿的地区,广东也建设了一批高水平的大学,类型多种多样。 曾经有这样一所大学,在八九十年代,分数曾比肩985名校,深受考生喜爱,如今却泯然众人矣了。不管是综合实力还是录取分数不要说比肩985,在广东都很难进前15名了。 这所高校就是位于广东汕头的:汕头大学。 图源:汕大官网,版权归…

    2025年4月2日
  • 广州华立科技职业学院招生电话

    01、学校简介 广州华立科技职业学院是一所经广东省人民政府批准、国家教育部备案的全日制普通高职院校。学校始建于1999年6月,面向全国招收普通高等教育国家任务生。学校设有广州、云浮两大校区9个二级学院53个专业,校园环境优美,教学设施一流,图书馆藏丰富,广州校区地处穗莞深港黄金走廊和广深科技创新走廊的重要节点,云浮校区位于云浮市高新技术开发区内,所设专业紧密…

    2024年9月14日
  • 视觉传达专业世界排名_视觉传达专业世界排名QS

    亲爱的高三学生们,选择大学专业就像是选对生命中的“伴侣”,一旦选择了视觉传达设计,就意味着你可能会与Photoshop和Illustrator共度一生!这里,我们为你提供了2024年全国最好的50所学习视觉传达设计的大学,让你的选择不再盲目,而是有的放矢。我们的排名基于教育质量、学生满意度、就业率和学术资源等多个维度,数据精确到小数点后两位,让你的志愿填报既…

    2024年4月26日
  • 新加坡留学本科几年制

    新加坡因为其安全的环境、学制短,回国认可度高,留学成本低,多文化的氛围,以及英联邦的教育体制,已经成为很多中国学生的选择。 新加坡是一个热带国家,一年四季温度恒定在29-32°之间,属赤道多雨气候,没有明显的四季之分,所以新加坡没有寒假、暑假。 本科学校分为公立大学和私立大学,公立大学的学制都是4年制,私立大学因专业不同而有所不同,有3年制的本科,也有2年制…

    2025年11月6日
  • 泰国皇太后大学算几本

    泰国清莱皇太后大学 皇太后大学于1998年9月25日正式成立,她是一所国立自治大学。她的建立是为了回应泰国北方人民为缅怀诗娜卡琳皇太后殿下宏恩厚泽的需要,使之成为人民纪念、效忠和继承皇太后殿下办学遗志的场所。该校为泰国教育部承认的高等学府,是泰国一所用英语授课的国立大学,同时还与国内外著名的学术机构有着密切的学术交流与合作关系。 立思辰留学介绍,泰国清莱皇太…

    2024年10月6日
  • 世界联合学院常熟分校入学条件

    对世界满怀热情和好奇吗? 期待与全球师生共同学习、生活, 并建立一生的友谊吗? 愿意跨出舒适圈,挑战全球认可、 极具含金量的IBDP课程吗? 渴望自主安排课余生活, 充分探索自我,深入探究世界吗? 想将所学与真实世界链接, 为社区带来积极影响吗? UWC 2025年入学申请现已正式开放, 诚挚欢迎有志青年提交申请, 加入UWC大家庭, 为世界和平与可持续发展…

    2025年8月28日
  • 宁波诺丁汉大学就业率

    2018-01-10 17:56 | 浙江新闻客户端 | 记者 马悦 通讯员 田艺 胡敏 作为国内第一家中外合作大学,宁波诺丁汉大学至今已有10届本科毕业生、12届硕士毕业生和5届博士毕业生,共有1.2多万人走向世界。在伦敦金融街顶级投行、全球四大会计师事务所、大型跨国公司、尖端技术实验室、各国顶尖名校,到处都能见到宁诺学子的身影。 根据最新发布的《宁波诺丁…

    2024年12月20日
  • 法学世界排名

    2025年CNUR法学学科排名出炉,北京大学第四名,清华大学第六名,排在前十名大学法学学科都是哪些呢? 1.中国政法大学 2.中国人民大学 3.武汉大学 4.北京大学 5.中南财经政法大学 6.清华大学 7.华东政法大学 8.西南政法大学 9.吉林大学 10.上海交通大学 法学曾经是热门专业,是文科生的最爱,这几年有所降温,但根据教育部就业指导中心的统计数据…

    2025年11月13日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信