圣彼得堡交通大学排名

智东西9月18日消息,今天凌晨,OpenAI和谷歌前后脚宣布,自家模型在全球知名编程竞赛ICPC 2025(第49届国际大学生程序设计竞赛)总决赛获得金牌级别的表现。

OpenAI推理系统答对了全部12道题目,并且一次性答对11道题,最难的题目提交了9次后成功,与人类团队相比可排第一;Gemini 2.5 Deep Think高级版本在677分钟内解出10道题,与人类团队相比可位列第二。

如果将AI列入ICPC的总排名中,前三名应该是OpenAI推理系统、圣彼得堡国立大学、谷歌Gemini 2.5 Deep Think高级版本。

ICPC的要求是参赛者在5个小时内解出12道复杂算法问题,解题方案是否完美、解题耗时都会影响积分。

最终139支队伍中获得金牌的为前四名,分别为圣彼得堡国立大学、东京大学、北京交通大学、清华大学,解出题目最多的是圣彼得堡国立大学,共11道。

ICPC拿下金牌的人类团队

这是继2个月前,OpenAI推理系统、谷歌Gemini 2.5 Deep Think在国际数学奥林匹克竞赛(IMO)之后,又一次在顶尖国际竞赛中证明了自己的实力。

谷歌Gemini 2.5 Deep Think高级版本参加ICPC总决赛的代码已经在GitHub开源。

GitHub地址:

https://github.com/google-deepmind/gemini_icpc2025

01.OpenAI拿下满分谷歌错两道

ICPC是全球公认的历史最悠久、规模最大、最负盛名的大学级算法编程竞赛,每年来自近3000所大学和超过103个国家的参与者竞相解决现实世界的编程问题。

OpenAI和谷歌都参与并获得金牌级别表现,OpenAI推理系统解答了12道题,谷歌Gemini 2.5 Deep Think高级版本答出10道题,最好的人类团队答出11道题。

1、OpenAI:拿下满分,11道题一次就做对

OpenAI推理系统获得满分。

OpenAI提到并没有专门为ICPC训练模型,其采用通用推理模型组合的方式参赛。

比赛中,GPT-5与一款实验性推理模型共同生成解题方案,由该实验性推理模型负责筛选待提交的方案。最终,GPT-5正确解答了11道题目,而最后一道也是难度最高的一道题目由这款实验性推理模型解决。

其模型一次性答对了11道题,最难的问题在第9次提交时成功了。

2、谷歌:答对10道题,45分钟解出8道题

Gemini 2.5 Deep Think高级版本按照ICPC规则在远程在线环境中进行现场比赛,比人类参赛者晚10分钟开始。Gemini总共花费677分钟,解决了12个问题中的10个,其中8个花费45分钟,另外2个问题花费3个小时。

下图是2025年ICPC总决赛中解决每个问题所用的时间,Gemini所花的时间以蓝色显示,最快的大学生团队的时间以灰色显示。

Gemini在3道题目上的解题时间都超过了人类。

ICPC总决赛中解决每个问题所用的时间

此外,谷歌DeepMind还提到一道困住所有人类团队的难题,被Gemini在半小时内成功解答。

问题C要求团队设计一套解决方案,通过相互连接的管道网络将液体输送至一组储液罐,目标是找到一种管道配置,以最快速度将所有储液罐注满。

该问题存在无限多种可能的配置,因为每条管道均可处于开启、关闭甚至部分开启的状态,这使得寻找最优配置的难度极大。

问题C简介

Gemini找到了有效的解决方案:它首先假设每个水库都有一个“优先级值”,代表每个水库与其他水库相比应该获得的优先程度。

当给定一组优先级值时,可以使用动态规划算法找到管道的最佳配置。

Gemini发现,通过应用极小极大定理(Minimax Theorem),原问题可转化为寻找能使最终流量受到最大约束的优先级数值。

借助优先级数值与最优流量之间的关联,Gemini在类似碗状的凸性解空间中,通过嵌套三分搜索(Nested Ternary Searches)快速找到最优优先级数值,最终解决了C题。

目前订阅Google AI Ultra的Gemini用户已经可以在Gemini App中使用轻量级版本的Gemini 2.5 Deep Think。

02.ICPC金牌水平展现大模型抽象推理能力

谷歌DeepMind的博客中提到,Gemini的表现得益于其在预训练、训练后、强化学习技术、多步骤推理和平行思维方面的技术创新。

例如,在强化学习过程中,研究人员训练Gemini为编程人员面临的一些最困难的问题进行推理和生成代码,从结果反馈中学习并改进其方法。为了解决一个问题,多个Gemini Agent会各自提出自己的解决方案,使用终端执行代码和测试,然后根据所有尝试迭代解决方案。

谷歌DeepMind的内部研究表明,Gemini 2.5 Deep Think高级版本也能在2023年和2024年ICPC世界总决赛中取得金牌级别的表现,表现不亚于全球前20名竞技开发者。

在ICPC上获得金牌水平对软件开发具有直接的实际影响,如果将比赛中最好的AI和人类解决方案结合起来,所有12个问题都会得到彻底和正确的解决。这表明AI有潜力提供独特思路,为人类专家提供补充。

除了数学和编程外,Gemini 2.5 Deep Think高级版本还展示了在抽象推理方面的能力。

这是因为,ICPC的问题需要模型理解复杂的问题、设计多步骤的逻辑计划、完美实施,这一过程与许多科学和工程领域所需的技能相同,包括设计新药或微芯片等领域。

OpenAI的研究人员在X上发布帖子称,他们采用同一组模型参加IMO和IOI竞赛,展示了模型性能以及通用型。

03.结语:大模型复杂抽象问题解决能力提升

从国际数学奥林匹克竞赛(IMO)到此次的编程竞赛,OpenAI以及谷歌的模型在解决更具挑战的数学、推理难题上迸发出巨大潜力。ICPC全球执行董事Bill Poucher博士称,ICPC一直致力于在解决问题方面设定最高标准,Gemini在这一领域取得的成绩,标志着定义下一代所需AI工具和学术标准的关键时刻。

这些在竞争性编程和数学推理方面的突破共同证明了大模型在抽象推理问题解决方面的性能飞跃,或能与人类专家结合,解决更加复杂的难题。

本文来自微信公众号“智东西”(ID:zhidxcom),作者:程茜,编辑:李水青,36氪经授权发布。

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/67126.html

(0)
上一篇 2025年11月27日
下一篇 2025年11月27日

相关推荐

  • 英国留学好还是美国好

    随着全球化的深入发展,越来越多的中国学生选择出国深造,而英国和美国无疑是两大热门留学目的地。但是,面对这两个各具特色的国家,该如何选择呢?本文将结合两国留学的特点,为您详细分析,帮助您做出最适合自己的决策。 一、英国留学特点 学制短而紧凑:英国的教育体系以其高效和紧凑著称。本科课程通常为三年,硕士课程(授课型)为一年,让学生能够在短时间内获得高质量的学位。 …

    2024年5月21日
  • 专升本南京航空航天大学

    南京航天航空大学是一所以航空航天为特色的大学,位于江苏省南京市。 自创建以来,学校一直致力于培养高素质的航空人才,在享有很高声誉。 为了满足更多学生的需求,南京航天航空大学推出了专升本招生计划,为更多有志于航空领域的学生提供了更好的机会。 南京航天航空大学专接本2023招生简章发布了,本次招生计划共开设了8个,分别为航空航天工程、飞行器设计与工程、飞行器动力…

    2025年3月7日
  • 昆士兰科技学院

    学校简介 昆士兰科技大学(QUT)是澳大利亚顶尖大学,拥有全球化视野和务实的办学理念,位于昆士兰州布里斯班。它是一所公立研究型大学,成立于1990年,由昆士兰理工学院和布里斯班高等教育学院合并而成。昆士兰科技大学提供世界一流的学习资源,是澳大利亚发展最快的研究型大学。 昆士兰科技大学在布里斯班有两个校区:花园点校区和凯尔文格罗夫校区。 昆士兰科技大学提供广泛…

    2025年6月24日
  • 软科大学排名(软科大学排名什么意思)

    中国政法大学、华东政法大学、西南政法大学、中国人民公安大学、西北政法大学

    2023年11月1日
  • 出国留学费用澳洲

    #澳洲留学# 对于计划赴澳留学的同学和家长而言,“预算够不够” 永远是首要关注的核心问题。选对院校、专业与城市,一年可节省十余万元。Velocity Education 基于 2025 年最新数据,拆解学费、生活费构成,分享硬核省钱技巧,助你避开 “留学刺客”,明明白白规划留学开支。 学费:差价藏在 “学校 + 专业” 里,选对能省一半开支澳洲留学学费绝非统…

    2025年12月31日
  • 延世大学研究生(延世大学研究生申请条件)

    招生简章 2023韩国延世大学 Yonsei Universityy 01应往届生均可报考,无需工作经验02国家教育部学位认证,可读博,可考公务员032023QS世界排名7304免硕士毕业论文,学制1.5年05本科-硕士06高奖学金 01 院校简介 韩国延世大学 延世大学成立于1885年,是一所世界顶尖研究型综合大学,在世界大学排名中一直名列前茅,2023年…

    2023年11月4日
  • 美国电影学院百年百大经典台词

    自2005年美国电影学会发布百大经典电影台词以来,电影世界里的金句犹如璀璨星辰。如今,历经二十余载,是时候重新审视那些跨越世纪的台词,让它们与电影史上最难忘的对白并肩闪耀。以下是我们精心挑选的史上十大经典电影台词,从第十名到榜首,一探究竟。 10. "King Kong ain’t got s*** on me!" —— 丹泽尔·华盛顿饰…

    2025年6月26日
  • 中国留学生在美国怎么样

    作者:左微 华盛顿大学人类学系德高望重的斯蒂文·郝瑞(Stevan Harrell)教授,精通中文和彝语,会闽南话和粤语,一手建立了华盛顿大学大与四川大学的本科生交流项目。曾任华盛顿大学人类学与国际研究所教授,人类学系主任,博克自然历史文化博物馆民族学部亚洲项目主任。42年来指导过的中国学生无数,见证了中国留学生从公派到自费、低龄化以及数量剧增的诸多变化。对…

    2025年10月14日
  • 美国大学暑假

    来源:中国新闻网 中新网成都7月19日电 (记者 岳依桐)四川省人民对外友好协会、北京大学于15日至19日在四川成功举办“知·行中国——美国高校青年代表团”暑期研学实践活动。来自哈佛大学、康奈尔大学、芝加哥大学等10所美国高校的20名青年学生与北京大学、四川大学师生和在川美国留学生一起,走进成都、德阳和雅安。 在三星堆博物馆,哥伦比亚大学学生邓柏霓凰惊叹古蜀…

    2025年12月27日
  • 达拉斯大学世界排名

    昨天,我们报道了伊利诺伊州已立法宣布该州所有公立大学将从2022年起,永久实施“Test-Optional"的消息。 今天我们和大家介绍的,就是位列其中、世界排名前50、同时还是中国留学生们的“大众情人”校的—— 伊利诺伊大学厄巴纳-香槟分校 University of Illinois, Urbana-Champaign(简称作UIUC) 学校基…

    2025年12月2日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信