圣彼得堡国立技术大学世界排名

智东西9月18日消息,今天凌晨,OpenAI和谷歌前后脚宣布,自家模型在全球知名编程竞赛ICPC 2025(第49届国际大学生程序设计竞赛)总决赛获得金牌级别的表现。

OpenAI推理系统答对了全部12道题目,并且一次性答对11道题,最难的题目提交了9次后成功,与人类团队相比可排第一;Gemini 2.5 Deep Think高级版本在677分钟内解出10道题,与人类团队相比可位列第二。

如果将AI列入ICPC的总排名中,前三名应该是OpenAI推理系统、圣彼得堡国立大学、谷歌Gemini 2.5 Deep Think高级版本。

ICPC的要求是参赛者在5个小时内解出12道复杂算法问题,解题方案是否完美、解题耗时都会影响积分。

最终139支队伍中获得金牌的为前四名,分别为圣彼得堡国立大学、东京大学、北京交通大学、清华大学,解出题目最多的是圣彼得堡国立大学,共11道。

ICPC拿下金牌的人类团队

这是继2个月前,OpenAI推理系统、谷歌Gemini 2.5 Deep Think在国际数学奥林匹克竞赛(IMO)之后,又一次在顶尖国际竞赛中证明了自己的实力。

谷歌Gemini 2.5 Deep Think高级版本参加ICPC总决赛的代码已经在GitHub开源。

GitHub地址:

https://github.com/google-deepmind/gemini_icpc2025

01.OpenAI拿下满分谷歌错两道

ICPC是全球公认的历史最悠久、规模最大、最负盛名的大学级算法编程竞赛,每年来自近3000所大学和超过103个国家的参与者竞相解决现实世界的编程问题。

OpenAI和谷歌都参与并获得金牌级别表现,OpenAI推理系统解答了12道题,谷歌Gemini 2.5 Deep Think高级版本答出10道题,最好的人类团队答出11道题。

1、OpenAI:拿下满分,11道题一次就做对

OpenAI推理系统获得满分。

OpenAI提到并没有专门为ICPC训练模型,其采用通用推理模型组合的方式参赛。

比赛中,GPT-5与一款实验性推理模型共同生成解题方案,由该实验性推理模型负责筛选待提交的方案。最终,GPT-5正确解答了11道题目,而最后一道也是难度最高的一道题目由这款实验性推理模型解决。

其模型一次性答对了11道题,最难的问题在第9次提交时成功了。

2、谷歌:答对10道题,45分钟解出8道题

Gemini 2.5 Deep Think高级版本按照ICPC规则在远程在线环境中进行现场比赛,比人类参赛者晚10分钟开始。Gemini总共花费677分钟,解决了12个问题中的10个,其中8个花费45分钟,另外2个问题花费3个小时。

下图是2025年ICPC总决赛中解决每个问题所用的时间,Gemini所花的时间以蓝色显示,最快的大学生团队的时间以灰色显示。

Gemini在3道题目上的解题时间都超过了人类。

ICPC总决赛中解决每个问题所用的时间

此外,谷歌DeepMind还提到一道困住所有人类团队的难题,被Gemini在半小时内成功解答。

问题C要求团队设计一套解决方案,通过相互连接的管道网络将液体输送至一组储液罐,目标是找到一种管道配置,以最快速度将所有储液罐注满。

该问题存在无限多种可能的配置,因为每条管道均可处于开启、关闭甚至部分开启的状态,这使得寻找最优配置的难度极大。

问题C简介

Gemini找到了有效的解决方案:它首先假设每个水库都有一个“优先级值”,代表每个水库与其他水库相比应该获得的优先程度。

当给定一组优先级值时,可以使用动态规划算法找到管道的最佳配置。

Gemini发现,通过应用极小极大定理(Minimax Theorem),原问题可转化为寻找能使最终流量受到最大约束的优先级数值。

借助优先级数值与最优流量之间的关联,Gemini在类似碗状的凸性解空间中,通过嵌套三分搜索(Nested Ternary Searches)快速找到最优优先级数值,最终解决了C题。

目前订阅Google AI Ultra的Gemini用户已经可以在Gemini App中使用轻量级版本的Gemini 2.5 Deep Think。

02.ICPC金牌水平展现大模型抽象推理能力

谷歌DeepMind的博客中提到,Gemini的表现得益于其在预训练、训练后、强化学习技术、多步骤推理和平行思维方面的技术创新。

例如,在强化学习过程中,研究人员训练Gemini为编程人员面临的一些最困难的问题进行推理和生成代码,从结果反馈中学习并改进其方法。为了解决一个问题,多个Gemini Agent会各自提出自己的解决方案,使用终端执行代码和测试,然后根据所有尝试迭代解决方案。

谷歌DeepMind的内部研究表明,Gemini 2.5 Deep Think高级版本也能在2023年和2024年ICPC世界总决赛中取得金牌级别的表现,表现不亚于全球前20名竞技开发者。

在ICPC上获得金牌水平对软件开发具有直接的实际影响,如果将比赛中最好的AI和人类解决方案结合起来,所有12个问题都会得到彻底和正确的解决。这表明AI有潜力提供独特思路,为人类专家提供补充。

除了数学和编程外,Gemini 2.5 Deep Think高级版本还展示了在抽象推理方面的能力。

这是因为,ICPC的问题需要模型理解复杂的问题、设计多步骤的逻辑计划、完美实施,这一过程与许多科学和工程领域所需的技能相同,包括设计新药或微芯片等领域。

OpenAI的研究人员在X上发布帖子称,他们采用同一组模型参加IMO和IOI竞赛,展示了模型性能以及通用型。

03.结语:大模型复杂抽象问题解决能力提升

从国际数学奥林匹克竞赛(IMO)到此次的编程竞赛,OpenAI以及谷歌的模型在解决更具挑战的数学、推理难题上迸发出巨大潜力。ICPC全球执行董事Bill Poucher博士称,ICPC一直致力于在解决问题方面设定最高标准,Gemini在这一领域取得的成绩,标志着定义下一代所需AI工具和学术标准的关键时刻。

这些在竞争性编程和数学推理方面的突破共同证明了大模型在抽象推理问题解决方面的性能飞跃,或能与人类专家结合,解决更加复杂的难题。

本文来自微信公众号“智东西”(ID:zhidxcom),作者:程茜,编辑:李水青,36氪经授权发布。

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/61854.html

(0)
上一篇 2025年10月30日
下一篇 2025年10月30日

相关推荐

  • 美国高中排名前50名名单_美国高中排名前50名名单篮球

     美国私立高中排名前50!Niche版! 申请高峰期来到了,近期咨询高端私立高中的家长增多,大多数都想去排名好的学校,但是对于排名很多家长都不是很了解,可以说是一知半解,实际上也不用太执着于排名,适合孩子的就是最好的学校,这与学生的性格,学术水平都息息相关,也和申请大学有着紧密的联系,学生去到这所学校特长和潜力能被挖掘出来,同时在全年级的排名最好在10%-1…

    2024年4月23日
  • 伍伦贡大学在澳洲排名

    《澳洲金融评论报》(Australian Financial Review,简称AFR),近日发布了《2024 澳洲最佳高校排名》。 这是澳洲唯一一个本土院校排行榜,想要去澳洲留学的伙伴,一定要看这份榜单哦~ 图源 | AFR官网 01 TOP 10大学 这份榜单排名了澳洲40所大学,我们常说的“澳洲八大”院校,均排名前十。 昆士兰大学(University…

    2024年12月19日
  • 耶鲁大学有获过物理诺贝尔奖的吗_耶鲁大学有获过物理诺贝尔奖的吗知乎

    【快讯!2020诺贝尔文学奖揭晓,美国诗人Louise Glück夺得】2020诺贝尔文学奖刚刚公布!据诺贝尔奖官方网站消息,诺贝尔文学奖于北京时间10月8日19时正式揭晓,来自美国的诗人Louise Glück获奖,获奖理由是“因为她那无可辩驳的诗意般的声音,用朴素的美使个人的存在变得普遍”。 据诺贝尔奖官方网站介绍,美国诗人Louise Glück于19…

    2024年2月28日
  • 中国所有211大学名单及排名

    文/圆梦志愿 马老师 教育部直属大学即由教育部直接管理的大学,这些学校一般都是全国重点大学,更受国家重视,在提高教学、科研和服务社会等多方面发挥着示范作用。本期,我们不但为大家整理了教育部直属211大学名单排名,还附有教育部直属211大学录取分数线,供大家填报志愿的时候参考。 一、教育部直属211大学(排除985)名单排名 根据教育部公布的《教育部直属高校学…

    2024年12月6日
  • 加州理工学院学费

    加州理工学院2019-2020学年研究生学费为52506美元一年学费每年会约有5%左右的上涨幅度;新生需额外准备3000美金左右的费用,以备购买电脑之类的个人所需品。除此之外该校奖学金非常丰厚,事实上98%的研究生(包括硕士、博士)以及99%的博士研究生都能从学校获得全额奖学金,包含全部学费外加按月发放的生活补贴。奖学金形式为Merit-based,无需额外…

    2025年11月18日
  • 考外国的大学怎么考的

    \r在追求卓越的学术之旅中,成功申请到心仪的国外大学是每一位留学梦想者的终极目标。为了确保这一目标能够顺利实现,深入了解申请步骤以及每个环节的注意事项至关重要。作为一名经验丰富的留学专家,今天我将结合多年的行业积累,为大家详细解析出国留学申请的具体流程,帮助你们避开潜在的陷阱,确保每一步都走得稳健而有力,助力你们顺利开启梦寐以求的留学生涯!\r \r \r1…

    2024年7月6日
  • 济南幼儿师范学校(济南幼儿师范学校2023招生简章)

    济南幼儿师范高等专科学校 2023年综合评价招生简章 学校代码:14332 一、学校概况 济南幼儿师范高等专科学校前身是创建于1902年的山东省济南师范学校、创建于1952年的山东省济南幼儿师范学校以及创建于1979年的济南广播电视大学。2011年4月经国家教育部批准,三校合并为全日制普通高等专科学校。 二、综合评价招生专业和招生计划 2023年综合评价招生…

    2023年11月20日
  • 中大是哪个大学

    \r “中大”这个简称,常常让人一头雾水。中山大学、中南大学、中北大学,名字里都有个“中”,但究竟谁才是真正的“中大”?不同地区、不同圈子,答案大相径庭。\r有人说“中大”只属于中山大学,百年名校、声名远扬;也有人坚持,中南大学才是湖南人的“中大”;而中北大学的学子同样自豪地称自己是“中大人”。一场关于“中大”归属的讨论,其实折射出高校间的地域认同与文化自信…

    2025年8月28日
  • 广州华南理工学院

    截至7月20日,华南理工大学在广东省的本科招生录取工作圆满结束。2025年,华南理工大学在广东省共录取3516名学生,普通类生源质量稳中有升。其中,录取物理类学子2793名,投档最低位次比去年显著提升;录取历史类学子220名,投档最低位次与2024年基本持平。 今年,华南理工大学坚持 “以生为本” 理念,推出招生培养一体化改革举措,包括优化专业结构、打造拔尖…

    2025年9月5日
  • 美国留学生一年的费用_美国留学生一年的费用大概是多少人民币

    去海外留学是很多莘莘学子的梦想,他们希望通过留学,学习到扎实的专业知识和技能,回来报效祖国,但能实现这种梦想的人是极少数。毕竟到国外留学,特别是到美国留学,除了很多特殊的因素外,留学费用高,这是很多家庭无法承受的。 在我周围的同事、朋友、同学中,其实也有很多人到美国、英国和澳洲等地留学,当时受到很多朋友的影响,我也想把自己的女儿送出去读书,但女儿当时不愿意,…

    2024年4月19日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信