圣彼得堡国立技术大学世界排名

智东西9月18日消息,今天凌晨,OpenAI和谷歌前后脚宣布,自家模型在全球知名编程竞赛ICPC 2025(第49届国际大学生程序设计竞赛)总决赛获得金牌级别的表现。

OpenAI推理系统答对了全部12道题目,并且一次性答对11道题,最难的题目提交了9次后成功,与人类团队相比可排第一;Gemini 2.5 Deep Think高级版本在677分钟内解出10道题,与人类团队相比可位列第二。

如果将AI列入ICPC的总排名中,前三名应该是OpenAI推理系统、圣彼得堡国立大学、谷歌Gemini 2.5 Deep Think高级版本。

ICPC的要求是参赛者在5个小时内解出12道复杂算法问题,解题方案是否完美、解题耗时都会影响积分。

最终139支队伍中获得金牌的为前四名,分别为圣彼得堡国立大学、东京大学、北京交通大学、清华大学,解出题目最多的是圣彼得堡国立大学,共11道。

ICPC拿下金牌的人类团队

这是继2个月前,OpenAI推理系统、谷歌Gemini 2.5 Deep Think在国际数学奥林匹克竞赛(IMO)之后,又一次在顶尖国际竞赛中证明了自己的实力。

谷歌Gemini 2.5 Deep Think高级版本参加ICPC总决赛的代码已经在GitHub开源。

GitHub地址:

https://github.com/google-deepmind/gemini_icpc2025

01.OpenAI拿下满分谷歌错两道

ICPC是全球公认的历史最悠久、规模最大、最负盛名的大学级算法编程竞赛,每年来自近3000所大学和超过103个国家的参与者竞相解决现实世界的编程问题。

OpenAI和谷歌都参与并获得金牌级别表现,OpenAI推理系统解答了12道题,谷歌Gemini 2.5 Deep Think高级版本答出10道题,最好的人类团队答出11道题。

1、OpenAI:拿下满分,11道题一次就做对

OpenAI推理系统获得满分。

OpenAI提到并没有专门为ICPC训练模型,其采用通用推理模型组合的方式参赛。

比赛中,GPT-5与一款实验性推理模型共同生成解题方案,由该实验性推理模型负责筛选待提交的方案。最终,GPT-5正确解答了11道题目,而最后一道也是难度最高的一道题目由这款实验性推理模型解决。

其模型一次性答对了11道题,最难的问题在第9次提交时成功了。

2、谷歌:答对10道题,45分钟解出8道题

Gemini 2.5 Deep Think高级版本按照ICPC规则在远程在线环境中进行现场比赛,比人类参赛者晚10分钟开始。Gemini总共花费677分钟,解决了12个问题中的10个,其中8个花费45分钟,另外2个问题花费3个小时。

下图是2025年ICPC总决赛中解决每个问题所用的时间,Gemini所花的时间以蓝色显示,最快的大学生团队的时间以灰色显示。

Gemini在3道题目上的解题时间都超过了人类。

ICPC总决赛中解决每个问题所用的时间

此外,谷歌DeepMind还提到一道困住所有人类团队的难题,被Gemini在半小时内成功解答。

问题C要求团队设计一套解决方案,通过相互连接的管道网络将液体输送至一组储液罐,目标是找到一种管道配置,以最快速度将所有储液罐注满。

该问题存在无限多种可能的配置,因为每条管道均可处于开启、关闭甚至部分开启的状态,这使得寻找最优配置的难度极大。

问题C简介

Gemini找到了有效的解决方案:它首先假设每个水库都有一个“优先级值”,代表每个水库与其他水库相比应该获得的优先程度。

当给定一组优先级值时,可以使用动态规划算法找到管道的最佳配置。

Gemini发现,通过应用极小极大定理(Minimax Theorem),原问题可转化为寻找能使最终流量受到最大约束的优先级数值。

借助优先级数值与最优流量之间的关联,Gemini在类似碗状的凸性解空间中,通过嵌套三分搜索(Nested Ternary Searches)快速找到最优优先级数值,最终解决了C题。

目前订阅Google AI Ultra的Gemini用户已经可以在Gemini App中使用轻量级版本的Gemini 2.5 Deep Think。

02.ICPC金牌水平展现大模型抽象推理能力

谷歌DeepMind的博客中提到,Gemini的表现得益于其在预训练、训练后、强化学习技术、多步骤推理和平行思维方面的技术创新。

例如,在强化学习过程中,研究人员训练Gemini为编程人员面临的一些最困难的问题进行推理和生成代码,从结果反馈中学习并改进其方法。为了解决一个问题,多个Gemini Agent会各自提出自己的解决方案,使用终端执行代码和测试,然后根据所有尝试迭代解决方案。

谷歌DeepMind的内部研究表明,Gemini 2.5 Deep Think高级版本也能在2023年和2024年ICPC世界总决赛中取得金牌级别的表现,表现不亚于全球前20名竞技开发者。

在ICPC上获得金牌水平对软件开发具有直接的实际影响,如果将比赛中最好的AI和人类解决方案结合起来,所有12个问题都会得到彻底和正确的解决。这表明AI有潜力提供独特思路,为人类专家提供补充。

除了数学和编程外,Gemini 2.5 Deep Think高级版本还展示了在抽象推理方面的能力。

这是因为,ICPC的问题需要模型理解复杂的问题、设计多步骤的逻辑计划、完美实施,这一过程与许多科学和工程领域所需的技能相同,包括设计新药或微芯片等领域。

OpenAI的研究人员在X上发布帖子称,他们采用同一组模型参加IMO和IOI竞赛,展示了模型性能以及通用型。

03.结语:大模型复杂抽象问题解决能力提升

从国际数学奥林匹克竞赛(IMO)到此次的编程竞赛,OpenAI以及谷歌的模型在解决更具挑战的数学、推理难题上迸发出巨大潜力。ICPC全球执行董事Bill Poucher博士称,ICPC一直致力于在解决问题方面设定最高标准,Gemini在这一领域取得的成绩,标志着定义下一代所需AI工具和学术标准的关键时刻。

这些在竞争性编程和数学推理方面的突破共同证明了大模型在抽象推理问题解决方面的性能飞跃,或能与人类专家结合,解决更加复杂的难题。

本文来自微信公众号“智东西”(ID:zhidxcom),作者:程茜,编辑:李水青,36氪经授权发布。

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/61854.html

(0)
上一篇 2025年10月30日
下一篇 2025年10月30日

相关推荐

  • 都灵理工大学回国就业

    本文来源于公众号:意大利留学情报站 高考结束啦,小编在小红书上一刷就能刷到很多问专业选择的帖子,也有很多准备去意大利留学的崽还在纠结自己该选什么大学专业。 作为已经工作的过来人,小编其实很建议同学们在选专业、选学校之前,除了兴趣以外,也考虑一下行业就业、薪资、发展空间等等比较实际的情况。 所以小编今天就特地搜罗了意大利几所热门大学和部分专业的就业数据,同学们…

    2025年8月21日
  • 南加州大学电影学院拿什么学位

    作为全美第一个设立电影艺术学士专业的大学,南加州大学USC不仅是一所名副其实的世界顶尖院校,南加大电影学院更培养出无数的电影传奇人才。正是有着如此深厚的文化底蕴,南加大USC电影学院每年根据市场变化做出相应调整,那现在南加州大学电影学院USC申请条件又有哪些变化?新增哪些电影专业方向呢? 南加州大学电影学院USC独特优势 南加州大学(University o…

    2024年8月16日
  • 世界大学学术水平排名

    2020年7月5日,Nature 指数公布了2019年5月1日到2020年4月30日大学/机构排名,也就是说最新的一期机构/大学的学术排名正式出炉。iNature编辑部进行了及时的整理。我们发现: 在全球大学/机构综合排名中,中国科学院位居榜首,其次是中国科学技术大学,北京大学及清华大学。中国科学技术大学在学术领域蝉联高校第一,另外有21个大学/机构顺利挺进…

    2024年8月5日
  • 芝加哥大学成立时间

    芝加哥大学(University of Chicago)是一所位于美国伊利诺伊州芝加哥市的私立研究型大学。该大学成立于1890年,以其严谨的学术氛围和强调自由思考的教育理念而闻名。 以下是芝加哥大学的一些特点和亮点: 学术声誉:芝加哥大学是美国顶尖的研究型大学之一,其学术声誉在全球范围内享有盛誉。它在多个学科领域都有杰出的研究成果和学术贡献。自由思考:芝加哥…

    2025年2月26日
  • 墨尔本大学一年学费

    近日,澳洲两大顶尖名校悉尼大学和墨尔本大学,正式确认2026年起大幅上调国际学生学费。涨幅最高达两三倍,部分热门专业一年学费直接冲破30万人民币,连本地生也未能幸免。 01 墨大、悉大宣布学费上涨 墨尔本大学 商科本科总学费涨至约 190,000 澳元(≈90 万人民币);工程学学费涨至约 60,000 澳元 / 年(≈30 万人民币 / 年);法律专业学费…

    2025年10月9日
  • 东海大学在日本排名

    杠精就别评论了,我只是一个搬运工,对这个排名不满的可以去QS官网指点他们修改。排名这回事,本身就无法明确定义,仁者见仁 QS世界大学排名(QS World University Rankings)是由英国教育组织Quacquarelli Symonds所发表的年度世界大学排名,与《泰晤士高等教育世界大学排名》、《USNews世界大学排名》、《ARWU世界大学…

    2024年12月2日
  • 东国大学忠武路宿舍

    南昌大学2024年韩国名校预科班 招生进行中 快来跟随小南一起 了解项目详情吧~ 1 南昌大学 남창대학교 南昌大学位于江西省南昌市,是国家“双一流”建设高校、国家“211工程”重点建设高校,教育部与江西省人民政府部省合建高校、江西省高水平大学整体建设高校,是中国教育国际交流协会常务理事单位、教育部来华留学示范基地、教育部留学服务中心战略合作伙伴、全国汉语水…

    2024年12月8日
  • 被美国拉黑的13所大学排行

    中国大学软科排名173位(校友会176),这个位置在国内高校圈里,似乎算不上“顶尖”。但就是这样一所看似“普通”的大学——中北大学,却在2020年5月被美国商务部毫不留情地丢进了“实体清单”制裁黑名单!与她并列的,是哈工大、北航、国防科大这些如雷贯耳的顶尖名校! 凭什么? 一所非985、非211、非“双一流”的“三非”院校,凭什么能“享受”与美国眼中“国防七…

    2025年7月25日
  • 312心理学考研学校排名

    还在纠结院校的心理学考研伙伴们,统考312容易上岸的高性价比学校第三期来了! 划重点~~本期院校推荐包含安徽,江西,四川各一所 喜欢的小伙伴记得帮小编点点赞啊~! 先赞后看,你必上岸! 具体高性价比主要参考包括: ①招生人数较多 ②分数不高,竞争不算特别激烈 ③地理位置优越或位于省会城市,发展资源丰富 ④学校专业排名靠前,有一定实力背景 ⑤基本为全国统考,不…

    2024年10月27日
  • 谢菲尔德排名_谢菲尔德排名世界排名第几

    2024年QS世界大学排名收录了全球104个地区的1500所院校,是同类排名中唯一强调就业能力和可持续性的排名。今年引入了三个新的衡量标准——可持续性、就业结果和国际研究网络。榜单结果借鉴了对1750万篇学术论文的分析,以及超过24万名学术界人士和雇主的专家意见。 The University of Sheffield谢菲尔德大学是英国最早的红砖大学之一,也…

    2024年3月21日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信