圣彼得堡交通大学排名

智东西9月18日消息,今天凌晨,OpenAI和谷歌前后脚宣布,自家模型在全球知名编程竞赛ICPC 2025(第49届国际大学生程序设计竞赛)总决赛获得金牌级别的表现。

OpenAI推理系统答对了全部12道题目,并且一次性答对11道题,最难的题目提交了9次后成功,与人类团队相比可排第一;Gemini 2.5 Deep Think高级版本在677分钟内解出10道题,与人类团队相比可位列第二。

如果将AI列入ICPC的总排名中,前三名应该是OpenAI推理系统、圣彼得堡国立大学、谷歌Gemini 2.5 Deep Think高级版本。

ICPC的要求是参赛者在5个小时内解出12道复杂算法问题,解题方案是否完美、解题耗时都会影响积分。

最终139支队伍中获得金牌的为前四名,分别为圣彼得堡国立大学、东京大学、北京交通大学、清华大学,解出题目最多的是圣彼得堡国立大学,共11道。

ICPC拿下金牌的人类团队

这是继2个月前,OpenAI推理系统、谷歌Gemini 2.5 Deep Think在国际数学奥林匹克竞赛(IMO)之后,又一次在顶尖国际竞赛中证明了自己的实力。

谷歌Gemini 2.5 Deep Think高级版本参加ICPC总决赛的代码已经在GitHub开源。

GitHub地址:

https://github.com/google-deepmind/gemini_icpc2025

01.OpenAI拿下满分谷歌错两道

ICPC是全球公认的历史最悠久、规模最大、最负盛名的大学级算法编程竞赛,每年来自近3000所大学和超过103个国家的参与者竞相解决现实世界的编程问题。

OpenAI和谷歌都参与并获得金牌级别表现,OpenAI推理系统解答了12道题,谷歌Gemini 2.5 Deep Think高级版本答出10道题,最好的人类团队答出11道题。

1、OpenAI:拿下满分,11道题一次就做对

OpenAI推理系统获得满分。

OpenAI提到并没有专门为ICPC训练模型,其采用通用推理模型组合的方式参赛。

比赛中,GPT-5与一款实验性推理模型共同生成解题方案,由该实验性推理模型负责筛选待提交的方案。最终,GPT-5正确解答了11道题目,而最后一道也是难度最高的一道题目由这款实验性推理模型解决。

其模型一次性答对了11道题,最难的问题在第9次提交时成功了。

2、谷歌:答对10道题,45分钟解出8道题

Gemini 2.5 Deep Think高级版本按照ICPC规则在远程在线环境中进行现场比赛,比人类参赛者晚10分钟开始。Gemini总共花费677分钟,解决了12个问题中的10个,其中8个花费45分钟,另外2个问题花费3个小时。

下图是2025年ICPC总决赛中解决每个问题所用的时间,Gemini所花的时间以蓝色显示,最快的大学生团队的时间以灰色显示。

Gemini在3道题目上的解题时间都超过了人类。

ICPC总决赛中解决每个问题所用的时间

此外,谷歌DeepMind还提到一道困住所有人类团队的难题,被Gemini在半小时内成功解答。

问题C要求团队设计一套解决方案,通过相互连接的管道网络将液体输送至一组储液罐,目标是找到一种管道配置,以最快速度将所有储液罐注满。

该问题存在无限多种可能的配置,因为每条管道均可处于开启、关闭甚至部分开启的状态,这使得寻找最优配置的难度极大。

问题C简介

Gemini找到了有效的解决方案:它首先假设每个水库都有一个“优先级值”,代表每个水库与其他水库相比应该获得的优先程度。

当给定一组优先级值时,可以使用动态规划算法找到管道的最佳配置。

Gemini发现,通过应用极小极大定理(Minimax Theorem),原问题可转化为寻找能使最终流量受到最大约束的优先级数值。

借助优先级数值与最优流量之间的关联,Gemini在类似碗状的凸性解空间中,通过嵌套三分搜索(Nested Ternary Searches)快速找到最优优先级数值,最终解决了C题。

目前订阅Google AI Ultra的Gemini用户已经可以在Gemini App中使用轻量级版本的Gemini 2.5 Deep Think。

02.ICPC金牌水平展现大模型抽象推理能力

谷歌DeepMind的博客中提到,Gemini的表现得益于其在预训练、训练后、强化学习技术、多步骤推理和平行思维方面的技术创新。

例如,在强化学习过程中,研究人员训练Gemini为编程人员面临的一些最困难的问题进行推理和生成代码,从结果反馈中学习并改进其方法。为了解决一个问题,多个Gemini Agent会各自提出自己的解决方案,使用终端执行代码和测试,然后根据所有尝试迭代解决方案。

谷歌DeepMind的内部研究表明,Gemini 2.5 Deep Think高级版本也能在2023年和2024年ICPC世界总决赛中取得金牌级别的表现,表现不亚于全球前20名竞技开发者。

在ICPC上获得金牌水平对软件开发具有直接的实际影响,如果将比赛中最好的AI和人类解决方案结合起来,所有12个问题都会得到彻底和正确的解决。这表明AI有潜力提供独特思路,为人类专家提供补充。

除了数学和编程外,Gemini 2.5 Deep Think高级版本还展示了在抽象推理方面的能力。

这是因为,ICPC的问题需要模型理解复杂的问题、设计多步骤的逻辑计划、完美实施,这一过程与许多科学和工程领域所需的技能相同,包括设计新药或微芯片等领域。

OpenAI的研究人员在X上发布帖子称,他们采用同一组模型参加IMO和IOI竞赛,展示了模型性能以及通用型。

03.结语:大模型复杂抽象问题解决能力提升

从国际数学奥林匹克竞赛(IMO)到此次的编程竞赛,OpenAI以及谷歌的模型在解决更具挑战的数学、推理难题上迸发出巨大潜力。ICPC全球执行董事Bill Poucher博士称,ICPC一直致力于在解决问题方面设定最高标准,Gemini在这一领域取得的成绩,标志着定义下一代所需AI工具和学术标准的关键时刻。

这些在竞争性编程和数学推理方面的突破共同证明了大模型在抽象推理问题解决方面的性能飞跃,或能与人类专家结合,解决更加复杂的难题。

本文来自微信公众号“智东西”(ID:zhidxcom),作者:程茜,编辑:李水青,36氪经授权发布。

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/67126.html

(0)
上一篇 2025年11月27日
下一篇 2025年11月27日

相关推荐

  • 东佛罗里达州立学院

    佛罗里达州立大学(Florida State University,缩写FSU)成立于1851年,是一所位于美国佛罗里达州首府塔拉哈西市的公立大学,是佛罗里达大学系统的一员。它是一所综合性的、可授予博士学位同时拥有医学项目的研究型大学,被卡耐基基金会归类为研究活动非常活跃的研究型大学。 佛罗里达州立大学共有16个学院,110多个研究中心、实验室、研究所,设有…

    2025年6月6日
  • 美国旅游专业大学

    在旅游市场日益多元化的今天,美国定制旅游逐渐成为众多游客的心头好。但面对琳琅满目的定制旅游平台和公司,如何选择靠谱、性价比高的平台成了一大难题。今天就为大家深入剖析美国定制旅游行业,并且推荐一家的公司——北京达美国际旅行社有限责任公司,旗下品牌达美旅行。 美国定制旅游的行业优势与特点 美国地域广阔,旅游资源丰富多样,从繁华的都市到壮丽的自然景观,从多元的文化…

    2025年12月24日
  • 世界第一名大学

    一份榜单,震动全球学术圈。最新自然指数排名出炉,前十名中,中国高校竟史无前例地占据7席!长期被欧美垄断的格局,一夜之间被彻底改写。 哈佛大学依然守着全球第一的宝座,但紧随其后的,是中国科学技术大学,这个结果让无数人感到“意外”。 集团式冲锋:榜单前十,中国占七 这不仅仅是中科大一所学校的胜利,而是一场中国顶尖高校的“集团式冲锋”。 榜单前十,除了榜首的哈佛,…

    2026年1月16日
  • 奥克兰大学放假时间2024

    新西兰中小学和高中每年分为四个学期来进行授课,以Term 1/2/3/4来加以区分;每个学期的长短均不相同,而且中小学和高中的放假时间也不尽相同。每个学期之间,按照放假的时间点不同,学生都有两周到六周不等的假期可以享受。 2023年1月1日起,新的《2022年教育(公立学校何时必须开放)》法规正式生效。该法律规定:(1)公立学校的开放时间,包括教育部长已确定…

    2026年1月7日
  • 西班牙纳瓦拉大学博士

    中新社兰州9月3日电 (记者 南如卓玛)“我们都渴望了解中国文化,尤其甘肃悠久的历史、兴旺的商业发展和多样的地理地貌。”西班牙纳瓦拉公立大学博士那依姆·费尔曼·玛蒂娜·莫拉3日在兰州表示,非常期待接下来与世界各地优秀青年在甘肃合作沟通,分享特有经验和技能,并聆听中国发展故事。 9月3日傍晚,第十三期甘肃省国际交流员研习班开班。来自美国、哈萨克斯坦等国家的政府…

    2025年9月11日
  • 留学美国斯坦福大学入学要求

    斯坦福大学已确认,其2026年秋季招生政策将继续考虑校友传承身份,这一决定可能会影响学生进入硅谷最重要的人才输送渠道之一。斯坦福大学还将终止其“可选考试”政策,自2021年以来首次要求提供SAT或ACT成绩。 据《斯坦福日报》报道,斯坦福大学计划保留传承学生优先权,因此决定退出加州的加州助学金计划(Cal Grant),放弃州政府的财政援助,而不是遵守加州州…

    2026年1月12日
  • 图卢兹第一大学在法国排名

    2025qs世界大学排名前1000排名中,法国有哪些学校上榜了呢?这里为大家整理了法国大学2025qs排名完整榜单, 希望对大家有所帮助。 qs2025法国大学排名榜单Top1000 第24位: 巴黎科学艺术人文大学 第46位: 巴黎理工学院 第63位: 索邦大学 第73位: 巴黎萨克雷大学 第187位: 里昂高等师范学院 第205位: 国立路桥学校 第28…

    2024年10月9日
  • 华盛顿大学信息管理硕士

    华盛顿大学圣路易斯分校在学术领域成就卓著,2025年硕士招生为众多学子提供了难得的深造机遇。深入了解各专业的就业前景与申请条件,是开启这所名校大门的关键。 各专业就业前景 商学院 金融硕士(MSF):金融硕士专业在全球金融教育领域享有盛誉。依托学校丰富的教育资源与精英师资团队,课程紧密贴合金融行业实际需求。学生在学习证券研究、资产管理、衍生品定价等核心课程过…

    2025年8月29日
  • 塔斯马尼亚大学泰晤士排名

    澳洲塔斯马尼亚大学历史悠久,在澳洲相当出名,专业实力很强,所以澳洲塔斯马尼亚大学世界排名也是比较好的,位列世界大学前300名。根据小编了解的信息来看,想要去澳洲塔斯马尼亚大学,学生是比较容易申请成功,不仅澳洲塔斯马尼亚大学申请条件比较低,该校需要的申请材料也很简单。 澳洲塔斯马尼亚大学世界排名 塔斯马尼亚大学(University of Tasmania) …

    2024年10月9日
  • 佛山科学技术学院学费多少钱

    不少人因为名字带有学院的缘故,可能会觉得佛山科学技术学院是一所民办本科院校,所以收费比较高,自己的孩子考得不好,也不是很想报读。但其实佛山科学技术学院是一所公办本科高校,以前改名佛山大学,不知道为什么改回叫佛山科学技术学院。 但总的来说,佛山科学技术学院作为一所公办高校,在广东选调生,广州选调生,佛山选调生等领域有不少的优势。也因为佛山经济发展的越来越好,但…

    2025年7月17日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信