圣彼得堡交通大学排名

智东西9月18日消息,今天凌晨,OpenAI和谷歌前后脚宣布,自家模型在全球知名编程竞赛ICPC 2025(第49届国际大学生程序设计竞赛)总决赛获得金牌级别的表现。

OpenAI推理系统答对了全部12道题目,并且一次性答对11道题,最难的题目提交了9次后成功,与人类团队相比可排第一;Gemini 2.5 Deep Think高级版本在677分钟内解出10道题,与人类团队相比可位列第二。

如果将AI列入ICPC的总排名中,前三名应该是OpenAI推理系统、圣彼得堡国立大学、谷歌Gemini 2.5 Deep Think高级版本。

ICPC的要求是参赛者在5个小时内解出12道复杂算法问题,解题方案是否完美、解题耗时都会影响积分。

最终139支队伍中获得金牌的为前四名,分别为圣彼得堡国立大学、东京大学、北京交通大学、清华大学,解出题目最多的是圣彼得堡国立大学,共11道。

ICPC拿下金牌的人类团队

这是继2个月前,OpenAI推理系统、谷歌Gemini 2.5 Deep Think在国际数学奥林匹克竞赛(IMO)之后,又一次在顶尖国际竞赛中证明了自己的实力。

谷歌Gemini 2.5 Deep Think高级版本参加ICPC总决赛的代码已经在GitHub开源。

GitHub地址:

https://github.com/google-deepmind/gemini_icpc2025

01.OpenAI拿下满分谷歌错两道

ICPC是全球公认的历史最悠久、规模最大、最负盛名的大学级算法编程竞赛,每年来自近3000所大学和超过103个国家的参与者竞相解决现实世界的编程问题。

OpenAI和谷歌都参与并获得金牌级别表现,OpenAI推理系统解答了12道题,谷歌Gemini 2.5 Deep Think高级版本答出10道题,最好的人类团队答出11道题。

1、OpenAI:拿下满分,11道题一次就做对

OpenAI推理系统获得满分。

OpenAI提到并没有专门为ICPC训练模型,其采用通用推理模型组合的方式参赛。

比赛中,GPT-5与一款实验性推理模型共同生成解题方案,由该实验性推理模型负责筛选待提交的方案。最终,GPT-5正确解答了11道题目,而最后一道也是难度最高的一道题目由这款实验性推理模型解决。

其模型一次性答对了11道题,最难的问题在第9次提交时成功了。

2、谷歌:答对10道题,45分钟解出8道题

Gemini 2.5 Deep Think高级版本按照ICPC规则在远程在线环境中进行现场比赛,比人类参赛者晚10分钟开始。Gemini总共花费677分钟,解决了12个问题中的10个,其中8个花费45分钟,另外2个问题花费3个小时。

下图是2025年ICPC总决赛中解决每个问题所用的时间,Gemini所花的时间以蓝色显示,最快的大学生团队的时间以灰色显示。

Gemini在3道题目上的解题时间都超过了人类。

ICPC总决赛中解决每个问题所用的时间

此外,谷歌DeepMind还提到一道困住所有人类团队的难题,被Gemini在半小时内成功解答。

问题C要求团队设计一套解决方案,通过相互连接的管道网络将液体输送至一组储液罐,目标是找到一种管道配置,以最快速度将所有储液罐注满。

该问题存在无限多种可能的配置,因为每条管道均可处于开启、关闭甚至部分开启的状态,这使得寻找最优配置的难度极大。

问题C简介

Gemini找到了有效的解决方案:它首先假设每个水库都有一个“优先级值”,代表每个水库与其他水库相比应该获得的优先程度。

当给定一组优先级值时,可以使用动态规划算法找到管道的最佳配置。

Gemini发现,通过应用极小极大定理(Minimax Theorem),原问题可转化为寻找能使最终流量受到最大约束的优先级数值。

借助优先级数值与最优流量之间的关联,Gemini在类似碗状的凸性解空间中,通过嵌套三分搜索(Nested Ternary Searches)快速找到最优优先级数值,最终解决了C题。

目前订阅Google AI Ultra的Gemini用户已经可以在Gemini App中使用轻量级版本的Gemini 2.5 Deep Think。

02.ICPC金牌水平展现大模型抽象推理能力

谷歌DeepMind的博客中提到,Gemini的表现得益于其在预训练、训练后、强化学习技术、多步骤推理和平行思维方面的技术创新。

例如,在强化学习过程中,研究人员训练Gemini为编程人员面临的一些最困难的问题进行推理和生成代码,从结果反馈中学习并改进其方法。为了解决一个问题,多个Gemini Agent会各自提出自己的解决方案,使用终端执行代码和测试,然后根据所有尝试迭代解决方案。

谷歌DeepMind的内部研究表明,Gemini 2.5 Deep Think高级版本也能在2023年和2024年ICPC世界总决赛中取得金牌级别的表现,表现不亚于全球前20名竞技开发者。

在ICPC上获得金牌水平对软件开发具有直接的实际影响,如果将比赛中最好的AI和人类解决方案结合起来,所有12个问题都会得到彻底和正确的解决。这表明AI有潜力提供独特思路,为人类专家提供补充。

除了数学和编程外,Gemini 2.5 Deep Think高级版本还展示了在抽象推理方面的能力。

这是因为,ICPC的问题需要模型理解复杂的问题、设计多步骤的逻辑计划、完美实施,这一过程与许多科学和工程领域所需的技能相同,包括设计新药或微芯片等领域。

OpenAI的研究人员在X上发布帖子称,他们采用同一组模型参加IMO和IOI竞赛,展示了模型性能以及通用型。

03.结语:大模型复杂抽象问题解决能力提升

从国际数学奥林匹克竞赛(IMO)到此次的编程竞赛,OpenAI以及谷歌的模型在解决更具挑战的数学、推理难题上迸发出巨大潜力。ICPC全球执行董事Bill Poucher博士称,ICPC一直致力于在解决问题方面设定最高标准,Gemini在这一领域取得的成绩,标志着定义下一代所需AI工具和学术标准的关键时刻。

这些在竞争性编程和数学推理方面的突破共同证明了大模型在抽象推理问题解决方面的性能飞跃,或能与人类专家结合,解决更加复杂的难题。

本文来自微信公众号“智东西”(ID:zhidxcom),作者:程茜,编辑:李水青,36氪经授权发布。

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/67126.html

(0)
上一篇 14小时前
下一篇 14小时前

相关推荐

  • 江苏最好的复读学校是哪一个

    在高中阶段,选择是否复读成为许多学生和家长关注的焦点。尤其是在南京这样教育氛围浓厚的城市,许多学生在首次高考后会考虑是否要再次努力,提升成绩,争取更理想的高校。随着2025年的高考临近,关于南京地区复读学校的排名逐渐成为热议话题。不同的学校各有特色,针对不同学生的需求,提供了多样化的学习环境和教学方案。本文将对南京2025年高考复读学校进行一次优秀梳理,帮助…

    2025年9月3日
  • 台湾义守大学多少分

    “小麦克”伟杰火力全开三分球7投6中轰下26分,帮助大马男篮挑选队在周五晚上演的陈诗圣杯国际篮球邀请赛A组焦点战中,狂风扫落叶般以106比63大破台湾义守大学,1胜1负获得副盟资格晋级4强。 大马挑选队也成为本届赛会首支以破百分姿态取胜的球队,有趣的是,他们将在周六晚进行的半决赛迎战熟悉的“自己人”森美兰金群利金鹿,争夺一张决赛门票。明晚另一场半决赛将由地主…

    2025年6月17日
  • 211大学有哪些好处

    “别嫌阿姨啰嗦,真的是有太多的放心不下。外卖虽然方便,总不如自己做的营养健康,熬夜加班的时候别总拿泡面凑合。难过委屈了,千万别一人扛着……” 近日,延边大学毕业典礼上食堂阿姨刘晓梅这段“没有套路,全是感情”的发言爆火全网,让台下的毕业生觉得哈特软软,也让很多网友被阿姨的朴实真情打动。 图源:抖音@延边大学 有网友说,“这是校园人文关怀的具象化,是毕业游子日后…

    2025年8月28日
  • 日本国立大学研究生留学条件

    千叶大学是日本的综合研究型国立大学,创办于于1949年,由千叶医科大学、千叶师范学校等多所学校合并而来。 千叶大学属于日本非常优秀的大学,常年位居日本前20名,相当于国内985级别的院校。 千叶大学位于日本千叶县,由于日本行政区面积都很小,千叶大学距离东京只有20多公里,实际上可以看作是同一个城市。 接下来,蔚蓝小编为大家介绍一下千叶大学2025年10月的研…

    2025年4月28日
  • 新加坡厨艺学校排名

    ©Kris Provoost ©Kris Provoost OMA设计的AIR循环校园和烹饪俱乐部位于新加坡的登普西山,是一个融合了现代建筑、可持续性和美食文化的创新项目。该项目由企业家罗纳德·阿基利(Ronald Akili)、厨师马修·奥兰多(Matthew Orlando)和威尔·戈德法布(Will Goldfarb),以及OMA建筑事务所的大卫·吉安…

    2024年11月5日
  • 宾州州立大学回国薪酬

    宾州州立大学帕克分校全称宾夕法尼亚州立大学分校,多年来致力于以本科生、研究生教育和继续教育为形式,通过知识的传播及其在自然科学、应用科学、社会科学、艺术、人文科学和其他特定领域的应用来促进人类的发展和经济的发展。学校集教学、科研和公共服务于一体,为美国乃至全世界培养了大批优秀人才,是一所享有极高声誉的综合性公立高等学府。 宾夕法尼亚州立大学(帕克校区)回国就…

    2024年10月15日
  • 英国大学化学专业排名_英国大学化学专业排名榜

    这几天日本排放核污水的事情闹得沸沸扬扬,也让人们了解了各种放射性元素的危害,同时也让化学专业变得更火热起来了。 本期小遥就给大家带来了QS化学专业排名TOP10的院校,看看这些院校的申请要求到底有多高! #01 剑桥大学 剑桥大学的化学专业属于自然科学的一个分支,学生可以在大一大二选择化学方向的基础课程,第三年专注化学的深入研究,第四年获得硕士学位。 申请要…

    2024年3月24日
  • 罗格斯大学在国内知名度

    亚洲学生最多的美国大学Top10!!! No.10 California State University, Fullerton 地理位置:Fullerton, CA 亚洲学生数量:7,483 加州州立大学富尔顿分校是位于加利福尼亚州富尔顿的一所公立大学,总招生人数超过41,000人,拥有加州州立大学系统23个校区中最大的学生群体,其研究生人数超过5,000…

    2025年8月15日
  • 俄罗斯留学申请条件

    中俄全面战略协作伙伴关系持续升温,教育、能源、科技等领域合作紧密,俄语复合型人才需求激增。 所以越来越多学子选择前往俄罗斯深造学习。 为此,环球唯优国际教育特别推出了俄罗斯专项留学申请项目,旨在协助学生解决学习和生活中可能遇到的挑战与压力,确保他们能够顺利进入理想学系,实现留学梦想。 俄罗斯留学优势 1. 政策红利加持,机遇前所未有 ● 中俄战略合作深化:俄…

    2025年9月30日
  • 高中生去澳大利亚留学条件

    随着移民潮的流行和增长,留学也呈现低龄化发展,其实,早早出去让孩子提早适应国外的环境,对尽快融入生活环境也是有好处的,那其中高中去澳洲读书需要什么条件呢?下面随小编一起往下来了解吧。 一、高中去澳洲读书学术成绩 成绩单:学校通常会要求提供初中三年的成绩单,成绩要达到一定标准,比如各科成绩至少要在中等偏上,这是评估学生学习能力的重要依据。 入学测试:有些学校可…

    2025年10月14日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信