圣彼得堡国立技术大学世界排名

智东西9月18日消息,今天凌晨,OpenAI和谷歌前后脚宣布,自家模型在全球知名编程竞赛ICPC 2025(第49届国际大学生程序设计竞赛)总决赛获得金牌级别的表现。

OpenAI推理系统答对了全部12道题目,并且一次性答对11道题,最难的题目提交了9次后成功,与人类团队相比可排第一;Gemini 2.5 Deep Think高级版本在677分钟内解出10道题,与人类团队相比可位列第二。

如果将AI列入ICPC的总排名中,前三名应该是OpenAI推理系统、圣彼得堡国立大学、谷歌Gemini 2.5 Deep Think高级版本。

ICPC的要求是参赛者在5个小时内解出12道复杂算法问题,解题方案是否完美、解题耗时都会影响积分。

最终139支队伍中获得金牌的为前四名,分别为圣彼得堡国立大学、东京大学、北京交通大学、清华大学,解出题目最多的是圣彼得堡国立大学,共11道。

ICPC拿下金牌的人类团队

这是继2个月前,OpenAI推理系统、谷歌Gemini 2.5 Deep Think在国际数学奥林匹克竞赛(IMO)之后,又一次在顶尖国际竞赛中证明了自己的实力。

谷歌Gemini 2.5 Deep Think高级版本参加ICPC总决赛的代码已经在GitHub开源。

GitHub地址:

https://github.com/google-deepmind/gemini_icpc2025

01.OpenAI拿下满分谷歌错两道

ICPC是全球公认的历史最悠久、规模最大、最负盛名的大学级算法编程竞赛,每年来自近3000所大学和超过103个国家的参与者竞相解决现实世界的编程问题。

OpenAI和谷歌都参与并获得金牌级别表现,OpenAI推理系统解答了12道题,谷歌Gemini 2.5 Deep Think高级版本答出10道题,最好的人类团队答出11道题。

1、OpenAI:拿下满分,11道题一次就做对

OpenAI推理系统获得满分。

OpenAI提到并没有专门为ICPC训练模型,其采用通用推理模型组合的方式参赛。

比赛中,GPT-5与一款实验性推理模型共同生成解题方案,由该实验性推理模型负责筛选待提交的方案。最终,GPT-5正确解答了11道题目,而最后一道也是难度最高的一道题目由这款实验性推理模型解决。

其模型一次性答对了11道题,最难的问题在第9次提交时成功了。

2、谷歌:答对10道题,45分钟解出8道题

Gemini 2.5 Deep Think高级版本按照ICPC规则在远程在线环境中进行现场比赛,比人类参赛者晚10分钟开始。Gemini总共花费677分钟,解决了12个问题中的10个,其中8个花费45分钟,另外2个问题花费3个小时。

下图是2025年ICPC总决赛中解决每个问题所用的时间,Gemini所花的时间以蓝色显示,最快的大学生团队的时间以灰色显示。

Gemini在3道题目上的解题时间都超过了人类。

ICPC总决赛中解决每个问题所用的时间

此外,谷歌DeepMind还提到一道困住所有人类团队的难题,被Gemini在半小时内成功解答。

问题C要求团队设计一套解决方案,通过相互连接的管道网络将液体输送至一组储液罐,目标是找到一种管道配置,以最快速度将所有储液罐注满。

该问题存在无限多种可能的配置,因为每条管道均可处于开启、关闭甚至部分开启的状态,这使得寻找最优配置的难度极大。

问题C简介

Gemini找到了有效的解决方案:它首先假设每个水库都有一个“优先级值”,代表每个水库与其他水库相比应该获得的优先程度。

当给定一组优先级值时,可以使用动态规划算法找到管道的最佳配置。

Gemini发现,通过应用极小极大定理(Minimax Theorem),原问题可转化为寻找能使最终流量受到最大约束的优先级数值。

借助优先级数值与最优流量之间的关联,Gemini在类似碗状的凸性解空间中,通过嵌套三分搜索(Nested Ternary Searches)快速找到最优优先级数值,最终解决了C题。

目前订阅Google AI Ultra的Gemini用户已经可以在Gemini App中使用轻量级版本的Gemini 2.5 Deep Think。

02.ICPC金牌水平展现大模型抽象推理能力

谷歌DeepMind的博客中提到,Gemini的表现得益于其在预训练、训练后、强化学习技术、多步骤推理和平行思维方面的技术创新。

例如,在强化学习过程中,研究人员训练Gemini为编程人员面临的一些最困难的问题进行推理和生成代码,从结果反馈中学习并改进其方法。为了解决一个问题,多个Gemini Agent会各自提出自己的解决方案,使用终端执行代码和测试,然后根据所有尝试迭代解决方案。

谷歌DeepMind的内部研究表明,Gemini 2.5 Deep Think高级版本也能在2023年和2024年ICPC世界总决赛中取得金牌级别的表现,表现不亚于全球前20名竞技开发者。

在ICPC上获得金牌水平对软件开发具有直接的实际影响,如果将比赛中最好的AI和人类解决方案结合起来,所有12个问题都会得到彻底和正确的解决。这表明AI有潜力提供独特思路,为人类专家提供补充。

除了数学和编程外,Gemini 2.5 Deep Think高级版本还展示了在抽象推理方面的能力。

这是因为,ICPC的问题需要模型理解复杂的问题、设计多步骤的逻辑计划、完美实施,这一过程与许多科学和工程领域所需的技能相同,包括设计新药或微芯片等领域。

OpenAI的研究人员在X上发布帖子称,他们采用同一组模型参加IMO和IOI竞赛,展示了模型性能以及通用型。

03.结语:大模型复杂抽象问题解决能力提升

从国际数学奥林匹克竞赛(IMO)到此次的编程竞赛,OpenAI以及谷歌的模型在解决更具挑战的数学、推理难题上迸发出巨大潜力。ICPC全球执行董事Bill Poucher博士称,ICPC一直致力于在解决问题方面设定最高标准,Gemini在这一领域取得的成绩,标志着定义下一代所需AI工具和学术标准的关键时刻。

这些在竞争性编程和数学推理方面的突破共同证明了大模型在抽象推理问题解决方面的性能飞跃,或能与人类专家结合,解决更加复杂的难题。

本文来自微信公众号“智东西”(ID:zhidxcom),作者:程茜,编辑:李水青,36氪经授权发布。

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/61854.html

(0)
上一篇 2025年10月30日
下一篇 2025年10月30日

相关推荐

  • 易方达蓝筹精选股票仓位创新高 张坤:当前投资者可用低价买到优秀公司的股权

    “只要相信10年后老百姓的生活水平会比现在更好,科技和消费龙头企业会走出目前阶段性的增长困境,重新进入成长期。”易方达基金副总经理张坤在最新三季报中表示,在目前的环境下,市场先生罕见地报出了价格,让投资者可以用便宜的价格买到优秀的公司股权。 10月25日零点刚过,张坤在管基金纷纷披露2024年三季报,其持仓情况也随之浮出水面。 调仓换股方面,阿里巴巴首次被易…

    2024年10月25日
  • 英国低龄留学(英国低龄留学中介)

    今天的文章比较简单,主要和大家分享三个英国低龄留学的案例,希望大家可以在别人的故事里找到自己的答案。 1. 从四线城市普通公立小学到英国温彻斯特公学 出国前的L同学:国内四线城市的公立小学四年级,语文数学成绩优异,但是因为在公立教育体系,也没有留学计划,所以当时的英文停留在简单的打招呼水平,读写的单词量仅有一两百个。 L在中国小学四年级的寒假到英国私校插班体…

    2023年11月21日
  • 免费留学的国家

    #留学# 在全球教育深度融合的当下,不少国内家庭将教育规划的视野投向海外留学,既希望孩子能接触到优质的国际教育资源,也期待通过多元文化环境开拓国际视野。 但这份“留学梦”的背后,往往伴随着不低的成本投入——尤其是英美等传统热门留学国家,每年仅学习与生活开销就常达几十万甚至上百万元,这样的经济压力让许多有留学意愿的学子望而却步。 也正因为如此,近几年留学市场逐…

    2025年10月22日
  • 斯坦福大学公开课(斯坦福大学公开课官网)

    大家好,我是科研资料帮,你身边的科研小助手~想要更多资源请看文末! 《Writing in the Sciences》是美国名校斯坦福大学 Kristin Sainani 教授为其校内研究生及学者提供的高品质课程。主要讲怎么样写一篇清晰的论文,适合生物医学、化学、材料等学科。课程内容非常系统,涉及高效写作的原则、导论、句子和段落、论文的组织和写作、如何审稿等…

    2023年11月18日
  • 昆明理工大学可以吗

    昆明被人们称为“春城”,环境优美、气候宜人、四季如春,昆明是云南省的省会城市,昆明理工大学就是坐落在这座春城的大学了。 我是山东人,与云南之间隔着千山万水,很遗憾没有去过云南省,也没有去过昆明,更是无缘与昆明理工大学相见了。 也许有网友说,既然你不了解这所大学,为什么还在这里啰嗦呢? 有句古诗写得很好:不识庐山真面目,只缘身在此山中。如果我是昆明理工大学的教…

    2025年1月4日
  • 南加州大学枪击案(南加州大学枪击案2012)

    来源:中国新闻网 中新社洛杉矶12月28日电 美国南加州大学附近12月28日发生枪击案,造成一人死亡。 综合“CBS”等美国媒体消息,这起枪击案发生于当地时间28日凌晨,地点位于洛杉矶市弗劳尔街和西23街交叉路口附近的洛伦佐公寓。该公寓距离南加州大学校园不到一英里,主要居住着南加州大学学生。枪击案受害人是在这座校外学生公寓担任保安的一名30多岁的男子。 当日…

    2023年10月20日
  • 哪些学校有预科班

    河南省2023年对口招收中等职业学校毕业生进入普通高等学校学习招生学校总表 各级教育行政部门、招生考试机构及学校要依据有关政策、依托河南省中等职业学校学籍、毕业生信息和技工学校学籍、毕业生信息,认真做好考生资格审核工作。生源学校负责考生报名资格的认定,承担考生报名资格的认定责任,对所提供的本校考生信息、在读等情况的真实性负责。县(市、区)招生考试机构负责考生…

    2024年6月2日
  • 国外医科大学排名

    10月9日,2026年泰晤士高等教育世界大学排名正式发布。从整体榜单来看,中国大陆进入前500名的高校达35所,共有18所中国大陆高校创下历史最佳排名,数量居全球之首。其中,南方医科大学表现亮眼,再次跻身全球300强,国际竞争力与知名度进一步彰显。 学校排名入围世界前300强(部分排名截图) 泰晤士高等教育世界大学排名是唯一从教学、研究、产业化及国际展望四大…

    2025年10月11日
  • 经济学专业世界排名

    “经济学”排名出炉,网友们都化身段子手了,说起这个专业我就想起了网红博主张学峰的一句话“家庭条件一般的不要学经济,长相普通的不要涉及,如果两样都不占的要远离”,我也不知道他说的到底对不对,不过身边学这个专业最后从事相关工作的确实不是“一般人”。 我一直以为北京大学的“经济学”才是全国第一,没想到软科排名只能排名第三,前面还有中国人民大学和复旦大学,如果你们够…

    2025年10月24日
  • 王向远广东外语外贸大学

    2025年1月6日至8日,2024年度“东方学、东方语文学与东西文明对话学术研讨会”在广东外语外贸大学举办。会议采用线上线下结合的方式进行,吸引全国百余所高校专家学者参与。 广东外语外贸大学党委常委、副校长何传添在开幕式致辞中表示,广外作为语言文学研究重镇,长期致力于推动东方学研究的发展,本次会议聚焦区域国别研究、东西文明对话等议题,为学术界提供了思想交流的…

    2025年7月26日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信