圣彼得堡交通大学排名

智东西9月18日消息,今天凌晨,OpenAI和谷歌前后脚宣布,自家模型在全球知名编程竞赛ICPC 2025(第49届国际大学生程序设计竞赛)总决赛获得金牌级别的表现。

OpenAI推理系统答对了全部12道题目,并且一次性答对11道题,最难的题目提交了9次后成功,与人类团队相比可排第一;Gemini 2.5 Deep Think高级版本在677分钟内解出10道题,与人类团队相比可位列第二。

如果将AI列入ICPC的总排名中,前三名应该是OpenAI推理系统、圣彼得堡国立大学、谷歌Gemini 2.5 Deep Think高级版本。

ICPC的要求是参赛者在5个小时内解出12道复杂算法问题,解题方案是否完美、解题耗时都会影响积分。

最终139支队伍中获得金牌的为前四名,分别为圣彼得堡国立大学、东京大学、北京交通大学、清华大学,解出题目最多的是圣彼得堡国立大学,共11道。

ICPC拿下金牌的人类团队

这是继2个月前,OpenAI推理系统、谷歌Gemini 2.5 Deep Think在国际数学奥林匹克竞赛(IMO)之后,又一次在顶尖国际竞赛中证明了自己的实力。

谷歌Gemini 2.5 Deep Think高级版本参加ICPC总决赛的代码已经在GitHub开源。

GitHub地址:

https://github.com/google-deepmind/gemini_icpc2025

01.OpenAI拿下满分谷歌错两道

ICPC是全球公认的历史最悠久、规模最大、最负盛名的大学级算法编程竞赛,每年来自近3000所大学和超过103个国家的参与者竞相解决现实世界的编程问题。

OpenAI和谷歌都参与并获得金牌级别表现,OpenAI推理系统解答了12道题,谷歌Gemini 2.5 Deep Think高级版本答出10道题,最好的人类团队答出11道题。

1、OpenAI:拿下满分,11道题一次就做对

OpenAI推理系统获得满分。

OpenAI提到并没有专门为ICPC训练模型,其采用通用推理模型组合的方式参赛。

比赛中,GPT-5与一款实验性推理模型共同生成解题方案,由该实验性推理模型负责筛选待提交的方案。最终,GPT-5正确解答了11道题目,而最后一道也是难度最高的一道题目由这款实验性推理模型解决。

其模型一次性答对了11道题,最难的问题在第9次提交时成功了。

2、谷歌:答对10道题,45分钟解出8道题

Gemini 2.5 Deep Think高级版本按照ICPC规则在远程在线环境中进行现场比赛,比人类参赛者晚10分钟开始。Gemini总共花费677分钟,解决了12个问题中的10个,其中8个花费45分钟,另外2个问题花费3个小时。

下图是2025年ICPC总决赛中解决每个问题所用的时间,Gemini所花的时间以蓝色显示,最快的大学生团队的时间以灰色显示。

Gemini在3道题目上的解题时间都超过了人类。

ICPC总决赛中解决每个问题所用的时间

此外,谷歌DeepMind还提到一道困住所有人类团队的难题,被Gemini在半小时内成功解答。

问题C要求团队设计一套解决方案,通过相互连接的管道网络将液体输送至一组储液罐,目标是找到一种管道配置,以最快速度将所有储液罐注满。

该问题存在无限多种可能的配置,因为每条管道均可处于开启、关闭甚至部分开启的状态,这使得寻找最优配置的难度极大。

问题C简介

Gemini找到了有效的解决方案:它首先假设每个水库都有一个“优先级值”,代表每个水库与其他水库相比应该获得的优先程度。

当给定一组优先级值时,可以使用动态规划算法找到管道的最佳配置。

Gemini发现,通过应用极小极大定理(Minimax Theorem),原问题可转化为寻找能使最终流量受到最大约束的优先级数值。

借助优先级数值与最优流量之间的关联,Gemini在类似碗状的凸性解空间中,通过嵌套三分搜索(Nested Ternary Searches)快速找到最优优先级数值,最终解决了C题。

目前订阅Google AI Ultra的Gemini用户已经可以在Gemini App中使用轻量级版本的Gemini 2.5 Deep Think。

02.ICPC金牌水平展现大模型抽象推理能力

谷歌DeepMind的博客中提到,Gemini的表现得益于其在预训练、训练后、强化学习技术、多步骤推理和平行思维方面的技术创新。

例如,在强化学习过程中,研究人员训练Gemini为编程人员面临的一些最困难的问题进行推理和生成代码,从结果反馈中学习并改进其方法。为了解决一个问题,多个Gemini Agent会各自提出自己的解决方案,使用终端执行代码和测试,然后根据所有尝试迭代解决方案。

谷歌DeepMind的内部研究表明,Gemini 2.5 Deep Think高级版本也能在2023年和2024年ICPC世界总决赛中取得金牌级别的表现,表现不亚于全球前20名竞技开发者。

在ICPC上获得金牌水平对软件开发具有直接的实际影响,如果将比赛中最好的AI和人类解决方案结合起来,所有12个问题都会得到彻底和正确的解决。这表明AI有潜力提供独特思路,为人类专家提供补充。

除了数学和编程外,Gemini 2.5 Deep Think高级版本还展示了在抽象推理方面的能力。

这是因为,ICPC的问题需要模型理解复杂的问题、设计多步骤的逻辑计划、完美实施,这一过程与许多科学和工程领域所需的技能相同,包括设计新药或微芯片等领域。

OpenAI的研究人员在X上发布帖子称,他们采用同一组模型参加IMO和IOI竞赛,展示了模型性能以及通用型。

03.结语:大模型复杂抽象问题解决能力提升

从国际数学奥林匹克竞赛(IMO)到此次的编程竞赛,OpenAI以及谷歌的模型在解决更具挑战的数学、推理难题上迸发出巨大潜力。ICPC全球执行董事Bill Poucher博士称,ICPC一直致力于在解决问题方面设定最高标准,Gemini在这一领域取得的成绩,标志着定义下一代所需AI工具和学术标准的关键时刻。

这些在竞争性编程和数学推理方面的突破共同证明了大模型在抽象推理问题解决方面的性能飞跃,或能与人类专家结合,解决更加复杂的难题。

本文来自微信公众号“智东西”(ID:zhidxcom),作者:程茜,编辑:李水青,36氪经授权发布。

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/67126.html

(0)
上一篇 2025年11月27日
下一篇 2025年11月27日

相关推荐

  • 美国留学学校排名

    本报记者 陈 茜 “2025(第三十届)中国国际教育巡回展”及“2025中国留学论坛”11日在北京同步启幕。论坛期间发布的《中国出国留学蓝皮书2025》显示,在留学环境综合评估方面,美国在28个被评估国家中排名第四,落后于英国、新加坡和加拿大,地缘政治紧张、留学专业限制、安全预警频发等是主要原因。 全球化智库副主任、研究总监郑金连在分论坛解读时表示,在28个…

    2025年10月30日
  • 再度爆发 多晶硅期货突破4万元!交易所紧急提保、扩板

    在“反内卷”加速推进的背景下,近期多晶硅期货持续大涨,成为期货市场上最火热的品种。 7月10日,多晶硅期货大涨5.5%,突破4万元大关,主力合约收盘报41345元/吨,触及近三个月新高,成交量更是高达101.5万手,创下历史新高。 随着多晶硅期货波动的加大,7月10日晚间,广期所发布提保扩板政策,一方面给市场适当降温,另一方面有助于防控风险。 多晶硅期货突破…

    2025年7月11日
  • 加利福尼亚大学伯克利分校钻石

    钻石作为自然界最美丽的天然矿石,被打造成了精美的首饰。王健林在接受鲁豫访谈时曾经表态:所有带钻的东西我都不用,因为70%的钻石都是带血的,钻石就是百年来最大的谎言。其实王健林这样说,并不夸张,因为”A DIAMOND IS FOREVER”,钻石恒久远,一颗永流传这个营销案例,钻石绑架了高消费的人们。但近年来随着高科技手段的运用,钻石也被开发出了许多新的用途…

    2024年10月25日
  • 新加坡国立大学生物科学系

    生物医学工程作为生物医学与工学的新兴领域,是一个跨学科的专业,生物医学工程领域覆盖范围广泛。包括医疗器械与设备、生物材料与组织工程、生物信息学与纳米生物技术、遗传工程与基因治疗、智能医疗设备与生物化学。 在之前的文章中,小佑介绍过生物医学工程的相关信息,点击链接可查看:医学与工程联姻,生物医学工程有你想不到的神奇。 全球生物医学工程市场规模从2019年的约3…

    2025年8月13日
  • 澳门管理学院_澳门管理学院在内地招生吗

    视频加载中… 南方财经全媒体记者蔡依莹 澳门报道 由澳门人才发展委员会及澳门基金会合办的“人才培养考证激励计划”将于本年度继续推行,申请期由2023年9月1日开始至2024年4月2日,奖励目录包括:外语能力测试、行业导向认证考试、“现代金融人才专业认证”及“信息技术人才专业认证”,申请获批后将可获得相应奖励。 澳门人才发展委员会委员、澳门管理学院…

    2024年3月16日
  • 学英语一年多少钱

    #我来唠家常# 问了一个英语培训班,53个课时,一年要4000多元,只是学26个英文字母。 听完之后,我沉默了。 一个班4000多也太贵了吧,问他团购价多少? 老板说:“现在都打压教培,我们连门头都没有,不存在团购价格,53个课时就4000多元。” 那一个班多少人? 老板淡定的回答:“30个。” 我惊呼这人也太多了吧,30个小孩能学到啥呢? 老板答:“就是这…

    2024年6月28日
  • 釜山大学相当于国内哪个大学

    在繁华的首尔之外,韩国地方大学也隐藏着一些实力非凡的大学。这些大学不仅在学术上和教育质量上赢得了广泛的认可,更以其独特的地域文化吸引了很多留学生的目光。 特别是国立大学普遍分布在地方,出于学费低这个优势,促使多少向往首尔地区大学的同学,最终投入了地方大学的怀抱。 今天,就让我们看看那些隐藏在地方的韩国实力大学都有哪些? No.1 庆北大学 庆北大学位于韩国第…

    2025年8月29日
  • 日本大学留学条件和费用

    申请日本研究生的必备条件 在选择日本作为留学目的地的过程中,很多同学的首选都是研究生阶段。那么,想要成功申请日本的研究生课程,需要符合哪些条件呢?以下是我作为留学学长总结的几点要素,希望对大家有所帮助。 学历要求 首先,学历方面,申请者需持有相关的学士或硕士学位,且所学专业通常需与所申请的研究方向相符。例如,想申请工程类课程的同学,需要有类似背景的学士学位,…

    2025年1月3日
  • 世界mba排名_世界mba排名榜单

    本报驻香港特约记者 叶 蓝 国际高等教育信息机构Quacquarelli Symonds(QS)25日公布2024工商管理硕士(MBA)课程全球排名,香港4所大学的商学院课程上榜。 据香港《星岛日报》26日报道,在本港4个上榜的MBA课程中,3个入围全球百大,其中排名最高的是香港大学(港大),今年排在全球第35位,比去年上升3位;香港科技大学(科大)从去年的…

    2024年3月4日
  • 工程管理专业留学

    寒暑假入学-时间灵活 跨学科深度融合 以实践为导向 ‍免语言|单证可申|可跨专业

    2025年12月30日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信