圣彼得堡国立技术大学世界排名

智东西9月18日消息,今天凌晨,OpenAI和谷歌前后脚宣布,自家模型在全球知名编程竞赛ICPC 2025(第49届国际大学生程序设计竞赛)总决赛获得金牌级别的表现。

OpenAI推理系统答对了全部12道题目,并且一次性答对11道题,最难的题目提交了9次后成功,与人类团队相比可排第一;Gemini 2.5 Deep Think高级版本在677分钟内解出10道题,与人类团队相比可位列第二。

如果将AI列入ICPC的总排名中,前三名应该是OpenAI推理系统、圣彼得堡国立大学、谷歌Gemini 2.5 Deep Think高级版本。

ICPC的要求是参赛者在5个小时内解出12道复杂算法问题,解题方案是否完美、解题耗时都会影响积分。

最终139支队伍中获得金牌的为前四名,分别为圣彼得堡国立大学、东京大学、北京交通大学、清华大学,解出题目最多的是圣彼得堡国立大学,共11道。

ICPC拿下金牌的人类团队

这是继2个月前,OpenAI推理系统、谷歌Gemini 2.5 Deep Think在国际数学奥林匹克竞赛(IMO)之后,又一次在顶尖国际竞赛中证明了自己的实力。

谷歌Gemini 2.5 Deep Think高级版本参加ICPC总决赛的代码已经在GitHub开源。

GitHub地址:

https://github.com/google-deepmind/gemini_icpc2025

01.OpenAI拿下满分谷歌错两道

ICPC是全球公认的历史最悠久、规模最大、最负盛名的大学级算法编程竞赛,每年来自近3000所大学和超过103个国家的参与者竞相解决现实世界的编程问题。

OpenAI和谷歌都参与并获得金牌级别表现,OpenAI推理系统解答了12道题,谷歌Gemini 2.5 Deep Think高级版本答出10道题,最好的人类团队答出11道题。

1、OpenAI:拿下满分,11道题一次就做对

OpenAI推理系统获得满分。

OpenAI提到并没有专门为ICPC训练模型,其采用通用推理模型组合的方式参赛。

比赛中,GPT-5与一款实验性推理模型共同生成解题方案,由该实验性推理模型负责筛选待提交的方案。最终,GPT-5正确解答了11道题目,而最后一道也是难度最高的一道题目由这款实验性推理模型解决。

其模型一次性答对了11道题,最难的问题在第9次提交时成功了。

2、谷歌:答对10道题,45分钟解出8道题

Gemini 2.5 Deep Think高级版本按照ICPC规则在远程在线环境中进行现场比赛,比人类参赛者晚10分钟开始。Gemini总共花费677分钟,解决了12个问题中的10个,其中8个花费45分钟,另外2个问题花费3个小时。

下图是2025年ICPC总决赛中解决每个问题所用的时间,Gemini所花的时间以蓝色显示,最快的大学生团队的时间以灰色显示。

Gemini在3道题目上的解题时间都超过了人类。

ICPC总决赛中解决每个问题所用的时间

此外,谷歌DeepMind还提到一道困住所有人类团队的难题,被Gemini在半小时内成功解答。

问题C要求团队设计一套解决方案,通过相互连接的管道网络将液体输送至一组储液罐,目标是找到一种管道配置,以最快速度将所有储液罐注满。

该问题存在无限多种可能的配置,因为每条管道均可处于开启、关闭甚至部分开启的状态,这使得寻找最优配置的难度极大。

问题C简介

Gemini找到了有效的解决方案:它首先假设每个水库都有一个“优先级值”,代表每个水库与其他水库相比应该获得的优先程度。

当给定一组优先级值时,可以使用动态规划算法找到管道的最佳配置。

Gemini发现,通过应用极小极大定理(Minimax Theorem),原问题可转化为寻找能使最终流量受到最大约束的优先级数值。

借助优先级数值与最优流量之间的关联,Gemini在类似碗状的凸性解空间中,通过嵌套三分搜索(Nested Ternary Searches)快速找到最优优先级数值,最终解决了C题。

目前订阅Google AI Ultra的Gemini用户已经可以在Gemini App中使用轻量级版本的Gemini 2.5 Deep Think。

02.ICPC金牌水平展现大模型抽象推理能力

谷歌DeepMind的博客中提到,Gemini的表现得益于其在预训练、训练后、强化学习技术、多步骤推理和平行思维方面的技术创新。

例如,在强化学习过程中,研究人员训练Gemini为编程人员面临的一些最困难的问题进行推理和生成代码,从结果反馈中学习并改进其方法。为了解决一个问题,多个Gemini Agent会各自提出自己的解决方案,使用终端执行代码和测试,然后根据所有尝试迭代解决方案。

谷歌DeepMind的内部研究表明,Gemini 2.5 Deep Think高级版本也能在2023年和2024年ICPC世界总决赛中取得金牌级别的表现,表现不亚于全球前20名竞技开发者。

在ICPC上获得金牌水平对软件开发具有直接的实际影响,如果将比赛中最好的AI和人类解决方案结合起来,所有12个问题都会得到彻底和正确的解决。这表明AI有潜力提供独特思路,为人类专家提供补充。

除了数学和编程外,Gemini 2.5 Deep Think高级版本还展示了在抽象推理方面的能力。

这是因为,ICPC的问题需要模型理解复杂的问题、设计多步骤的逻辑计划、完美实施,这一过程与许多科学和工程领域所需的技能相同,包括设计新药或微芯片等领域。

OpenAI的研究人员在X上发布帖子称,他们采用同一组模型参加IMO和IOI竞赛,展示了模型性能以及通用型。

03.结语:大模型复杂抽象问题解决能力提升

从国际数学奥林匹克竞赛(IMO)到此次的编程竞赛,OpenAI以及谷歌的模型在解决更具挑战的数学、推理难题上迸发出巨大潜力。ICPC全球执行董事Bill Poucher博士称,ICPC一直致力于在解决问题方面设定最高标准,Gemini在这一领域取得的成绩,标志着定义下一代所需AI工具和学术标准的关键时刻。

这些在竞争性编程和数学推理方面的突破共同证明了大模型在抽象推理问题解决方面的性能飞跃,或能与人类专家结合,解决更加复杂的难题。

本文来自微信公众号“智东西”(ID:zhidxcom),作者:程茜,编辑:李水青,36氪经授权发布。

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/61854.html

(0)
上一篇 2025年10月30日
下一篇 2025年10月30日

相关推荐

  • 广东理工职业学院南海校区学费

    2025年广职学费住宿费公布了,文科5250艺术10000,住宿费800起,费用透明但艺术和合作专业偏高,家长压力不小。 费用结构还算清晰。 普通专业学费和公办高校平均水平接近,文科5250理工6410不算离谱。 但美术和学前直接飙到一万,学分互认和中外合作项目更是一万六起跳,比普通专业贵了两三倍。 这差距太明显了,虽说艺术类投入大,但普通家庭负担起来真够呛…

    2025年8月21日
  • 澳洲维多利亚大学毕业证

    中新网2月27日电 据澳洲网报道,澳大利亚维多利亚州高考(VCE)有望迎来历史上规模最大的一场变革。维州政府正考虑针对所有学生设立最低读写和数学标准,只有达到这一标准的学生才有资格从高中毕业。 维州拟设最低能力标准 据报道,有关学生学术能力出现持续倒退的报道在澳引发热议。在此之际,维州教育厅长马连劳(James Merlino)敦促维州课程与评估管理局(VC…

    2025年3月13日
  • 南洋理工职业学院老师信息

    2月5日,农历乙巳蛇年新春的首个工作日,广东省委、省政府召开全省高质量发展大会,聚焦“建设现代化产业体系”,凝聚共识,汇聚各方力量,共谋广东高质量发展蓝图。 “广州南洋理工职业学院作为省内一所民办高职院校,有其独特的体制机制优势。”广州南洋理工职业学院执行校长姚侃表示,学校始终根据行业发展、市场需求和社会变革要求及时调整优化专业设置、课程内容和人才培养模式,…

    2025年7月23日
  • 印第安纳大学法学院排名

    近日,知名法律网站Above the Law(以下简称ATL)公布了第10届Top 50法学院排名,即ATL Top 50 Law Schools 2022。和其他主流法学院排名相比,ATL排名的特点是着重于评估法学院毕业生的就业情况,而非学生水平、师资力量、教学资源等传统因素。这是因为,ATL认为法学院教育的质量高低在很大程度上是由学生的就业质量所决定和体…

    2025年9月5日
  • 法国著名大学排名_法国著名大学排名前十

    公立大学毕业率一直是大家关心的问题,用两年时间拿到硕士学位是件很难的事情吗? 想要留学,如何选择院校?一般来讲,大家倾向于选择知名度高、学术实力强的学府,但是,对于生涯规划较为紧凑、必须如期完成学习的同学来说, 有一项指标亦不容忽视,那就是院校的毕业率。 3月12日,L'Etudiant公布了2024年公立大学硕士学位毕业率榜单。根据高等教育和研究…

    2024年4月14日
  • 白俄罗斯留学政策

    来源:海外网 视频加载中… 近日,在北京大学就读的白俄罗斯籍留学生列莎接受人民日报海外网采访,点赞白中两国经济合作和人文交流的成果。她说,现在越来越多的白俄罗斯人开始学中文,到中国留学,同时也有很多中国学生去白俄罗斯读书。她还表示,中国与白俄罗斯共建的中白工业园,为很多白俄罗斯人和中国人提供了就业机会。(海外网 刘强 实习生 殷晨浠)

    2025年9月30日
  • rochester大学qs排名

    罗切斯特大学世界排名 罗切斯特大学(University of Rochester)是一所位于美国的著名私立研究型大学,其在全球范围内的排名一直是学生们关注的重点。以下是根据最近的搜索结果得到的相关信息: QS世界大学排名2024年QS世界大学排名:罗切斯特大学位列第224名。2023年QS世界大学排名:罗切斯特大学位列第147名。2022年QS世界大学排名…

    2024年7月31日
  • 英国第二轮封锁

    “封国”,落到普通人头上,就是一个大写的“乱”字。 文│安光系 编辑│戴闻名 插画│刘俊 英国又“封国”了。 继今年3月全国性封城之后,英国政府再次官宣,又要封锁至少一个月。 几个月来,焦头烂额的首相鲍里斯·约翰逊口风一变再变:一开始说,3月封锁完了很快就恢复正常生活;后来慢慢变成了,希望万圣节能过上正常生活;再后来呢,又要再次封锁了,否则连圣诞节都不能出门…

    2023年10月19日
  • 数字媒体技术专业大学排名

    #大学专业如何选##大学排名##录取分数线# 前言:由于篇幅限制,只上传了部分省份的录取分数线。想要获取更多,可以关注并私信我。文章较长,建议您收藏,因为到用的时候不一定能找得到。 今天为大家介绍数字媒体技术专业。 数字媒体技术专业学什么? 属于工科计算机类,专业代码080906。 本专业主要从表现形式和技术的角度来研究新媒体,是通信和信息技术、计算机科学、…

    2025年11月19日
  • 美国里海大学世界排名第几

    录取率是衡量大学是否优秀的重要标准,但入学率(即被录取的学生最终入学的比例)更能说明这所大学是否是学生们的首选。 芝加哥大学、麻省理工、哈佛大学和斯坦福大学的入学率超过80%,然而有些排名也不错的大学却面临着凄凉的境况,入学率仅有10-30%左右。 今天,我们就来一起看看入学率较低的10所美国大学吧! 这些大学排名虽然还行,但大家真的不爱去! #01 凯斯西…

    2024年10月14日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信