圣彼得堡交通大学排名

智东西9月18日消息,今天凌晨,OpenAI和谷歌前后脚宣布,自家模型在全球知名编程竞赛ICPC 2025(第49届国际大学生程序设计竞赛)总决赛获得金牌级别的表现。

OpenAI推理系统答对了全部12道题目,并且一次性答对11道题,最难的题目提交了9次后成功,与人类团队相比可排第一;Gemini 2.5 Deep Think高级版本在677分钟内解出10道题,与人类团队相比可位列第二。

如果将AI列入ICPC的总排名中,前三名应该是OpenAI推理系统、圣彼得堡国立大学、谷歌Gemini 2.5 Deep Think高级版本。

ICPC的要求是参赛者在5个小时内解出12道复杂算法问题,解题方案是否完美、解题耗时都会影响积分。

最终139支队伍中获得金牌的为前四名,分别为圣彼得堡国立大学、东京大学、北京交通大学、清华大学,解出题目最多的是圣彼得堡国立大学,共11道。

ICPC拿下金牌的人类团队

这是继2个月前,OpenAI推理系统、谷歌Gemini 2.5 Deep Think在国际数学奥林匹克竞赛(IMO)之后,又一次在顶尖国际竞赛中证明了自己的实力。

谷歌Gemini 2.5 Deep Think高级版本参加ICPC总决赛的代码已经在GitHub开源。

GitHub地址:

https://github.com/google-deepmind/gemini_icpc2025

01.OpenAI拿下满分谷歌错两道

ICPC是全球公认的历史最悠久、规模最大、最负盛名的大学级算法编程竞赛,每年来自近3000所大学和超过103个国家的参与者竞相解决现实世界的编程问题。

OpenAI和谷歌都参与并获得金牌级别表现,OpenAI推理系统解答了12道题,谷歌Gemini 2.5 Deep Think高级版本答出10道题,最好的人类团队答出11道题。

1、OpenAI:拿下满分,11道题一次就做对

OpenAI推理系统获得满分。

OpenAI提到并没有专门为ICPC训练模型,其采用通用推理模型组合的方式参赛。

比赛中,GPT-5与一款实验性推理模型共同生成解题方案,由该实验性推理模型负责筛选待提交的方案。最终,GPT-5正确解答了11道题目,而最后一道也是难度最高的一道题目由这款实验性推理模型解决。

其模型一次性答对了11道题,最难的问题在第9次提交时成功了。

2、谷歌:答对10道题,45分钟解出8道题

Gemini 2.5 Deep Think高级版本按照ICPC规则在远程在线环境中进行现场比赛,比人类参赛者晚10分钟开始。Gemini总共花费677分钟,解决了12个问题中的10个,其中8个花费45分钟,另外2个问题花费3个小时。

下图是2025年ICPC总决赛中解决每个问题所用的时间,Gemini所花的时间以蓝色显示,最快的大学生团队的时间以灰色显示。

Gemini在3道题目上的解题时间都超过了人类。

ICPC总决赛中解决每个问题所用的时间

此外,谷歌DeepMind还提到一道困住所有人类团队的难题,被Gemini在半小时内成功解答。

问题C要求团队设计一套解决方案,通过相互连接的管道网络将液体输送至一组储液罐,目标是找到一种管道配置,以最快速度将所有储液罐注满。

该问题存在无限多种可能的配置,因为每条管道均可处于开启、关闭甚至部分开启的状态,这使得寻找最优配置的难度极大。

问题C简介

Gemini找到了有效的解决方案:它首先假设每个水库都有一个“优先级值”,代表每个水库与其他水库相比应该获得的优先程度。

当给定一组优先级值时,可以使用动态规划算法找到管道的最佳配置。

Gemini发现,通过应用极小极大定理(Minimax Theorem),原问题可转化为寻找能使最终流量受到最大约束的优先级数值。

借助优先级数值与最优流量之间的关联,Gemini在类似碗状的凸性解空间中,通过嵌套三分搜索(Nested Ternary Searches)快速找到最优优先级数值,最终解决了C题。

目前订阅Google AI Ultra的Gemini用户已经可以在Gemini App中使用轻量级版本的Gemini 2.5 Deep Think。

02.ICPC金牌水平展现大模型抽象推理能力

谷歌DeepMind的博客中提到,Gemini的表现得益于其在预训练、训练后、强化学习技术、多步骤推理和平行思维方面的技术创新。

例如,在强化学习过程中,研究人员训练Gemini为编程人员面临的一些最困难的问题进行推理和生成代码,从结果反馈中学习并改进其方法。为了解决一个问题,多个Gemini Agent会各自提出自己的解决方案,使用终端执行代码和测试,然后根据所有尝试迭代解决方案。

谷歌DeepMind的内部研究表明,Gemini 2.5 Deep Think高级版本也能在2023年和2024年ICPC世界总决赛中取得金牌级别的表现,表现不亚于全球前20名竞技开发者。

在ICPC上获得金牌水平对软件开发具有直接的实际影响,如果将比赛中最好的AI和人类解决方案结合起来,所有12个问题都会得到彻底和正确的解决。这表明AI有潜力提供独特思路,为人类专家提供补充。

除了数学和编程外,Gemini 2.5 Deep Think高级版本还展示了在抽象推理方面的能力。

这是因为,ICPC的问题需要模型理解复杂的问题、设计多步骤的逻辑计划、完美实施,这一过程与许多科学和工程领域所需的技能相同,包括设计新药或微芯片等领域。

OpenAI的研究人员在X上发布帖子称,他们采用同一组模型参加IMO和IOI竞赛,展示了模型性能以及通用型。

03.结语:大模型复杂抽象问题解决能力提升

从国际数学奥林匹克竞赛(IMO)到此次的编程竞赛,OpenAI以及谷歌的模型在解决更具挑战的数学、推理难题上迸发出巨大潜力。ICPC全球执行董事Bill Poucher博士称,ICPC一直致力于在解决问题方面设定最高标准,Gemini在这一领域取得的成绩,标志着定义下一代所需AI工具和学术标准的关键时刻。

这些在竞争性编程和数学推理方面的突破共同证明了大模型在抽象推理问题解决方面的性能飞跃,或能与人类专家结合,解决更加复杂的难题。

本文来自微信公众号“智东西”(ID:zhidxcom),作者:程茜,编辑:李水青,36氪经授权发布。

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/67126.html

(0)
上一篇 2025年11月27日
下一篇 2025年11月27日

相关推荐

  • 《中国人口报》刊文:高校要发挥婚恋教育主阵地作用

    构建新型婚育文化是营造生育友好社会氛围的重要内容。国务院办公厅印发的《关于加快完善生育支持政策体系推动建设生育友好型社会的若干措施》在强调“大力倡导积极的婚恋观、生育观、家庭观”的同时,首次提出“加强人口国情国策教育,将相关内容融入中小学、本专科教育”。 笔者近期开展的调查研究发现,当代大学生作为未来生育的主力军,婚恋观念发生了明显变化。例如,56.9%的同…

    2024年12月3日
  • 成都新东方(成都新东方考研培训机构)

    各地春季报名接近尾声,有些同学还在为选择学校犹豫不决…不如去实地考察再做决定! 有些同学早就做好了,想学一门实打实的技术的决定,可是迟迟不敢做选择,怕和想象的不一样,那就去实地考察! 敢接受检验和考察的学校才是真的拥有最强实力!成都新东方高级技工学校从不惧怕考察,欢迎各位家长和同学来我校实地考察,选择成都新东方不后悔! 亲眼验证校园环境,教学设备…

    2023年9月11日
  • 波士顿大学和罗切斯特大学哪个好

    近日,US.News发布了2026美本最佳计算机科学(CS)专业排名,Jam爸爸利用假期时间统计了最近6年US.News美本CS专业排名及10个细分专业排名变化,自己学习,顺便分享给大家参考(欢迎私信,Jam爸爸原创,抄袭必究)。 注:黄色底纹为USNEWS综排TOP30大学,Jam爸爸原创统计,抄袭必究 CS专业排名TOP5: MIT CS专业重回第一,最…

    2025年12月23日
  • 扣非净利暴增超139倍 芯片龙头热度高居第一!多只苹果概念股被盯上

    近一周机构调研个股数量有220多只,澜起科技成为调研机构数量最多的股票。 澜起科技机构关注度高居第一,合计402家机构调研了该公司,其中包括82家基金公司、65家证券公司、101家私募、25家险资以及33家海外机构等。 2024年上半年,公司预计实现营业收入16.65亿元,同比增长79.49%;预计净利润5.83亿元至6.23亿元,同比增长612.73%至6…

    2024年7月21日
  • 罗切斯特大学世界排名多少

    前几天,2021年USNews最新美国大学排名发布,由于今年取消了SAT/ACT考试成绩的考核,不少学校出现了较大变动。 加州理工从去年的12名冲进了前十,位列第9! 德克萨斯大学奥斯汀分校、迈阿密大学也出现了明显的上升; 奥本大学和犹他大学也顺利冲进了TOP100。 当然,几家欢喜几家愁。在这些学校名次上升的同时,某些学校的名次也出现了或多或少的下降。 杜…

    2025年9月16日
  • 韩国龙仁大学怎么样

    来源:央视新闻客户端 韩国龙仁大学教授、韩国中国经营研究所所长朴胜赞是中韩两国1992年建交后,最早一批来到中国的韩国留学生。在清华大学获得博士学位之后,他在韩国驻华大使馆工作多年,如今回到韩国专注学术研究,仍然经常来中国、在各地探访。朴教授经常说:“中国的变化太快了,如果不经常过来看一看,就会跟不上。”那么在他眼中,中国社会有了哪些日新月异的变化呢? 韩国…

    2024年5月26日
  • 美国圣托马斯大学世界排名

    圣托马斯大学 University of St. Thomas 图片来源:百度百科 创校年份: 1885年 学校类型:私立大学 学生人数:约10,229人 学校官网: www.stthomas.edu 学校概况: 圣托马斯大学University of St.Thomas建于1885年,是一所天主教的文科类区域性综合大学,其高质量的教学和研究水平在美国中西部…

    2024年10月12日
  • 长崎国际大学在哪

    长崎国际大学 国内直招日本大学 -学校简介- 长崎国际大学是于2000年设立的日本私立大学,其前身是拥有60余年历史的学校法人九州文化学园。长崎国际大学是一所现代国际化的大学,位于日本佐世堡市北部,与日本第三大主题公园豪斯登堡相邻。在校学生可以凭借学员证免费出入豪斯登堡,并且豪斯登堡提供在校生优先就业和打工的机会。 人文社会学部分为国际观光学科和社会福祉学科…

    2024年8月16日
  • 美国政府正式关门

    来源:海外网 美国国会大厦。(图片来源:视觉中国) 美国政府可能又要“关门”了。据美国政治新闻网站Politico9月11日报道,尽管国会参议院仍在就下一个财政年度的拨款法案进行辩论,但两党参议员们的工作很可能徒劳无功。由于众议院两党和共和党内部仍在预算问题上缠斗不休,美国政府在10月1日新财政年度开始当天关门的风险正在急剧上升。 预算案通过机会渺茫 Pol…

    2023年10月31日
  • 美国威廉玛丽学院有什么学院

    威廉玛丽学院(The College of William and Mary,或称威廉与玛丽学院)是一所位于美国弗吉尼亚州威廉斯堡的著名小型公立大学,创立于1693年,是美国历史继哈佛大学之后第二悠久的大学,校园极具历史价值。学校的硬件和软件环境都是一流,更是公立常春藤之一,可以用便宜的价格使学生享受和私立大学同等的教学质量。校园所在地威廉斯堡是历史名城,位…

    2024年10月19日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信