马萨诸塞大学阿姆赫斯特分校计算机

刚刚,美国计算机学会 ACM 今天宣布 Andrew Barto 和 Richard Sutton 获得 2024 年 ACM A.M.图灵奖,以表彰他们开发了强化学习的概念和算法基础。就强化学习而言,从 20 世纪 80 年代开始,Barto 和 Sutton 在其一系列论文中介绍了主要理念,构建了数学基础,并开发了的重要算法——这是创建智能系统的最重要方法之一。

ACM 主席 Yannis Ioannidis 表示:“Barto 和 Sutton 的工作展示了应用多学科方法应对我们领域长期挑战的巨大潜力。从认知科学、心理学到神经科学的研究领域激发了强化学习的发展,这为 AI 的一些最重要的进展奠定了基础,并让我们更深入地了解到大脑的工作原理。Barto 和 Sutton 的工作并不是我们已经跨越的垫脚石。强化学习仍在不断发展,并为计算和许多其他学科的进一步发展提供了巨大的潜力。这个领域最有声望的奖项对于他们而言,实至名归。”谷歌高级副总裁 Jeff Dean 说道:“艾伦·图灵在 1947 年的一次演讲中提到‘我们想要的是一台能够从经验中学习的机器’。由 Barto 和 Sutton 开创的强化学习直接回答了图灵的问题。他们的工作是过去几十年 AI 进步的关键。他们开发的工具仍然是 AI 繁荣的核心支柱,并取得了重大进展,吸引了大批年轻研究人员,并带动了数十亿美元的投资。RL 的影响将延续到未来。谷歌很荣幸赞助 ACM A.M.图灵奖,并向那些塑造了改善我们生活的技术的个人致敬。”

Andrew Barto 是马萨诸塞大学阿姆赫斯特分校信息与计算机科学系的名誉教授,被誉为强化学习领域的先驱之一。他于 1970 年在密歇根大学获得数学学士学位,随后在 1975 年获得计算机与通信科学的博士学位。Barto 在 1977 年加入马萨诸塞大学阿姆赫斯特分校,开始了他的学术生涯,并在多个职位上任职,包括副教授、教授和系主任。Barto 在强化学习领域的贡献不可小觑。他与他的博士学生 Richard Sutton 合作,从 20 世纪 80 年代开始,系统地介绍了强化学习的主要理念,构建了数学基础,并开发了重要的算法。他们的工作为创建智能系统提供了重要的方法论支持。Barto 和 Sutton 共同撰写了经典教材《Reinforcement Learning: An Introduction》,该书至今仍是该领域的标准参考书目,被引次数已超过 75,000 次。Barto 因其在强化学习领域的开创性工作获得了多项荣誉,包括马萨诸塞大学神经科学终身成就奖、IJCAI 卓越研究奖和 IEEE 神经网络学会先锋奖。他是电气电子工程师协会(IEEE)的会员,也是美国科学促进协会(AAAS)的会士。

图丨Andrew Barto(来源:College of Information and Computer SciencesUniversity of Massachusetts Amherst)

Richard Sutton 是阿尔伯塔大学计算机科学教授,同时也是 Keen Technologies 的研究科学家,并担任阿尔伯塔机器智能研究所(Amii)的首席科学顾问。Sutton 在强化学习领域的影响力深远,被认为是现代强化学习的奠基人之一。他在 20 世纪 80 年代与 Andrew Barto 合作,共同推动了强化学习的发展。Sutton 于 1978 年在斯坦福大学获得心理学学士学位,随后在马萨诸塞大学阿姆赫斯特分校获得计算机与信息科学的硕士和博士学位。他的研究兴趣主要集中在决策者与环境相互作用时所面临的学习问题,认为这是智能的核心问题。Sutton 在强化学习领域的贡献包括时序差分学习、策略梯度方法和 Dyna 架构等。Sutton 的著作《Reinforcement Learning: An Introduction》与 Andrew Barto 共同撰写,成为该领域的经典教材,影响了无数研究人员和学生。他曾在 2017 年至 2023 年期间担任 DeepMind 的杰出研究科学家,并在多个学术机构任职,积累了丰富的研究和管理经验。Sutton 因其在强化学习领域的卓越贡献获得了多项荣誉,包括国际人工智能联合会议(IJCAI)卓越研究奖和加拿大人工智能协会终身成就奖。他的工作不仅在学术界产生了深远影响,也为工业界的应用提供了重要支持。

图丨Richard Sutton(来源:University of Alberta)

强化学习作为机器学习领域的重要分支,有着丰富的发展历程。其起源可追溯到 20 世纪 50 年代,当时科学家们开始探索让计算机像人类一样通过试错来学习最优策略的方法。早期的理论奠基工作为后续发展打下了基础,但受限于计算能力和数据量,强化学习在当时并未得到广泛应用。到了 20 世纪 80 年代,Richard Sutton 和 Andrew Barto 等学者做出了开创性贡献。他们系统地阐述了强化学习的基本概念和理论框架,提出了时间差分学习算法,如 Q-learning 。Q-learning 能够在不依赖环境模型的情况下,通过不断更新状态 – 动作对的 Q 值来学习最优策略,大大简化了学习过程,为强化学习的发展注入了强大动力。进入 21 世纪,随着计算机性能的大幅提升和大数据的爆发式增长,强化学习迎来了新的发展机遇。深度学习的兴起更是为强化学习带来了革命性变化,深度强化学习应运而生。深度神经网络强大的特征表示能力与强化学习的决策优化能力相结合,在诸多领域展现出卓越性能。在游戏领域,AlphaGo 利用深度强化学习击败人类顶尖棋手,震惊世界;在机器人控制方面,强化学习使机器人能够自主学习完成复杂任务,如行走、抓取物体等;自动驾驶领域,强化学习也在路径规划和决策制定中发挥着重要作用。

尽管 Barto 和 Sutton 的算法是在数十年前开发的,但通过与深度学习算法的结合,强化学习的实际应用在过去十五年里取得了重大进展。这表明他们的研究具有持久的影响力,并为未来的技术发展奠定了基础。他们的成就激励了成千上万的研究人员投身于强化学习领域,推动了该领域的持续发展和创新。

参考资料:

https://amturing.acm.org/

运营/排版:何晨龙

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/45191.html

(0)
上一篇 2025年5月27日
下一篇 2025年5月27日

相关推荐

  • 法国中央理工大学好吗

    巴黎中央理工-高等电力学院(CentraleSupélec)是T.I.M.E.联盟成员,2015年1月由法国两所著名工程师学校,巴黎中央理工学院(l’Ecole Centrale Paris)和高等电力学院(Supélec)合并而成,现已并入巴黎萨克雷大学(Université Paris-Saclay)。 在2021QS世界大学排名中,巴黎中央理工-高等电…

    2025年9月8日
  • 牛津国际公学佛山学校_佛山市牛津家具有限公司

    9月5日,沃顿公学(原牛津国际公学成都学校)举行了线上开学典礼。校长彭长贵在致辞中说: 从“牛津”到“沃顿”,我们将一如既往的延续“牛津”的高质量与辉煌,并追求更卓越的未来。 “牛津团队+沃顿校园=强强联合”。牛津和沃顿之间,有一个美好的相逢。 今年7月20日,业界传出消息:牛津国际公学成都学校将从成华区迁到高新区,新学校地址位于高新区新尚路45号的“成都沃…

    2024年2月26日
  • 南开大学法国诺欧商学院

    编者按 学校坚持立德树人根本任务,以迎接新一轮本科教育教学审核评估为契机,扎实推进“南开卓越公能人才培养体系3.0”建设,着力提升人才自主培养质量。为全面展示各学院本科教育教学综合改革成效与创新实践经验,特推出“本科教育教学审核评估学院巡礼”。 本期推送:商学院 一、 学院简介 1919年南开大学建校之时,便以“文以治国、理以强国、商以富国”为办学理念,设立…

    2025年8月25日
  • 香港大学面试内容

    #家长百问百答# 香港大学内地学生家长 肥佬 今天下午,姗姗来迟的香港大学2023年内地本科招生之多元卓越计划面试终于揭开了神秘 的面纱,今年多元卓越计划的面试通知,截止到2023年2月17号仍未发放,(在往年,香港大学内地本科招生的多元卓越计划面试,从元月中旬就开始进行了,今年已经迟了一个多月了)在此之前我们就怀疑香港大学的多元卓越计划面试有可能发生重大的…

    2023年12月2日
  • 杜克大学商学院排名

    商科一直是中国留学生申请的热门专业之一,如果本科想去美国读商科,对不起,绝大部分名校都没有! 由于商科类专业是职业指向非常强的专业,不符合美国通识教育的传统,因此并非所有的综合性大学的商学院都设立本科学位,特别是顶尖商学院。 比如大家熟知的:哈佛、斯坦福、耶鲁大学、芝加哥、杜克大学、西北大学、约翰霍普金斯大学等都不提供本科课程。 也有一些顶尖大学开设了本科商…

    2025年10月27日
  • 万科债券价格回升 下午高层将集体出席与金融机构沟通会议

    11月6日,据澎湃新闻了解,万科拟于11月6日16时通过线上会议方式,统一与金融机构交流经营情况及近期二级市场债券价格波动事宜,深圳国资委相关领导、深圳地铁集团董事长辛杰、万科董事长郁亮、万科总裁祝九胜、万科副总裁兼财务负责人韩慧华将悉数出席。 此次,深圳国资委、大股东深铁集团共同出面,被市场认为是对万科的有力站台。 受此消息影响,万科多只境内债券午后延续上…

    2023年11月6日
  • 美国加州大学尔湾分校排名

    近期,U.S.News 发布了最新的 2026 全美最佳公立大学排名! 下面就跟小启一起来看看排名详情~ 排名亮点速览 纵观今年榜单,最引人注目的当属UC 系大学的集体闪耀: 加州大学伯克利分校(UCB)从去年第2位重回冠军宝座,捍卫"公立大学第一学府"荣耀;加州大学洛杉矶分校(UCLA)虽暂居第二,但与伯克利仅毫厘之差;加州大学圣地亚哥…

    2025年11月21日
  • 西澳大学专业排名

    蜿蜒的河流Swan River 是陆地的脐带,是连接尼昂加尔人与布嘉的生命力量 这里是西澳文化的发源地 也是黑天鹅的故里 这一形象,也被西澳大学巧妙地 应用于校徽设计 盾形+麦穗+五角星+黑天鹅 共同展示出 西澳大学的创新、开放和未来发展的决心 接下来,和新志愿教育一起详细了解一下这所 QS排名77位的世界名校 西澳大学 一、院校概况 西澳大学始建于1911…

    2025年9月30日
  • 美国数学建模大赛(美国数学建模大赛奖的等级)

    近日,第37届美国国际大学生数学建模竞赛(MCM)与交叉学科建模竞赛(ICM)成绩公布,在全球36个MCM和ICM特等奖(Outstanding Winner)中,上海交通大学学生团队获得5个特等奖(Outstanding Winner),并获得27个特等奖提名(Finalist);同时获得MCM 和ICM共计66个一等奖(Meritorious Winne…

    2023年10月12日
  • 哈佛商学院出版社在哪儿

    为什么有些公司能持续繁荣数十年,而有的却昙花一现?企业失败往往不是单一因素造成,而是多种因素叠加引发的连锁反应,导致原本有效的战略失效。然而,导致企业衰退甚至倒闭的关键原因——所有权模式,往往被忽视。 企业的所有权模式(如上市公司、私营公司、家族所有、员工持股公司、慈善机构所有等)决定了其运作方式,并对企业的长期生存能力产生深远影响。上市公司因承受来自公开市…

    2025年7月31日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信