马萨诸塞大学阿姆赫斯特分校计算机

刚刚,美国计算机学会 ACM 今天宣布 Andrew Barto 和 Richard Sutton 获得 2024 年 ACM A.M.图灵奖,以表彰他们开发了强化学习的概念和算法基础。就强化学习而言,从 20 世纪 80 年代开始,Barto 和 Sutton 在其一系列论文中介绍了主要理念,构建了数学基础,并开发了的重要算法——这是创建智能系统的最重要方法之一。

ACM 主席 Yannis Ioannidis 表示:“Barto 和 Sutton 的工作展示了应用多学科方法应对我们领域长期挑战的巨大潜力。从认知科学、心理学到神经科学的研究领域激发了强化学习的发展,这为 AI 的一些最重要的进展奠定了基础,并让我们更深入地了解到大脑的工作原理。Barto 和 Sutton 的工作并不是我们已经跨越的垫脚石。强化学习仍在不断发展,并为计算和许多其他学科的进一步发展提供了巨大的潜力。这个领域最有声望的奖项对于他们而言,实至名归。”谷歌高级副总裁 Jeff Dean 说道:“艾伦·图灵在 1947 年的一次演讲中提到‘我们想要的是一台能够从经验中学习的机器’。由 Barto 和 Sutton 开创的强化学习直接回答了图灵的问题。他们的工作是过去几十年 AI 进步的关键。他们开发的工具仍然是 AI 繁荣的核心支柱,并取得了重大进展,吸引了大批年轻研究人员,并带动了数十亿美元的投资。RL 的影响将延续到未来。谷歌很荣幸赞助 ACM A.M.图灵奖,并向那些塑造了改善我们生活的技术的个人致敬。”

Andrew Barto 是马萨诸塞大学阿姆赫斯特分校信息与计算机科学系的名誉教授,被誉为强化学习领域的先驱之一。他于 1970 年在密歇根大学获得数学学士学位,随后在 1975 年获得计算机与通信科学的博士学位。Barto 在 1977 年加入马萨诸塞大学阿姆赫斯特分校,开始了他的学术生涯,并在多个职位上任职,包括副教授、教授和系主任。Barto 在强化学习领域的贡献不可小觑。他与他的博士学生 Richard Sutton 合作,从 20 世纪 80 年代开始,系统地介绍了强化学习的主要理念,构建了数学基础,并开发了重要的算法。他们的工作为创建智能系统提供了重要的方法论支持。Barto 和 Sutton 共同撰写了经典教材《Reinforcement Learning: An Introduction》,该书至今仍是该领域的标准参考书目,被引次数已超过 75,000 次。Barto 因其在强化学习领域的开创性工作获得了多项荣誉,包括马萨诸塞大学神经科学终身成就奖、IJCAI 卓越研究奖和 IEEE 神经网络学会先锋奖。他是电气电子工程师协会(IEEE)的会员,也是美国科学促进协会(AAAS)的会士。

图丨Andrew Barto(来源:College of Information and Computer SciencesUniversity of Massachusetts Amherst)

Richard Sutton 是阿尔伯塔大学计算机科学教授,同时也是 Keen Technologies 的研究科学家,并担任阿尔伯塔机器智能研究所(Amii)的首席科学顾问。Sutton 在强化学习领域的影响力深远,被认为是现代强化学习的奠基人之一。他在 20 世纪 80 年代与 Andrew Barto 合作,共同推动了强化学习的发展。Sutton 于 1978 年在斯坦福大学获得心理学学士学位,随后在马萨诸塞大学阿姆赫斯特分校获得计算机与信息科学的硕士和博士学位。他的研究兴趣主要集中在决策者与环境相互作用时所面临的学习问题,认为这是智能的核心问题。Sutton 在强化学习领域的贡献包括时序差分学习、策略梯度方法和 Dyna 架构等。Sutton 的著作《Reinforcement Learning: An Introduction》与 Andrew Barto 共同撰写,成为该领域的经典教材,影响了无数研究人员和学生。他曾在 2017 年至 2023 年期间担任 DeepMind 的杰出研究科学家,并在多个学术机构任职,积累了丰富的研究和管理经验。Sutton 因其在强化学习领域的卓越贡献获得了多项荣誉,包括国际人工智能联合会议(IJCAI)卓越研究奖和加拿大人工智能协会终身成就奖。他的工作不仅在学术界产生了深远影响,也为工业界的应用提供了重要支持。

图丨Richard Sutton(来源:University of Alberta)

强化学习作为机器学习领域的重要分支,有着丰富的发展历程。其起源可追溯到 20 世纪 50 年代,当时科学家们开始探索让计算机像人类一样通过试错来学习最优策略的方法。早期的理论奠基工作为后续发展打下了基础,但受限于计算能力和数据量,强化学习在当时并未得到广泛应用。到了 20 世纪 80 年代,Richard Sutton 和 Andrew Barto 等学者做出了开创性贡献。他们系统地阐述了强化学习的基本概念和理论框架,提出了时间差分学习算法,如 Q-learning 。Q-learning 能够在不依赖环境模型的情况下,通过不断更新状态 – 动作对的 Q 值来学习最优策略,大大简化了学习过程,为强化学习的发展注入了强大动力。进入 21 世纪,随着计算机性能的大幅提升和大数据的爆发式增长,强化学习迎来了新的发展机遇。深度学习的兴起更是为强化学习带来了革命性变化,深度强化学习应运而生。深度神经网络强大的特征表示能力与强化学习的决策优化能力相结合,在诸多领域展现出卓越性能。在游戏领域,AlphaGo 利用深度强化学习击败人类顶尖棋手,震惊世界;在机器人控制方面,强化学习使机器人能够自主学习完成复杂任务,如行走、抓取物体等;自动驾驶领域,强化学习也在路径规划和决策制定中发挥着重要作用。

尽管 Barto 和 Sutton 的算法是在数十年前开发的,但通过与深度学习算法的结合,强化学习的实际应用在过去十五年里取得了重大进展。这表明他们的研究具有持久的影响力,并为未来的技术发展奠定了基础。他们的成就激励了成千上万的研究人员投身于强化学习领域,推动了该领域的持续发展和创新。

参考资料:

https://amturing.acm.org/

运营/排版:何晨龙

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/45191.html

(0)
上一篇 2025年5月27日
下一篇 2025年5月27日

相关推荐

  • 外交部驳斥欧盟领导人涉华“产能过剩”言论:充满偏见和双重标准

    6月18日,外交部发言人郭嘉昆主持例行记者会。有记者提问,据报道,欧盟委员会主席16日在G7峰会期间指责中国无视全球贸易规则,提供大量补贴扶持本国企业,表示中国将稀土主导地位“武器化”,并向全球市场转移“过剩产能”。G7必须实现关键供应链特别是原材料的多元化,共同应对非市场政策和行为。中方对此有何评论? “我们注意到有关报道,对有关言论罔顾事实、充满偏见和双…

    2025年6月18日
  • 诺丁汉大学法学专业

    课程概况 诺丁汉大学的法律硕士LLM允许学生从30多个模块中选择,涵盖了广泛的主题。 这意味着你可以根据你的兴趣和职业目标定制你的法学硕士学位,并获得多样化的法律教育或专注于特定的法律领域。 其次LLM课程因其卓越的教学和研究而得到全世界的认可,并受到雇主的高度评价。 教授学生的是各自领域的专家,他们将自己的研究融入到教学中,我们的课程也在不断发展,以应对主…

    2024年1月8日
  • 香港大学多少分

    在香港读硕士,前几年还算是“弯道超车”的捷径,现在不同了。你光看学费,能不能扛住都是个问题。别说学费了,光是“报名费”,都能让不少内地学生心头一紧。为什么大家还在往前挤?都说是学历贬值,其实核心还是“镀金”心态在作祟。 先看港大,不同学院的价格,跨度能把人看得头晕。建筑学院,便宜的二十来万,贵的得四十多万港币,要学设计那个更夸张。硕士一读,七十二万多,买套二…

    2025年12月30日
  • 赫德学校贴吧

    慢养,是我和先生的一贯主张。 我家的老大是一个普通的不能再普通的娃。在读赫德小学一年级之前,可以说是一个标准的“零基础”。 作为一枚普通妈妈,在孩子入学前,我也是各种焦虑,各种心路历程,和其他家长们一样。当时,我最担心的还是孩子的“零基础”:我家娃的汉语拼音、phonics自然拼读法都没有开始,而这些都是传说中入学前要完成的任务。 不过,我和自己讲,零基础不…

    2025年8月28日
  • 中国传媒大学莱斯特

    去英国读传媒,其实和商科不算同一个路数。商科的学生毕竟要去大厂,互联网,券商这种,竞争激烈,对毕业生的学校厂牌要求极高。 但传媒不同,去电视台或4A这种,卡学校的其实不多,基本都能混进一面,能否录取就看自己的其他综合实力。所以,一般选传媒的学生,会更看重自己的专业多点。对学校的追求,也没那么丧心病狂。 英国开传媒的学校虽然多,但综合学校里面,靠前的就那么几个…

    2025年1月9日
  • 中国哪个理工大学最好

    理工大学的很多专业的技术性强,出来也很好就业,所以理工大学一直都是热门的报考大学。在我国理工大学的数量很多,但是论科研成果和师资力量总要分个高下,今天给大家带来了我国最强的五所理工大学,看看你的大学是否在里面! 一、北京理工大学 北京理工大学创办于1940年,是国家首批入选“985工程”、“211工程”的全国重点高校。作为一所985高校,北京理工大学也是不负…

    2025年1月24日
  • 香港浸会大学研究生毕业之后能考公吗

    国考过后,从三月份以来,各个省份陆陆续续开展了省考,受到社会广泛关注。 毕竟公务员意味着“稳定饭碗”,大家戏称“宇宙的尽头是编制”,但也不难看出,体制内岗位是很多人理想的工作。 不过留学圈里总是有一种传言,说留学生们因为特殊的教育背景,在考公时不太受欢迎,报考了限制也很大。 但凡大家关注一下近几年的中国海外人才职业发展情况就会发现,每年有超过20%的学生进入…

    2024年12月8日
  • 日本留学英语要求

    在全球化浪潮与日本高等教育国际化战略的双重推动下,英语能力已从日本留学的 “加分项” 转变为 “必备项”。无论是学术研究、专业学习,还是与国际教授的协作交流,英语都扮演着关键角色。本文将从英语重要性的核心原因切入,详细解析托福、托业、雅思三大主流英语考试的内容、分值与考期,并明确日本院校的申请成绩门槛,为留学规划提供清晰参考。 一、日本留学英语重要性日益凸显…

    2025年10月13日
  • 华威大学租房攻略下

    编者按:除了华威大学提供的宿舍外,还有很大一部分同学会选择在校外,与小伙伴们一起租房,那么这个时候,都该注意些什么呢? 小编向来喜爱房地产,因此在华威的两年对我们大考村的市场有所研究。近来闻悉许多PG同学没有分到学校的宿舍,或是分到的校外宿舍并不理想,目前急于寻找校外宿舍,在此希望凭拙见给大家提供一些意见和帮助。由于资源有限,本文内容无法做到完全准确;一切信…

    2025年6月24日
  • 留学韩国湖南大学中国承认学历吗

    韩国湖南大学 3+1国际课程委托培养项目 图片来自网络 韩国湖南大学简介 韩国湖南大学(英语:Honam University)创办于1978年,是中韩两国教育部承认的四年制综合大学。大学设两个校区,占地约1300亩。该校以“人性化,民族化,现代化教育” 作为教育理念,以培养“有涵养,有知识,具有创新性的专业人才”作为教育目标。学校重视应用学科教育,着重发展…

    2025年1月15日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信