马萨诸塞大学阿姆赫斯特分校计算机

刚刚,美国计算机学会 ACM 今天宣布 Andrew Barto 和 Richard Sutton 获得 2024 年 ACM A.M.图灵奖,以表彰他们开发了强化学习的概念和算法基础。就强化学习而言,从 20 世纪 80 年代开始,Barto 和 Sutton 在其一系列论文中介绍了主要理念,构建了数学基础,并开发了的重要算法——这是创建智能系统的最重要方法之一。

ACM 主席 Yannis Ioannidis 表示:“Barto 和 Sutton 的工作展示了应用多学科方法应对我们领域长期挑战的巨大潜力。从认知科学、心理学到神经科学的研究领域激发了强化学习的发展,这为 AI 的一些最重要的进展奠定了基础,并让我们更深入地了解到大脑的工作原理。Barto 和 Sutton 的工作并不是我们已经跨越的垫脚石。强化学习仍在不断发展,并为计算和许多其他学科的进一步发展提供了巨大的潜力。这个领域最有声望的奖项对于他们而言,实至名归。”谷歌高级副总裁 Jeff Dean 说道:“艾伦·图灵在 1947 年的一次演讲中提到‘我们想要的是一台能够从经验中学习的机器’。由 Barto 和 Sutton 开创的强化学习直接回答了图灵的问题。他们的工作是过去几十年 AI 进步的关键。他们开发的工具仍然是 AI 繁荣的核心支柱,并取得了重大进展,吸引了大批年轻研究人员,并带动了数十亿美元的投资。RL 的影响将延续到未来。谷歌很荣幸赞助 ACM A.M.图灵奖,并向那些塑造了改善我们生活的技术的个人致敬。”

Andrew Barto 是马萨诸塞大学阿姆赫斯特分校信息与计算机科学系的名誉教授,被誉为强化学习领域的先驱之一。他于 1970 年在密歇根大学获得数学学士学位,随后在 1975 年获得计算机与通信科学的博士学位。Barto 在 1977 年加入马萨诸塞大学阿姆赫斯特分校,开始了他的学术生涯,并在多个职位上任职,包括副教授、教授和系主任。Barto 在强化学习领域的贡献不可小觑。他与他的博士学生 Richard Sutton 合作,从 20 世纪 80 年代开始,系统地介绍了强化学习的主要理念,构建了数学基础,并开发了重要的算法。他们的工作为创建智能系统提供了重要的方法论支持。Barto 和 Sutton 共同撰写了经典教材《Reinforcement Learning: An Introduction》,该书至今仍是该领域的标准参考书目,被引次数已超过 75,000 次。Barto 因其在强化学习领域的开创性工作获得了多项荣誉,包括马萨诸塞大学神经科学终身成就奖、IJCAI 卓越研究奖和 IEEE 神经网络学会先锋奖。他是电气电子工程师协会(IEEE)的会员,也是美国科学促进协会(AAAS)的会士。

图丨Andrew Barto(来源:College of Information and Computer SciencesUniversity of Massachusetts Amherst)

Richard Sutton 是阿尔伯塔大学计算机科学教授,同时也是 Keen Technologies 的研究科学家,并担任阿尔伯塔机器智能研究所(Amii)的首席科学顾问。Sutton 在强化学习领域的影响力深远,被认为是现代强化学习的奠基人之一。他在 20 世纪 80 年代与 Andrew Barto 合作,共同推动了强化学习的发展。Sutton 于 1978 年在斯坦福大学获得心理学学士学位,随后在马萨诸塞大学阿姆赫斯特分校获得计算机与信息科学的硕士和博士学位。他的研究兴趣主要集中在决策者与环境相互作用时所面临的学习问题,认为这是智能的核心问题。Sutton 在强化学习领域的贡献包括时序差分学习、策略梯度方法和 Dyna 架构等。Sutton 的著作《Reinforcement Learning: An Introduction》与 Andrew Barto 共同撰写,成为该领域的经典教材,影响了无数研究人员和学生。他曾在 2017 年至 2023 年期间担任 DeepMind 的杰出研究科学家,并在多个学术机构任职,积累了丰富的研究和管理经验。Sutton 因其在强化学习领域的卓越贡献获得了多项荣誉,包括国际人工智能联合会议(IJCAI)卓越研究奖和加拿大人工智能协会终身成就奖。他的工作不仅在学术界产生了深远影响,也为工业界的应用提供了重要支持。

图丨Richard Sutton(来源:University of Alberta)

强化学习作为机器学习领域的重要分支,有着丰富的发展历程。其起源可追溯到 20 世纪 50 年代,当时科学家们开始探索让计算机像人类一样通过试错来学习最优策略的方法。早期的理论奠基工作为后续发展打下了基础,但受限于计算能力和数据量,强化学习在当时并未得到广泛应用。到了 20 世纪 80 年代,Richard Sutton 和 Andrew Barto 等学者做出了开创性贡献。他们系统地阐述了强化学习的基本概念和理论框架,提出了时间差分学习算法,如 Q-learning 。Q-learning 能够在不依赖环境模型的情况下,通过不断更新状态 – 动作对的 Q 值来学习最优策略,大大简化了学习过程,为强化学习的发展注入了强大动力。进入 21 世纪,随着计算机性能的大幅提升和大数据的爆发式增长,强化学习迎来了新的发展机遇。深度学习的兴起更是为强化学习带来了革命性变化,深度强化学习应运而生。深度神经网络强大的特征表示能力与强化学习的决策优化能力相结合,在诸多领域展现出卓越性能。在游戏领域,AlphaGo 利用深度强化学习击败人类顶尖棋手,震惊世界;在机器人控制方面,强化学习使机器人能够自主学习完成复杂任务,如行走、抓取物体等;自动驾驶领域,强化学习也在路径规划和决策制定中发挥着重要作用。

尽管 Barto 和 Sutton 的算法是在数十年前开发的,但通过与深度学习算法的结合,强化学习的实际应用在过去十五年里取得了重大进展。这表明他们的研究具有持久的影响力,并为未来的技术发展奠定了基础。他们的成就激励了成千上万的研究人员投身于强化学习领域,推动了该领域的持续发展和创新。

参考资料:

https://amturing.acm.org/

运营/排版:何晨龙

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/45191.html

(0)
上一篇 2025年5月27日
下一篇 2025年5月27日

相关推荐

  • 卡耐基梅隆大学录取率

    卡内基梅隆大学近两年的录取率: 2018年度接到申请:20,497份,录取:4,550人,实际入学:1,676人,录取率:22.1%。 2017年度接到申请:21,189份,录取:4,601人,实际入学:1,552人,录取率:21.7%。 卡内基梅隆大学(Carnegie Mellon University,简称CMU)是美国东部著名的顶尖私立研究型大学,位…

    2025年3月20日
  • 雪城大学毕业率

    雪城大学就业率高。学校地靠纽约,校友庞大。基本上只要愿意毕业搬来纽约的,三五个月内找个工作还是没问题的。同时在纽约就业,一般职位和薪资都会比别的区域好上不少。就中国的学生而言,四大/JP Morgan/高盛/亚马逊/巴克莱/穆迪/UBS/BNY/State Street/雅诗兰黛等等各种大公司里的人很多。雪城毕业的学生在纽约找工作口碑还是很不错的。特别最近转…

    2025年5月22日
  • 利物浦大学留学花费

    利物浦大学留学一年费用包含学费和生活费,学费一年大约在2.3万英镑-3.3万英镑左右,生活费一年约1.2万英镑-1.6万英镑,留学一年费用约3.5万英镑-4.9万英镑,约合人民币32.7万元/年-45.7万元/年。 以下是利物浦大学留学一年费用盘点—— 一、学费 1、利物浦大学不同课程的学费不同,大部分课程学费约2.3万英镑-3.3万英镑,约合人民币21.5…

    2024年10月31日
  • 天普大学概况

    天普大学(Temple University),又译坦普尔大学,坐落于美国宾夕法尼亚州的费城,创办于1884年,至今已有130年的历史。天普大学一直致力于贯彻平等教育的理念,被称为费城三大名校之一(宾夕法尼亚州大学、德雷塞尔大学、天普大学),也是宾夕法尼亚州三大公立大学之一。 天普大学有五个校区,遍布全费城,一所校区在州府哈里斯堡。天普大学最特殊的一点即是在…

    2024年8月16日
  • 英国雷丁大学介绍

    对于高考后考虑留学英国雷丁大学(University of Reading)的学生,以下是一些关键的申请指南和信息: 1. **学校概况**: – 雷丁大学是位于英国伯克郡首府雷丁的一所研究型大学,成立于1892年,是英国一流的大学之一。 2. **申请条件**: – 申请者需要具有相关学科的硕士学位,语言要求为雅思成绩不低于6.5(…

    2024年8月23日
  • 同济大学留学生招生

    01 培养目标 培养热爱祖国,拥护中国共产党的领导,拥护社会主义制度,遵纪守法,品德良好,具有服务国家、服务人民的社会责任感,德智体美劳全面发展,掌握本学科坚实的基础理论和系统的专业知识,具有创新精神、创新能力和从事科学研究、教学、管理等工作能力的高层次学术型专门人才以及具有较强解决实际问题的能力、能够承担专业技术或管理工作、具有良好职业素养的高层次应用型专…

    2024年1月25日
  • 华南地区大学排名榜

    华南地区主要包括了广东、广西和海南等地区,其实除了广东地区实力比较强的大学数量很多之外,广西和海南地区普遍比较偏,不算是高考生填报志愿关注的重点,所以更多的还是更愿意报考广东以及经济发达地区的大学,而华南地区实力很强以及综合竞争力比较强的大学普遍也集中在广东省。 所以今天要分享的这十大华南地区实力最强的大学,基本上都位于广东省,综合排名很靠前,而且大部分都是…

    2024年12月10日
  • 美国前100的大学好吗

    近期,QS和USNews先后更新2025世界大学排名,我们看到不少学校的名次都有所变动,但由于排名指标并未大改,所以今年的新排名也并未有太大的变化。 两个排名结果不同源于侧重点不同,比如,QS排名关注学校的就业情况、可持续性和科研水平,而US News排名专注于评估学校的科研水平。 因此,如果你更看重学校的科研实力,那么你可以重点参考US News排名,而如…

    2024年7月23日
  • 为什么要学市场营销

    我是一名非财经类大学毕业的,从事非财经工作的财经与商业的爱好者。没有经济学基础的我,在工作之余不断学习各类经济学课程。最近我在网上学习中南财经政法大学老师主讲的《人人学点营销学》课程。 为了鼓励自己不断学习,我决定把我的学习笔记和学习心得,转化为文章,放在头条号上,和大家一起探讨营销学知识。 好了,我们言归正传。今天我们一起聊聊“为什么要学习市场营销?”。这…

    2024年5月29日
  • 去英国留学送什么礼物

    马上要到开学季了,同学们即将踏入异国他乡的旅途了,在漫长的英国求学旅程中,有哪些好物是中国宝宝最应该带的呢?下面小遥就来给大家讲讲! 证件篇 1、护照 2、学校录取通知书 3、语言成绩单的原件和复印件 4、若干张一寸和两寸照片 5、学费认缴证明,如果是网上支付,要保留好邮件收据! 6、住宿合同 7、体检证明,肺结核检查证明、疫苗证明等。 8、英镑现金,现金带…

    2024年4月29日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信