马萨诸塞大学阿姆赫斯特分校计算机

刚刚,美国计算机学会 ACM 今天宣布 Andrew Barto 和 Richard Sutton 获得 2024 年 ACM A.M.图灵奖,以表彰他们开发了强化学习的概念和算法基础。就强化学习而言,从 20 世纪 80 年代开始,Barto 和 Sutton 在其一系列论文中介绍了主要理念,构建了数学基础,并开发了的重要算法——这是创建智能系统的最重要方法之一。

ACM 主席 Yannis Ioannidis 表示:“Barto 和 Sutton 的工作展示了应用多学科方法应对我们领域长期挑战的巨大潜力。从认知科学、心理学到神经科学的研究领域激发了强化学习的发展,这为 AI 的一些最重要的进展奠定了基础,并让我们更深入地了解到大脑的工作原理。Barto 和 Sutton 的工作并不是我们已经跨越的垫脚石。强化学习仍在不断发展,并为计算和许多其他学科的进一步发展提供了巨大的潜力。这个领域最有声望的奖项对于他们而言,实至名归。”谷歌高级副总裁 Jeff Dean 说道:“艾伦·图灵在 1947 年的一次演讲中提到‘我们想要的是一台能够从经验中学习的机器’。由 Barto 和 Sutton 开创的强化学习直接回答了图灵的问题。他们的工作是过去几十年 AI 进步的关键。他们开发的工具仍然是 AI 繁荣的核心支柱,并取得了重大进展,吸引了大批年轻研究人员,并带动了数十亿美元的投资。RL 的影响将延续到未来。谷歌很荣幸赞助 ACM A.M.图灵奖,并向那些塑造了改善我们生活的技术的个人致敬。”

Andrew Barto 是马萨诸塞大学阿姆赫斯特分校信息与计算机科学系的名誉教授,被誉为强化学习领域的先驱之一。他于 1970 年在密歇根大学获得数学学士学位,随后在 1975 年获得计算机与通信科学的博士学位。Barto 在 1977 年加入马萨诸塞大学阿姆赫斯特分校,开始了他的学术生涯,并在多个职位上任职,包括副教授、教授和系主任。Barto 在强化学习领域的贡献不可小觑。他与他的博士学生 Richard Sutton 合作,从 20 世纪 80 年代开始,系统地介绍了强化学习的主要理念,构建了数学基础,并开发了重要的算法。他们的工作为创建智能系统提供了重要的方法论支持。Barto 和 Sutton 共同撰写了经典教材《Reinforcement Learning: An Introduction》,该书至今仍是该领域的标准参考书目,被引次数已超过 75,000 次。Barto 因其在强化学习领域的开创性工作获得了多项荣誉,包括马萨诸塞大学神经科学终身成就奖、IJCAI 卓越研究奖和 IEEE 神经网络学会先锋奖。他是电气电子工程师协会(IEEE)的会员,也是美国科学促进协会(AAAS)的会士。

图丨Andrew Barto(来源:College of Information and Computer SciencesUniversity of Massachusetts Amherst)

Richard Sutton 是阿尔伯塔大学计算机科学教授,同时也是 Keen Technologies 的研究科学家,并担任阿尔伯塔机器智能研究所(Amii)的首席科学顾问。Sutton 在强化学习领域的影响力深远,被认为是现代强化学习的奠基人之一。他在 20 世纪 80 年代与 Andrew Barto 合作,共同推动了强化学习的发展。Sutton 于 1978 年在斯坦福大学获得心理学学士学位,随后在马萨诸塞大学阿姆赫斯特分校获得计算机与信息科学的硕士和博士学位。他的研究兴趣主要集中在决策者与环境相互作用时所面临的学习问题,认为这是智能的核心问题。Sutton 在强化学习领域的贡献包括时序差分学习、策略梯度方法和 Dyna 架构等。Sutton 的著作《Reinforcement Learning: An Introduction》与 Andrew Barto 共同撰写,成为该领域的经典教材,影响了无数研究人员和学生。他曾在 2017 年至 2023 年期间担任 DeepMind 的杰出研究科学家,并在多个学术机构任职,积累了丰富的研究和管理经验。Sutton 因其在强化学习领域的卓越贡献获得了多项荣誉,包括国际人工智能联合会议(IJCAI)卓越研究奖和加拿大人工智能协会终身成就奖。他的工作不仅在学术界产生了深远影响,也为工业界的应用提供了重要支持。

图丨Richard Sutton(来源:University of Alberta)

强化学习作为机器学习领域的重要分支,有着丰富的发展历程。其起源可追溯到 20 世纪 50 年代,当时科学家们开始探索让计算机像人类一样通过试错来学习最优策略的方法。早期的理论奠基工作为后续发展打下了基础,但受限于计算能力和数据量,强化学习在当时并未得到广泛应用。到了 20 世纪 80 年代,Richard Sutton 和 Andrew Barto 等学者做出了开创性贡献。他们系统地阐述了强化学习的基本概念和理论框架,提出了时间差分学习算法,如 Q-learning 。Q-learning 能够在不依赖环境模型的情况下,通过不断更新状态 – 动作对的 Q 值来学习最优策略,大大简化了学习过程,为强化学习的发展注入了强大动力。进入 21 世纪,随着计算机性能的大幅提升和大数据的爆发式增长,强化学习迎来了新的发展机遇。深度学习的兴起更是为强化学习带来了革命性变化,深度强化学习应运而生。深度神经网络强大的特征表示能力与强化学习的决策优化能力相结合,在诸多领域展现出卓越性能。在游戏领域,AlphaGo 利用深度强化学习击败人类顶尖棋手,震惊世界;在机器人控制方面,强化学习使机器人能够自主学习完成复杂任务,如行走、抓取物体等;自动驾驶领域,强化学习也在路径规划和决策制定中发挥着重要作用。

尽管 Barto 和 Sutton 的算法是在数十年前开发的,但通过与深度学习算法的结合,强化学习的实际应用在过去十五年里取得了重大进展。这表明他们的研究具有持久的影响力,并为未来的技术发展奠定了基础。他们的成就激励了成千上万的研究人员投身于强化学习领域,推动了该领域的持续发展和创新。

参考资料:

https://amturing.acm.org/

运营/排版:何晨龙

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/45191.html

(0)
上一篇 2025年5月27日
下一篇 2025年5月27日

相关推荐

  • 英国低龄留学_英国低龄留学费用

    家长最关心的因素 根据英国低龄留学白皮书, 安全状况和学校教学水平是家长最 关心的两个因素,占比超过80%。 这体现出家长对孩子安全和教育 质量的高度重视。 NO.1 常见问题及解决方案 1. 安全问题 风险因素: 寄宿家庭、人身安全、文化冲突等。 解决方案: 选择提供住宿服务的学校或信誉良好的寄宿家庭。 聘请可靠的当地具有DBS认证的监护人,或专业的本地监…

    2024年3月12日
  • 早稻田大学报考条件

    早稻田大学各个学部(本科)/研究科留学要求不同。因为我不知道你要考早稻田大学本科还是硕士(修士),也不知道具体的专业是什么,所以蔚蓝日本留学老师简单给你说一下吧 去早稻田大学留学需要哪些条件 如果你想读早稻田大学本科(学部)留学条件是: 1.最低年龄要求为18岁以上 2.高中毕业学历,接受相当于12年的教育经历 3.参加日本留学考试EJU,然后通过早稻田大学…

    2024年11月16日
  • 上海交通大学密西根学院算上交吗

    在上海交通大学密西根学院,学生除了跨国修读上海交大和美国密西根大学双学位外,又多了一个选择——花五年时间获得上海交大本科学位和美国密西根大学或瑞典皇家理工学院硕士学位。2019年5月16日,上海交大密西根学院院长黄佩森表示,该院已启动“全球学位通”计划(Global Degree Pathways,以下简称“GDP”计划),鼓励学院本科毕业生前往国外一流大学…

    2024年11月4日
  • 美国亚利桑大学

    今天小编给大家介绍一下美国的亚利桑那大学: 亚利桑那大学(University of Arizona,简称UA)坐落于美国亚利桑那州首府图森市,始建于1885年,是一所世界一流公立研究型大学。该校是美国“公立常青藤”大学联盟(Public Ivy League)的成员之一,也是北美顶尖研究型大学联盟美国大学协会(Association of American…

    2024年9月13日
  • 日本东京大学宿舍

    每年4月,日本迎来毕业与入学的双重季节。校园里涌动着身着学士服的毕业生与怀揣憧憬的新生,构成了独特的春日风景。 对于留学生而言,日本的大学生活既有着与国内相似的青春气息,也存在诸多文化与制度上的差异。本文将从住宿、学业、生活日常等维度,全景式呈现日本大学生活的真实面貌。 住宿:多元选择下的独立与现实 中日大学生活的显著差异,首当其冲体现在住宿形式上。国内大学…

    2025年9月3日
  • 土耳其签证政策(土耳其签证政策2023最新)

    在亚欧大陆的交界处,有一个阳光照耀着的文明古国。 在这里,古老而辉煌的帝国历史留下了数不清的遗迹,爱琴海海岸赋予了这个国家独特的风情。欧亚文化在这里碰撞交融,自然风光与人文历史交织出无尽的魅力。 走进土耳其,想带你感受的不只有浪漫,还有散落在广阔草原与陡峭山坡里的金色时光。 土耳其签证办理,其实非常简单! 先看一下土耳其电子签样板: 土耳其电子签仅需护照首页…

    2023年11月18日
  • 留学动机信中文范文

    小可爱们,大噶好呀,又到了每周的德国留学干货时间~申请德国大学时,很多人都会忽视动机信的重要性。 说实话,对于德国大学来讲,他们能了解千里之外的一个申请者,只有通过“简历”和“动机信”这两个文书。而简历,都是一些硬性的模块,相对来讲,动机信则更能提起招生办老师的兴趣。一封小小的动机信,很可能就是关乎“是否被录取”的重要因素。 今天我们邀请到了慕尼黑工大的学姐…

    2024年1月25日
  • 秘密启动“千问”项目?阿里未予确认

    11月13日,据外媒报道,阿里巴巴已秘密启动“千问”项目,基于Qwen最强模型打造一款同名个人AI助手——千问APP,全面对标ChatGPT,阿里核心管理层将其视为“AI时代的未来之战”。记者就此事询问阿里巴巴,公司未予确认。 (文章来源:第一财经)

    2025年11月13日
  • 韦尔斯利学院麻省理工

    全美排名第4! 岁末寒冬,喜讯不断。 热烈祝贺 成都树德中学国际部2021级肖雨忱同学 获得美国韦尔斯利学院录取 (2024美国文理学院排名第4) 肖雨忱同学 获韦尔斯利学院录取,IB预估成绩40+(满分45分),托福110分,SAT 1510分。 韦尔斯利学院录取信截图 申请仍在继续,更多好消息正在路上。期待同学们在国际部教育教学、升学团队和家长的共同陪伴…

    2024年10月16日
  • 热门专业有哪些

    报志愿、选专业,成为当前考生及家长最为关注的话题,那么竞争激烈的报志愿季,你是否已经确定了自己的大学专业方向? 今天我们来聊聊这些热门专业,主要有:经济类、临床医学类、电气类、工商管理、机械类、电子信息和计算机类,它们都是近几年高考,众多考生、家长最心仪的选择参考。 在这些专业中,经济类是热门程度最高的,其就业前景和薪资待遇一直稳居榜首。临床医学类的学生需要…

    2024年6月17日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信