马萨诸塞大学阿姆赫斯特分校计算机

刚刚,美国计算机学会 ACM 今天宣布 Andrew Barto 和 Richard Sutton 获得 2024 年 ACM A.M.图灵奖,以表彰他们开发了强化学习的概念和算法基础。就强化学习而言,从 20 世纪 80 年代开始,Barto 和 Sutton 在其一系列论文中介绍了主要理念,构建了数学基础,并开发了的重要算法——这是创建智能系统的最重要方法之一。

ACM 主席 Yannis Ioannidis 表示:“Barto 和 Sutton 的工作展示了应用多学科方法应对我们领域长期挑战的巨大潜力。从认知科学、心理学到神经科学的研究领域激发了强化学习的发展,这为 AI 的一些最重要的进展奠定了基础,并让我们更深入地了解到大脑的工作原理。Barto 和 Sutton 的工作并不是我们已经跨越的垫脚石。强化学习仍在不断发展,并为计算和许多其他学科的进一步发展提供了巨大的潜力。这个领域最有声望的奖项对于他们而言,实至名归。”谷歌高级副总裁 Jeff Dean 说道:“艾伦·图灵在 1947 年的一次演讲中提到‘我们想要的是一台能够从经验中学习的机器’。由 Barto 和 Sutton 开创的强化学习直接回答了图灵的问题。他们的工作是过去几十年 AI 进步的关键。他们开发的工具仍然是 AI 繁荣的核心支柱,并取得了重大进展,吸引了大批年轻研究人员,并带动了数十亿美元的投资。RL 的影响将延续到未来。谷歌很荣幸赞助 ACM A.M.图灵奖,并向那些塑造了改善我们生活的技术的个人致敬。”

Andrew Barto 是马萨诸塞大学阿姆赫斯特分校信息与计算机科学系的名誉教授,被誉为强化学习领域的先驱之一。他于 1970 年在密歇根大学获得数学学士学位,随后在 1975 年获得计算机与通信科学的博士学位。Barto 在 1977 年加入马萨诸塞大学阿姆赫斯特分校,开始了他的学术生涯,并在多个职位上任职,包括副教授、教授和系主任。Barto 在强化学习领域的贡献不可小觑。他与他的博士学生 Richard Sutton 合作,从 20 世纪 80 年代开始,系统地介绍了强化学习的主要理念,构建了数学基础,并开发了重要的算法。他们的工作为创建智能系统提供了重要的方法论支持。Barto 和 Sutton 共同撰写了经典教材《Reinforcement Learning: An Introduction》,该书至今仍是该领域的标准参考书目,被引次数已超过 75,000 次。Barto 因其在强化学习领域的开创性工作获得了多项荣誉,包括马萨诸塞大学神经科学终身成就奖、IJCAI 卓越研究奖和 IEEE 神经网络学会先锋奖。他是电气电子工程师协会(IEEE)的会员,也是美国科学促进协会(AAAS)的会士。

图丨Andrew Barto(来源:College of Information and Computer SciencesUniversity of Massachusetts Amherst)

Richard Sutton 是阿尔伯塔大学计算机科学教授,同时也是 Keen Technologies 的研究科学家,并担任阿尔伯塔机器智能研究所(Amii)的首席科学顾问。Sutton 在强化学习领域的影响力深远,被认为是现代强化学习的奠基人之一。他在 20 世纪 80 年代与 Andrew Barto 合作,共同推动了强化学习的发展。Sutton 于 1978 年在斯坦福大学获得心理学学士学位,随后在马萨诸塞大学阿姆赫斯特分校获得计算机与信息科学的硕士和博士学位。他的研究兴趣主要集中在决策者与环境相互作用时所面临的学习问题,认为这是智能的核心问题。Sutton 在强化学习领域的贡献包括时序差分学习、策略梯度方法和 Dyna 架构等。Sutton 的著作《Reinforcement Learning: An Introduction》与 Andrew Barto 共同撰写,成为该领域的经典教材,影响了无数研究人员和学生。他曾在 2017 年至 2023 年期间担任 DeepMind 的杰出研究科学家,并在多个学术机构任职,积累了丰富的研究和管理经验。Sutton 因其在强化学习领域的卓越贡献获得了多项荣誉,包括国际人工智能联合会议(IJCAI)卓越研究奖和加拿大人工智能协会终身成就奖。他的工作不仅在学术界产生了深远影响,也为工业界的应用提供了重要支持。

图丨Richard Sutton(来源:University of Alberta)

强化学习作为机器学习领域的重要分支,有着丰富的发展历程。其起源可追溯到 20 世纪 50 年代,当时科学家们开始探索让计算机像人类一样通过试错来学习最优策略的方法。早期的理论奠基工作为后续发展打下了基础,但受限于计算能力和数据量,强化学习在当时并未得到广泛应用。到了 20 世纪 80 年代,Richard Sutton 和 Andrew Barto 等学者做出了开创性贡献。他们系统地阐述了强化学习的基本概念和理论框架,提出了时间差分学习算法,如 Q-learning 。Q-learning 能够在不依赖环境模型的情况下,通过不断更新状态 – 动作对的 Q 值来学习最优策略,大大简化了学习过程,为强化学习的发展注入了强大动力。进入 21 世纪,随着计算机性能的大幅提升和大数据的爆发式增长,强化学习迎来了新的发展机遇。深度学习的兴起更是为强化学习带来了革命性变化,深度强化学习应运而生。深度神经网络强大的特征表示能力与强化学习的决策优化能力相结合,在诸多领域展现出卓越性能。在游戏领域,AlphaGo 利用深度强化学习击败人类顶尖棋手,震惊世界;在机器人控制方面,强化学习使机器人能够自主学习完成复杂任务,如行走、抓取物体等;自动驾驶领域,强化学习也在路径规划和决策制定中发挥着重要作用。

尽管 Barto 和 Sutton 的算法是在数十年前开发的,但通过与深度学习算法的结合,强化学习的实际应用在过去十五年里取得了重大进展。这表明他们的研究具有持久的影响力,并为未来的技术发展奠定了基础。他们的成就激励了成千上万的研究人员投身于强化学习领域,推动了该领域的持续发展和创新。

参考资料:

https://amturing.acm.org/

运营/排版:何晨龙

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/45191.html

(0)
上一篇 2025年5月27日
下一篇 2025年5月27日

相关推荐

  • 青岛盟诺学校

    在全球化和信息化时代,教育的新概念层出不穷。近两年,来自美国科学教育领域的STEM教育,不仅在各种校外教育机构中蓬勃发展,也进入了正规学校教育,甚至被写进了国家科学课程标准。STEM是科学(Science),技术(Technology),工程(Engineering),数学(Mathematics)四门学科英文首字母的缩写。简单地说,STEM教育是这四个领域…

    2025年2月11日
  • 深交所重磅发布!事关程序化交易

    深交所重磅! 对于市场关注的程序化交易,深交所今日连发三条问答。详情如下: 《关于加强程序化交易管理有关事项的通知》《关于股票程序化交易报告工作有关事项的通知》何时施行?存量投资者是否需要报告? 答:《关于加强程序化交易管理有关事项的通知》《关于股票程序化交易报告工作有关事项的通知》自2023年10月9日起施行。通知施行前已经开展股票程序化交易的投资者(简称…

    2023年10月18日
  • 周婷突然卸任杉杉控股董事长 知情人士:接任者为周婷直系亲属 并非逃避责任

    近日杉杉控股有限公司发生工商变更,引发市场关注。其创始人郑永刚遗孀周婷不再担任董事长、法人代表,职务变更为董事,周顺和为新任董事长、法人代表,孙伟卸任董事职务。 此前,周婷替代郑驹成为杉杉控股董事长仅三个月时间。 周顺和并无公开信息。但21世纪经济报道记者通过工商资料查询到,一位名为周顺和的人士,为上海慰笛文化传播有限公司10%股东。而“慰笛”为周婷艺名。 …

    2025年2月13日
  • 德州学院智慧校园系统入口

    山东省属本科高校网站网址 1山东科技大学http://www.sdust.edu.cn/ 2青岛科技大学https://www.qust.edu.cn/ 3济南大学https://www.ujn.edu.cn/ 4青岛理工大学http://www.qtech.edu.cn/ 5山东建筑大学https://www.sdjzu.edu.cn/ 6齐鲁工业大学ht…

    2025年8月18日
  • 威斯康星大学普拉特维尔分校排名

    众所周知,相较于私立大学,美国公立大学的性价比超高,对本州居民或美国本土学生来说,学费很低;对于国际生来说,也比私立大学要划算得多。 而提起美国公立大学系统,大家第一个一定会想到UC加州大学系统。没错,作为美国公立大学系统的代表,UC可以说是最受国际学生喜爱的大学系统了,以其卓越的教育质量、创新的研究机会和多元化的文化环境,每年申请季吸引了无数学子的目光。 …

    2025年6月23日
  • 新加坡华侨中学学费_新加坡华侨中学学费2022

    新加坡华侨初中学的入学要求主要包括学生年龄和考试成绩两个方面。 首先,要求学生年龄在16周岁以下。这个年龄限制是为了保证学生能够在规定的时间内完成初中教育,并且适应学校的课程设置和日常生活。 其次,学生需要参加新加坡AEIS考试,并凭借考试成绩申请进入新加坡华侨初中一年级至三年级。AEIS考试是新加坡教育部为确保外国学生能够适应本国教育体系而设立的入学考试,…

    2024年3月27日
  • 考上中国大学了还能再去日本留学吗_考上中国大学了还能再去日本留学吗知乎

    人民网东京7月30日电(李沐航)据NHK电视台报道,作为允许外国人入境的特例,自8月5日起,日本政府以拥有在留资格、临时回国的留学生、企业驻地人员等为对象,在接受PCR核酸检测后,可以再次进入日本。 受新冠疫情影响,日本政府加强了入境管理,共禁止146个国家和地区的外国人进入日本。期间,定居在日本的外国人一旦离开,在没有特殊情况下,也不被允许再次进入日本。 …

    2024年2月26日
  • 维也纳技术应用大学

    学校介绍 维也纳技术应用技术大学是奥地利最大的理工类应用技术大学,有超过6800名毕业生和当前4000名在校学生,学校教职员工共842位(2012年),13个本科专业以及17个硕士学位课程。 维也纳技术应用技术大学建立于1994年,并在2000年成为维也纳的第一所应用技术大学。维也纳技术应用技术大学的各种学士和硕士学位课程是基于坚实的理论基础,同时也注重实践…

    2024年11月6日
  • 大学什么时候放寒假

    进入一月份,各大高校陆续开始放寒假。很多大学生利用寒假进行实习和兼职赚取零花钱,也有大学生准备升学考试、求职和参加公考和事业单位考试。寒假成为大学生充分发挥个人特性,开辟个人成长空间的重要时间阶段。 各大高校的寒假长短区别很大,看看您的孩子所在学校的情况吧: 北京大学:1 月 15 日至 2 月 18 日北京航空航天大学:1月15日-2月25日天津大学:1月…

    2024年5月3日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信