马萨诸塞大学阿姆赫斯特分校计算机

刚刚,美国计算机学会 ACM 今天宣布 Andrew Barto 和 Richard Sutton 获得 2024 年 ACM A.M.图灵奖,以表彰他们开发了强化学习的概念和算法基础。就强化学习而言,从 20 世纪 80 年代开始,Barto 和 Sutton 在其一系列论文中介绍了主要理念,构建了数学基础,并开发了的重要算法——这是创建智能系统的最重要方法之一。

ACM 主席 Yannis Ioannidis 表示:“Barto 和 Sutton 的工作展示了应用多学科方法应对我们领域长期挑战的巨大潜力。从认知科学、心理学到神经科学的研究领域激发了强化学习的发展,这为 AI 的一些最重要的进展奠定了基础,并让我们更深入地了解到大脑的工作原理。Barto 和 Sutton 的工作并不是我们已经跨越的垫脚石。强化学习仍在不断发展,并为计算和许多其他学科的进一步发展提供了巨大的潜力。这个领域最有声望的奖项对于他们而言,实至名归。”谷歌高级副总裁 Jeff Dean 说道:“艾伦·图灵在 1947 年的一次演讲中提到‘我们想要的是一台能够从经验中学习的机器’。由 Barto 和 Sutton 开创的强化学习直接回答了图灵的问题。他们的工作是过去几十年 AI 进步的关键。他们开发的工具仍然是 AI 繁荣的核心支柱,并取得了重大进展,吸引了大批年轻研究人员,并带动了数十亿美元的投资。RL 的影响将延续到未来。谷歌很荣幸赞助 ACM A.M.图灵奖,并向那些塑造了改善我们生活的技术的个人致敬。”

Andrew Barto 是马萨诸塞大学阿姆赫斯特分校信息与计算机科学系的名誉教授,被誉为强化学习领域的先驱之一。他于 1970 年在密歇根大学获得数学学士学位,随后在 1975 年获得计算机与通信科学的博士学位。Barto 在 1977 年加入马萨诸塞大学阿姆赫斯特分校,开始了他的学术生涯,并在多个职位上任职,包括副教授、教授和系主任。Barto 在强化学习领域的贡献不可小觑。他与他的博士学生 Richard Sutton 合作,从 20 世纪 80 年代开始,系统地介绍了强化学习的主要理念,构建了数学基础,并开发了重要的算法。他们的工作为创建智能系统提供了重要的方法论支持。Barto 和 Sutton 共同撰写了经典教材《Reinforcement Learning: An Introduction》,该书至今仍是该领域的标准参考书目,被引次数已超过 75,000 次。Barto 因其在强化学习领域的开创性工作获得了多项荣誉,包括马萨诸塞大学神经科学终身成就奖、IJCAI 卓越研究奖和 IEEE 神经网络学会先锋奖。他是电气电子工程师协会(IEEE)的会员,也是美国科学促进协会(AAAS)的会士。

图丨Andrew Barto(来源:College of Information and Computer SciencesUniversity of Massachusetts Amherst)

Richard Sutton 是阿尔伯塔大学计算机科学教授,同时也是 Keen Technologies 的研究科学家,并担任阿尔伯塔机器智能研究所(Amii)的首席科学顾问。Sutton 在强化学习领域的影响力深远,被认为是现代强化学习的奠基人之一。他在 20 世纪 80 年代与 Andrew Barto 合作,共同推动了强化学习的发展。Sutton 于 1978 年在斯坦福大学获得心理学学士学位,随后在马萨诸塞大学阿姆赫斯特分校获得计算机与信息科学的硕士和博士学位。他的研究兴趣主要集中在决策者与环境相互作用时所面临的学习问题,认为这是智能的核心问题。Sutton 在强化学习领域的贡献包括时序差分学习、策略梯度方法和 Dyna 架构等。Sutton 的著作《Reinforcement Learning: An Introduction》与 Andrew Barto 共同撰写,成为该领域的经典教材,影响了无数研究人员和学生。他曾在 2017 年至 2023 年期间担任 DeepMind 的杰出研究科学家,并在多个学术机构任职,积累了丰富的研究和管理经验。Sutton 因其在强化学习领域的卓越贡献获得了多项荣誉,包括国际人工智能联合会议(IJCAI)卓越研究奖和加拿大人工智能协会终身成就奖。他的工作不仅在学术界产生了深远影响,也为工业界的应用提供了重要支持。

图丨Richard Sutton(来源:University of Alberta)

强化学习作为机器学习领域的重要分支,有着丰富的发展历程。其起源可追溯到 20 世纪 50 年代,当时科学家们开始探索让计算机像人类一样通过试错来学习最优策略的方法。早期的理论奠基工作为后续发展打下了基础,但受限于计算能力和数据量,强化学习在当时并未得到广泛应用。到了 20 世纪 80 年代,Richard Sutton 和 Andrew Barto 等学者做出了开创性贡献。他们系统地阐述了强化学习的基本概念和理论框架,提出了时间差分学习算法,如 Q-learning 。Q-learning 能够在不依赖环境模型的情况下,通过不断更新状态 – 动作对的 Q 值来学习最优策略,大大简化了学习过程,为强化学习的发展注入了强大动力。进入 21 世纪,随着计算机性能的大幅提升和大数据的爆发式增长,强化学习迎来了新的发展机遇。深度学习的兴起更是为强化学习带来了革命性变化,深度强化学习应运而生。深度神经网络强大的特征表示能力与强化学习的决策优化能力相结合,在诸多领域展现出卓越性能。在游戏领域,AlphaGo 利用深度强化学习击败人类顶尖棋手,震惊世界;在机器人控制方面,强化学习使机器人能够自主学习完成复杂任务,如行走、抓取物体等;自动驾驶领域,强化学习也在路径规划和决策制定中发挥着重要作用。

尽管 Barto 和 Sutton 的算法是在数十年前开发的,但通过与深度学习算法的结合,强化学习的实际应用在过去十五年里取得了重大进展。这表明他们的研究具有持久的影响力,并为未来的技术发展奠定了基础。他们的成就激励了成千上万的研究人员投身于强化学习领域,推动了该领域的持续发展和创新。

参考资料:

https://amturing.acm.org/

运营/排版:何晨龙

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/45191.html

(0)
上一篇 2025年5月27日
下一篇 2025年5月27日

相关推荐

  • 意大利米兰理工大学陈蓁

    (观察者网讯)在意大利大学执教的大陆导师纠正台湾留学生论文上的国籍错误后,气得跳脚的台当局向这位老师发难了。 综合意大利媒体及台媒近日报道,相关视频在网上引起热议后,台当局外事部门及所谓“驻意大利代表处”向米兰理工大学致函抗议,一些与台当局有着密切关系的意大利议员也向校方施压,要求学校对该大陆导师做停职处理。3月28日,校方回应表示已成立纪律委员会,就此事展…

    2025年1月16日
  • 送给出国留学孩子的话_送给出国留学孩子的话300字

    亲爱的儿子: 随着你踏上赴异国求学的征途,妈妈的心也被你揪走,心中五味杂陈,喜忧参半:喜的是你在近而立之年,终于懂得了读书深造的意义,忧的是当下国外的疫情还在肆虐,“儿行千里母担忧,惟愿平安此所求”,愿我儿此行平安顺风,吉星高照! 记得台湾作家龙应台在《目送》中有一段话:“所谓父女母子一场,只不过意味着,你和他的缘分就是今生今世不断地在目送他的背影渐行渐远。…

    2024年2月15日
  • 北京中医药大学成人本科招生

    一,北京中医药大学2024年成人高等学历继续教育招生简章 京中医药大学是一所以中医药学为主干学科的全国重点大学,直属教育部管理,由教育部、国家卫生健康委员会、国家中医药管理局和北京市共建,是国家“双一流”建设高校,也是教育部新一届高等学校中医学类、中西医结合类专业教学指导委员会主任委员单位。学校现有3个校区,分别为良乡校区、和平街校区和望京校区。良乡校区位于…

    2024年12月19日
  • 不说话的英语

    一、silent 的搭配(不说话的;沉默的) a silent film 无声电影 be silent about sth.对某事保持沉默 二、score的搭配(得分,进球) scores of 许多,大量 in scores 大量地;大批地 keep the score (在比赛中)记分 三、require的搭配(需要,要求) ★require后接宾语从句…

    2024年6月11日
  • 加大拿签证_加大拿签证送签多久能拿到签证

    有效期:最长10年(护照有效期相同) 停留时间:180天 入境次数:多次 签证类型:旅游/商务/探亲/访友 办理周期:1-3月左右 资料要求:护照原件 (有效期至国后6个月)白底2照片(可以只提供电子版,35x45mm,人物轮廓清晰,深色衣服) : 3、申请人身份证正反面扫描件; 4、申请人全家的户口本完整扫描件 (包括首页、户主页、其他亲属页、变更页等);…

    2024年3月11日
  • 阿姆斯特丹自由大学cs

    “如果我想拿荷兰PR或者留在荷兰工作一段时间,申请什么专业比较好呢?” 很多小伙伴在选择专业时,会更倾向于好留、实用性强的专业。 如果希望毕业后留在荷兰,可以简单的从当下最容易找工作的几个专业方向里选择,足矣给自己提供一个安稳又平淡的生活。 但作为外国人在荷找工作,跟荷兰和欧盟人竞争,有几点是我们明显的弱势: 荷兰语 文化融入 工作签证 因此,首先要考虑清楚…

    2025年5月13日
  • 庆应义塾大学学费_庆应义塾大学学费人民币

    庆应义塾大学是日本历史很悠久的私立大学之一,当然它也是日本非常顶尖的一所私立大学。学生们要在这所大学里留学,需要的费用是多少呢?下面云学教育科技集团就来给大家讲讲它的留学费用吧。 一、庆应义塾大学留学费用 庆应义塾大学学费本科:在庆大的文学部读本科课程学费是134万日元一年,在庆大的经济学部读本科课程学费是134万日元一年,在庆大的医学部读本科课程学费是38…

    2024年4月10日
  • ucd大学排名_美国UCD大学排名

    加利福尼亚大学(University of California),简称加州大学(UC),它不是一所真正意义上的大学,而是一个由10所公立大学组成的行政系统。 它是全美最大的公立校系统,教育水平公立校中最高,在美高教育界拥有不可撼动的地位。 除此以外,它拥有自己的独立申请系统,所有加州大学下辖的学校(UC San Francisco 除外)都只能通过 UC …

    2024年3月24日
  • 新东方游学(新东方游学官网)

    500年前,江阴徐霞客以一人之力,游遍中国大好河山,并留下了一部60万字的地理名著《徐霞客游记》;500年后,与徐霞客同为老乡的新东方创始人俞敏洪老师,阐述新东方带孩子探索中国的深远意义。 古人云:读万卷书、行万里路。读万卷书,不能只读学科考试的书,更要读启发孩子智慧和思想的书;行万里路,就是要让孩子走向大自然、人文历史和大江大河,从而由心生出一种豪气、一种…

    2023年11月2日
  • 医学包括哪些专业

    大家都知道,在我国3000多所高等院校当中,其中医药类院校占有很大的比重。医药类专业,也是我国700多个大学专业当中,数量比较多的专业类别。 由于新的人们对生命健康状况以及生活品质要求的不断提高,对于医疗行业的需求也越来越大。在此背景下,越来越多的考生选择报考医学类专业,想从事医疗、医药行业。 医疗、医药行业,相对于其他行业来说,工资收入水平比较高,工作环境…

    2024年6月1日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信