Саттон, Ричард (учёный)
| Ричард Саттон | |
|---|---|
| Ричард Саттон в 2016 году | |
| Дата рождения | XX век |
| Место рождения | |
| Страна | |
| Род деятельности | специалист в области информатики, инженер, исследователь искусственного интеллекта, преподаватель университета |
| Научная сфера | обучение с подкреплением, информатика[1], ИИ[1], машинное обучение[1] и информатика[1] |
| Место работы | |
| Альма-матер | |
| Научный руководитель | Эндрю Барто |
| Награды и премии |
(2025) |
| Сайт | richsutton.com (англ.) |
| Медиафайлы на Викискладе | |
Ричард Саттон (род. XX век, Огайо) — канадский учёный-информатик. Является профессором вычислительной техники в Университете Альберты и научным сотрудником компании Keen Technologies[2]. Саттон считается одним из основателей современного обучения с подкреплением[3].
Биография
Ричард Саттон родился в 1957 или 1958 году[4] в Огайо, вырос в Оук-Брук, штат Иллинойс[5].
В 1978 году Саттон получил степень бакалавра психологии в Стэнфордском университете, затем — степень магистра (1980) и доктора (1984) информатики в Массачусетском университете в Амхерсте под руководством Эндрю Барто[6].
На него повлияли работы Гарри Клопфа 1970-х годов. Клопф предположил, что для создания ИИ и объяснения разумного поведения одного лишь обучения с учителем недостаточно — необходимо обучение методом проб и ошибок, обусловленное «гедонистическими аспектами поведения». Благодаря этому Саттон сосредоточился на обучении с подкреплением[7].
В 1984 году Саттон стал постдокторантом Массачусетского университета[8]. С 1985 по 1994 год он был главным техническим сотрудником в лаборатории компьютерных и интеллектуальных систем компании GTE в Уолтеме, штат Массачусетс. После этого провёл три года в Массачусетском университете в Амхерсте в качестве старшего научного сотрудника. С 1998 по 2002 год Саттон работал в лаборатории AT&T Shannon в Флорхам-Парке, штат Нью-Джерси, в качестве главного технического сотрудника в отделе по разработке искусственного интеллекта[9].
С 2003 года является профессором вычислительной техники в Университете Альберты. До 2018 года возглавлял лабораторию обучения с подкреплением и искусственного интеллекта[10][9]. Сохранив профессорскую должность, Саттон в июне 2017 года присоединился к компании DeepMind в качестве учёного-исследователя и соучредителя её офиса в Эдмонтоне[6][11][12].
В 2015 году Саттон стал гражданином Канады[12].
Обучение с подкреплением
В начале 1980-х в Университете Массачусетса Саттон совместно с Эндрю Барто начал изучать поведение нейронов в мозге человека как основу для интеллекта, развивая концепцию, предложенную информатиком А. Гарри Клопфом. Эта концепция стала известна как обучение с подкреплением и явилась ключевой частью методов создания искусственного интеллекта[13].
Барто и Саттон использовали марковские процессы принятия решений (MDP) в качестве математической основы для объяснения того, как агенты (алгоритмические сущности) принимают решения в стохастической или случайной среде, получая вознаграждение по окончании каждого действия. Традиционная теория MDP предполагала, что агенты знают всю информацию о среде, пытаясь максимизировать своё совокупное вознаграждение. Методы обучения с подкреплением Барто и Саттона допускали, что и среда, и вознаграждение неизвестны, что позволило применять алгоритмы этой категории для решения широкого круга задач[14].
В 2000-х годах Саттон вернулся в Канаду и продолжил работу над темой, которая в то время развивалась преимущественно в академических кругах. Одним из первых крупных практических применений стала программа AlphaGo компании Google, построенная на этой концепции и победившая чемпиона по го[13]. Барто и Саттон широко признаны пионерами современного обучения с подкреплением, а сам метод лёг в основу современного бума ИИ[15].
В эссе 2019 года Саттон раскритиковал область исследований ИИ за то, что её представители «не смогли усвоить горький урок: построение [систем] на основе того, как мы думаем, в долгосрочной перспективе не работает». Он утверждал, что «70 лет исследований ИИ показали, что общие методы, использующие вычисления, в конечном итоге наиболее эффективны, и с большим отрывом», превосходя подходы, основанные на знаниях человека о конкретных областях, таких как компьютерное зрение, распознавание речи, шахматы или го[16][17].
В 2023 году Саттон и Джон Кармак объявили о партнёрстве для разработки AGI[2].
Награды
Саттон является членом Ассоциации по развитию искусственного интеллекта (AAAI) с 2001 года[18].
В 2003 году получил премию президента Международного общества нейронных сетей[19], а в 2013 году — премию за выдающиеся достижения в исследованиях от Массачусетского университета в Амхерсте[20].
В 2016 году Саттон был избран членом Королевское общество Канады[21]. В 2021 году был избран членом Лондонское королевское общество[22].
В 2025 году вместе с Эндрю Барто получил премию Тьюринга от Ассоциация вычислительной техники «за разработку концептуальных и алгоритмических основ обучения с подкреплением»[23][24].
Примечания
- ↑ 1 2 3 4 Sutton, Richard S. // Чешская национальная авторитетная база данных
- ↑ 1 2 John Carmack and Rich Sutton partner to accelerate development of Artificial General Intelligence (англ.). markets.businessinsider.com. Дата обращения: 2 октября 2023.
- ↑ Exclusive: Interview with Rich Sutton, the Father of Reinforcement Learning (11 января 2018). Дата обращения: 17 декабря 2018. Архивировано 11 января 2018 года.
- ↑ Rich Sutton, A.M. Turing Award Winner: Understanding Intelligence. Amii (5 марта 2025). — «So I'm 67 years old, but I want to still try to do some amazing things.» Дата обращения: 10 марта 2025.
- ↑ Heidrich-Meisner, Verena (2009). Interview with Richard S. Sutton (PDF). Künstliche intelligenz, Heft.
- ↑ 1 2 Brief Biography for Richard Sutton. incompleteideas.net. Дата обращения: 17 декабря 2018.
- ↑ Sutton, Richard S. Reinforcement learning: an introduction / Richard S. Sutton, Andrew Barto. — Second. — Cambridge, Massachusetts : The MIT Press, 2020. — P. 22–23. — ISBN 978-0-262-03924-6.
- ↑ Dr. Richard Sutton (англ.). awards.acm.org. Дата обращения: 7 марта 2025.
- ↑ 1 2 Piatetsky, Gregory. Exclusive: Interview with Rich Sutton, the Father of Reinforcement Learning (амер. англ.). KDnuggets (5 декабря 2017). Дата обращения: 10 февраля 2024.
- ↑ Brown, Michael. AI innovator Richard Sutton named to Royal Society (англ.). Alberta Machine Intelligence Institute (10 мая 2021). Дата обращения: 10 февраля 2024.
- ↑ DeepMind expands to Canada with new research office in Edmonton, Alberta. DeepMind. Дата обращения: 17 декабря 2018.
- ↑ 1 2 Edmonton AI guru Rich Sutton has lost his DeepMind but not his ambition. National Post (19 марта 2023). Дата обращения: 2 июля 2023.
- ↑ 1 2 Metz, Cade (5 марта 2025). Turing Award Goes to 2 Pioneers of Artificial Intelligence. The New York Times (амер. англ.). ISSN 0362-4331. Дата обращения: 8 марта 2025.
- ↑ A.M. Turing Award. amturing.acm.org. Дата обращения: 8 марта 2025.
- ↑ AI pioneers Andrew Barto and Richard Sutton win 2025 Turing Award for groundbreaking contributions to reinforcement learning | NSF – National Science Foundation (англ.). www.nsf.gov (5 марта 2025). Дата обращения: 8 марта 2025.
- ↑ Bitter Lesson, 2019.
- ↑ Tunstall, Lewis. Natural Language Processing with Transformers : [англ.] / Lewis Tunstall, Leandro von Werra, Thomas Wolf. — "O'Reilly Media, Inc.", January 26, 2022. — ISBN 978-1-0981-0319-4.
- ↑ Elected AAAI Fellows. www.aaai.org. Дата обращения: 17 декабря 2018.
- ↑ INNS Award Recipients. www.inns.org. Дата обращения: 17 декабря 2018.
- ↑ Outstanding Achievement and Advocacy Award Recipients (англ.). College of Information and Computer Sciences, University of Massachusetts Amherst (5 октября 2010). Дата обращения: 17 декабря 2018.
- ↑ Brown, Michael. U of A Scholars Join Ranks of Royal Society. The Quad (19 сентября 2016). Дата обращения: 24 августа 2023.
- ↑ Royal Society elects outstanding new Fellows and Foreign Members. royalsociety.org. Дата обращения: 8 июня 2021.
- ↑ Cade Metz (5 марта 2025). Turing Award Goes to 2 Pioneers of Artificial Intelligence. The New York Times. Дата обращения: 5 марта 2025.
- ↑ Turing Awardees – Directorate for Computer and Information Science and Engineering (CISE) | NSF – National Science Foundation (англ.). www.nsf.gov (5 марта 2025). Дата обращения: 8 марта 2025.
Литература
- Ричард С. Саттон, Эндрю Г. Барто. Обучение с подкреплением = Reinforcement Learning: An Introduction / пер. с англ. А. А. Слинкина. — ДМК Пресс, 2020. — 552 с. — ISBN 978-5-97060-097-9.
Ссылки
- Rich Sutton. The Bitter Lesson (англ.) (13 марта 2019). — (перевод на русский: Горький урок отрасли ИИ). Дата обращения: 28 сентября 2025.