Саттон, Ричард (учёный)

Ричард Саттон
Ричард Саттон
	; Ричард Саттон в 2016 году
Дата рождения	XX век
Место рождения	Огайо, США;
Страна	Канада;
Род деятельности	специалист в области информатики, инженер, исследователь искусственного интеллекта, преподаватель университета
Научная сфера	обучение с подкреплением, информатика, ИИ, машинное обучение и информатика
Место работы	Альбертский университет;
Альма-матер	Массачусетский университет в Амхерсте; Стэнфордский университет;
Научный руководитель	Эндрю Барто
Лауреаты премии Тьюринга
	Перлис (1966); Уилкс (1967); Хэмминг (1968); Минский (1969); Уилкинсон (1970); Маккарти (1971); Дейкстра (1972); Бахман (1973); Кнут (1974); Ньюэлл; Саймон (1975); Рабин; Скотт (1976); Бэкус (1977); Флойд (1978); Айверсон (1979); Хоар (1980); Кодд (1981); Кук (1982); Томпсон; Ритчи (1983); Вирт (1984); Карп (1985); Хопкрофт; Тарьян (1986); Кок (1987); Сазерленд (1988); Кэхэн (1989); Корбато (1990); Милнер (1991); Лэмпсон (1992); Хартманис; Стернс (1993); Фейгенбаум; Редди (1994); Блюм (1995); Пнуэли (1996); Энгельбарт (1997); Грей (1998); Брукс (1999); Яо (2000); Даль; Нюгор (2001); Ривест; Шамир; Адлеман (2002); Кэй (2003); Серф; Кан (2004); Наур (2005); Аллен (2006); Кларк; Эмерсон; Сифакис (2007); Лисков (2008); Текер (2009); Вэлиант (2010); Перл (2011); Микали; Гольдвассер (2012); Лэмпорт (2013); Стоунбрейкер (2014); Диффи; Хеллман (2015); Бернерс-Ли (2016); Хеннесси; Паттерсон (2017); Бенжио; Хинтон; Лекун (2018); Катмулл; Ханрахан (2019); Ахо; Ульман (2020); Донгарра (2021); Меткалф (2022); Вигдерзон (2023); Барто; Саттон (2024);
Сайт	richsutton.com (англ.)
	Медиафайлы на Викискладе

Ричард Саттон (род. XX век, Огайо) — канадский учёный-информатик. Является профессором вычислительной техники в Университете Альберты и научным сотрудником компании Keen Technologies^[2]. Саттон считается одним из основателей современного обучения с подкреплением^[3].

Биография

Ричард Саттон родился в 1957 или 1958 году^[4] в Огайо, вырос в Оук-Брук, штат Иллинойс^[5].

В 1978 году Саттон получил степень бакалавра психологии в Стэнфордском университете, затем — степень магистра (1980) и доктора (1984) информатики в Массачусетском университете в Амхерсте под руководством Эндрю Барто^[6].

На него повлияли работы Гарри Клопфа 1970-х годов. Клопф предположил, что для создания ИИ и объяснения разумного поведения одного лишь обучения с учителем недостаточно — необходимо обучение методом проб и ошибок, обусловленное «гедонистическими аспектами поведения». Благодаря этому Саттон сосредоточился на обучении с подкреплением^[7].

В 1984 году Саттон стал постдокторантом Массачусетского университета^[8]. С 1985 по 1994 год он был главным техническим сотрудником в лаборатории компьютерных и интеллектуальных систем компании GTE в Уолтеме, штат Массачусетс. После этого провёл три года в Массачусетском университете в Амхерсте в качестве старшего научного сотрудника. С 1998 по 2002 год Саттон работал в лаборатории AT&T Shannon в Флорхам-Парке, штат Нью-Джерси, в качестве главного технического сотрудника в отделе по разработке искусственного интеллекта^[9].

С 2003 года является профессором вычислительной техники в Университете Альберты. До 2018 года возглавлял лабораторию обучения с подкреплением и искусственного интеллекта^[10]^[9]. Сохранив профессорскую должность, Саттон в июне 2017 года присоединился к компании DeepMind в качестве учёного-исследователя и соучредителя её офиса в Эдмонтоне^[6]^[11]^[12].

В 2015 году Саттон стал гражданином Канады^[12].

Обучение с подкреплением

В начале 1980-х в Университете Массачусетса Саттон совместно с Эндрю Барто начал изучать поведение нейронов в мозге человека как основу для интеллекта, развивая концепцию, предложенную информатиком А. Гарри Клопфом. Эта концепция стала известна как обучение с подкреплением и явилась ключевой частью методов создания искусственного интеллекта^[13].

Барто и Саттон использовали марковские процессы принятия решений (MDP) в качестве математической основы для объяснения того, как агенты (алгоритмические сущности) принимают решения в стохастической или случайной среде, получая вознаграждение по окончании каждого действия. Традиционная теория MDP предполагала, что агенты знают всю информацию о среде, пытаясь максимизировать своё совокупное вознаграждение. Методы обучения с подкреплением Барто и Саттона допускали, что и среда, и вознаграждение неизвестны, что позволило применять алгоритмы этой категории для решения широкого круга задач^[14].

В 2000-х годах Саттон вернулся в Канаду и продолжил работу над темой, которая в то время развивалась преимущественно в академических кругах. Одним из первых крупных практических применений стала программа AlphaGo компании Google, построенная на этой концепции и победившая чемпиона по го^[13]. Барто и Саттон широко признаны пионерами современного обучения с подкреплением, а сам метод лёг в основу современного бума ИИ^[15].

В эссе 2019 года Саттон раскритиковал область исследований ИИ за то, что её представители «не смогли усвоить горький урок: построение [систем] на основе того, как мы думаем, в долгосрочной перспективе не работает». Он утверждал, что «70 лет исследований ИИ показали, что общие методы, использующие вычисления, в конечном итоге наиболее эффективны, и с большим отрывом», превосходя подходы, основанные на знаниях человека о конкретных областях, таких как компьютерное зрение, распознавание речи, шахматы или го^[16]^[17].

В 2023 году Саттон и Джон Кармак объявили о партнёрстве для разработки AGI^[2].

Награды

Саттон является членом Ассоциации по развитию искусственного интеллекта (AAAI) с 2001 года^[18].

В 2003 году получил премию президента Международного общества нейронных сетей^[19], а в 2013 году — премию за выдающиеся достижения в исследованиях от Массачусетского университета в Амхерсте^[20].

В 2016 году Саттон был избран членом Королевское общество Канады^[21]. В 2021 году был избран членом Лондонское королевское общество^[22].

В 2025 году вместе с Эндрю Барто получил премию Тьюринга от Ассоциация вычислительной техники «за разработку концептуальных и алгоритмических основ обучения с подкреплением»^[23]^[24].

Примечания

↑ ¹ ² ³ ⁴ Sutton, Richard S. // Чешская национальная авторитетная база данных
↑ ¹ ² John Carmack and Rich Sutton partner to accelerate development of Artificial General Intelligence (англ.). markets.businessinsider.com. Дата обращения: 2 октября 2023.
↑ Exclusive: Interview with Rich Sutton, the Father of Reinforcement Learning (11 января 2018). Дата обращения: 17 декабря 2018. Архивировано 11 января 2018 года.
↑ Rich Sutton, A.M. Turing Award Winner: Understanding Intelligence . Amii (5 марта 2025). — «So I'm 67 years old, but I want to still try to do some amazing things.» Дата обращения: 10 марта 2025.
↑ Heidrich-Meisner, Verena (2009). Interview with Richard S. Sutton (PDF). Künstliche intelligenz, Heft.
↑ ¹ ² Brief Biography for Richard Sutton . incompleteideas.net. Дата обращения: 17 декабря 2018.
↑ Sutton, Richard S. Reinforcement learning: an introduction / Richard S. Sutton, Andrew Barto. — Second. — Cambridge, Massachusetts : The MIT Press, 2020. — P. 22–23. — ISBN 978-0-262-03924-6.
↑ Dr. Richard Sutton (англ.). awards.acm.org. Дата обращения: 7 марта 2025.
↑ ¹ ² Piatetsky, Gregory. Exclusive: Interview with Rich Sutton, the Father of Reinforcement Learning (амер. англ.). KDnuggets (5 декабря 2017). Дата обращения: 10 февраля 2024.
↑ Brown, Michael. AI innovator Richard Sutton named to Royal Society (англ.). Alberta Machine Intelligence Institute (10 мая 2021). Дата обращения: 10 февраля 2024.
↑ DeepMind expands to Canada with new research office in Edmonton, Alberta . DeepMind. Дата обращения: 17 декабря 2018.
↑ ¹ ² Edmonton AI guru Rich Sutton has lost his DeepMind but not his ambition . National Post (19 марта 2023). Дата обращения: 2 июля 2023.
↑ ¹ ² Metz, Cade (5 марта 2025). Turing Award Goes to 2 Pioneers of Artificial Intelligence. The New York Times (амер. англ.). ISSN 0362-4331. Дата обращения: 8 марта 2025.
↑ A.M. Turing Award . amturing.acm.org. Дата обращения: 8 марта 2025.
↑ AI pioneers Andrew Barto and Richard Sutton win 2025 Turing Award for groundbreaking contributions to reinforcement learning | NSF – National Science Foundation (англ.). www.nsf.gov (5 марта 2025). Дата обращения: 8 марта 2025.
↑ Bitter Lesson, 2019.
↑ Tunstall, Lewis. Natural Language Processing with Transformers : [англ.] / Lewis Tunstall, Leandro von Werra, Thomas Wolf. — "O'Reilly Media, Inc.", January 26, 2022. — ISBN 978-1-0981-0319-4.
↑ Elected AAAI Fellows . www.aaai.org. Дата обращения: 17 декабря 2018.
↑ INNS Award Recipients . www.inns.org. Дата обращения: 17 декабря 2018.
↑ Outstanding Achievement and Advocacy Award Recipients (англ.). College of Information and Computer Sciences, University of Massachusetts Amherst (5 октября 2010). Дата обращения: 17 декабря 2018.
↑ Brown, Michael. U of A Scholars Join Ranks of Royal Society . The Quad (19 сентября 2016). Дата обращения: 24 августа 2023.
↑ Royal Society elects outstanding new Fellows and Foreign Members . royalsociety.org. Дата обращения: 8 июня 2021.
↑ Cade Metz (5 марта 2025). Turing Award Goes to 2 Pioneers of Artificial Intelligence. The New York Times. Дата обращения: 5 марта 2025.
↑ Turing Awardees – Directorate for Computer and Information Science and Engineering (CISE) | NSF – National Science Foundation (англ.). www.nsf.gov (5 марта 2025). Дата обращения: 8 марта 2025.

Литература

Ричард С. Саттон, Эндрю Г. Барто. Обучение с подкреплением = Reinforcement Learning: An Introduction / пер. с англ. А. А. Слинкина. — ДМК Пресс, 2020. — 552 с. — ISBN 978-5-97060-097-9.

Ссылки

Rich Sutton. The Bitter Lesson (англ.) (13 марта 2019). — (перевод на русский: Горький урок отрасли ИИ). Дата обращения: 28 сентября 2025.

[_8fd82b6d846177a7-1] ¹ ² ³ ⁴ Sutton, Richard S. // Чешская национальная авторитетная база данных

[auto2-2] ¹ ² John Carmack and Rich Sutton partner to accelerate development of Artificial General Intelligence (англ.). markets.businessinsider.com. Дата обращения: 2 октября 2023.

[3] Exclusive: Interview with Rich Sutton, the Father of Reinforcement Learning (11 января 2018). Дата обращения: 17 декабря 2018. Архивировано 11 января 2018 года.

[4] Rich Sutton, A.M. Turing Award Winner: Understanding Intelligence . Amii (5 марта 2025). — «So I'm 67 years old, but I want to still try to do some amazing things.» Дата обращения: 10 марта 2025.

[5] Heidrich-Meisner, Verena (2009). Interview with Richard S. Sutton (PDF). Künstliche intelligenz, Heft.

[incompleteideas.net2-6] ¹ ² Brief Biography for Richard Sutton . incompleteideas.net. Дата обращения: 17 декабря 2018.

[7] Sutton, Richard S. Reinforcement learning: an introduction / Richard S. Sutton, Andrew Barto. — Second. — Cambridge, Massachusetts : The MIT Press, 2020. — P. 22–23. — ISBN 978-0-262-03924-6.

[8] Dr. Richard Sutton (англ.). awards.acm.org. Дата обращения: 7 марта 2025.

[Piatetsky-2017-9] ¹ ² Piatetsky, Gregory. Exclusive: Interview with Rich Sutton, the Father of Reinforcement Learning (амер. англ.). KDnuggets (5 декабря 2017). Дата обращения: 10 февраля 2024.

[10] Brown, Michael. AI innovator Richard Sutton named to Royal Society (англ.). Alberta Machine Intelligence Institute (10 мая 2021). Дата обращения: 10 февраля 2024.

[11] DeepMind expands to Canada with new research office in Edmonton, Alberta . DeepMind. Дата обращения: 17 декабря 2018.

[National_Post-20232-12] ¹ ² Edmonton AI guru Rich Sutton has lost his DeepMind but not his ambition . National Post (19 марта 2023). Дата обращения: 2 июля 2023.

[Metz-20252-13] ¹ ² Metz, Cade (5 марта 2025). Turing Award Goes to 2 Pioneers of Artificial Intelligence. The New York Times (амер. англ.). ISSN 0362-4331. Дата обращения: 8 марта 2025.

[14] A.M. Turing Award . amturing.acm.org. Дата обращения: 8 марта 2025.

[15] AI pioneers Andrew Barto and Richard Sutton win 2025 Turing Award for groundbreaking contributions to reinforcement learning | NSF – National Science Foundation (англ.). www.nsf.gov (5 марта 2025). Дата обращения: 8 марта 2025.

[_92c9b6381ca21c05-16] Bitter Lesson, 2019.

[17] Tunstall, Lewis. Natural Language Processing with Transformers : [англ.] / Lewis Tunstall, Leandro von Werra, Thomas Wolf. — "O'Reilly Media, Inc.", January 26, 2022. — ISBN 978-1-0981-0319-4.

[www.aaai.org-18] Elected AAAI Fellows . www.aaai.org. Дата обращения: 17 декабря 2018.

[19] INNS Award Recipients . www.inns.org. Дата обращения: 17 декабря 2018.

[20] Outstanding Achievement and Advocacy Award Recipients (англ.). College of Information and Computer Sciences, University of Massachusetts Amherst (5 октября 2010). Дата обращения: 17 декабря 2018.

[21] Brown, Michael. U of A Scholars Join Ranks of Royal Society . The Quad (19 сентября 2016). Дата обращения: 24 августа 2023.

[22] Royal Society elects outstanding new Fellows and Foreign Members . royalsociety.org. Дата обращения: 8 июня 2021.

[23] Cade Metz (5 марта 2025). Turing Award Goes to 2 Pioneers of Artificial Intelligence. The New York Times. Дата обращения: 5 марта 2025.

[24] Turing Awardees – Directorate for Computer and Information Science and Engineering (CISE) | NSF – National Science Foundation (англ.). www.nsf.gov (5 марта 2025). Дата обращения: 8 марта 2025.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]