Толока (компания)

Toloka
Тип бизнес
Дата основания 2014
Основатели Ольга Мегорская
Отрасль интернет
Материнская компания Nebius Group[1]
Сайт toloka.ai

Toloka (Толо́ка, ранее Яндекс Толока) — нидерландская многонациональная компания, предоставляющая услуги по обработке данных, расположенная в Амстердаме (Нидерланды). Она предоставляет услуги по аннотированию и оценке данных с участием человека, что способствует разработке генеративного искусственного интеллекта и больших языковых моделей.

«Толока» — подразделение компании Nebius Group NV, поставщика ИИ-инфраструктуры, акции которой котируются на бирже Nasdaq[2]. В мае 2025 года инвестиционная компания Джеффа Безоса Bezos Expeditions привлекла в компанию раунд финансирования в размере 72 миллионов долларов США[3]. В раунде также принял участие Михаил Парахин, технический директор Shopify[4].

Клиентами Toloka являются Amazon, Microsoft, Anthropic, Shopify и poolside.

Название сервиса

Толо́ка — это форма деревенской взаимопомощи в России, Украине, Белоруссии, Эстонии, Латвии и Литве. Её организовывали в деревне для выполнения срочных работ, требующих большого количества работников: сбор урожая, вырубка леса, сооружение домов и т. д. Иногда толоку использовали для проведения общественных работ (строительство церквей, школ, дорог и т. п.).

Идея совместной полезной работы на общий результат сочетается с принципом краудсорсинга[5].

Толока в составе Yandex N.V. (Яндекс Толока, 2014—2024)

Толока была создана в 2014 году[6] для быстрой разметки большого количества данных, которые затем используются для машинного обучения и совершенствования поисковых алгоритмов[7]. Как правило, размещаемые задания достаточно простые, для их исполнения не требуется специальная подготовка[8]. В основном они связаны с анализом и оценкой контента[9]. Поэтому любой желающий может выполнять задания и получать за них вознаграждение[10].

В 2024 году компания Yandex N.V. закрыла сделку по продаже российских активов. Yandex N.V. сохранила контроль над иностранными стартапами Nebius, Toloka, Avride и TripleTen, а также контроль над дата-центром в Финляндии. Yandex N.V. была переименована в Nebius Group[11].

Виды заданий и область применения результатов

Совершенствование поисковых алгоритмов

Результаты разметки помогают улучшить качество поиска и эффективно настраивать алгоритмы распределения его результатов. Так, в августе 2017-го года Яндекс представил новый поисковый алгоритм «Королёв», при создании которого для обучения нейронных сетей использовались оценки толокеров. За два с лишним года существования сервиса они дали около двух миллиардов оценок, которые позволили разработчикам значительно усовершенствовать свой алгоритм[12].

Развитие машинного обучения

Чтобы машина поняла, как решать ту или иную задачу, необходимо показать ей огромное количество примеров, как положительных, так и отрицательных[13]. Пользователи сервиса Яндекс Толока в числе других задач могут получать и задания по описанию объектов, определённых компьютером на изображении. Например, на фото помечены объекты, которые смог определить искусственный интеллект, но для применения этих данных в деле требуется точно знать, что это за объекты, чтобы обучить искусственный интеллект по массе таких определений человеком. Который, в свою очередь, получит за такую работу вознаграждение.[7] Кроме того, в Толоке производят проверку автоматически полученных черновиков словарных статей для Яндекс Переводчика.[14]

Аудит и маркетинговые исследования

Проверка качества работы интернет-магазина, службы доставки, написание отзывов о продуктах и услугах. Например, в 2017 году пользователи Толоки принимали участие в проверке качества работы сервиса возврата товара на Яндекс Маркете. Подобные эксперименты позволяют контролировать качество работы сервиса и выявлять слабые места, над которыми в дальнейшем будет проведена работа по улучшению и устранению выявленных проблем.[15] В другом проекте пользователям предлагалось написать отзыв на товар из популярных категорий и снабдить его собственными фотографиями[16][17].

Выбор дизайна и названий новых продуктов и сервисов

Ответы на вопросы, связанные с выбором наиболее удачного названия и дизайна для нового продукта или сервиса[18], личными или потребительскими предпочтениями пользователей. В одном из таких опросов толокеры выбирали название для голосового помощника Яндекса[19]. Целью задания было — определить черты характера девушки с тем или иным именем. Для опроса взяли как нужные характеристики так и совсем неподходящие, и стали спрашивать: «Если у девушки вот такое имя, то она скорее добрая или агрессивная?». С большим отрывом в опросе победило имя «Алиса».[20]

Вознаграждение и вывод средств

Задания в Толоке оплачиваются — сумма, которую можно заработать, указана рядом с заданием[13]. Для вывода средств можно воспользоваться системами: ЮMoney (Бывшие Яндекс Деньги), PayPal, Qiwi. На этапе отладки процессов со стороны Толоки вывод денег может занимать от нескольких минут до месяца[5].

Мобильные приложения

Для решения задач, которые требуют работу «в поле» (например, пойти по адресу и проверить актуальность информации об организации), существует мобильная версия Толоки[5]. Сервисом разработаны два приложения — для Android и iOS.

Пользователи

Пользователи Толоки, или толокеры — люди, которые за вознаграждение выполняют задания по тестированию и улучшению системы на краудфандинговой площадке Яндекс. Толока[21]. В настоящее время в Толоке около 4 миллионов зарегистрированных пользователей[22] из России, с Украины, из Белоруссии, Казахстана, Узбекистана, Турции, Франции, Индонезии и других стран[23], которые выставили более 2 миллиардов оценок[10]. В 2018 году в проектах в «Толоке» поучаствовало больше миллиона людей[22]. Большинство толокеров — это молодые люди до 35 лет (как правило, студенты технических вузов или мамы в декрете).[5] В основном исполнители рассматривают Толоку в качестве дополнительного источника денег, хотя многие отмечают, что им нравится выполнять полезную работу, делать интернет чище.[5] В 2017 году интернет-холдинг Яндекс наградил 25-летнего челябинца Илью Михаленко за наибольший вклад в совершенствование поисковой системы.[24] На церемонии запуска нового алгоритма поиска челябинцу вручили статуэтку в виде ракеты как символа того, что вводимые работниками Яндекса инновации сопоставимы с полётами людей в космос.[6]

Заказчики

Все задания в Толоке размещают Заказчики. Основные направления использования «Толоки» внутри проектов «Яндекса» — это сбор и обработка данных для проектов, связанных с машинным обучением, речевыми технологиями, компьютерным зрением, умными алгоритмами «Поиска» и т. д., модерация контента (разговоры в «Яндекс Картах»), полевые задания (актуализация данных об организациях в «Справочнике»), оптимизация внутренних бизнес-процессов (поиск публикаций в соцсетях, разметка упоминаний Яндекса по тональности на позитивные и негативные). Поскольку над задачей одновременно работают как минимум сотни, а то и тысячи толокеров, результаты готовы в худшем случае на следующий день[7].

Критика

Для выявления и изъятия ЛГБТ-книг интернет-издательство Ridero использовало нейросеть, обучавшуюся с помощью «Толоки», пользователям которой предлагали прочитать текст и указать, одобряется ли в нём «существование лесбиянок, геев, бисексуалов и трансгендеров», смена пола, зоофилия, некрофилия, идеи чайлдфри или инцест. В пресс-службе «Яндекса» сообщили, что отозвали это задание, сочтя его оскорбительным[25].

Согласно данным взлома белорусскими хакерами Главного радиочастотного центра Роскомнадзора в ноябре 2022 г., «Яндекс. Толока» используется Роскомнадзором для обучения нейросетей ищущего «запрещённый контент» «Чистого интернета»[26].

Исследования в Толоке

Толока — это не только инструмент для решения прикладных задач, но и площадка для научных исследований в разных предметных областях. В мае 2019 года команда сервиса начала публиковать наборы данных для некоммерческих, академических целей, чтобы поддержать научное сообщество и привлечь исследователей в Толоку. Датасеты могут быть интересны исследователям разных направлений: для лингвистических исследований, для задач компьютерного зрения, для тестирования моделей агрегации вердиктов исполнителей и обучения чат-ботов[27].

Примечания

  1. https://toloka.ai/about
  2. About Nebius (англ.). nebius.com. Дата обращения: 22 октября 2025.
  3. Amazon's Bezos leads new investment in AI data company Toloka. Reuters (амер. англ.). Архивировано 15 мая 2025. Дата обращения: 22 октября 2025.
  4. Amsterdam-based AI data firm Toloka raises €64M round led by Jeff Bezos - Silicon Canals (брит. англ.) (10 мая 2025). Дата обращения: 22 октября 2025.
  5. 1 2 3 4 5 TolokaTeam (20 июля 2016). Яндекс.Толока. Как люди помогают обучать машинный интеллект. habrahabr. Архивировано 31 марта 2017. Дата обращения: 19 января 2018.
  6. 1 2 Яндекс назвал своим лучшим толокером жителя Челябинска. АН "Доступ". 23 августа 2017. Архивировано 6 сентября 2018. Дата обращения: 19 февраля 2018.
  7. 1 2 3 Александр Лычавко (15 января 2018). «Зимой выхлопные газы кажутся лидару стеной». Как в минском офисе «Яндекса» разрабатывают беспилотники. dev.by. Архивировано 18 февраля 2018. Дата обращения: 15 февраля 2018.
  8. Дмитрий Шихов (17 января 2018). Uber в ритейле: как это работает. Rusbase. Архивировано 17 января 2018. Дата обращения: 15 февраля 2018.
  9. Алексей Берилло (23 октября 2017). Конференция Nvidia GTC 2017 Europe: первым делом автопилоты. ixbt.com. Архивировано 2 февраля 2018. Дата обращения: 19 февраля 2018.
  10. 1 2 Роман Рожков (23 августа 2017). «Яндекс» подключил «Королева» к поискам. Комерстантъ. Архивировано 6 октября 2018. Дата обращения: 19 февраля 2018.
  11. «Яндекс» завершил разделение, в обновленную нидерландскую компанию ждут возвращения Аркадия Воложа
  12. Денис Сухов (22 августа 2017). Компания «Яндекс» представила новый поисковый алгоритм «Королев». Комсомольская Правда. Архивировано 6 октября 2018. Дата обращения: 22 января 2018.
  13. 1 2 Иван Кущ (23 августа 2017). Нейросети, космос, человек: «Яндекс» представил новый поиск. Будь мобильным!. Архивировано 26 августа 2017. Дата обращения: 19 февраля 2018.
  14. Екатерина Еникеева (30 января 2018). Как робот-переводчик находит и выучивает новые слова. N + 1. Архивировано 6 октября 2018. Дата обращения: 15 февраля 2018.
  15. «Яндекс» запустил эксперимент «Контрольная закупка на Маркете». retail.ru. 13 февраля 2017.
  16. В товарных отзывах на "Маркете" появятся фото. oborot.ru. 05-04-2017. Архивировано 2020-09-20. Дата обращения: 2018-02-19. {{cite news}}: Проверьте значение даты: |date= (справка)
  17. «Яндекс.Маркет» предложил пользователям писать отзывы к товарам за деньги. Афиша daily. 20 февраля 2017.
  18. Саша Море (2 февраля 2018). Дизайн продукта от начала до конца. vc.ru.
  19. Василий Волнухин (13 февраля 2018). Директор Яндекса по технологиям: программисты из России – это уже давно серьезный бренд.
  20. Daria Khokhlova (10 октября 2017). Как «Яндекс» создавал «Алису». vc.ru.
  21. Чем жила Челябинская область: главные новости недели. АН "Доступ". 27 августа 2017. Архивировано 6 сентября 2018. Дата обращения: 19 февраля 2018.
  22. 1 2 Татьяна Петрущенкова (08-04-2019). «Мы хотим монетизировать экспертизу в краудсорсинге». Rusbase. Архивировано 2019-04-11. Дата обращения: 2019-04-11. {{cite news}}: Проверьте значение даты: |date= (справка)
  23. Давид Нармания (23 сентября 2017). Двадцать лет спустя: как "Яндекс" стал не только поисковиком. РИА новости. Архивировано 9 ноября 2017. Дата обращения: 19 января 2018.
  24. Челябинец стал лучшим тестером Яндекса. ГТРК “Южный Урал”. 23 августа 2017. Архивировано 6 сентября 2018. Дата обращения: 19 февраля 2018.
  25. Чернокнижники. Как закон о «пропаганде» ЛГБТ, вступивший в силу неделю назад, уже изменил издательский рынок. Медиазона. 12 декабря 2022.
  26. Архитектура российской цензуры: что мы узнали из крупнейшей утечки в истории Роскомнадзора. Главное. Русская служба Би-би-си. 9 февраля 2022. Архивировано 16 мая 2023. Дата обращения: 6 сентября 2024.
  27. Яндекс открывает датасеты Толоки для исследователей. habr.com. Дата обращения: 2 июля 2019. Архивировано 2 июля 2019 года.

Ссылки