Толока (компания)
| Toloka | |
|---|---|
| Тип | бизнес |
| Дата основания | 2014 |
| Основатели | Ольга Мегорская |
| Отрасль | интернет |
| Материнская компания | Nebius Group[1] |
| Сайт | toloka.ai |
Toloka (Толо́ка, ранее Яндекс Толока) — нидерландская многонациональная компания, предоставляющая услуги по обработке данных, расположенная в Амстердаме (Нидерланды). Она предоставляет услуги по аннотированию и оценке данных с участием человека, что способствует разработке генеративного искусственного интеллекта и больших языковых моделей.
«Толока» — подразделение компании Nebius Group NV, поставщика ИИ-инфраструктуры, акции которой котируются на бирже Nasdaq[2]. В мае 2025 года инвестиционная компания Джеффа Безоса Bezos Expeditions привлекла в компанию раунд финансирования в размере 72 миллионов долларов США[3]. В раунде также принял участие Михаил Парахин, технический директор Shopify[4].
Клиентами Toloka являются Amazon, Microsoft, Anthropic, Shopify и poolside.
Название сервиса
Толо́ка — это форма деревенской взаимопомощи в России, Украине, Белоруссии, Эстонии, Латвии и Литве. Её организовывали в деревне для выполнения срочных работ, требующих большого количества работников: сбор урожая, вырубка леса, сооружение домов и т. д. Иногда толоку использовали для проведения общественных работ (строительство церквей, школ, дорог и т. п.).
Идея совместной полезной работы на общий результат сочетается с принципом краудсорсинга[5].
Толока в составе Yandex N.V. (Яндекс Толока, 2014—2024)
Толока была создана в 2014 году[6] для быстрой разметки большого количества данных, которые затем используются для машинного обучения и совершенствования поисковых алгоритмов[7]. Как правило, размещаемые задания достаточно простые, для их исполнения не требуется специальная подготовка[8]. В основном они связаны с анализом и оценкой контента[9]. Поэтому любой желающий может выполнять задания и получать за них вознаграждение[10].
В 2024 году компания Yandex N.V. закрыла сделку по продаже российских активов. Yandex N.V. сохранила контроль над иностранными стартапами Nebius, Toloka, Avride и TripleTen, а также контроль над дата-центром в Финляндии. Yandex N.V. была переименована в Nebius Group[11].
Виды заданий и область применения результатов
Совершенствование поисковых алгоритмов
Результаты разметки помогают улучшить качество поиска и эффективно настраивать алгоритмы распределения его результатов. Так, в августе 2017-го года Яндекс представил новый поисковый алгоритм «Королёв», при создании которого для обучения нейронных сетей использовались оценки толокеров. За два с лишним года существования сервиса они дали около двух миллиардов оценок, которые позволили разработчикам значительно усовершенствовать свой алгоритм[12].
Развитие машинного обучения
Чтобы машина поняла, как решать ту или иную задачу, необходимо показать ей огромное количество примеров, как положительных, так и отрицательных[13]. Пользователи сервиса Яндекс Толока в числе других задач могут получать и задания по описанию объектов, определённых компьютером на изображении. Например, на фото помечены объекты, которые смог определить искусственный интеллект, но для применения этих данных в деле требуется точно знать, что это за объекты, чтобы обучить искусственный интеллект по массе таких определений человеком. Который, в свою очередь, получит за такую работу вознаграждение.[7] Кроме того, в Толоке производят проверку автоматически полученных черновиков словарных статей для Яндекс Переводчика.[14]
Аудит и маркетинговые исследования
Проверка качества работы интернет-магазина, службы доставки, написание отзывов о продуктах и услугах. Например, в 2017 году пользователи Толоки принимали участие в проверке качества работы сервиса возврата товара на Яндекс Маркете. Подобные эксперименты позволяют контролировать качество работы сервиса и выявлять слабые места, над которыми в дальнейшем будет проведена работа по улучшению и устранению выявленных проблем.[15] В другом проекте пользователям предлагалось написать отзыв на товар из популярных категорий и снабдить его собственными фотографиями[16][17].
Выбор дизайна и названий новых продуктов и сервисов
Ответы на вопросы, связанные с выбором наиболее удачного названия и дизайна для нового продукта или сервиса[18], личными или потребительскими предпочтениями пользователей. В одном из таких опросов толокеры выбирали название для голосового помощника Яндекса[19]. Целью задания было — определить черты характера девушки с тем или иным именем. Для опроса взяли как нужные характеристики так и совсем неподходящие, и стали спрашивать: «Если у девушки вот такое имя, то она скорее добрая или агрессивная?». С большим отрывом в опросе победило имя «Алиса».[20]
Вознаграждение и вывод средств
Задания в Толоке оплачиваются — сумма, которую можно заработать, указана рядом с заданием[13]. Для вывода средств можно воспользоваться системами: ЮMoney (Бывшие Яндекс Деньги), PayPal, Qiwi. На этапе отладки процессов со стороны Толоки вывод денег может занимать от нескольких минут до месяца[5].
Мобильные приложения
Для решения задач, которые требуют работу «в поле» (например, пойти по адресу и проверить актуальность информации об организации), существует мобильная версия Толоки[5]. Сервисом разработаны два приложения — для Android и iOS.
Пользователи
Пользователи Толоки, или толокеры — люди, которые за вознаграждение выполняют задания по тестированию и улучшению системы на краудфандинговой площадке Яндекс. Толока[21]. В настоящее время в Толоке около 4 миллионов зарегистрированных пользователей[22] из России, с Украины, из Белоруссии, Казахстана, Узбекистана, Турции, Франции, Индонезии и других стран[23], которые выставили более 2 миллиардов оценок[10]. В 2018 году в проектах в «Толоке» поучаствовало больше миллиона людей[22]. Большинство толокеров — это молодые люди до 35 лет (как правило, студенты технических вузов или мамы в декрете).[5] В основном исполнители рассматривают Толоку в качестве дополнительного источника денег, хотя многие отмечают, что им нравится выполнять полезную работу, делать интернет чище.[5] В 2017 году интернет-холдинг Яндекс наградил 25-летнего челябинца Илью Михаленко за наибольший вклад в совершенствование поисковой системы.[24] На церемонии запуска нового алгоритма поиска челябинцу вручили статуэтку в виде ракеты как символа того, что вводимые работниками Яндекса инновации сопоставимы с полётами людей в космос.[6]
Заказчики
Все задания в Толоке размещают Заказчики. Основные направления использования «Толоки» внутри проектов «Яндекса» — это сбор и обработка данных для проектов, связанных с машинным обучением, речевыми технологиями, компьютерным зрением, умными алгоритмами «Поиска» и т. д., модерация контента (разговоры в «Яндекс Картах»), полевые задания (актуализация данных об организациях в «Справочнике»), оптимизация внутренних бизнес-процессов (поиск публикаций в соцсетях, разметка упоминаний Яндекса по тональности на позитивные и негативные). Поскольку над задачей одновременно работают как минимум сотни, а то и тысячи толокеров, результаты готовы в худшем случае на следующий день[7].
Критика
Для выявления и изъятия ЛГБТ-книг интернет-издательство Ridero использовало нейросеть, обучавшуюся с помощью «Толоки», пользователям которой предлагали прочитать текст и указать, одобряется ли в нём «существование лесбиянок, геев, бисексуалов и трансгендеров», смена пола, зоофилия, некрофилия, идеи чайлдфри или инцест. В пресс-службе «Яндекса» сообщили, что отозвали это задание, сочтя его оскорбительным[25].
Согласно данным взлома белорусскими хакерами Главного радиочастотного центра Роскомнадзора в ноябре 2022 г., «Яндекс. Толока» используется Роскомнадзором для обучения нейросетей ищущего «запрещённый контент» «Чистого интернета»[26].
Исследования в Толоке
Толока — это не только инструмент для решения прикладных задач, но и площадка для научных исследований в разных предметных областях. В мае 2019 года команда сервиса начала публиковать наборы данных для некоммерческих, академических целей, чтобы поддержать научное сообщество и привлечь исследователей в Толоку. Датасеты могут быть интересны исследователям разных направлений: для лингвистических исследований, для задач компьютерного зрения, для тестирования моделей агрегации вердиктов исполнителей и обучения чат-ботов[27].
Примечания
- ↑ https://toloka.ai/about
- ↑ About Nebius (англ.). nebius.com. Дата обращения: 22 октября 2025.
- ↑ Amazon's Bezos leads new investment in AI data company Toloka. Reuters (амер. англ.). Архивировано 15 мая 2025. Дата обращения: 22 октября 2025.
- ↑ Amsterdam-based AI data firm Toloka raises €64M round led by Jeff Bezos - Silicon Canals (брит. англ.) (10 мая 2025). Дата обращения: 22 октября 2025.
- ↑ 1 2 3 4 5 TolokaTeam (20 июля 2016). Яндекс.Толока. Как люди помогают обучать машинный интеллект. habrahabr. Архивировано 31 марта 2017. Дата обращения: 19 января 2018.
- ↑ 1 2 Яндекс назвал своим лучшим толокером жителя Челябинска. АН "Доступ". 23 августа 2017. Архивировано 6 сентября 2018. Дата обращения: 19 февраля 2018.
- ↑ 1 2 3 Александр Лычавко (15 января 2018). «Зимой выхлопные газы кажутся лидару стеной». Как в минском офисе «Яндекса» разрабатывают беспилотники. dev.by. Архивировано 18 февраля 2018. Дата обращения: 15 февраля 2018.
- ↑ Дмитрий Шихов (17 января 2018). Uber в ритейле: как это работает. Rusbase. Архивировано 17 января 2018. Дата обращения: 15 февраля 2018.
- ↑ Алексей Берилло (23 октября 2017). Конференция Nvidia GTC 2017 Europe: первым делом автопилоты. ixbt.com. Архивировано 2 февраля 2018. Дата обращения: 19 февраля 2018.
- ↑ 1 2 Роман Рожков (23 августа 2017). «Яндекс» подключил «Королева» к поискам. Комерстантъ. Архивировано 6 октября 2018. Дата обращения: 19 февраля 2018.
- ↑ «Яндекс» завершил разделение, в обновленную нидерландскую компанию ждут возвращения Аркадия Воложа
- ↑ Денис Сухов (22 августа 2017). Компания «Яндекс» представила новый поисковый алгоритм «Королев». Комсомольская Правда. Архивировано 6 октября 2018. Дата обращения: 22 января 2018.
- ↑ 1 2 Иван Кущ (23 августа 2017). Нейросети, космос, человек: «Яндекс» представил новый поиск. Будь мобильным!. Архивировано 26 августа 2017. Дата обращения: 19 февраля 2018.
- ↑ Екатерина Еникеева (30 января 2018). Как робот-переводчик находит и выучивает новые слова. N + 1. Архивировано 6 октября 2018. Дата обращения: 15 февраля 2018.
- ↑ «Яндекс» запустил эксперимент «Контрольная закупка на Маркете». retail.ru. 13 февраля 2017.
- ↑ В товарных отзывах на "Маркете" появятся фото. oborot.ru. 05-04-2017. Архивировано 2020-09-20. Дата обращения: 2018-02-19.
{{cite news}}: Проверьте значение даты:|date=(справка) - ↑ «Яндекс.Маркет» предложил пользователям писать отзывы к товарам за деньги. Афиша daily. 20 февраля 2017.
- ↑ Саша Море (2 февраля 2018). Дизайн продукта от начала до конца. vc.ru.
- ↑ Василий Волнухин (13 февраля 2018). Директор Яндекса по технологиям: программисты из России – это уже давно серьезный бренд.
- ↑ Daria Khokhlova (10 октября 2017). Как «Яндекс» создавал «Алису». vc.ru.
- ↑ Чем жила Челябинская область: главные новости недели. АН "Доступ". 27 августа 2017. Архивировано 6 сентября 2018. Дата обращения: 19 февраля 2018.
- ↑ 1 2 Татьяна Петрущенкова (08-04-2019). «Мы хотим монетизировать экспертизу в краудсорсинге». Rusbase. Архивировано 2019-04-11. Дата обращения: 2019-04-11.
{{cite news}}: Проверьте значение даты:|date=(справка) - ↑ Давид Нармания (23 сентября 2017). Двадцать лет спустя: как "Яндекс" стал не только поисковиком. РИА новости. Архивировано 9 ноября 2017. Дата обращения: 19 января 2018.
- ↑ Челябинец стал лучшим тестером Яндекса. ГТРК “Южный Урал”. 23 августа 2017. Архивировано 6 сентября 2018. Дата обращения: 19 февраля 2018.
- ↑ Чернокнижники. Как закон о «пропаганде» ЛГБТ, вступивший в силу неделю назад, уже изменил издательский рынок. Медиазона. 12 декабря 2022.
- ↑ Архитектура российской цензуры: что мы узнали из крупнейшей утечки в истории Роскомнадзора. Главное. Русская служба Би-би-си. 9 февраля 2022. Архивировано 16 мая 2023. Дата обращения: 6 сентября 2024.
- ↑ Яндекс открывает датасеты Толоки для исследователей. habr.com. Дата обращения: 2 июля 2019. Архивировано 2 июля 2019 года.