Microsoft Translator
| Microsoft Translator | |
|---|---|
| URL |
microsoft.com/translator bing.com/translator |
| Тип сайта | Переводчик |
| Регистрация | необязательно |
| Язык | 179 |
| Владелец | Microsoft |
| Создатель | Microsoft |
| Текущий статус | активен |
Microsoft Translator или Bing Translator — многоязычный облачный сервис машинного перевода, а также веб-служба, предоставляемая корпорацией Microsoft. Microsoft Translator является частью Microsoft Cognitive Services[1] и интегрирован в различные продукты для потребителей, разработчиков и предприятий, включая Bing, Microsoft Office, SharePoint, Microsoft Edge, Microsoft Lync, Yammer, Skype Translator, Visual Studio и приложения Microsoft Translator для Windows, Windows Phone, iPhone, Apple Watch, Android и Android Wear.
Microsoft Translator также предлагает услуги перевода текста и речи через облачные сервисы для бизнеса. Сервис перевода текста через Translator Text API доступен в различных вариантах: от бесплатного, поддерживающего два миллиона символов в месяц, до платных, поддерживающих миллиарды символов в месяц[2]. Услуги перевода речи через сервисы Microsoft Speech предоставляются с учётом времени аудиопотока.
Сервис поддерживает перевод текста между многими языками и их вариантами. Он также поддерживает несколько систем речевого перевода, которые в настоящее время используются в функции живого общения Microsoft Translator, Skype Translator и Skype для настольного компьютера Windows, а также в приложениях Microsoft Translator для iOS и Android[3].
История
Первая версия системы машинного перевода Microsoft была разработана в 1999–2000 годах в рамках исследовательского центра Microsoft Research. Эта система основывалась на семантических предикатно-аргументных структурах, известных как логические формы (LF), и была разработана на основе функции исправления грамматики, разработанной для Microsoft Word. В конечном итоге эта система была использована для перевода всей базы знаний Microsoft на испанский, французский, немецкий и японский языки[4].
Сайт-переводчик для потребителей Bing Translator (ранее известный как Windows Live Translator и Live Search Translator) был запущен в 2007 году и предлагает бесплатный перевод текстов и веб-сайтов в интернете.
В 2011 году сервис был расширен и теперь включает множество продуктов Microsoft Translator через облачный API, который поддерживает продукты, доступные как частным, так и корпоративным пользователям. В марте 2016 года была добавлена дополнительная возможность речевого перевода[5].
В мае 2018 года было представлено обновление API. В новой версии нейронный машинный перевод был выбран в качестве метода перевода по умолчанию. Помимо перевода, новая версия включает транслитерацию и двуязычный словарь для поиска слов, поиска альтернативных переводов и просмотра примеров в предложениях[6].
Методология перевода и исследования
Microsoft Translator использует машинный перевод для мгновенного перевода с одного естественного языка на другой. Эта система основана на четырёх различных областях исследований компьютерного обучения, представленных ниже[7]:
| Тип обучения | Влияние на перевод |
|---|---|
| Нейронные сети |
Нейронные сети пытаются имитировать работу мозга при переводе между языками. На высоком уровне нейросетевой перевод работает в два этапа. Во-первых, на первом этапе моделируется слово, которое необходимо перевести, на основе контекста этого слова (и его возможных переводов) в полном предложении. Во-вторых, нейронная сеть переводит эту модель слова (не само слово, а модель, построенную нейронной сетью) в контексте предложения на другой язык[8]. Нейронный машинный перевод — это метод перевода по умолчанию для API Microsoft Translator. |
| SMT на основе синтаксиса |
Перевод на основе синтаксиса основан на идее перевода синтаксических единиц, а не отдельных слов или цепочек слов. Компания Microsoft использовала SMT на основе синтаксиса для перевода значительной части своих компьютерных текстов с английского на несколько целевых языков. Продолжающиеся исследования в этой области привели к улучшению склонений и порядка слов. |
| SMT на основе фраз | В SMT, основанном на фразах, машина изучает соответствие между языками на основе параллельных текстов без привлечения лингвистических знаний. Это позволяет получать более качественные переводы за меньшее время, чем другие системы. |
| Выравнивание слов по битексту | Системы SMT используют существующие данные перевода для обучения автоматическому переводу с одного языка на другой. Для обучения систем критически важно определить соответствия слов (или выравнивание слов). Microsoft разработала как дискриминационный[9], так и генеративный[10] подходы к выравниванию слов, что приводит к ускорению алгоритмов и повышению качества переводов. |
| Моделирование языка | Моделирование языка использует модели N-грамм для построения понятных переводов на целевой язык. Это гарантирует, что перевод будет плавным и читабельным. |
Точность
Качество результатов машинного перевода Microsoft Translator оценивается с помощью метода, называемого BLEU[11].
BLEU (Bilingual Evaluation Understudy) — это алгоритм оценки качества текста, переведённого с одного естественного языка на другой. Качество определяется соответствием между результатом работы машины и результатом работы человека. BLEU стала одной из первых метрик, достигших высокой корреляции с человеческими оценками качества, и остаётся одной из самых популярных автоматизированных и недорогих метрик.
Поскольку машинный перевод основан на статистических алгоритмах, а не на переводчиках-людях, автоматические переводы не всегда абсолютно точны. Microsoft Translator внедрил в свои продукты различные функции обратной связи, такие как Collaborative Translation Framework, позволяющие пользователям предлагать альтернативные варианты перевода. Эти альтернативные варианты затем интегрируются в алгоритмы Microsoft Translator для улучшения будущих переводов.
В ноябре 2016 года Microsoft Translator представил перевод с использованием глубоких нейронных сетей на девяти наиболее популярных языках, включая все языки с речью и японский. Нейронные сети обеспечивают более качественный перевод, чем стандартное статистическое машинное обучение[12].
Поддерживаемые языки
Список поддерживаемых языков доступен на веб-сайте Microsoft Translator, а также может быть получен программным способом через облачные сервисы[13].
По состоянию на январь 2026 года Microsoft Translator поддерживает 179 языков и языковых вариантов[3][14]:
- Азербайджанский
- Албанский
- Амхарский
- Английский
- Английский (Великобритания)
- Арабский
- Арабский (Египетский)
- Арабский (Марокканский)
- Арабский (Романизированный)
- Армянский
- Ассамский
- Астурийский
- Африкаанс
- Ачехский (Латиница)
- Балийский
- Баскский
- Батак-тоба
- Башкирский
- Белорусский
- Бенгальский
- Бикольский
- Бирманский
- Бодо
- Болгарский
- Боснийский
- Бходжпури
- Валлийский
- Варайский
- Венгерский
- Венетский
- Верхнелужицкий
- Вьетнамский
- Гаитянский
- Галисийский
- Ганда
- Греческий
- Грузинский
- Гуджарати
- Дари
- Датский
- Догри
- Зулу
- Ибанский
- Иврит
- Игбо
- Идиш (Восточный)
- Илокано
- Индонезийский
- Инуиннактун
- Инуктитут
- Инуктитут (Латиница)
- Ирландский
- Исландский
- Испанский
- Итальянский
- Йоруба
- Кабувердьяну
- Казахский
- Каннада
- Кантонский (Традиционная Китайская)
- Капампанган
- Каталанский
- Кашмири
- Киньяруанда
- Киргизский
- Китайский (Классический)
- Китайский (Традиционная Китайская)
- Китайский (Упрощенная Китайская)
- Клингонский (Латиница)
- Конкани
- Корейский
- Корсиканский
- Коса
- Крио
- Курдский (Северная)
- Курдский (Центральная)
- Кхмерский
- Лаосский
- Латинский
- Латышский
- Лигурский (Генуэзский)
- Лимбургский
- Лингала
- Литовский
- Ломбардский
- Люксембургский
- Маврикийский Креольский
- Майтхили
- Македонский
- Малагасийский
- Малайский
- Малаялам
- Мальдивский
- Мальтийский
- Маори
- Маратхи
- Марвари
- Минангкабау (Латиница)
- Монгольский (Кириллица)
- Монгольский (Традиционный)
- Немецкий
- Непальский
- Нидерландский
- Нижнелужицкий
- Норвежский Букмол
- Норвежский Нюнорск
- Ньянджа
- Окситанский
- Ория
- Отоми (Керетаро)
- Панджаби (Гурмукхи)
- Панджаби (Шахмукхи)
- Папьяменто
- Персидский
- Польский
- Португальский (Бразилия)
- Португальский (Португалия)
- Пушту
- Румынский
- Рунди
- Русский
- Самоанский
- Санскрит
- Сардинский
- Себуано
- Северный сото
- Сейшельский Креольский
- Сербский (Кириллица)
- Сербский (Латиница)
- Сесото
- Сетсвана
- Сингальский
- Синдхи
- Сицилийский
- Словацкий
- Словенский
- Сомали
- Суахили
- Сунданский
- Таджикский
- Таитянский
- Тайский
- Тамильский
- Татарский
- Телугу
- Тетум
- Тибетский
- Тигринья
- Ток-писин
- Тонганский
- Турецкий
- Туркменский
- Узбекский (Латиница)
- Уйгурский
- Украинский
- Урду
- Фарерский
- Фиджи
- Филиппинский
- Финский
- Французский
- Французский (Канада)
- Фризский
- Фриульский
- Хауса
- Хилигайнон
- Хинди
- Хмонг
- Хорватский
- Чешский
- Чхаттисгархи
- Шведский
- Шона
- Эсперанто
- Эстонский
- Юкатекский Майя
- Яванский
- Ямайский Креольский
- Японский
Примечания
- ↑ Carmen., Steiner. Pilotstudie: über die Funktion des Anhebens der Augenbrauen in der Deutschschweizerischen Gebärdensprache DSGS. — Verein zur Unterstützung der Gebärdensprache der Gehörlosen, 2000.
- ↑ Azure Data Marketplace- Microsoft Translator (англ.). Дата обращения: 8 декабря 2014. Архивировано из оригинала 6 февраля 2018 года.
- ↑ 1 2 Языковая поддержка — переводчик. Microsoft. Дата обращения: 6 января 2023.
- ↑ Microsoft Research- Arul Menezes (англ.).
- ↑ Microsoft Translator brings end-to-end speech translation to everyone with the world's first Speech Translation API (англ.).
- ↑ Microsoft Translator — Перевод текста. Microsoft (13 ноября 2025).
- ↑ "Microsoft Research- Machine Translation". (англ.).
- ↑ What is neural network based translation? (англ.). Дата обращения: 28 ноября 2016. Архивировано из оригинала 8 февраля 2021 года.
- ↑ A Discriminative Framework for Bilingual Word Alignment (англ.). Архивировано из оригинала 20 июля 2008 года.
- ↑ Using Word Dependent Transition Models in HMM based Word Alignment for Statistical Machine Translation (англ.).
- ↑ Microsoft Translator Hub: Discussion of BLEU Score (англ.) (23 мая 2013).
- ↑ Microsoft Translator запускает переводы на основе нейронных сетей для всех речевых языков (16 ноября 2016).
- ↑ Коды языков переводчика (18 июля 2023).
- ↑ Поиск Microsoft Translator. www.bing.com. Дата обращения: 19 декабря 2024.