«Яндекс.Переводчик» начал использовать нейросеть





Яндекс.Переводчик начал использовать гибридную систему перевода. К статистическому переводчику добавилась технология перевода на основе нейронной сети. Теперь перевод выполняют обе модели, а затем алгоритм на основе метода машинного обучения CatBoost сравнивает результаты и предлагает лучший. Об этом рассказывается в блоге Яндекса, где отмечается, что у нейросетевого перевода есть свои недостатки.

«У нейросетевого перевода тоже есть свои недостатки. Если по каким-то причинам нейронной сети трудно перевести то или иное предложение — а такое время от времени случается, — она поведёт себя примерно как студент на экзамене: начнёт что-то выдумывать от себя в надежде угадать правильный ответ.

Кроме того, нейросеть не всегда хорошо справляется с переводом мало распространённых имён, топонимов и других редких слов. Зато для статистического перевода, как вы помните, это нетрудная задача — если слово было в параллельных текстах, машина его запомнит. Мы решили объединить два подхода и создать гибридную систему, которая объединяет статистический и нейросетевой перевод. Работая вместе, две системы компенсируют недостатки друг друга.

Когда Яндекс.Переводчик получает от пользователя текст, он отдаёт его на перевод обеим системам — и нейронной сети, и статистическому переводчику. Затем алгоритм, основанный на методе обучения CatBoost, оценивает, какой перевод лучше. При выставлении оценки учитываются десятки факторов — от длины предложения (короткие фразы лучше переводит статистическая модель) до синтаксиса. Перевод, признанный лучшим, показывается пользователю.

Сейчас гибридная система используется для переводов с английского языка на русский. Это самое популярное направление: на него приходится около 80% всех запросов к Яндекс.Переводчику. В ближайшие месяцы мы включим систему и для других направлений. Чтобы было интереснее, мы добавили в веб-версию Переводчика переключатель — с его помощью можно сравнить гибридный и статистический переводы и понять, чем они различаются.»

Автор: Softodrom.ru
Дата:
Новые статьи: Интернет
05.08.2020 21:02

Боярский внесет в Госдуму законопроект о борьбе с травлей в Интернете

В Госдуму будет внесен законопроект о борьбе с преследованием в Интернете, предусматривающий введение института судебного запрета

05.08.2020 12:54

Twitter грозит штраф до $250 млн за использование данных пользователей

Федеральная торговая комиссия США подозревает Twitter в нарушении соглашения о неразглашении личных данных

04.08.2020 19:34

72% россиян хотят остаться на удаленке

Почти три четверти российских офисных сотрудников хотели бы продолжить работать дистанционно и после окончания пандемии

04.08.2020 16:24

Искусственный интеллект отследит фейковые новости за 94 млн руб.

Реализовать проект по выявлению фейковых новостей предполагается в рамках федерального проекта «Искусственный интеллект», затраты на него оцениваются в 94,3 млн руб.

03.08.2020 22:07

Вышел новый трейлер фильма «Новые мутанты» из серии «Люди Икс»

Изначально планировалось, что премьера фильма «Новые мутанты» состоится в апреле 2018 года, однако затем сроки выхода несколько раз переносились

Популярное: Интернет
05.08.2020 21:02

Боярский внесет в Госдуму законопроект о борьбе с травлей в Интернете

В Госдуму будет внесен законопроект о борьбе с преследованием в Интернете, предусматривающий введение института судебного запрета

05.08.2020 12:54

Twitter грозит штраф до $250 млн за использование данных пользователей

Федеральная торговая комиссия США подозревает Twitter в нарушении соглашения о неразглашении личных данных

03.08.2020 22:07

Вышел новый трейлер фильма «Новые мутанты» из серии «Люди Икс»

Изначально планировалось, что премьера фильма «Новые мутанты» состоится в апреле 2018 года, однако затем сроки выхода несколько раз переносились

04.08.2020 16:24

Искусственный интеллект отследит фейковые новости за 94 млн руб.

Реализовать проект по выявлению фейковых новостей предполагается в рамках федерального проекта «Искусственный интеллект», затраты на него оцениваются в 94,3 млн руб.

04.08.2020 19:34

72% россиян хотят остаться на удаленке

Почти три четверти российских офисных сотрудников хотели бы продолжить работать дистанционно и после окончания пандемии

utrennik
utrennik, 15.09.2017 16:27
Тындекс.Переводчик начал использовать нейросеть Гугл Переводчика? :)
» Прочитать остальные / Написать свой комментарий

Новости /
Интернет /
«Яндекс.Переводчик» начал использовать нейросеть
Все рубрики статей:
Статистика | Рейтинги | Авторам | Реклама
Copyright © 1999-2020 Softodrom.ru
О перепечатках | Рассылки | Пользовательское соглашение | Политика конфиденциальности | О проекте | Карта сайта
Яндекс.Метрика