Софтодром   
Windows Программы для Windows
Linux Программы для Linux
Android Приложения для Android
iOS Приложения для iPhone

Новости  Форумы

«США не виновата»: Google рассказал о багах в переводчике



Новости    Интернет


Михаил Дайчик, менеджер технических программ Google, рассказал в корпоративном блоге поисковика о том, как он исправлял баг в переводчике Google.

Недавно была обнаружена ошибка в Переводчике Google, из-за которой однотипные фразы " is to blame" переводились одним из трех случайных вариантов: " виноват", " в этом виноват" и, что самое неприятное, " не виноват".

Эту ошибку, в частности, можно было заметить при переводе следующих фраз:

"USA is to blame" - "США не виновата"
"Russia is to blame" - "Россия виновата"
"Google is to blame" - "Google не виноват"
"Italy is to blame" - "Италия виновата"

Для того чтобы объяснить, откуда могла появиться эта ошибка, следует коротко рассказать о том, как работает Переводчик Google и в чем его принципиальное отличие от других средств.

Обычные переводчики, как правило, преобразуют грамматические конструкции из одного языка в другой исходя из жестко прописанных правил.
Примером такого правила может быть "если в оригинале использовалась временная форма present perfect, то в русском переводе нужно использовать соответствующую форму для этого глагола".
Эти правила могут быть сложнее или проще. Могут использоваться правила, распознающие сложные конструкции и меняющие порядок слов в конечном тексте. Но в любом случае в традиционных переводчиках их пишут вручную. У этого подхода есть свои преимущества и недостатки, к которым, в частности, можно отнести нечеловеческую сложность работы, требующейся для того, чтобы покрыть такими правилами все разнообразие языка.

Переводчик Google устроен принципиально иначе. У нас есть набор статистических эвристик, например, "эта последовательность слов обычно переводится так", который дополнен рядом вспомогательных правил, обобщающих группы слов. Этих правил больше, чем можно найти в традиционных словарях, поэтому они не проходят ручную обработку, а генерируются автоматически.

Изначально для обучения Переводчика Google мы взяли набор текстов, переведенных максимально близко к оригиналу. В дальнейшем для усовершенствования правил мы дали пользователям возможность присылать нам переводы тех фраз, которые Переводчик перевел некорректно.

Откуда появились правила, по которым осуществлялся перевод "США не виновата", пока еще до конца не ясно, но мы предполагаем, что из предложений пользователей.
В любом случае, ошибка была устранена в кратчайшие сроки и, надеюсь, не повторится.

Хронология событий:

16:28 Я (Михаил Дайчик) получил сообщение о баге.
16:57 Баг передан команде поддержки. Так как команда поддержки находится в другом часовом поясе, у них была глубокая ночь.
17:32 Баг эскалирован, для чего разбудили инженера из команды технической поддержки Переводчика.
19:18 Фикс готов, тестирование началось.
19:39 Патч начали выкатывать на датацентры.
~ 20:10 Изменения вступили в силу во всем мире.


Автор: Softodrom.ru
Дата:

Новое: Интернет
22.04.2024 20:17

Вышел трейлер фильма «Дэдпул и Росомаха»

Кинокомпания Marvel Studios представила трейлер американского супергеройского фильма «Дэдпул и Росомаха»


22.04.2024 16:37

На Госуслугах появятся электронные студенческие билеты и зачётные книжки

Их можно будет использовать наравне с бумажными, постановление об этом подписало правительство РФ


21.04.2024 10:34

У основателя Telegram Павла Дурова нашли ошибки в английском языке

Одной из заметных ИТ-новостей прошедшей недели стало интервью основателя соцсети «ВКонтакте» и мессенджера Telegram Павла Дурова, которое он дал бывшему ведущему телеканала Fox News Такеру Карлсону


19.04.2024 12:49

Киносети отказались от пиратских фильмов после ультиматума прокатчиков

Из афиш крупных российских сетей кинотеатров практически исчезло так называемое предсеансное обслуживание — в последние два года это был популярный формат показа фильмов ушедших из России голливудских киностудий


17.04.2024 11:42

В Казахстане 447 школ обеспечили интернетом с помощью терминалов Starlink

После установки терминалов Starlink средняя скорость интернета в школах достигает 200 Мбит/с, отметили в Минцифры Казахстана


Популярное: Интернет
03.01.2023 17:02

Как опубликовать свою статью на Софтодроме

Если вы хотите опубликовать свою статью на Софтодроме, то рассказываем о том, какие статьи нам нужны


25.12.2023 14:13

Суд отправил жительницу Петербурга в психбольницу за фейки про армию в соцсети

Калининский районный суд Санкт-Петербурга вынес приговор местной жительнице за фейки в соцсети «ВКонтакте»


26.12.2023 18:10

Доходы пиратов выросли на 71% после ухода Netflix и Голливуда

На фоне роста нелегальных сервисов официальные аудио- и видеостриминговые сервисы находятся в стагнации, отмечают аналитики


27.12.2023 13:09

Фильм «Догмен» Люка Бессона выйдет в российских онлайн-кинотеатрах

Российская премьера нового фильма «Догмен» режиссера Люка Бессона состоится в онлайн-кинотеатрах, но в прокат в обычных кинотеатрах фильм в России не выйдет


24.12.2023 16:49

Ведущий шахматный портал заблокировал Крамника за критику в свой адрес

Российский шахматист в очередной раз раскритиковал руководство платформы из-за отсутствия серьезных мер по борьбе с читерством



Ищете, где скачать бесплатные программы?

Скачать бесплатные программы для компьютера на Windows и смартфона на iOS или Android можно на Софтодроме. На данный момент в каталоге Софтодрома представлено более 13 000 бесплатных программ для Windows, iOS, Android и Linux.
Все рубрики статей (6143 / 109):


Программы для Windows | Приложения для Android | Приложения для iPhone | Программы для Linux
Статистика | Рейтинги | Авторам | Рассылки
Copyright © 1999-2024 Softodrom.ru
Реклама | О проекте | О перепечатках | Пользовательское соглашение | Политика конфиденциальности | Карта сайта