Подписывайтесь на Газету.Ru в Telegram Публикуем там только самое важное и интересное!
Новые комментарии +

Трудности перевода: как нейросеть разжигает вражду

Палестинца арестовали из-за ошибки перевода Facebook

В Израиле после публикации в Facebook был арестован палестинский рабочий — он пожелал всем доброго утра, но после перевода нейросети безобидная фраза превратилась в призыв к разжиганию межнациональной розни. «Газета.Ru» вспоминала другие досадные ошибки машинного перевода, которые сеяли раздор между нациями.

Выпил кофе и в тюрьму

Житель Палестины Халавим Халави был арестован израильской полицией после того, как опубликовал запись в Facebook с пожеланием доброго утра на арабском, сообщает International Business Times.

Халави, на текущий момент работающий строителем, выложил свою фотографию на фоне бульдозера с чашкой кофе в руке и подписал ее: «с добрым утром». Снимок сделан в израильском поселении Бейтар-Илит, в котором и трудился Халави.

Автоматическая система перевода Facebook, работающая на базе нейросетей, перевела дружелюбную фразу на иврит и английский язык своеобразно — «напади на них » и «навреди им» соответственно.

Так как бульдозеры ранее использовались в террористических атаках, правоохранительные органы Израиля заинтересовались публикацией и задержали Халавима Халави по подозрению в подстрекательстве.

Как выяснилось, арабское простонародное выражение «всем доброго утра» и фраза «навреди им» различаются всего одной буквой, из-за чего нейросеть и допустила фатальную ошибку. Спустя несколько часов допроса полиция отпустила палестинца. Публикация, которая привела к аресту невиновного человека, более недоступна на Facebook.

В августе 2017 года Facebook объявила о том, что в социальную сеть был внедрен машинный перевод с помощью нейросетей, которые автоматически переводят контент сайта с одного языка на другой. Многие технологические компании, включая Microsoft и Google постепенно переключаются на подобную систему перевода и отказываются от традиционной машинной модели, что ускоряет и улучшает результат.

Тем не менее, перевод с помощью нейросетей пока далек от идеала и периодически выдает ошибки, которые вряд ли допустил бы человек.

Орки из Мордора

В прошлом году переводчик от Google тоже был замечен в неправильной интерпретации слов. Так, пользователи интернета обратили внимание на то, что при переводе с украинского языка слово «Россия» превращалось в «Мордор» — вымышленное владение сил зла из саги Джон Р. Р. Толкина «Властелин колец».

Кроме того, «россияне» стали «оккупантами», а фамилия министра иностранных дел Сергея Лаврова была переведена как «грустная лошадка».

Неожиданный перевод появился в системе на фоне ухудшения отношений между Российской Федерацией и Украиной после присоединения Крыма в 2014 году.

Google объяснила «трудности перевода» технической ошибкой, заявив, что перевод генерируется автоматически, используя сотни миллионов примеров из других текстов и документов, чтобы сделать перевод более релевантным. Компания добавила, что даже в похожих языках, как русский и украинский, система может давать сбои, так как значение слов зачастую зависит от контекста.

Тем не менее, официальная версия звучит не очень правдоподобно, так как пользователи имеют возможность предлагать свои варианты перевода, если им не понравится версия, предложенная машиной. В таком случае не исключена спланированная акция при участии людей, которые намеренно пытались «переучить» систему и заставить ее выдавать некорректный перевод.

Мат по-китайски

Не избежал порицания и сервис Skype, который осуществляет перевод на базе Microsoft Translator. Из-за несовершенства системы программа начала автоматически добавлять ругательства в перевод на китайский язык.

Фотограф Том Картер, который должен был участвовать в международной рекламе Skype, заявил о неудачном опыте общения с китайским мужчиной, который должен был помогать ему со съемкой.

Безобидная фраза «рад познакомиться» в интерпретации машинного перевода сохранила смысл, но добавила непонятно откуда взявшуюся обсценную лексику практически перед каждым отдельным словом.

Skype пришлось извиниться и сообщить, что переводчик находится в стадии бета-тестирования, поэтому качество перевода будет только улучшаться в дальнейшем. При этом не стоит забывать о том, что иероглифические языки — китайский, корейский или японский — сильно отличаются от языков, основанных на латинском алфавите, поэтому достичь точного перевода бывает трудно вне зависимости от мощности нейросети.

Новости и материалы
Песков рассказал о борьбе с фейками СМИ Запада
В Саранске ребенку едва не оторвало пальцы взрывом петарды
Пользователям Windows 11 стала доступна шпионящая за ними функция Recall
Банки ОАЭ перестали обслуживать карты Газпромбанка системы UnionPay
Стал известен результат психиатрической экспертизы певца Шарлота
Туристы с ребенком заблудились ночью в лесу Краснодарского края
В Курской области нашли уникальный старинный кинжал
Chrysler выпустит новый минивэн через три года
Иранский аналитик прокомментировал применение Россией ракеты «Орешник»
В Японии показали «человеческую стиральную машину будущего»
Стало известно об аукционе на билеты на «Щелкунчика» в Большом театре
В США заявили, что на Украине мало финансирования и мощностей для создания ракет
Стало известно, насколько подорожали цветы за год
Сломавший ногу Овечкину хоккеист испытывает чувство вины
«Давно рожать пора»: протоиерей Ткачев обвинил Запад в позднем взрослении детей
Фермеры Польши заблокировали КПП на границе с Украиной
Европе предрекли новый газовый кризис
Песков рассказал об отсутствии свободы слова на Западе
Все новости