Выпил кофе и в тюрьму
Житель Палестины Халавим Халави был арестован израильской полицией после того, как опубликовал запись в Facebook с пожеланием доброго утра на арабском, сообщает International Business Times.
Халави, на текущий момент работающий строителем, выложил свою фотографию на фоне бульдозера с чашкой кофе в руке и подписал ее: «с добрым утром». Снимок сделан в израильском поселении Бейтар-Илит, в котором и трудился Халави.
Автоматическая система перевода Facebook, работающая на базе нейросетей, перевела дружелюбную фразу на иврит и английский язык своеобразно — «напади на них » и «навреди им» соответственно.
Так как бульдозеры ранее использовались в террористических атаках, правоохранительные органы Израиля заинтересовались публикацией и задержали Халавима Халави по подозрению в подстрекательстве.
Как выяснилось, арабское простонародное выражение «всем доброго утра» и фраза «навреди им» различаются всего одной буквой, из-за чего нейросеть и допустила фатальную ошибку. Спустя несколько часов допроса полиция отпустила палестинца. Публикация, которая привела к аресту невиновного человека, более недоступна на Facebook.
В августе 2017 года Facebook объявила о том, что в социальную сеть был внедрен машинный перевод с помощью нейросетей, которые автоматически переводят контент сайта с одного языка на другой. Многие технологические компании, включая Microsoft и Google постепенно переключаются на подобную систему перевода и отказываются от традиционной машинной модели, что ускоряет и улучшает результат.
Тем не менее, перевод с помощью нейросетей пока далек от идеала и периодически выдает ошибки, которые вряд ли допустил бы человек.
Орки из Мордора
В прошлом году переводчик от Google тоже был замечен в неправильной интерпретации слов. Так, пользователи интернета обратили внимание на то, что при переводе с украинского языка слово «Россия» превращалось в «Мордор» — вымышленное владение сил зла из саги Джон Р. Р. Толкина «Властелин колец».
Кроме того, «россияне» стали «оккупантами», а фамилия министра иностранных дел Сергея Лаврова была переведена как «грустная лошадка».
Неожиданный перевод появился в системе на фоне ухудшения отношений между Российской Федерацией и Украиной после присоединения Крыма в 2014 году.
Google объяснила «трудности перевода» технической ошибкой, заявив, что перевод генерируется автоматически, используя сотни миллионов примеров из других текстов и документов, чтобы сделать перевод более релевантным. Компания добавила, что даже в похожих языках, как русский и украинский, система может давать сбои, так как значение слов зачастую зависит от контекста.
Тем не менее, официальная версия звучит не очень правдоподобно, так как пользователи имеют возможность предлагать свои варианты перевода, если им не понравится версия, предложенная машиной. В таком случае не исключена спланированная акция при участии людей, которые намеренно пытались «переучить» систему и заставить ее выдавать некорректный перевод.
Мат по-китайски
Не избежал порицания и сервис Skype, который осуществляет перевод на базе Microsoft Translator. Из-за несовершенства системы программа начала автоматически добавлять ругательства в перевод на китайский язык.
Фотограф Том Картер, который должен был участвовать в международной рекламе Skype, заявил о неудачном опыте общения с китайским мужчиной, который должен был помогать ему со съемкой.
Безобидная фраза «рад познакомиться» в интерпретации машинного перевода сохранила смысл, но добавила непонятно откуда взявшуюся обсценную лексику практически перед каждым отдельным словом.
Skype пришлось извиниться и сообщить, что переводчик находится в стадии бета-тестирования, поэтому качество перевода будет только улучшаться в дальнейшем. При этом не стоит забывать о том, что иероглифические языки — китайский, корейский или японский — сильно отличаются от языков, основанных на латинском алфавите, поэтому достичь точного перевода бывает трудно вне зависимости от мощности нейросети.