Почему роботы «Газеты.Ru» боятся дождей

Как пометки о запрете или присвоении статуса иноагента появляются рядом с безобидными словами

Даша Зайцева/«Газета.Ru»
В соцсетях заметили, что в тексте новости «Газеты.Ru» песня Марины Хлебниковой «Дожди» была названа «иноагентом». Ошибка была исправлена через несколько минут, но мы считаем нужным объяснить, почему так произошло, и рассказать, какие подобные ошибки случались с нами раньше.

Почему так происходит

Согласно ст. 4 закона РФ «О средствах массовой информации», СМИ не имеют права упоминать организации или объединения, признанные на территории страны экстремистскими, без указания, что они либо ликвидированы, либо их деятельность запрещена. То же касается упоминания организаций и лиц, включенных в реестр иностранных агентов. За нарушение этих правил может грозить штраф до 50 тыс. рублей.

Несколько лет назад «Газета.Ru», как и многие прочие СМИ, запустила на сайте систему, которая автоматически добавляет необходимые пометки при упоминании организаций из списков Минюста и ФСБ. Учитывая объемы контента, производимого изданием, это единственный способ застраховаться от человеческой ошибки, грозящей денежным штрафом. Но поскольку некоторые организации, произведения, географические объекты и даже граждане именуются практически идентично с запрещенными или с иноагентами, бот по ошибке может помечать и их. Как в случае с песней Марины Хлебниковой, которую робот записал в «иноагенты».

\«Газета.Ru\»

Как говорит технический директор «Газеты.Ru» Алексей Карпов, одна из основных проблем при функционировании бота заключается в том, что ряд запрещенных организаций имеет достаточно «ходовые» названия — в частности, «Братство» (организация, напомним, запрещена в России). При этом минимизируются подобные случаи несколькими способами: единым написанием запрещенных объединений, базой исключений, машинным обучением, автоматическим принятием в расчет предыдущих и последующих слов, а также, конечно, непосредственно редакторской коррекцией.

Кого «запрещал» робот

Фармаколог Олег Талибов

\«Газета.Ru\»

В материале 2020 года об опасности мефлохина при профилактике COVID-19 приводилось экспертное мнение клинического фармаколога Олега Талибова, которого бот, перепутав с участниками запрещенного в России «Талибана», назвал «запрещенной организацией». Хотя сам эксперт ничего запретного не говорил — лишь уточнил, что препарат может негативно повлиять на работу печени и центральной нервной системы.

Река в Тульской области

\«Газета.Ru\»

Годом ранее в авторской колонке о региональных выборах упоминалась река Упа — правый приток Оки. Однако робот счел ее запрещенной по аналогии с (действительно запрещенной законом) экстремистской организацией «Украинская повстанческая армия» (УПА). К слову, схожая ситуация с Упой произошла и в ряде других изданий.

МЧС по Новосибирской области

\«Газета.Ru\»

В новости про пожар в Новосибирске, произошедшем в 2020 году на территории местного крематория, бот усмотрел следы запрещенного в РФ «Национал-социалистического общества» (НСО). А все потому, что в тексте региональное МЧС было упомянуто как «МЧС по НСО» — Новосибирской области.

Атаки на американских дипломатов

\«Газета.Ru\»

В 2018-м робот ошибся при автоматическом тегировании новостного материала о якобы причастности России к атаке на дипломатов США в Китае. В данном случае система перепутала само слово «атака» и одноименное объединение, запрещенное в России.

Кетчуп

\«Газета.Ru\»

В случае с цитатой вратаря «Спартака» Артема Реброва, который рассказывал о рационе одноклубников, под автоматический запрет внезапно попал кетчуп. Здесь у робота произошел технический сбой — вероятно, он считал в названии соуса ту же запрещенную УПА.

Что еще может смутить робота

Например, фильм Павла Лунгина «Братство», рассказывающий о выводе советских войск из Афганистана, — в России запрещена одноименная организация. Или же «Сеть» — речь о множественных фильмах и песнях с таким названием.

Пострадать может и Павел Воля, так как на территории РФ запрещена и ликвидирована политическая партия с идентичным фамилии шоумена названием. А вот коллегам из спортивного отдела — при описании событий того или иного матча — следует избегать упоминания «правого сектора штрафной».