Российские компьютерные лингвисты смогли автоматически составить самый большой компьютерный словарь паронимов русского языка — слов, похожих по форме, но разных по значению, сообщает РИА «Новости».
Правильное употребление таких слов, как, например, «адресат» и «адресант», часто вызывает трудности. «У (нового) словаря есть как минимум два приложения — исправление ошибок в тексте и обучение правильному употреблению паронимов в разных контекстах», — сказала соавтор исследования, сотрудник факультета вычислительной математики и кибернетики МГУ Елена Большакова, представившая результаты работы на конференции по компьютерной лингвистике «Диалог».
Исследователи определили паронимы как однокоренные слова одной части речи, имеющие определенные отличия в приставках и суффиксах — например, «добровольный» и «добровольческий». Степень различия слов, при которой они еще достаточно схожи, чтобы считаться паронимами, ученые нашли, анализируя самый большой печатный словарь паронимов русского языка, который содержит 1100 паронимических рядов из 2-7 слов.
В качестве материала для построения компьютерного словаря паронимов ученые использовали созданный ими же словарь однокоренных слов с 23 тысячами единиц. На основании введенных ими критериев, компьютер выбрал среди паронимов 192 тысячи слов, которые составили почти 22 тысячи статей словаря.