Ученые из Института искусственного интеллекта AIRI научили ИИ узнавать персонажей книг Джона Рональда Руэла Толкина по их репликам и описаниям, а также определять характер взаимоотношений между ними. Об этом «Газете.Ru» рассказали в AIRI.
Для обучения исследователи взяли работы Джона Рональда Руэла Толкина и опубликованные после смерти писателя записи под редакцией его сына. В список вошли «История Средиземья», «Властелин колец» и «Хоббит».
С помощью токенизации исследователи извлекли из текста 156482 предложения и в режиме «ручной настройки» получили список из 518 имен, 15 расовых лейблов и биографических фактов. После уточнения списка общее количество наименований для анализа составило 880.
Затем ученые описали алгоритм автоматического анализа произведений. Содержащийся в исследовании набор шагов можно использовать для решения ряда практических задач. Например, проводить анализ нормативной документации и суммаризацию юридических текстов, чтобы переписывать сложные документы простым и понятным обычному человеку языком.
Технология применима для обучения диалоговых ботов и переводчиков, а также поможет сэкономить время при поиске информации в больших объемах текста.