Специалисты Сбера и Института AIRI опубликовали статью «Ограничения языковых моделей в понимании химии: исследование на примере задачи описания молекул», в которой доказали, что химические языковые модели пока неустойчиво работают с описанием молекул и предсказанием результатов химических реакций, сообщает пресс-служба Сбера.
Как отметил старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка Андрей Белевцев, ученые заинтересованы в развитии подобных языковых моделей.
«Чтобы повысить надежность нейросетевых химических моделей, необходимо кардинально пересмотреть подход к автоматической обработке химических данных», — сказал он.
В исследовании отмечается, что даже незначительные изменения входного слова понижают достоверность описания ИИ-модели, увеличивая количество ошибок.
По словам генерального директора Института искусственного интеллекта AIRI, профессора Сколтеха Ивана Оселедца, для улучшения ИИ-модели необходимо глубже исследовать и моделировать все потенциальные сценарии использования языковой модели в химии.
«Изучая, как LLM выполняют конкретные задачи, можно повысить их точность, эффективность и надежность», — сказал он.
Авторы исследования планируют разработать метрику для сопоставления представлений молекул в скрытых слоях сетей.
По словам ученых, в будущем благодаря языковым моделям появится возможность ускорить разработку новых лекарств.