Специалисты Института искусственного интеллекта AIRI совместно с коллегами из МФТИ разработали архитектуру RMT – Recurrent Memory Transformer – для ранее разработанной в России нейросети GENA. Об этом «Газете.Ru» рассказала биоинформатик, научный сотрудник и руководитель группы «Биоинформатика» AIRI Ольга Кардымон.
Нейросеть GENA может анализировать последовательности ДНК и искать в них закономерности. Ее можно использовать для определения влияния мутаций на работу генов, поиска различных участков генома, классификации живых организмов на основе данных секвенирования и прочих задач.
«Первый вариант GENA работает с длиной приблизительно в 3000 нуклеотидов, вторая архитектура модели позволяет на вход подавать 24000 нуклеотидов. Обе модели уже выложены в открытый доступ и доступны мировому сообществу. У нас есть своя новая собственная архитектура, разработанная в AIRI совместно с коллегами из МФТИ, называется RMT – Recurrent Memory Transformer. Она потенциально может работать с неограниченной длиной последовательности текста, на ряде задач успешно справляется с длинами в 1-2 миллиона букв», – объяснила Кардымон.
По словам специалиста, увеличение длины анализируемой нейросетью последовательности ДНК — крайне важная для ученых задача.
«Потому что нужно понимать контекст, в котором есть мутации. Чем длиннее мы даем последовательность, тем больше нейросеть может в ней увидеть и выучить какие-то закономерности. Наша задача и состоит в том, чтобы увеличить последовательность, которую может анализировать нейросеть», – добавила биоинформатик.
Подробнее о том, как нейросети ищут мутации в геноме человека, создают не существовавшие ранее в природе белки и предсказывают эффективность вакцин и лекарств – в материале «Газеты.Ru».