Нейросеть Сбера обучили распознавать запросы пользователей по изображениям

GigaChat научился распознавать изображения

insta_photos/Shutterstock/FOTODOM

Сбер расширил возможности своей нейросетевой модели — GigaChat Pro научилась распознавать запросы пользователей по изображениям. Об этом сообщает пресс-служба банка.

Как рассказал старший вице-президент, руководитель блока «Технологическое развитие» Сбера Андрей Белевцев, нейросеть обрела новую модальность, которая расширила способы и сферы применения больших языковых моделей. По его словам, мультимодальность стала ключевым направлением развития генеративного искусственного интеллекта.

Нейросеть получила возможность распознавать иллюстрации, печатный и рукописный текст, формулы, графики и таблицы. Отмечается, что сервис использует их как дополнительный контекст, а также анализирует данные, которые в них содержатся.

«Это не просто еще один важный шаг в развитии нашего сервиса, он открывает широкий спектр новых возможностей для наших пользователей. В том числе появляется много сценариев использования GigaChat API для бизнеса», — сказал Белевцев.

Кроме того, программный интерфейс (API) позволяет использовать функционал сервиса бизнес-клиентам. Для компании был расширен список сценариев использования искусственного интеллекта. Например, он поможет модерировать и классифицировать отзывы, систематизировать медиаконтент и автоматизировать линию поддержки.

Также в четыре раза был увеличен размер контекста для GigaChat Pro и GigaChat Lite. Теперь максимальный объем запроса вырос до 60 страниц. Кроме того, у моделей повысился уровень математических знаний.

«Увеличение размера контекста системы в четыре раза позволит поддерживать более длинные диалоги с пользователями и проще реализовывать кейсы с механикой RAG», — подчеркнул Белевцев.