«Школьники уже вовсю участвуют в развитии ИИ в России»: в Москве прошел финал НТО

Вице-президент Сбербанка Максим Еременко рассказал о финальном этапе НТО по профилю «Искусственный интеллект»

100%

Вице-президент Сбербанка Максим Еременко

Пресс-служба Сбера

В Москве прошел финал совместного профиля «Искусственный интеллект» (ИИ) Национальной технологической олимпиады (НТО) и Академии искусственного интеллекта для школьников Благотворительного фонда Сбербанка «Вклад в будущее». В этом году старшеклассники разработали алгоритм, способный анализировать видео и отвечать на вопросы по его содержанию. Задачи были сформулированы при экспертной поддержке команды Sber AI. О перспективах применения ИИ в нашей жизни, финальном задании и работе Сбера в области развития передовых технологий рассказал вице-президент, директор Департамента развития искусственного интеллекта и машинного обучения Сбербанка Максим Еременко.

— Сбер уже несколько лет поддерживает профиль «Искусственный интеллект» Национальной технологической олимпиады. По вашим оценкам, насколько популярен профиль среди молодежи?

— Школьные олимпиады — отличная возможность протестировать свои навыки и даже выбрать будущую профессию. Сбер поддерживает и сами интеллектуальные соревнования, которые проходят в духе честной борьбы и спортивного азарта, и их участников, которые планируют связать свою жизнь с миром науки и информационных технологий.

Идея популяризации искусственного интеллекта среди учащихся школ появилась в 2017 году. Тогда Благотворительный фонд Сбербанка «Вклад в будущее» создал Академию искусственного интеллекта для школьников. Проект начался с просветительских уроков, которые завершились хакатоном по машинному обучению. С 2019 года хакатоны стали уже ежегодными соревнованиями в рамках Олимпиады КД НТИ (Национальная технологическая олимпиада с 2021 г. — Прим. ред.), положив начало новому профилю «Искусственный интеллект». А сегодня это уже олимпиада второго уровня, где победители получают преференции при поступлении в ведущие вузы.

В этом году на олимпиаду зарегистрировались 6150 старшеклассников, больше сотни из них прошли в финал.

И это ребята не только из России, но и из Беларуси, Казахстана, Индии и других стран. Всего за четыре года проведения профиля в нем приняли участие 21 тыс. человек. Думаю, есть все основания полагать, что тема искусственного интеллекта с каждым годом будет все больше интересовать ребят.

— В чем отличие профиля «Искусственный интеллект» от других?

— Профиль «Искусственный интеллект» — одно из самых сложных, но в то же время и самых интересных направлений, в котором мы наблюдаем нетривиальный подход и яркие идеи. С каждым годом я вижу все больше желания и огня в глазах ребят. У нас очень талантливые школьники, и они уже всерьез участвуют в развитии ИИ в нашей стране и драйвят это направление.

По результатам профильного тура команды-победители получат приглашения на стажировку в Сбер и компании-партнеры по направлению «Машинное обучение». А лучших финалистов мы пригласим в сообщество амбассадоров и менторскую программу, в которой опытные IT-специалисты помогают школьникам достигать поставленных целей в сфере ИИ. Мы заинтересованы в талантливых и мотивированных ребятах, которые хотят работать в сильной и надежной технологической компании.

— В этом году задачей финала стала разработка решения ИИ по анализу видео. Расскажите подробнее про задание.

— В этом году соревнования, как и прежде, проходили в несколько этапов с нарастающей сложностью. Мы предложили участникам различные задачи по анализу видеопоследовательностей. Это направление в области компьютерного зрения активно развивается. Сегодня уже появляются генеративные модели для создания видео по описаниям, быстрого поиска информации на видео и многого другого.

На первом этапе участникам предлагалось разработать классификатор видео по его содержанию. Затем мы провели хакатон, где ребята разрабатывали модель, которая позволяла строить текстовое описание видео на естественном языке. Наконец, в финальном испытании, подготовленном при участии специалистов Sber AI, ребята создали алгоритм, который анализирует видео и отвечает на вопросы по его содержанию. Причем это ответы не только на закрытые вопросы типа «да/нет», но и на открытые вопросы, где ответ не был фиксирован. Например: «Что делает человек на видео?» или «Сколько врачей на видео?» и так далее.

— Сбер уделяет большое внимание популяризации ИИ среди молодежи. Какие проекты вы реализуете? Есть ли у вас стажировки для молодежи по ИИ?

— В прошлом году более 1250 студентов прошли стажировку в Сбере, а больше половины из них уже работают у нас. Самые популярные среди ребят направления — Data Science, Java и бизнес-анализ. Они учатся в ведущих российских вузах по IT-направлениям, техническим, экономическим, юридическим и другим специальностям. Мы развиваем сотрудничество с НИУ ВШЭ, МГУ имени М. В. Ломоносова, МГТУ имени Н. Э. Баумана, МИРЭА, МФТИ, МИФИ. Всего у Сбера свыше 300 партнерских вузов по всей стране.

Возможность попасть на стажировку есть у студентов всех уровней образования, мы создаем возможности для совмещения учебы и работы.

Несколько лет назад открылась стажировка и для талантливых школьников — победителей конкурсов и олимпиад, а также для студентов образовательного проекта «Школа 21». В зависимости от целей и задач стажировки могут длится от трех до шести месяцев, а ребята также получают хорошую финансовую поддержку на старте карьеры.

Кроме того, семь лет подряд мы проводим международную конференцию Artificial Intelligence Journey (AI Journey), посвященную развитию технологий в России, с участием лучших экспертов в области ИИ, для всех, кто интересуется этой темой, включая студентов. А с 2020 года проводим отдельный трек для школьников — AIJ Junior.

— Вы возглавляете Департамент развития искусственного интеллекта и машинного обучения Сбера. Как развивается это направление в банке?

— Один из основных трендов в исследованиях ИИ — обучение мультимодальных, мультизадачных и мультиязыковых моделей, способных быстро и качественно решать разные задачи. Они включают понимание и распознавание языков, работу с текстами, картинками, звуком и другими данными. Вместе с нашим научным партнером — Институтом искусственного интеллекта AIRI — мы работаем над созданием новых мультимодальных архитектур, которые могут решать сразу несколько задач. Модели такого типа могут одновременно работать как с текстовыми задачами (и, например, выполнять суммаризацию текста), так и решать задачи расшифровки аудио и синтеза ответов на вопросы по видео.

За последний год выросла популярность text2image-моделей, позволяющих воплощать в жизнь любые творческие задумки. У Сбера есть свои нейросети, создающие любой образ по текстовому описанию: Kandinsky и Kandinsky 2.0. Последняя основана на диффузионной архитектуре. Уже сейчас с помощью этих моделей создаются отдельные элементы дизайна для различных мероприятий и выставок, а также реализовано несколько интересных коллабораций и созданы необычные продукты для наших клиентов.

Наша команда также продолжает развивать собственные трансформерные архитектуры для решения ряда задач в нескольких модальностях. В ходе исследований мы изучаем возможности диалогового общения с пользователем, используя не только текст, но и изображения.

— ИИ проник уже почти во все сферы жизни. Что сейчас наиболее актуально в этом направлении?

— Искусственный интеллект — это не только основа передовых и высокотехнологичных продуктов, но и помощник в прорывных научных исследованиях. Создание некоторых продуктов и сервисов сегодня уже просто невозможно без искусственного интеллекта.

Технологии ИИ давно интегрированы во внутрибанковские процессы. Кредитный скоринг, рекомендательная платформа, виртуальные ассистенты — эти и другие сервисы daily banking повышают уровень комфорта клиентов.

Сейчас можно выделить несколько основных трендов. Во-первых, это обучение больших мультимодальных моделей, прежде всего подобных трансформерам GPT по архитектуре. Уже сейчас такие модели, как ChatGPT, меняют целые рынки, и мы видим большие перспективы применения подобной технологии в наших продуктах и сервисах. Совместно с коллегами из других подразделений банка и SberDevices мы разрабатываем собственную большую языковую модель, а скоро ее можно будет протестировать.

Во-вторых, классические трансформеры, как и относительно новые диффузионные модели, в процессе обучения и дообучения становятся эффективнее. Их можно применять для решения задач разного класса. Например, генеративные модели способны создавать по текстовому описанию не только картинку, но и видео. Таким образом, это еще один технологический шаг для создания контента для метавселенных.

Наконец, одна из важных научно-исследовательских задач — движение к сильному искусственному интеллекту (AGI). Такая технология будет способна решать сложные составные задачи из жизни человека, понимать и анализировать его эмоции, помогать в быту. В качестве примера можно вспомнить персонажа Джарвиса из фильма «Железный человек».