Дорого и реалистично
Накануне стало известно, что часть выступления гендиректора компании Nvidia Дженсена Хуанга на конференции GTC 2021 проводил не он сам, а его виртуальный двойник. Создание такой цифровой копии, с возможностью изменения речи и движений в режиме реального времени, потребует от заказчика $50 тыс., рассказал основатель и директор по развитию компании Промобот Олег Кивокурцев.
«Это работает так: сначала строится 3D-модель тела, затем телу присваиваются маркеры в программе, позволяющей делать моушен-дизайн [анимацию]», — сообщил Кивокурцев.
Для модели также может проводиться цифровизация синтеза речи. «Человек наговаривает примерно 100 часов, и на этой основе строится речевой синтаксис, который позволит воспроизводить любые фразы. Далее это соединяется [с моделью]», — пояснил специалист.
Лишь создание достаточно реалистичной текстуры человека может занять до месяца, а дальше необходимо работать с лицевой мимикой и голосом, объяснил в свою очередь глава HoloGroup Александр Якубов.
«Если нужно сделать качественно, неотличимо от реального человека, необходимо серьезное оборудование. Сумма может подняться до $100 тыс.» — констатировал основатель Промобота.
Кивокурцев уточнил, что полноценная цифровая модель будет жестикулировать, а при речи — открывать рот в соответствии с текстом. Самое дорогое в этой работе — построение 3D-модели и рендеринг.
Альтернативой 3D-анимации для сохранения качества и ускорения сроков может стать волюметрическое видео, добавил Якубов.
Волюметрическое, то есть объемное, видео — это виртуальное пространство, в котором участник способен перемещаться вокруг других людей, ранее заснятых на камеру. Для таких проектов пока мало студий, а также необходима обработка ролика после съемки, в том числе деятельность 3D-дизайнера.
Эксперт оценил производство анимированной цифровой модели в десятки тысяч долларов в зависимости от качества выполненной работы. Общая сумма затрат может достигать и свыше $100 тыс., заключил Якубов.
По словам Nvidia, виртуальный Хуанг был создан с помощью оцифровки реального руководителя в комнате, наполненной специальными фотоаппаратами. Кухня Хуанга, которая с начала пандемии стала новой площадкой для выступлений Nvidia, также была полностью создана на компьютере.
В один из моментов презентации было показано, как Хуанг волшебным образом исчезает, а его кухня разделяется на несколько разных 3D-моделей реальных предметов.
«Чтобы создать виртуального Дженсена, команды провели полное сканирование его лица и тела для 3D-модели, затем обучили искусственный интеллект имитировать его жесты и выражения», — говорится в блоге компании. В Nvidia объяснили свои действия желанием удивить аудиторию и заставить зрителей усомниться в том, какая часть основного выступления была реальной, а какая — виртуальной.
Просто и доступно
Есть способ создать двойника подешевле. 12 августа в открытии российского форума «Цифровая эволюция» участвовал губернатор Калужкой области Владислав Шапша. Представила главу региона его собственная голограмма.
Олег Кивокурцев из компании Промобот отметил, что способ губернатора Калужской области достаточно легко реализовать в техническом плане.
«Производится видеозапись на зеленом фоне и с помощью проектора проецируется на сетку. Голос записан ранее и дается через динамики», — сообщил специалист.
Кивокурцев уточнил, что стоимость такого проекта крайне мала: около трех тысяч рублей — оператору за видеосъемку.
Генеральный директор HoloGroup Александр Якубов в свою очередь отметил, что есть и другие достаточно простые способы подобных проекций: голографические пирамиды (изображение появляется на поверхности прозрачной геометрической фигуры) и пленки обратной проекции (показывает через проектор картинку на стеклах).
Шапша впоследствии рассказал, что у его виртуальной копии есть и преимущества.
«Она может не спать, не есть, работать практически круглосуточно. Копия получилась очень общительная. Собеседник прекрасный, покладистый, не спорит», — заметил губернатор.
Глава региона добавил, что есть много способов использования подобной технологии, и выразил надежду, что технический прогресс не лишит людей потребности «глядеть друг другу в глаза».