Специалисты выяснили, как с помощью нейросетей создавать трехмерные карты пространства, в которых находятся роботы. Это поможет им избегать столкновений и осуществлять автономную навигацию. Работа проходила в рамках проекта, поддерживаемого Российским научным фондом, а ее результаты были представлены на конференции European Conference on Mobile Robotics, которая проходит 4-7 сентября в Чехии.
Одна из основных мировых тенденций развития сейчас – автоматизация. Машины заменяют человека не только на производстве, но и в быту. Почту начинают доставлять дроны, а на дорогах уже начали тестировать беспилотные машины. Ученые продолжают совершенствовать роботов, разрабатывая новые механизмы, чтобы сделать их эффективнее, а траекторию движения – точнее.
Сотрудники Института проблем искусственного интеллекта ФИЦ «Информатика и управление» РАН исследуют методы и алгоритмы, с помощью которых автоматически строятся планы помещений на основе видео, полученного с камеры, закрепленной на роботе. Даже если система GPS не работает, робот снимает обстановку вокруг себя и по последовательности кадров – видеопотоку – выстраивает план помещения и определяет свое местоположение в нем и пройденную траекторию. Такое «умение» очень важно для обеспечения безопасной автономной навигации при проведении поисково-спасательных работ или при доставке грузов до адресата внутри незнакомого помещения.
Однако камера, хоть и показывает обстановку, не может определить точное расстояние до предметов в пространстве, а это очень важно для построения точной карты. Для решения задачи определения расстояния в последнее время активно используются нейронные сети, которые «учатся» предсказывать расстояние по изображению. Проблема заключается в том, что такие нейросети обычно требуют для своей работы мощного железа, которое не всегда можно установить на мобильного робота (из-за ограничений на грузоподъемность и энерговооруженность). Именно эту проблему и решали сотрудники ФИЦ «Информатика и управление» РАН.
«В этой работе мы создали такую нейросеть, которая, с одной стороны, качественно определяет расстояние до объектов в пространстве, а с другой — быстро работает на маломощных компьютерах, таких как Nvidia Jetson, – рассказывает один из авторов исследования Константин Яковлев, кандидат физико-математических наук, сотрудник Института проблем искусственного интеллекта ФИЦ ИУ РАН.
Эта нейросеть имеет архитектуру энкодер-декодер, которая часто используется при решении подобного рода задач. Энкодер – это часть нейросети, которая извлекает из цветного изображения некоторые признаки. Декодер из этих признаков извлекает информацию о расстояниях до объектов – карту глубины.
«Наше новшество состоит в том, что мы методом проб и ошибок существенно упростили структуру декодера, а также внесли улучшения в процесс обучения – изменили структуру функции потерь. За счет этого сеть работает быстро и при этом достаточно хорошо определяет расстояния до объектов», – поясняет Константин.
Полученная таким образом карта глубины используется в дальнейшем для построения общей 3D карты окружающего пространства.