В МФТИ создали систему автоматического сопровождения объекта с помощью множества камер. Об этом «Газете.Ru» рассказал Андрей Леус, ведущий научный сотрудник лаборатории цифровых систем специального назначения МФТИ.
Современные компьютерные алгоритмы позволяют распознавать образы на фотографиях и видео, в том числе человеческие лица. Однако в большинстве случаев такие программы способны фиксировать лишь сам факт присутствия целевого объекта в кадре одной из камер, для продолжительного наблюдения за человеком (или машиной) и восстановления его маршрута требуется вмешательство оператора.
«Созданная нами система позволяет создавать треки [записи пути] наблюдаемых объектов и увязать между собой изображения разных камер. Большинство современных камер наблюдения с распознаванием образов обозначает каждый найденный объект как «новый найденный объект», и даже если прямо в этот момент его же наблюдает другая камера, связи между ними система не видит. Представим, что по городу едет машина, но ее номер можно распознать только на одной камере. Наш алгоритм позволяет отождествить изображение автомобиля с видимым номером с изображением того же самого автомобиля на других камерах, где номера не видно», — рассказал ученый.
Благодаря этому система наблюдения способна автоматически сопровождать целевой объект, «передавая» его последовательно следующим камерам. В качестве грубой аналогии можно привести человеческое восприятие: если на крупном плане мы обнаружили в толпе нужного нам человека в шляпе и длинном пальто, то на других кадрах мы сможем его узнать, видя лишь силуэт в шляпе и пальто без лица. При этом за каждым объектом закрепляется не один образ, а целая серия, на разных дистанциях и с разных ракурсов.
«В ходе записи трека каждая отдельная камера записывает целую серию снимков. Поэтому с объектом связана не одна картинка, а целая множество, сотни и тысячи. Запомнив этот набор данных, на следующей камере мы легко можем распознать объект и продолжить отслеживать его», — пояснил Леус.
При этом систему наблюдения можно увязать с пространством, в котором находятся камеры. Это позволяет, например, следить за посещаемостью студента на лекциях — установить, в какой аудитории находился человек и в какое время.