Технология, позволяющая распознавать лица, с недавних пор обрела сильное распространение. Социальные сети внедряют алгоритмы, позволяющие определить людей на фотографиях, многие компании выпускают сервисы по определению возраста, настроения и прочих факторов по снимку.
Так, Microsoft выпустила целую серию ботов, которые определяют информацию о человеке по снимкам. После этого она и вовсе продемонстрировала очки для незрячих, которые не только объясняют, какие объекты находятся перед человеком, но и рассказывают о возрасте и настроении собеседника.
Другим популярным сервисом, использующим распознавание лиц исключительно для развлечения пользователя, является белорусский MSQRD.
Разработчики рассказывают, что на создание алгоритма для точного определения лица в реальном времени они потратили около пяти лет.
Алгоритм работает невероятно точно, быстро и без всяких затруднений накладывает на лицо маску, с учетом положения головы и тех действий, которые выполняет пользователь. Благодаря этому на MSQRD обратила внимание соцсеть Facebook, купившая стартап для совершенствования собственных алгоритмов распознавания лиц.
Кандидат технических наук и генеральный директор Smart Engines Владимир Арлазаров рассказал «Газете.Ru», в чем заключается принцип работы систем распознавания лиц. «В стандартном подходе обычно выделяют четыре этапа: детектирование и локализация лица, пространственная и цветовая нормировка области лица, построение инвариантного описания, сравнение с эталоном или поиск по базе известных лиц», — поясняет Арлазаров.
Он также добавил, что для некоторых пунктов могут быть использованы методы машинного обучения: «Для детектирования и локализации лица, а также для построения инвариантного описания, как правило, используются методы глубинного обучения машин».
Программы, которые могут просто сравнить портрет с каким-то эталонным изображением, существуют достаточно давно, и FindFace не стал откровением для знающих людей. При этом, как и любой другой подобный алгоритм, его можно обмануть, просто повернув или наклонив голову, и в таком случае точность определения лица становится гораздо ниже.
Однако кроме обычного выделения лиц в кадре, определения настроения человека, возраста и прочих данных самым желанным является определение личности человека, который попал в объектив камеры.
Подобные возможности машинного зрения открывает для технологии абсолютно новые сферы применения.
Никаких паролей
Высокая точность определения лиц в первую очередь необходима для использования технологии в сферах безопасности. Смартфоны, к примеру, давно научились делать снимки, на которых компьютер может определить лицо человека на большом расстоянии и при плохом свете. Лицо человека, как и отпечаток, голос, сетчатку глаза или ДНК, можно и необходимо использовать в качестве средства аутентификации, так как эти данные уникальны для всех людей.
«В первую очередь это различные системы ограничения доступа и системы наблюдения при обеспечении комплекса антитеррористических мероприятий. Кроме этого, технологии используются в области идентификации и верификации клиента при получении финансовых и иных услуг», — уточняет эксперт.
Так, платежная система MasterCard создала «селфи-платежи», при которых для подтверждения операции необходимо лишь сделать селфи и приложить палец к сканеру отпечатков на смартфоне. Использовать отдельно лицо в качестве способа входа в систему нецелесообразно, так как машинное зрение все еще может дать сбой, и именно по этой причине его лучше использовать в связке с другими биометриями.
Благодаря уникальности этих данных в будущем можно будет полностью отказаться от паролей, пин-кодов и токенов и использовать в качестве способа входа ту информацию, которую запоминать просто не нужно.
Многие компании уже работают в этом направлении и внедряют способы авторизации с помощью биометрии снимков лица и других уникальных данных пользователей. При этом используется зачастую не только 2D-снимок, но и объемная модель лица человека. Создание 3D-модели несколько сложнее в реализации, так как требует особого ПО, которое может «склеить» несколько снимков человека. Cам процесс определения человека гораздо проще и точнее, так как сравнение идет со всей головой пользователя, а не только портретом.
Если объединить систему распознавания лиц с имеющейся клиентской базой, различные магазины и банки могут заменить таким образом программу лояльности, понимая, кто пришел, еще до того, как он представился. Внедрение подобной «связки» позволит обеспечить более персональный подход к каждому клиенту.
Но применение технологии не ограничивается только торговыми сетями. Более 30 церквей в Индонезии, США, Португалии, Африке и Индии используют систему Churchix, которая позволяет отслеживать прихожан и определять, кто из них пришел впервые на службу. Кроме того, Churchix отслеживает, кто из прихожан пропустил службу, чтобы церковные служители могли выяснить причины отсутствия.
Однако опыт FindFace показывает, что многие пользователи против подобного вмешательства в частную жизнь. В связи с этим законодательная база должна дорабатываться и более точно регулировать системы распознавания лиц. Пока технология не имеет четких рамок, но очевидно, что она должна быть четко регламентирована.
На благо нации
Правоохранительные органы были одними из первых, кто начал использовать технологию распознавания лиц.
К примеру, ФБР использует базу из 412 млн фотографий для того, чтобы искать преступников. При этом ФБР договорилось с несколькими штатами о получении доступа к базе данных State Department's Visa and Passport, в которой хранятся биометрические данные соискателей виз и не только. Как результат ФБР удалось обнаружить преступника, который разыскивался 14 лет, именно благодаря системе распознавания лиц.
Мегаполисы обладают практически всем необходимым для организации оперативного поиска преступников с помощью данной технологии. К примеру, на улицах Москвы размещено более 140 тыс. камер, которые ведут постоянную съемку.
Правительство Москвы уже достаточно давно готовятся модернизировать систему видеонаблюдения, чтобы она смогла находить преступников и пропавших людей.
Вместе с этим, также для обеспечения безопасности, в преддверии чемпионата мира по футболу – 2018 стадионы оснащаются системами распознавания лиц болельщиков. Вместе с «Законом о болельщиках» это позволит выявлять болельщиков из черного списка во время прохода на стадион, а также фиксировать правонарушения и их организаторов во время матча.
Несмотря на то что распознавание лиц уже применяется на практике и помогает найти преступников, вероятность обнаружения все еще остается низкой.
Виной тому является то, что зачастую эти камеры обладают низким разрешением и при обработке изображения не удается отчетливо выделить лицо. К тому же из-за большого количества камер для реализации этого метода нужны огромные вычислительные мощности.
Будущее под колпаком
Системы распознавания лиц уже внедрены во многих странах и используются во многих областях промышленности, бизнеса и торговли. Можно удариться в футурологию и порассуждать на тему того, как скоро камеры с возможностью отследить конкретного человека будут абсолютно везде.
В теории, на базе систем видеонаблюдения с технологией распознавания лиц можно создать единую сеть в духе городской операционной системы ctOS из игры Watch Dogs. Эта сеть будет знать все о каждом горожанине и следить за всеми его перемещениями и действиями. Однако это скорее из разряда утопий, нежели реальности.
Что касается безопасности, то Владимир Арлазаров советует не беспокоиться насчет тотальной слежки: «Можно пофантазировать на тему накладных бород, но на деле трудно представить, зачем законопослушным гражданам знать, как можно однократно обмануть систему.»
При этом реальную угрозу могут представлять злоумышленники, у которых оказалась база данных с фотографиями и прочими данными.
«Следует скорее опасаться недобросовестных бизнесменов, которые будут собирать о вас личную информацию. И тогда рецепт прост: будьте аккуратнее с социальными сетями. Каждая дополнительная фотография в вашем профиле повышает вероятность того, что на улице вас распознает даже низкокачественная система», — заключил эксперт.