Технология распознавания лиц в видеонаблюдении
Как подобрать подходящую камеру и правильно выбрать место её установки
Системы видеонаблюдения уже давно перестали быть пассивными. Алгоритмы видеоанализа позволяют автоматически извлекать информацию из потока данных от камеры наблюдения. Одной из наиболее востребованных является технология распознавания лиц. В данной статье разберем вопрос выбора камеры для идентификации лица и места ее установки для минимизации ошибок распознавания.
Целевые задачи видеонаблюдения
Идентификация человека – одна из целевых задач видеонаблюдения. Технология распознавания лиц позволяет автоматически осуществлять идентификацию человека за счет алгоритмов видеоанализа.
Функция идентификации лица позволяет с заданной вероятностью выделить из видеопотока лицо человека, находящегося в базе данных системы видеонаблюдения. Помимо идентификации, технология распознавания лиц может фиксировать и другую информацию из видеопотока:
- определение пола
- оценка возраста
- определение расы
- выявление эмоций
- наличие усов / бороды
- наличие очков
- подсчет уникальных посетителей
Таким образом сферы применения технологии распознавания лиц куда шире, чем традиционные задачи расследования произошедших инцидентов. Вот неполный перечень:
- поиск лица в архиве видеонаблюдения
- идентификационный признак для системы контроля и управления доступом
- сбор статистики о посетителях в сфере ритейла
Отдельно следует отметить задачи сохранения приватности, которые (как ни странно!) также могут решаться средствами видеоаналитики. Система видеонаблюдения выделяет на кадре лицо человека и “замыливает” этот участок изображения таким образом, чтобы попавшие в кадр лица невозможно было узнать. Соблюдение приватности при работе видеонаблюдения в общественных зонах могут требоваться как заказчиком такой системы, так и законодательно.
Идентификация и верификация
При распознавании лиц алгоритм выявляет ряд биометрических данных о человеке. Эти данные могут быть использованы по-разному:
- накапливаться в системе для статистики
- сравниваться со всей накопленной базой данных лиц для поиска наиболее близкого совпадения (идентификации)
- сравниваться с эталонными данными для оценки степени соответствия (верификации)
Идентификация, как правило, используется для поиска лиц в архиве. Это позволяет эффективно проводить расследования инцидентов и преступлений. Кроме того, идентификация используется для отслеживания нахождения человека в “белом” или “черном” списке посетителей.
Верификация чаще используется для систем контроля и управления доступом, как один из идентификаторов посетителя.
Ошибки FAR и FRR
Для оценки качества применяемых алгоритмов используются две вероятностных величины: ошибки первого и второго рода. FAR (False Acceptance Rate) – процентный порог, определяющий вероятность того, что один человек может быть принят за другого (ошибка второго рода). FRR (False Rejection Rate) — вероятность того, что человек может быть не распознан системой (ошибка первого рода).
Ошибки FAR и FRR связаны между собой: чем ниже вероятность FAR, тем выше вероятность FRR и наоборот. Поэтому при настройке алгоритма выбирают их оптимальное соотношение для конкретного объекта защиты.
Facе Anti-Spoofing
В системах распознавания лиц необходима защита от попыток обмана (spoofing attack). Это либо попытка подделать идентификационный признак для ошибочной верификации пользователя системой распознавания. Либо попытка избежать идентификации различными методами маскировки лица.
Наиболее продвинутые алгоритмы идентификации используют различные методы Facе Anti-Spoofing.
Выбор системы распознавания лиц
Существует огромное число различных реализаций систем идентификации лиц. Их можно классифицировать по подходам к реализации:
- стандартные алгоритмы
- нейросетевые алгоритмы
А также по месту обработки видеопотока:
- на сервере
- на IP камере
- на видеорегистраторе
Системы распознавания лиц существенно отличаются друг от друга и требует тщательного выбора как по функциональности, так и по качеству идентификации (упомянутым ошибкам первого и второго рода, стойкости к spoofing attack). Наиболее продвинутые системы строятся на базе видеоаналитических модулей VMS систем (Video Management System или Video Management Software). Простейшие алгоритмы могут быть приятным бонусом в относительно бюджетных видеорегистраторах. И те и другие имеют своего потребителя, однако решают задачи разного класса и степени важности для потребителя.
Критерии идентификации лица человека
При планировании системы распознавания лиц необходимо учитывать требования производителя конкретного оборудования или видеоаналитических модулей. Ведь для автоматического распознавания лиц не существует единых государственных или межгосударственных стандартов.
Наиболее проработанными являются требования к городским системам видеонаблюдения класса “Безопасный город”, а также для систем транспортной безопасности. Так в Постановление Правительства РФ от 26.09.2016 N 969 “Об утверждении требований к функциональным свойствам технических средств обеспечения транспортной безопасности и Правил обязательной сертификации технических средств обеспечения транспортной безопасности” приведены следующие требования:
34. Функциональные свойства технических систем и средств идентификации физических лиц, указанные в пункте 33 настоящих требований, должны обеспечиваться при следующих условиях:
а) освещенность в плоскости лица – от (100 ± 10) до (1000 ± 50) люкс;
б) неравномерность освещенности лица – не более (50 ± 5) процентов;
в) характеристики видеоизображения:
разрешение видеоизображения, обеспечивающее регистрацию изображений лиц на рабочей дистанции съемки видеокамеры не менее 1,5 метра с расстоянием между центрами глаз (40 ± 2) пикселей (для алгоритмов и аппаратно-программных средств детекции) и (60 ± 2) пикселей (для алгоритмов и аппаратно-программных средств идентификации);
динамический диапазон интенсивности изображения в области лица – не менее 8 бит;
цветность видеоизображения – черно-белое;
частота – не менее 16 кадров в секунду;
г) плотность потока людей – 1 чел/м ;
д) скорость движения – не более 5 км/ч;
е) ракурс лица относительно фронтального ракурса, определяемый в соответствии с ГОСТ Р ИСО/МЭК 19794-5-2013 “Информационные технологии. Биометрия. Форматы обмена биометрическими данными. Часть 5. Данные изображения лица” угловыми координатами поворота, наклона и отклонения лица:
для алгоритмов и аппаратно-программных средств детекции – в диапазоне от 0 до (30 ± 2) градусов;
для алгоритмов и аппаратно-программных средств идентификации – в диапазоне от 0 до (15 ± 2) градусов;
ж) структура фона (подвижный случайно неоднородный фон съемки с перепадами контраста) – от (0,2 ± 0,05) до (0,8 ± 0,05);
з) объем базы данных эталонных изображений лиц – не менее 1000 лиц условно-фронтального типа (в соответствии с ГОСТ Р ИСО/МЭК 19794-5-2013 “Информационные технологии. Биометрия. Форматы обмена биометрическими данными. Часть 5. Данные изображения лица”).
35. В состав технических систем и средств идентификации физических лиц включаются средства регистрации видеоизображений, к которым предъявляются следующие требования:
а) разрешение регистрируемого видеоизображения – не менее 1,2 мегапикселя;
б) частота кадров – не менее 16 кадров в секунду;
в) разрешающая способность – разрешение на рабочей дистанции съемки объектов размером 2 миллиметра и более (значения для области в центре кадра и на расстоянии до одной третьей ширины, высоты и диагоналей кадра от центра включительно);
г) глубина резко отображаемого пространства – не менее 1 метра (для области в центре кадра и на расстоянии до одной третьей ширины, высоты и диагоналей кадра от центра включительно);
д) расстояние между центрами глаз на изображении лица, зарегистрированном на рабочей дистанции съемки, – не менее (60 ± 2) пикселей (для области в центре кадра и на расстоянии до одной третьей ширины, высоты и диагоналей кадра от центра включительно);
е) максимальное отношение “сигнал – шум” (с выключенной функцией автоматического усиления сигнала) – не менее 45 дБ;
ж) дисторсия – не более 5 процентов (по краям кадра – на расстоянии одной третьей ширины, высоты и диагоналей кадра от его центра).
Для обычной (не алгоритмической) идентификации некоторые рекомендации в нормативных документах все же есть. Из отечественных можно вспомнить Р 78.36.008-99 Проектирование и монтаж систем охранного телевидения и домофонов. Рекомендации:
*МРД – минимальная различимая деталь (изображения)
В европейском стандарте BS EN 62676-4:2015 Video surveillance systems for use in security applications. Application guidelines приведены близкие к отечественным рекомендации по плотности пикселей для решения целевой задачи идентификации:
Если же проанализировать требования производителей видеоаналитических модулей, то основными критериями будут:
- число пикселей между глаз
- угол между горизонталью и направлением «лицо — камера» (на сколько лицо “анфас” по вертикале)
- угол между направлением оптической оси камеры и нормалью условной плоскости лица (на сколько лицо “анфас” по горизонтали)
Как выбрать место установки камеры для автоматического распознавания лиц?
Как было сказано выше – наша задача получить изображение лица “анфас”. Исходя из этого нам требуется максимально уменьшать вертикальные и горизонтальные углы, под которыми мы снимаем человека. Для этого при планировании системы видеонаблюдения мы должны:
- определить место, где человек неизбежно окажется при входе на объект с понятным положением головы
- установить камеру напротив входа, по-возможности без смещения относительно центра
- при возможности – максимально приблизить высоту установки камеры к росту наиболее рослого человека (около 2 метров), однако не слишком низко, чтобы впереди идущий человек не загораживал лицо следующего за ним
- при невозможности установить камеру низко – максимально сместить ее от зоны съемки лица (для уменьшения вертикального угла)
Следует также избегать мест установки камеры, где человек инстинктивно смотрит вниз под ноги: выход или вход с эскалатора, проход через турникеты (человек будет смотреть на считыватель), подъем по ступенькам и т.п. Либо как то привлекать внимание к камере – например размещая рядом с ней экран с выводом изображения с камеры.
Как подобрать характеристики камеры?
Нас интересуют прежде всего два параметра:
- разрешение камеры
- угол обзора камеры (на который влияют фокусное расстояние и размер матрицы)
Для идентификации нам не подойдут широкоугольные камеры с наличием выраженной дисторсией объектива.
При выборе угла обзора нужно учитывать размер входной зоны, где неизбежно должна оказаться голова входящего на объект человека. Разрешение матрицы нужно выбирать минимально достаточным, чтобы при заданном угле обзора выполнить требование по числу пикселей между глаз человека или аналогичному значению плотности пикселей.
В зависимости от условий съемки нужно подбирать и другие характеристики камеры:
- размер матрицы и ее светочувствительность
- F-число диафрагмы объектива
- величину выдержки электронного затвора
- режим работы диафрагмы и электронного затвора
Тут речь идет о том, что контрастность изображения не должна зависеть от времени суток и изображение не должно быть смазанным из-за быстрого перемещения человека в кадре.
Выводы
Технологии идентификации занимают все большее место в современных системах видеонаблюдения. Для правильного планирования таких систем важно подобрать систему, удовлетворяющую пользователей по соотношению ошибок первого и второго уровня, а также правильно подобрать место установки камеры и ее характеристики. Для этого нужно выяснить критерии идентификации у выбранного производителя и произвести нужные расчеты. Наиболее удобно планировать такие системы в специализированном софте для проектирования систем видеонаблюдения.
Дополнительные материалы
Бесплатная книга с практическими уроками по проектированию видеонаблюдения.
Анонс: Плагин AutoCAD для видеонаблюдения
Рейтинги: топ 10 популярных камер видеонаблюдения
Скачать: 90 дневную версию программы IP Video System Design Tool 10