Пн-Пт: с 9:00 до 20:00
Сб-Вс: с 10:00 до 16:00
105118, г. Москва,
ул. Буракова, д. 27

Технология распознавания лиц

пример определения лицЛюди обычно, чтобы узнать других людей, смотрят в лицо. Продвижения в области вычислений за последние несколько десятилетий позволили сделать аналогичное узнавание автоматическим. Ранние алгоритмы распознавания лиц использовали простые геометрические модели, но процесс распознавания совершенствовался и теперь перешёл в науку сложных математических представлений и соответствующих процессов. Распознавание лиц можно использовать как для проверки, так и для идентификации.
Разработанная в 1960-х годах, первая полуавтоматическая система распознавания лиц требовала от оператора поиска на фотографиях функций (с точки зрения алгоритмов, глаза, уши, нос и рот это функции, описывающие в данном случае лицо ) до того, как рассчитывались расстояния и отношения к общей контрольной точке, которые затем сравнивались с шаблонными данными. В 1970-е годы, для уточнения автоматизации распознавания, были введены и использовались специальные субъективные маркеры, такие как цвет волос, бровей и толщина губ.
Проблема в этих ранних решениях заключалась в том, что измерения и местоположения рассчитывались вручную. В 1988 году , наряду со стандартным методом линейной алгебры, был разработан новый прикладной компонентный анализ для решения данной проблемы распознавания. Этот этап показал, что для точного кодирования, правильно выровненного и нормализованного изображения лица, требуется менее 100 значений.

В 1991 году ученые обнаружили, что при использовании методов собственных границ остаточная ошибка может быть использована для обнаружения лиц в изображениях, что позволяет использовать надежные автоматические системы распознавания лиц в режиме реального времени. Несмотря на то, что этот подход ограничен факторами окружающей среды, он вызвал значительный интерес в развитии технологий автоматизированного распознавания лиц. Технология впервые привлекла внимание общественности от реакции СМИ на пробную реализацию в январе 2001 года на матче Super Bowl, в которой изображения камер наблюдения сравнивались с базой данных цифровых копий. На матче находилось 19 человек, ожидающих ордера на арест.
Сегодня технология распознавания лиц используется для борьбы с мошенничеством, поддержки правоохранительных органов, выявления пропавших без вести, в биометрических системах контроля доступа на предприятиях, сопутствующим к ним терминалах и так далее.

Существует два преобладающих подхода к проблеме распознавания лиц:

геометрический (основанный на характеристиках) и фотометрический (основанный на просмотре). По мере того, как интерес исследователей к распознаванию лиц продолжался, было разработано много различных алгоритмов, три из которых хорошо изучены в литературе по распознаванию лиц - анализ основных компонентов (PCA), линейный дискриминантный анализ (LDA) и гибкого сравнения на графах EBGM.

Алгоритмы распознавания лиц

анализ PCA модели

метод PCA

Анализ основных компонентов (PCA)

обычно называемый использованием собственных поверхностей (Eigenface - математические уравнения, которые адекватно уменьшают статистическую сложность в представлении изображения лица), является методом, впервые примененном в 1988 году. В технологии PCA изображения должны быть одного размера и быть сначала нормализованы, выровнены линии глаз и рта. Затем подход PCA используется для уменьшения размера данных с помощью основ сжатия данных и показывает наиболее эффективную низкоразмерную структуру черт лица. Типизирует и упрощает. Это уменьшение размеров удаляет информацию, не являющейся полезной, и точно раскладывает структуру лица в ортогональные (некоррелированные) компоненты, известные как собственные. Каждое изображение лица может быть представлено в виде взвешенной суммы (вектора признаков) собственных границ, которые хранятся в массиве 1D. Пробное изображение сравнивается с изображением в галерее, измеряется расстояние между их соответствующими векторами признаков. Подход PCA обычно требует чтобы открытый лоб представлялся каждый раз, в противном случае падает коэффициент распознавания. Основным преимуществом этого метода является то, что он может уменьшить данные, необходимые для идентификации человека до одной тысячной представленных данных.

LDA анализ лицаЛинейный дискриминантный анализ (LDA)

является статистическим подходом для классификации образцов неизвестных классов на основе учебных образцов с известными классами. Этот метод направлен на максимизацию дисперсии между классами (то есть между пользователями) и минимизацию дисперсии внутри класса (то есть внутри пользователя). При работе с данными с высокими размерностями лиц этот метод сталкивается с проблемой небольшого размера выборки, которая возникает там, где имеется небольшое количество доступных учебных образцов по сравнению с размерностью пространства выборки.

Гибкое согласование графов (EBGM)

алгоритм EBGM

основывается на концепции, что изображения реальных лиц имеют много нелинейных характеристик, которые не рассматриваются методами линейного анализа, рассмотренными ранее, такими как изменения освещенности (затенение, солнечное освещение или люминесцентное), поза стоящего и выражение лица (человек хмуриться или улыбается). Вейвлет-преобразование Габора создаёт динамическую архитектуру ссылок, проецирующее лицо на эластичную сетку. Описывается поведение изображения вокруг данной точки.фильтр Габора

Этот результат сворачивания изображения с фильтром Габора спользуется для обнаружения фигур и извлечения функций с использованием обработки изображений. Распознавание основано на подобии ответа фильтра Габора на каждом узле Габора. Этот метод, основанный на биологии, с использованием фильтров Габора представляет собой процесс, выполняемый в зрительной коре высших млекопитающих.

Трудности в этом методе заключается в сложности математических вычислений, на разном оборудовании будет разная точность, необходимости точной локализации ориентиров, которая иногда может быть достигнута путем объединения методов PCA и LDA.

Оценка технологии распознавания лиц

(FERET) спонсировалась Агентством перспективных исследовательских продуктов обороны (DARPA) с 1993 по 1997 год. Учитывая разумное контролируемое внутреннее освещение, текущее современное состояние распознавания лиц является 90%-ой положительной вероятностью. В приложениях для распознавания лиц необходимо размещать демографическую информацию, поскольку такие характеристики, как возраст и пол, могут существенно повлиять на производительность.
Использование морфируемых моделей, которые отображают 2D-изображение на 3D-сетку в попытке преодолеть колебания освещения и позы, может значительно улучшить распознавание лица.

Biometrics Research Group, Inc. определяет распознавание лиц как технологию, измеряющую расстояния между конкретными частями лица человека и которая может выступать как способ идентификации.