
En unas pocas décadas, el reconocimiento facial ha pasado de ser unos sistemas de seguridad muy avanzados en las películas a herramientas biométricas ubicuas, que existen a nuestro alrededor e incluso en la palma de nuestras manos como teléfonos inteligentes.
La tecnología se utiliza de muchas maneras diferentes. Algunos teléfonos usan el reconocimiento facial para otorgar acceso, y algunos gobiernos como el de EE. UU. y China usan el reconocimiento facial en bases de datos como las licencias de conducir por una variedad de razones. También tenemos divertidos filtros en las cámaras de los teléfonos móviles que utilizan la detección facial para crear efectos. Lo bueno del reconocimiento facial es que reemplaza la mayoría de los métodos de seguridad que dependen de contraseñas y PIN, que son difíciles de recordar o se pueden perder fácilmente.
El reconocimiento facial es, de hecho, un problema complejo. Funciona en función de un conjunto de características y rasgos faciales, pero obviamente, siempre hay más en una cara que solo estas características. Los rostros humanos difieren en muchos factores, como el ancho de la nariz, la distancia entre los ojos, la forma del tamaño de la boca, etc.
Algunas tecnologías de reconocimiento facial analizan hasta 80 factores en la cara para ayudar a identificar características únicas y, en última instancia, identifican estas características con bastante detalle, observando cosas como la profundidad de las cuencas de los ojos y la altura de los pómulos en la forma de la línea de la mandíbula.
Para los humanos, el reconocimiento facial ocurre naturalmente, pero para las máquinas puede presentar muchos desafíos complicados, causados por variaciones intrapersonales en nuestras caras como variaciones de iluminación, variaciones de pose, expresiones faciales, disfraces, uso de cosméticos y accesorios, cambios de peinado y variaciones temporales como envejecimiento.
Por lo tanto, para reconocer caras, los ingenieros han creado muchas técnicas para trabajar. En esta publicación, veremos algunas de las técnicas estándar de reconocimiento facial y sus aplicaciones.
Métodos de reconocimiento facial
1. Métodos basados en modelos
Los métodos de reconocimiento facial basados en modelos, también conocidos como métodos basados en geometría o basados en plantillas, construyen un modelo facial, capaz de capturar variaciones faciales o reflejos en función de su relación geométrica. Se centran en la distancia, la disposición y los tamaños relativos de los elementos faciales internos, como la ubicación de los ojos, las fosas nasales, etc., y comparan los parámetros con los parámetros de los rostros conocidos. Los métodos basados en modelos se dividen en dos:
a. Modelo transformable en 3D (3DMM): Es un poderoso modelo estadístico 3D de la forma y textura del rostro humano. Puede modelar las propiedades intrínsecas de las caras en 3D, como la forma y la textura de la piel, en lugar de su apariencia. Ampliamente utilizado para la representación general de rostros, el análisis de imágenes y la síntesis de imágenes, 3DMM recopila datos a través de una colección de escaneos faciales 2D y 3D bien controlados y establece un mapeo entre un espacio de parámetros de baja dimensión y un espacio de alta dimensión de modelos 3D texturizados. .
b. Coincidencia de gráficos de grupos elásticos (EBGM): reconoce a un ser humano localizando primero un conjunto de características de puntos de referencia y luego haciendo coincidir las similitudes y características estructurales comunes con otras imágenes en la base de datos. Todas las instancias están representadas por el mismo tipo de gráfico, a partir del cual se crea una estructura con los nodos, representando texturas y variantes locales. EBGM solo se puede aplicar a objetos con una estructura común, como caras en una pose frontal, que comparten un conjunto estándar de puntos de referencia.
2. Métodos basados en la apariencia holística
Uno de los métodos más exitosos y mejor estudiados en el reconocimiento facial, los métodos basados en la apariencia, utilizan los valores de intensidad de píxel, que corresponden directamente al resplandor de la luz emitida por el objeto junto con ciertos rayos en el espacio. El reconocimiento facial basado en la apariencia se puede dividir en métodos de análisis lineales, como PCA, ICA y LDA, y métodos de análisis no lineales, como KPCA.
a. Análisis de componentes principales (PCA): Es una técnica de extracción de características que descarta las variables «menos importantes» mientras retiene las características más valiosas y expresivas dentro de una cara. Al reducir el número de variables, saca a la luz variables vitales (características propias como ojos, nariz, boca, mejillas, etc.) que representan mejor la cara y trata de construir un modelo computacional que la describa mejor.
b. Análisis de componentes independientes (ICA): Cuando PCA intenta obtener una representación de las entradas basada en variables no correlacionadas, ICA proporciona una representación basada en variables estadísticamente independientes. Un modelo generativo para los datos multivariados observados, ICA revela factores ocultos que subyacen a conjuntos de variables aleatorias, mediciones o señales. ICA se utiliza principalmente en el problema de la separación ciega de señales.
C. Análisis de componentes principales del kernel (KPCA): Es el método no lineal para extraer características esenciales o puntos de referencia. Mediante el uso de una función kernel, las imágenes se transforman primero del espacio de la imagen en un espacio de características de mayor dimensión para explotar la estructura espacial complicada.
d. Análisis Discriminante Lineal (LDA): También llamada Fisherface, LDA es una técnica basada en la apariencia utilizada para la reducción de la dimensionalidad. Reduce el número de dimensiones (es decir, variables) en un conjunto de datos mientras retiene la mayor cantidad posible de información discriminatoria de clase. Utiliza una estrategia de aprendizaje reguladora que utiliza más de una imagen de preparación para una clase individual. Esta estrategia busca mezclas directas de aspectos destacados mientras ahorra clase de forma autónoma.
3. Máquina de vectores de soporte (SVM)
Las máquinas de vectores de soporte (SVM) son una de las técnicas más útiles en problemas de clasificación. Intuitivamente, dado un conjunto de puntos pertenecientes a dos clases, una SVM encuentra el hiperplano que separa la mayor fracción posible de puntos de la misma clase en el mismo lado, mientras maximiza la distancia de cualquier clase al hiperplano. Este hiperplano, denominado hiperplano de separación óptima (OSH), minimiza el riesgo de clasificar erróneamente no solo los ejemplos del conjunto de entrenamiento, sino también los ejemplos no vistos del conjunto de prueba.
4. Red neuronal artificial (ANN)
En los últimos años, se utilizaron diferentes arquitecturas y modelos ANN para la detección y el reconocimiento de rostros, ya que estos modelos pueden simular la forma en que funcionan las neuronas en el cerebro humano. A continuación, puede ver algunos de los principales métodos relacionados con la detección de rostros basados en ANN.
- Red neuronal conectada a la retina (RCNN)
- Red neuronal invariante de rotación (RINN)
- Análisis de Componentes Principales con ANN (PCA & ANN)
- Redes neuronales rápidas (FNN)
- Red neuronal polinomial (PNN)
- Red neuronal convolucional (CNN)
- Optimización Evolutiva de Redes Neuronales
- Perceptrón multicapa (MLP)
- Redes neuronales de retropropagación (BPNN)
- Caras Wavelet de Gabor con ANN
- Color de piel y BPNN
- Red neuronal en cascada
En comparación con el reconocimiento facial por humanos, el reconocimiento automático de rostros por máquina tiene varias ventajas. Una computadora puede almacenar una gran cantidad de imágenes de rostros en una galería que contiene rostros de personas conocidas, recordando a más personas y reconociéndolas a cada una de ellas de manera más eficiente que un humano, porque nunca se cansa. Esto ha creado una gran cantidad de aplicaciones, que incluyen seguridad, vigilancia, tratamiento médico, etc.