¿Qué es el reconocimiento facial? AI para Gran Hermano

¿Puede el Gran Hermano identificar su rostro en la vigilancia CCTV a nivel de la calle y saber si está feliz, triste o enojado? ¿Puede esa identificación conducir a su arresto con una orden pendiente? ¿Cuáles son las probabilidades de que la identificación sea incorrecta y realmente se conecte con otra persona? ¿Puedes derrotar la vigilancia por completo usando algún truco?

Por otro lado, ¿puede ingresar a una bóveda protegida por una cámara y un software de identificación facial sosteniendo una impresión del rostro de una persona autorizada? ¿Qué pasa si te pones una máscara tridimensional de la cara de una persona autorizada?

Bienvenido al reconocimiento facial y a la suplantación del reconocimiento facial.

¿Qué es el reconocimiento facial?

El reconocimiento facial es un método para identificar a una persona desconocida o autenticar la identidad de una persona específica a partir de su rostro. Es una rama de la visión por computadora, pero el reconocimiento facial es especializado y viene con un bagaje social para algunas aplicaciones, así como algunas vulnerabilidades a la suplantación de identidad.

¿Cómo funciona el reconocimiento facial?

Los primeros algoritmos de reconocimiento facial (que todavía se utilizan hoy en día en forma mejorada y más automatizada) se basan en la biometría (como la distancia entre los ojos) para convertir las características faciales medidas de una imagen bidimensional en un conjunto de números (una característica vector o plantilla) que describe la cara. El proceso de reconocimiento luego compara estos vectores con una base de datos de caras conocidas que se han mapeado a características de la misma manera. Una complicación en este proceso es ajustar las caras a una vista normalizada para tener en cuenta la rotación e inclinación de la cabeza antes de extraer las métricas. Esta clase de algoritmos se llama geométrica .

Otro enfoque para el reconocimiento facial es normalizar y comprimir imágenes faciales bidimensionales y compararlas con una base de datos de imágenes comprimidas y normalizadas de manera similar. Esta clase de algoritmos se llama fotométrica .

El reconocimiento facial tridimensional utiliza sensores 3-D para capturar la imagen facial, o reconstruye la imagen 3-D a partir de tres cámaras de seguimiento 2-D apuntadas en diferentes ángulos. El reconocimiento facial 3-D puede ser considerablemente más preciso que el reconocimiento 2-D.

El análisis de la textura de la piel asigna las líneas, los patrones y las manchas del rostro de una persona a otro vector de características. Agregar el análisis de la textura de la piel al reconocimiento facial 2-D o 3-D puede mejorar la precisión del reconocimiento entre un 20 y un 25 por ciento, especialmente en los casos de personas parecidas y gemelas. También puede combinar todos los métodos y agregar imágenes multiespectrales (luz visible e infrarroja), para una precisión aún mayor.

El reconocimiento facial ha ido mejorando año tras año desde que comenzó el campo en 1964. En promedio, la tasa de error se ha reducido a la mitad cada dos años.

Video relacionado: Cómo funciona el reconocimiento facial

Pruebas de proveedores de reconocimiento facial

NIST, el Instituto Nacional de Estándares y Tecnología de EE. UU., Ha estado realizando pruebas de algoritmos de reconocimiento facial, la Prueba de proveedor de reconocimiento facial (FRVT), desde 2000. Los conjuntos de datos de imágenes utilizados son en su mayoría fotografías policiales, pero también incluyen imágenes fijas salvajes, como las que se encuentran en Wikimedia, e imágenes de baja resolución de cámaras web.

Los algoritmos FRVT son enviados principalmente por proveedores comerciales. Las comparaciones de un año a otro muestran importantes mejoras en el rendimiento y la precisión; según los proveedores, esto se debe principalmente al uso de redes neuronales convolucionales profundas.

Los programas de pruebas de reconocimiento facial del NIST relacionados han estudiado los efectos demográficos, la detección de la transformación de rostros, la identificación de rostros publicados en las redes sociales y la identificación de rostros en video. Una serie anterior de pruebas se llevó a cabo en la década de 1990 con un nombre diferente, Tecnología de reconocimiento facial (FERET).

NIST

Aplicaciones de reconocimiento facial

Las aplicaciones de reconocimiento facial se dividen principalmente en tres categorías principales: seguridad, salud y marketing / venta minorista. La seguridad incluye la aplicación de la ley, y esa clase de usos del reconocimiento facial puede ser tan benigno como hacer coincidir a las personas con sus fotos de pasaporte de manera más rápida y precisa que los humanos, y tan espeluznante como el escenario de "Persona de interés" donde las personas son rastreadas a través de CCTV y comparadas a bases de datos de fotografías recopiladas. La seguridad no policial incluye aplicaciones comunes como desbloqueo facial para teléfonos móviles y control de acceso para laboratorios y bóvedas.

Las aplicaciones de salud del reconocimiento facial incluyen registros de pacientes, detección de emociones en tiempo real, seguimiento de pacientes dentro de una instalación, evaluación de los niveles de dolor en pacientes no verbales, detección de ciertas enfermedades y afecciones, identificación del personal y seguridad de las instalaciones. Las aplicaciones de marketing y minoristas de reconocimiento facial incluyen la identificación de los miembros del programa de lealtad, la identificación y seguimiento de ladrones de tiendas conocidos y el reconocimiento de personas y sus emociones para sugerencias de productos específicos.

Controversias, prejuicios y prohibiciones del reconocimiento facial

Decir que algunas de estas aplicaciones son controvertidas sería quedarse corto. Como se analiza en un artículo del New York Times de 2019, el reconocimiento facial ha generado controversia, desde su uso para la vigilancia de estadios hasta el software racista.

¿Vigilancia del estadio? El reconocimiento facial se utilizó en el Super Bowl de 2001: el software identificó a 19 personas que se creía que eran sujetos de órdenes judiciales pendientes, aunque ninguna fue arrestada (no por falta de intento).

¿Software racista? Ha habido varios problemas, comenzando con el software de seguimiento facial de 2009 que podía rastrear a los blancos pero no a los negros, y continuando con el estudio del MIT de 2015 que mostró que el software de reconocimiento facial de la época funcionaba mucho mejor en rostros masculinos blancos que en mujeres y / o Rostros negros.

Este tipo de problemas ha llevado a la prohibición total del software de reconocimiento facial en lugares específicos o para usos específicos. En 2019, San Francisco se convirtió en la primera ciudad estadounidense importante en impedir que la policía y otras agencias de aplicación de la ley usen software de reconocimiento facial; Microsoft pidió regulaciones federales sobre reconocimiento facial; y el MIT mostró que Amazon Rekognition tenía más problemas para determinar el género femenino que el masculino a partir de las imágenes faciales, así como más problemas con el género femenino negro que con el género femenino blanco.

En junio de 2020, Microsoft anunció que no venderá ni vendió su software de reconocimiento facial a la policía; Amazon prohibió a la policía usar Rekognition durante un año; e IBM abandonó su tecnología de reconocimiento facial. Sin embargo, prohibir por completo el reconocimiento facial no será fácil, dada su amplia adopción en iPhones (Face ID) y otros dispositivos, software y tecnologías.

No todo el software de reconocimiento facial sufre los mismos sesgos. El estudio de efectos demográficos del NIST de 2019 siguió el trabajo del MIT y mostró que el sesgo demográfico algorítmico varía ampliamente entre los desarrolladores de software de reconocimiento facial. Sí, existen efectos demográficos en la tasa de coincidencias falsas y la tasa de no coincidencias falsas de los algoritmos de identificación facial, pero pueden variar en varios órdenes de magnitud de un proveedor a otro, y han ido disminuyendo con el tiempo.

Hackear reconocimiento facial y técnicas anti-spoofing

Dada la posible amenaza a la privacidad del reconocimiento facial y el atractivo de tener acceso a recursos de alto valor protegidos por autenticación facial, se han realizado muchos esfuerzos para piratear o falsificar la tecnología. Puede presentar una imagen impresa de un rostro en lugar de un rostro vivo, o una imagen en una pantalla, o una máscara impresa en 3-D, para pasar la autenticación. Para la vigilancia por CCTV, puede reproducir un video. Para evitar la vigilancia, puede probar las telas y el maquillaje “CV Dazzle”, y / o los emisores de luz IR, para engañar al software y hacer que no detecte su rostro.

Por supuesto, existen esfuerzos para desarrollar técnicas anti-spoofing para todos estos ataques. Para detectar imágenes impresas, los proveedores usan una prueba de vivacidad, como esperar a que el sujeto parpadee, o realizar un análisis de movimiento, o usar infrarrojos para distinguir un rostro vivo de una imagen impresa. Otro enfoque es realizar análisis de microtexturas, ya que la piel humana es ópticamente diferente de las impresiones y los materiales de las máscaras. Las últimas técnicas anti-spoofing se basan principalmente en redes neuronales convolucionales profundas.

Este es un campo en evolución. Hay una guerra de armas entre atacantes y software anti-spoofing, así como investigaciones académicas sobre la efectividad de diferentes técnicas de ataque y defensa.

Proveedores de reconocimiento facial

Según la Electronic Frontier Foundation, MorphoTrust, una subsidiaria de Idemia (antes conocida como OT-Morpho o Safran), es uno de los mayores proveedores de reconocimiento facial y otras tecnologías de identificación biométrica en los Estados Unidos. Ha diseñado sistemas para DMV estatales, agencias de aplicación de la ley federales y estatales, control de fronteras y aeropuertos (incluido TSA PreCheck) y el departamento estatal. Otros proveedores comunes incluyen 3M, Cognitec, DataWorks Plus, Dynamic Imaging Systems, FaceFirst y NEC Global.

La prueba de proveedores de reconocimiento facial del NIST enumera los algoritmos de muchos más proveedores de todo el mundo. También existen varios algoritmos de reconocimiento facial de código abierto, de calidad variable, y algunos servicios en la nube importantes que ofrecen reconocimiento facial.

Amazon Rekognition es un servicio de análisis de imágenes y videos que puede identificar objetos, personas, texto, escenas y actividades, incluido el análisis facial y las etiquetas personalizadas. La API de Google Cloud Vision es un servicio de análisis de imágenes previamente capacitado que puede detectar objetos y rostros, leer texto impreso y escrito a mano y crear metadatos en su catálogo de imágenes. Google AutoML Vision le permite entrenar modelos de imágenes personalizados.

La API de Azure Face realiza detección de rostros que percibe rostros y atributos en una imagen, realiza una identificación de personas que coincide con un individuo en su repositorio privado de hasta 1 millón de personas y realiza el reconocimiento de emociones percibidas. Face API se puede ejecutar en la nube o en el borde en contenedores.

Conjuntos de datos faciales para entrenamiento de reconocimiento

Hay docenas de conjuntos de datos faciales disponibles para descargar que se pueden usar para entrenamiento de reconocimiento. No todos los conjuntos de datos faciales son iguales: tienden a variar en tamaño de imagen, número de personas representadas, número de imágenes por persona, condiciones de las imágenes e iluminación. Las fuerzas del orden también tienen acceso a conjuntos de datos faciales no públicos, como fotografías policiales actuales e imágenes de licencias de conducir.

Algunas de las bases de datos de caras más grandes son Caras etiquetadas en la naturaleza, con ~ 13K personas únicas; FERET, utilizado para las primeras pruebas NIST; la base de datos Mugshot utilizada en el actual NIST FRVT; la base de datos de cámaras de vigilancia SCFace, también disponible con puntos de referencia faciales; y caras de Wikipedia etiquetadas, con aproximadamente 1.5K identidades únicas. Varias de estas bases de datos contienen varias imágenes por identidad. Esta lista del investigador Ethan Meyers ofrece algunos consejos convincentes sobre cómo elegir un conjunto de datos faciales para un propósito específico.

En resumen, el reconocimiento facial está mejorando y los proveedores están aprendiendo a detectar la mayoría de las falsificaciones, pero algunas aplicaciones de la tecnología son controvertidas. La tasa de error para el reconocimiento facial se reduce a la mitad cada dos años, según NIST. Los proveedores han mejorado sus técnicas anti-spoofing incorporando redes neuronales convolucionales.

Mientras tanto, existen iniciativas para prohibir el uso del reconocimiento facial en la vigilancia, especialmente por parte de la policía. Sin embargo, prohibir por completo el reconocimiento facial sería difícil, dada la extensión que se ha vuelto.

Obtenga más información sobre el aprendizaje automático y el aprendizaje profundo:

  • Aprendizaje profundo versus aprendizaje automático: comprenda las diferencias
  • ¿Qué es el aprendizaje automático? Inteligencia derivada de datos
  • ¿Qué es el aprendizaje profundo? Algoritmos que imitan el cerebro humano.
  • Explicación de los algoritmos de aprendizaje automático
  • Explicación del aprendizaje automático automatizado o AutoML
  • Explicación del aprendizaje supervisado
  • Explicación del aprendizaje semi-supervisado
  • Explicación del aprendizaje no supervisado
  • Explicación del aprendizaje por refuerzo
  • ¿Qué es la visión por computadora? AI para imágenes y video
  • ¿Qué es el reconocimiento facial? AI para Gran Hermano
  • ¿Qué es el procesamiento del lenguaje natural? AI para voz y texto
  • Kaggle: donde los científicos de datos aprenden y compiten
  • ¿Qué es CUDA? Procesamiento paralelo para GPU