La cámara de campo luminoso de la IA lee las expresiones faciales en 3D
Un equipo de investigación conjunto dirigido por los profesores Ki-Hun Jeong y Doheon Lee, del Departamento de Bioingeniería e Ingeniería Cerebral del KAIST, informó del desarrollo de una técnica de detección de expresiones faciales mediante la fusión de técnicas de “cámara” de campo de luz infrarroja cercana con tecnología de inteligencia artificial (IA).
A diferencia de una cámara convencional, la cámara de campo de luz contiene conjuntos de microlentes delante del sensor de imagen, lo que hace que la cámara sea lo suficientemente pequeña como para caber en un teléfono inteligente, al tiempo que le permite adquirir la información espacial y direccional de la luz con un solo disparo. La técnica ha sido objeto de atención porque puede reconstruir las imágenes de múltiples formas, como las multivistas, el reenfoque y la adquisición de imágenes en 3D, lo que da lugar a muchas aplicaciones potenciales.
Sin embargo, la diafonía óptica entre las sombras causadas por fuentes de luz externas en el entorno y la microlente ha limitado las cámaras de campo de luz existentes para poder proporcionar un contraste de imagen preciso y una reconstrucción 3D.
El equipo de investigación conjunto aplicó un láser de emisión superficial de cavidad vertical (VCSEL) en el rango cercano al infrarrojo para estabilizar la precisión de la reconstrucción de imágenes en 3D que antes dependía de la luz ambiental. Cuando una fuente de luz externa brilla sobre un rostro en ángulos de 0, 30 y 60 grados, la cámara de campo luminoso reduce el 54% de los errores de reconstrucción de imágenes. Además, al insertar una capa absorbente de luz para las longitudes de onda visibles y cercanas al infrarrojo entre las matrices de microlentes, el equipo pudo minimizar la diafonía óptica y aumentar el contraste de la imagen en 2,1 veces.
Gracias a esta técnica, el equipo pudo superar las limitaciones de las cámaras de campo de luz existentes y pudo desarrollar su cámara de campo de luz basada en NIR (NIR-LFC), optimizada para la reconstrucción de imágenes 3D de expresiones faciales. Utilizando la NIR-LFC, el equipo adquirió imágenes de reconstrucción en 3D de alta calidad de expresiones faciales que expresaban diversas emociones, independientemente de las condiciones de iluminación del entorno.
Las expresiones faciales en las imágenes 3D adquiridas se distinguieron mediante el aprendizaje automático con una media del 85% de precisión, una cifra estadísticamente significativa en comparación con cuando se utilizaron imágenes 2D. Además, al calcular la interdependencia de la información de distancia que varía con la expresión facial en las imágenes 3D, el equipo pudo identificar la información que utiliza una cámara de campo de luz para distinguir las expresiones humanas.
El profesor Ki-Hun Jeong afirma que “la cámara de campo luminoso subminiatura desarrollada por el equipo de investigación tiene el potencial de convertirse en la nueva plataforma para analizar cuantitativamente las expresiones faciales y las emociones de los seres humanos”. Para resaltar la importancia de esta investigación, añade, “podría aplicarse en diversos campos, como la asistencia sanitaria móvil, el diagnóstico de campo, la cognición social y las interacciones hombre-máquina”.
Esta investigación se publicó en Advanced Intelligent Systems.
[content-egg module=Youtube template=custom/simple]Lo más visto del mes en: Tecnología

Laura Andrade
Laura Andrade es una periodista freelance especializada en la investigación de la electrónica de consumo, especialmente de smartphones, tabletas y ordenadores. Actualmente participa en varios proyectos en los que se ha encargado de escribir sobre lanzamientos de nuevos productos digitales, aplicaciones, sitios y servicios para publicaciones impresas o en línea. Está constantemente estudiando las últimas tecnologías para estar siempre al día.