Sony AI propone una nueva solución para abordar el sesgo de visión por computadora contra la piel amarilla

Sony AI propone solución contra sesgo de visión por computadora en piel amarilla.

La gigante tecnológica japonesa Sony describe en un reciente artículo una posible forma de medir el sesgo del sistema contra algunos tonos de piel.

Los sistemas de visión por computadora han tenido dificultades históricamente para detectar y analizar con precisión a personas con tonos de piel con matices amarillos. La escala estándar de tipo de piel Fitzpatrick no tiene en cuenta adecuadamente la variación en la tonalidad de la piel, centrándose únicamente en el tono de claro a oscuro. Como resultado, los conjuntos de datos y algoritmos estándar muestran un rendimiento reducido en personas con tonos de piel amarillos.

Este problema afecta de manera desproporcionada a ciertos grupos étnicos, como los asiáticos, lo que lleva a resultados injustos. Por ejemplo, los estudios han demostrado que los sistemas de reconocimiento facial producidos en Occidente tienen una precisión inferior para los rostros asiáticos en comparación con otras etnias. La falta de diversidad en los datos de entrenamiento es un factor clave que impulsa estos sesgos.

En el artículo, los investigadores de Sony AI proponen un enfoque multidimensional para medir el color aparente de la piel en imágenes con el fin de evaluar mejor la equidad en los sistemas de visión por computadora. El estudio argumenta que el enfoque común de utilizar la escala de tipo de piel Fitzpatrick para caracterizar el color de la piel es limitado, ya que solo se centra en el tono de la piel de claro a oscuro. En cambio, los investigadores proponen medir tanto la luminosidad perceptual L* para capturar el tono de la piel como el ángulo de matiz h* para capturar la tonalidad de la piel que va desde el rojo hasta el amarillo. William Thong, autor principal del estudio, explicó:

“Si bien es práctico y efectivo, reducir el color de la piel a su tono es limitante dada la complejidad constitutiva de la piel. […] Por lo tanto, promovemos una escala multidimensional para representar mejor las variaciones aparentes del color de la piel entre las personas en las imágenes.”

Los investigadores demostraron el valor de este enfoque multidimensional en varios experimentos. Primero, mostraron que los conjuntos de datos de imágenes faciales estándar como CelebAMask-HQ y FFHQ están sesgados hacia el color de piel rojo claro y subrepresentan los colores de piel amarillo oscuro. Los modelos generativos entrenados con estos conjuntos de datos reproducen un sesgo similar.

En segundo lugar, el estudio reveló sesgos de tono y tonalidad de la piel en modelos de recorte de imágenes basados en la prominencia y en modelos de verificación facial. El algoritmo de recorte de imágenes de Twitter mostró una preferencia por los colores de piel rojo claro. Los modelos populares de verificación facial también tuvieron un mejor rendimiento en colores de piel claros y rojos.

Finalmente, la manipulación del tono y la tonalidad de la piel reveló efectos causales en los modelos de predicción de atributos. Las personas con tonos de piel más claros tenían más probabilidades de ser clasificadas como femeninas, mientras que aquellas con tonalidades de piel más rojas se predijeron con más frecuencia como sonrientes. Thong concluyó:

“Nuestras contribuciones para evaluar el color de piel de manera multidimensional ofrecen nuevas ideas, antes invisibles, para comprender mejor los sesgos en la evaluación de equidad tanto de conjuntos de datos como de modelos.”

Los investigadores recomiendan adoptar escalas de color de piel multidimensionales como herramienta de equidad al recopilar nuevos conjuntos de datos o evaluar modelos de visión por computadora. Esto podría ayudar a mitigar problemas como la subrepresentación y las diferencias de rendimiento para colores de piel específicos.

Crédito de la imagen destacada: