Enseñan a las máquinas a entender lo que ven

Sonia Alfonso Sánchez

4 years ago

La investigación en inteligencia artificial abarca muchísimos campos con el objetivo de conseguir la que podría ser la máquina inteligente ideal, que percibe su entorno y lleva a cabo acciones que maximicen sus posibilidades de éxito en algún objetivo a o tarea.

El grupo Computer Vision and Pattern Discovery de la UPV/EHU, se dedica a la visión por ordenador y al aprendizaje automático.

"Básicamente utilizamos técnicas modernas de inteligencia artificial para resolver problemas de imagen muy diversos, en imágenes de todo tipo: 2D, 3D, vídeos etc…", explica Ignacio Arganda, investigador del departamento.

De hecho, el grupo de investigación está especializado en temas tan diversos como imágenes biomédicas (detección de células, tejidos, tumores…), imágenes faciales (percepción de la belleza, estimación de la edad) o imágenes de la calle (localización de vehículos, peatones…), que abordan en colaboración con investigadores de otras entidades y centros de investigación.

"En general, son técnicas de aprendizaje automático, porque normalmente partimos de un conjunto de datos, imágenes o vídeos etiquetados (en los que se conoce dónde están los objetos o qué tipo de categoría tienen), con los que enseñamos o entrenamos a nuestros modelos estadísticos o de inteligencia artificial a asignar esas mismas etiquetas a ejemplos que no habían visto antes", explica Arganda.

¿En qué se fija la red para deducir la edad de una personas o dar una puntuación de belleza?

En sendas investigaciones relacionadas con las imágenes faciales, los investigadores han propuesto mejoras en relación con la predicción de la belleza y la estimación de la edad. "En la investigación de la predicción de la belleza, intentamos replicar las puntuaciones de belleza dadas en diferentes bases de datos, utilizando técnicas semisupervisadas (en las que no todas las imágenes están etiquetadas). Para eso, utilizamos redes en las que se extraen diferentes características que se utilizan para entrenar a los modelos con los que predecir la belleza", comenta. En esta línea, los miembros del equipo han demostrado que "el aprendizaje semisupervisado, nunca utilizado hasta ahora para este tipo de problema, da tan buenos resultados o incluso mejores que el supervisado (en el que todas las imágenes están etiquetadas)", apunta.

"Para la estimación de la edad, se utilizan redes neuronales convolucionales (CNN): lo que se tiene es una imagen de entrada; una serie de filtros van extrayendo características que ayudan a tomar la decisión final, o sea un número, en este caso la edad", añade. En esta línea, "hicimos un estudio empírico para ver qué funciones de error ayudan a entrenar mejor a las redes en este ámbito, porque el error en las estimaciones se puede minimizar de diferentes maneras", explica el investigador. Los resultados experimentales obtenidos han demostrado la manera en la que se puede mejorar la estimación de la edad.

Para este tipo de predicciones y estimaciones se utilizan redes neuronales profundas: "Redes con muchísimas conexiones, muchísimos filtros, millones de datos… Pero es importante entender en qué se está fijando la red para predecir la edad de una persona o hacer cualquier otro tipo de predicción. Actualmente existe otro campo de investigación, en el que estamos sumergidos, llamado inteligencia artificial explicable o interpretable, que estudia técnicas con las que dilucidar en qué pone la red su atención", adelanta Arganda.

Asimismo, el investigador alerta de que "las técnicas de aprendizaje automático nos fectan en la vida más de lo que pensamos. Se están generando muchísimos datos y se están tomando decisiones de alto nivel en función de estos sistemas. Es muy importante tener en cuenta el factor ético. De hecho, en el aprendizaje automático, se utilizan bases de datos gigantescas con las que se entrenan los modelos, y todos los sesgos que contienen estos datos se replican en las predicciones y estimaciones que hacen los modelos, y puede ser realmente nocivo. En ese sentido, hay investigaciones abiertas en las que se estudia cómo quitar los diferentes sesgos de los datos". En opinión de Arganda, "estamos en un momento apasionante en este campo".