Datos, algoritmos y políticas: la redefinición del mundo digital by Publicaciones de la CEPAL, Naciones Unidas

Capítulo VII

Comisión Económica para América Latina y el Caribe (CEPAL)

Arquitecturas de aprendizaje profundo

Una de las principales características teóricas de la implementación de la IA en la actualidad es el aprendizaje profundo (deep learning) o basado en redes neuronales profundas (deep neural networks). Entre otras formas de articular el aprendizaje profundo, se lo ha explicado como una red neuronal artificial (ANN), perspectiva que se basa en dos conceptos. El primero sugiere que el cerebro constituye un modelo para las redes artificiales y que es posible reproducir su funcionalidad para construir inteligencia. El segundo indica que los modelos de aprendizaje de máquina que arrojan luz sobre preguntas científicas básicas no solo son útiles para resolver aplicaciones de ingeniería, sino que pueden aclarar constructos teóricos más profundos sobre lo que se considera inteligencia (Goodfellow, Bengio y Courville, 2016). Aunque el modelo del cerebro es útil para pensar en el aprendizaje profundo, puede tener un papel limitado en la investigación contemporánea, pues el cerebro es un sistema demasiado complejo para extraer de él ideas o conclusiones importantes. Por lo tanto, en lugar de quedarse con las analogías biológicas, es más útil comprender otros conceptos fundamentales que se han desarrollado en el campo del aprendizaje de máquina. Estos se organizan en las cuatro R del aprendizaje profundo: representación, reutilización, robustez y regularización. Una meta importante es encontrar características tecnológicas que permitan enfrentar desafíos de desarrollo económico y social.

a) Representación: capas profundas Una de las principales formas en que las máquinas de IA son capaces de comprender la naturaleza situacional y subjetiva de los datos es mediante el aprendizaje representacional (representational learning). Este comprende un conjunto de métodos que permiten que una máquina alimentada con datos de entrada (inputs) sin procesar descubra, a partir de esos datos, las representaciones necesarias para hacer clasificaciones (LeCun, Bengio y Hinton, 2015). Los métodos de aprendizaje profundo son esencialmente métodos de representación-aprendizaje con múltiples niveles de representación, que en forma progresiva producen representaciones con un grado de abstracción cada vez mayor. Los algoritmos tradicionales de aprendizaje de máquina, como las regresiones logísticas, se alimentan mediante elementos que representan datos no procesados. Por ejemplo, un médico interpreta una imagen escaneada y alimenta las características observadas en un sistema de aprendizaje de máquina (la máquina no recibe la imagen sino una representación de la imagen), que luego sugiere acciones (por ejemplo, calcula la probabilidad de que se requiera cirugía). Para esto se requieren doctores especializados en la tecnología de imágenes médicas, que suponen un costo elevado y cuya interpretación puede ser subjetiva. Una solución es utilizar el aprendizaje de máquina para descubrir no solo el mapeo de la representación en el resultado, sino también la representación en sí misma. Esto se denomina aprendizaje de representación (representation learning). El aprendizaje profundo implica además que los niveles de características (features) se aprenden a partir de los datos y no son diseñados explícitamente por ingenieros humanos. En otras palabras, la máquina no solo aprende la estructura de datos (aprendizaje tradicional), sino también una parte de su propia arquitectura de alto nivel. El aprendizaje de representación depende de factores particulares de variación que ayudan a separar cada factor único de la representación. Uno de los principales problemas de este enfoque es que a menudo algunos de los factores de variación influyen en múltiples datos, por lo que es necesario separar los factores de variación e ignorar aquellos que son insignificantes. El aprendizaje profundo resuelve el problema de separar los factores de variación mediante la introducción de representaciones que se expresan en términos de otras representaciones más simples (Goodfellow, Bengio y Courville, 2016). A modo de ejemplo, en el diagrama VII.1 se muestra un caso de reconocimiento de imagen, como el que se realiza millones de veces cada día en redes sociales como Facebook o Instagram.

172