12 minute read

Machine Learning en educación: Learning Analytics

Kevin Hernández [kevinhernandezbel@hotmail.com] Facultad de Ciencias de la Salud Universidad Dr. Andrés Bello

Resumen

Advertisement

En este artículo se desarrolla una breve introducción a la analítica del aprendizaje o «Learning Analytics», cuya base está en el Aprendizaje Automático o «Machine Learning» pero orientado a la educación. «Machine Learning» es una herramienta de alto impacto que está siendo usada en diferentes ámbitos de las ciencias sociales y exactas, las recomendaciones en las plataformas de transmisión continua o «streaming» son un ejemplo del uso de «Machine Learning», sin embargo, la orientación a la educación es reciente. Definiciones y aplicabilidades son presentadas en este artículo en torno a preguntas o necesidades del centro educativo, las posibles soluciones o planteamientos pueden ser genéricas. Se introduce también los temas de predictibilidad y minería de datos en educación, que precisamente son temas que pueden ser aplicados a otras áreas.

Palabras clave: Educación, «Machine Learning», Estudiantes, Analítica del aprendizaje, Estadística, administración.

Introducción

A lo largo de la historia la educación ha entrado en diversas etapas de evolución, ciertamente, se intenta mejorarla en función de los diversos fines que se persigan, actualmente, la educación está atravesando una etapa de virtualización obligatoria debido a la pandemia del COVID19, lo que ha ocasionado que se haya alternado del formato de educación presencial a uno semipresencial. La virtualización ha sido una oportunidad para digitalizar diversos cursos que tradicionalmente se imparten en forma presencial. El auge de los contenidos digitales propicia una mayor retención del conocimiento, además, de generar nuevo conocimiento [1].

Sin embargo, para medir este aprendizaje por parte de los estudiantes, se suelen utilizar diferentes métodos, ya sean cuantitativos o cualitativos, orientados a la evaluación educativa.

El manejo de estos métodos a menudo suele tener diversos errores. En España se realizó una investigación sobre el análisis estadístico a una muestra de profesores de educación primaria [2], en la cual se puede citar que «sumados los gráficos incorrectos y parcialmente incorrectos, más de la mitad de los futuros profesores realizaron gráficos con algún tipo de error. Es preocupante la proporción de futuros profesores que cometen errores graves en la elaboración de gráficos que presentan a sus estudiantes», ciertamente, la educación es una construcción histórica y la falta de capacitación al personal docente propicia que los errores se vayan acumulando a medida éstos dejan de asistir a diversas capacitaciones, ya que la evaluación educativa se debe ver como una oportunidad de mejorar, no como una estigmatización o en menor medida, como una posible amonestación [3, 4].

Ciertamente, los docentes son formados en áreas del conocimiento como: ciencias naturales y matemática, ingeniería y tecnología, ciencias médicas y de la salud, ciencias agrícolas y veterinaria, ciencias sociales, o en humanidades y arte [5]; lo cual implica que no necesariamente todos los docentes están formados académicamente para ejecutar análisis estadísticos.

La formación docente necesaria para ejecutar programas estadísticos puede ser asimilado por diferentes instituciones públicas y privadas, pero el coste y la falta de tiempo pueden estancar la solución de este problema, es acá donde toma realce la importancia de los especialistas para las evaluaciones educativas

Un agente externo formado fuertemente en matemáticas y estadística, con conocimientos sólidos en programación, educación y humaniades puede en principio recopilar datos de calificaciones, datos no personales de estudiantes y docentes, riesgos del centro educativo, matrícula anual, propuestas de proyectos, etc.; todo ello en formatos semi digitales; es decir, tanto en papel físico como en memorias digitales con los que se pueden brindar soluciones a preguntas cómo: ¿se tiene capacidad para más estudiantes con relación a los docentes?, ¿se cuenta con buena calidad educativa con base al aprendizaje/enseñanza? ¿cuál será el nivel óptimo de actividades extracurriculares para los estudiantes de tal manera que no descuiden sus estudios?, ¿cuándo es mejor programar las actividades evaluativas y formativas a nivel general?

Es de tener en cuenta que la virtualización ha afectado esta formación especializada en matemáticas y estadísticas, ahora los docentes son formados en tecnologías híbridas basadas en la web, como las aulas virtuales, exámenes en líneas tareas digitales, etc. Sin embargo, las personas encargadas de los análisis estadísticos han evolucionado, incorporando nuevos elementas de programación, para procesar más datos, tales como las herramientas de datos masivos o «Big Data» sean estos estructurados o no, consecuentemente es posible que se necesite afinar detalles de programación para obtener resultados idóneos de acuerdo con los objetivos y metas del centro educativo en donde laboren.

«Machíne Learníng»

Es una disciplina del campo de la inteligencia artificial que, a través de algoritmos, dota a los ordenadores de la capacidad de identificar patrones en datos masivos y elaborar predicciones (análisis predictivo).

Esto es posible debido a que los algoritmos de programación han evolucionado desde simples funciones definidas por el usuario, pasando por las clases y atributos, hasta la era moderna en donde se implementan algoritmos de inteligencia artificial; una definición usual sobre inteligencia artificial es: "la habilidad que tiene una computadora para presentar las mismas capacidades que un humano a nivel de procesamiento de información, aprendizaje y toma de decisiones" [6], claramente, la computadora a través de algoritmos de programación genera resultados con base en unos supuestos que el ser humano propone. Dentro de la inteligencia artificial es donde aparecen los conceptos de «Machine Learning» y aprendizaje profundo o «Deep Learning» cuya diferencia radica en su nivel de profundidad de aprendizaje automático.

Algunos autores consideran que «Deep Learning» es parte de «Machine Learníng», esto debido a que el aprendizaje de máquina tiene 4 variantes: aprendizaje supervisado, no supervisado, reforzado y profundo. Si bien las primeras 3 variantes son con base en datos y pruebas estadísticas el «Deep Learníng» intenta imitar el aprendizaje humano utilizando redes neuronales artificiales [6].

Las técnicas de análisis de datos usuales dentro de «Machine Leaming» son las siguientes:

• Regresión lineal, polinómica, exponenciales u otros comportamientos.

• Árboles de decisiones.

• Redes neuronales.

• Red Bayesiana.

• Cadenas de Markov.

• Algoritmos de Montecarlo.

A través de estás técnicas el algoritmo basado en «Machine Learning» recopila datos, limpia, dearrolla y ejecuta predicciones (6, 7). El proceso de construcción de un modelo de «Machíne Learning» está resumido en la figura 1, cada proceso de construcción requiere por lo menos de 6 pasos para su implementación, sin embargo, es un proceso cíclico porque permite la reutilización del modelo para nuevos datos, entre más datos, la predicción es mejor en un nivel de aceptabilidad (6,7).

Se destaca que los lenguajes de programación más usados en modelos de «Machine Learníng» son: Python, R, Matlab y Julia (7). La selección del programa a utilizar depende en gran medida del tipo de problema a resolver, por ejemplo, Julia es más rápido que Python para resolver problemas de índole específicos, como bioinformática o biología, aunque Python es más para tareas generales (7).

La predicción de los modelos de «Machíne Learníng» tienen implícito un rango de validez, es decir, dependen del número de datos recibidos, de los datos útiles para la predicción, del modelo a ejecutar, y del período seleccionado. Por ejemplo, se explica que parte de las aplicaciones de los modelos de «Machíne Learning » [71 son dados en detección de correos no deseados, recomendaciones para clientes en Amazon, detección de patrones de imágenes, etc. El «Machíne Learning» se ha aplicado a procesos de Marketing a fin de encontrar la probabilidad de la función objetivo que impacte a consumidores a través del modelo de elevación o «Uplíft» [8]. Para predecir la experiencia del cliente en cuanto a los suministros eléctricos se refiere, utilizando el histórico de datos de series temporales de los suministros. [9]

Ciertamente, las ventajas de los modelos de «Machine Learning)> tienden a predecir variables, con base en datos históricos, utilizándose en distintas áreas como logística, economía, finanzas y educación. Desde el nacimiento del internet, pasando por la virtualización de cursos y aprendizaje informal se han estado almacenando datos de los consumidores-estudiantes acerca de su experiencia educativa en estos sistemas.

Minería de datos en educación

La minería de datos es el proceso de extraer información, anomalías, patrones y correlaciones en grandes conjuntos de datos para predecir resultados, por ejemplo: datos del clima podría dar información de la probabilidad de que hoy llueva o prediga el máximo de temperatura y el mínimo en una zona determinada.

Se ha destacado que la minería de datos educacionales es más ventajosa frente a los métodos tradicionales de investigación [10], por ejemplo: experimentos de laboratorio, estudios sociológicos o investigaciones de diseño. La tabla 1 muestra los enfoques de minería de datos en educación [10]. Esto se debe a que los estudiantes interactúan más con las plataformas digitales, por tanto, hay más registro de datos de los estudiantes en ellas, que al realizar una encuesta para una muestra pequeña. En tal sentido, la minería de datos en educación propicia nueva información para los estudiantes, docentes, directores, supervisores e inclusive el propio Ministerio de Educación, ciertamente, el uso de análisis estadístico podría ser suficiente para escuelas pequeñas, no obstante, utilizar modelos de «Machine Learning» podría incluso aumentar la calidad educativa del mismo.

Entonces, la minería de datos en educación propicia nueva información para los estudiantes, docentes, directores, supervisores e inclusive el propio ministerio de educación, ciertamente, el uso de análisis estadístico suele ser suficiente para escuelas pequeñas, no obstante, utilizar modelos de Machine Learning podría incluso aumentar la calidad educativa del centro educativo

Estas son las orientaciones iniciales de los datos obtenidos en educación de manera general, los ejemplos mostrados anteriormente son aplicados con análisis estadísticos o modelos de «Machine Learning».

«Learning Analytics»

Se describe como «la medición, recolección, análisis e informe de datos de los alumnos, y sus contextos, con el fin de entender y optimizar el aprendizaje y los contextos en los que ocurre» [11], esta definición formal está más orientada hacia el aprendizaje del estudiante, considerando que se debe optimizar el aprendizaje a través de estas.

Los estudiantes suelen buscar en internet mejores explicaciones de las que reciben en el aula presencial, escenario que da lugar a la recolección de datos, a través de la huella del estudiante en internet; En tal sentido, con el uso de las aulas virtuales aparece la integración de las nuevas tecnologías como «Learning Analytics» (figura 2) para agregar información, que el docente no puede incorporar presencialmente, por ejemplo: si el docente coloca un video de 7 minutos, puede extraer datos como, por ejemplo:

¿Cuántos estudiantes vieron exactamente los 7 minutos del video? ∞ ¿Cuántos estudiantes lo vieron en menos de 3 minutos?

∞ ¿En qué horario los estudiantes visualizan el video?

La primera pregunta, le diría al docente que los videos largos o cortos son óptimos para el estudiante en términos de tiempo invertido, la segunda pregunta está más asociada a la capacidad del estudiante para aprender más rápido buscando las partes más importantes del video mientras que la tercera pregunta está asociada a la mejor hora de publicar un video, ciertamente esto podría ayudar al docente en la planificación.

Los modelos usuales suelen elaborar preguntas que estén asociadas a las necesidades de la institución educativa, luego de conocer estas necesidades inicia el proceso de recolección de datos de los estudiantes, que luego deben pasar por filtros, prellenados, separación, clasificación, etc., pertenecientes a algún algoritmo de programación que debe devolver un informe que incluya el análisis de los datos, con este análisis se precisa tomar decisiones que puedan optimizar el proceso de aprendizaje/enseñanza.

En general, los entornos virtuales de aprendizaje son una herramienta principal para el uso de la analítica del aprendizaje, por lo que se espera reconocer patrones o aplicar predicción. Al tomar datos entramos a un campo completamente nuevo para el docente, los datos deben resolver ciertos problemas (11):

∞ Localización e interpretación de los datos.

∞ Consentimiento informado, privacidad y desindentificación de los datos.

∞ La gestión, clasificación y almacenamiento de los datos.

Estos problemas están asociados a la ética de los datos que, al ser datos disponibles para cualquier usuario, pueden caer ante un problema legal (12), no obstante, ya hay artículos que resuelven estos problemas como poniendo límites al almacenamiento, separar datos de los nombres de usuarios, solicitar consentimiento de los datos, cómo se va a administrar, y cuál será su tiempo de vida, etc.

Dentro de la analítica del aprendizaje, se propone utilizar modelos predictivos para diferentes variables o inclusive multivariables actuando sobre un solo fenómeno. Las preguntas usuales que pueden resolverse con predictibilidad son:

Conclusiones

En la era del internet, es necesario establecer separaciones entre la información apta para el aprendizaje del estudiante como las metodologías de enseñanza por parte de los docentes. «Learning Analytics» se prepara para clasificar esta información y evaluar eventos futuros de la aplicabilidad de nuevas metodologías, no es una sorpresa que utilice la información de los estudiantes, por ende, los informes son generados con base en datos pasados del estudiante, pero no son la excepción, porque pueden utilizarse algoritmos que utilicen datos actuales y de forma remota; eventualmente, generar un evento con predicción.

∞ ¿Cuál es la probabilidad de que un estudiante se retire a medio semestre?

∞ ¿Cuál es el número de estudiantes que van a dejar el curso dado un examen de nivel intermedio?

∞ ¿Cómo aumentaría la matrícula estudiantil si se utiliza una metodología diferente de mercadeo y publicidad?

∞ Un examen de 10 preguntas puede ser respondido en 1 hora por 80% de los estudiantes, y si se aumenta a 2 horas, lo entregaría 95% de los estudiantes, ¿cuántas preguntas debe tener el examen para que 90% de los estudiantes terminen en 45 minutos?

Normalmente, el uso de estadística descriptiva es suficiente para la primera pregunta o inclusive, se podría hacer a través de la distribución binomial conociendo el promedio de estudiantes retirados en el primer mes, podría extenderse a medio mes. Para la segunda pregunta, que está asociada a la deserción estudiantil por bajo promedio en el curso, utilizando regresión lineal podría establecerse mejor la respuesta. En la tercera pregunta, es necesario utilizar datos geo referenciados o «geodatas» para encontrar estudiantes aptos para matricularse, el lanzamiento de publicidad en estas áreas podría incentivar a nuevos estudiantes, usando también para ello regresión lineal. En la última pregunta, ciertamente se debe usar métodos más formales de estadística inferencial, responder esa pregunta traería un ahorro en recursos materiales como humanos a la institución educativa, y definiría el tipo de examen que se debe realizar para alcanzar las competencias necesarias.

En diversos casos de estudios en educación, se destacan: identificación de estudiantes en riesgo, alerta temprana, caminos personalizados, analítica predictiva u otros. Es importante establecer, que los modelos pueden ser replicados en diferentes centros educativos, esto permite un grado de flexibilidad para extender en otros problemas.

Probablemente, el docente no tiene por la especialización de su formación, el uso de herramientas para tal actividad, la analítica de aprendizajes requiere de formación continua para establecer un punto de partida, no es sorpresa que suelen trabajar con agentes externos que propician la calidad educativa.

Evaluar las competencias de los estudiantes podría establecer un punto de partida para que el docente tome decisiones basadas en los primeros resultados. si bien evaluaciones cualitativas podrían generar algunas respuestas para el cambio de la mala calidad de enseñanza (responsable de malas calificaciones), los datos cuantitativos basados en «Machine Learning» y «Learning Analytics» podrían también generar un nuevo e importante punto de vista.

«Learning Analytics» evalúa con base en información de los estudiantes que deben pasar por la ética de los datos, la obtención de estos ya resuelve un buen porcentaje del problema de analítica, el resto es elaborado a través de programación y genera un informe detallado de los niveles de comprensión.

Bibliografía

«Learning Analytics» propicia herramientas de mejora de la calidad educativa, relación enseñanza/ aprendizaje, infraestructura y evolución del centro educativo,. diversos artículos ya han sido generados utilizando estas herramientas, que fueron aplicadas inicialmente a los negocios, para mejorar las ventas de una empresa, generando modelos de predictibilidad, de elección y de proveedores; por lo que, aplicarlas al centro educativo, como un centro de servicios de aprendizajes, podría aumentar su calidad educativa con modelos de predictibilidad.

No es sorpresa que Learning Analytics propicia herramientas de mejora de la calidad educativa, de la relación enseñanza/aprendizaje, de la infraestructura y de la evolución del centro educativo, diversos artículos ya han sido generados utilizando estas herramientas, que si bien es cierto, primero fue aplicado a los negocios, para mejorar las ventas de una empresa a través de business analytics, generando modelos de predictibilidad, de elección y de proveedores, por lo que, ver el centro educativo como un centro de servicios de aprendizajes puede aumentar su calidad educativa con simples modelos de predictibilidad.

1. Valero AL, Martínez IJ. 2015. Textualidad digital y multialfabetización. Los contenidos digitales como material educativo. Educatio Siglo XXI; 165-182.

2. Arteaga P, Batanero, C, Contreras JM, Cañadas G. 2016. Evaluación de errores en la construcción de gráficos estadísticos elementales por futuros profesores. Revista latinoamericana de investigación en matemática educativa; 19(1): 15-40.

3. Anijovich R, Cappelletti G. 2017. La evaluación como oportunidad.

4. López Belmonte J, Pozo Sánchez S, Fuentes Cabrera A, Gómez García G. 2019. Análisis del efecto de la formación «b-Learning» en el profesorado. Estudio de caso de una cooperativa de enseñanza.

5. OCDE. 2015. Frascati Manual 2015: Guidelines for Collecting and Reporting Data on Research and Experimental Development, The Measurement of Scientific, Technological

6. and Innovation Activities. Publicado por acuerdo con la OCDE, París (Francia).

7. DOI: http://dx.doi.org/10.1787/9789264239012-enMaisueche

8. Cuadrado A. 2019. Utilización del «Machine Learning» en la industria 4.0.

9. Rojas EM. 2020. Machine Learning: análisis de lenguajes de programación y herramientas para desarrollo. Revista Ibérica de Sistemas e Tecnologias de Informação: 586-599.

10. Llusar Saura Ó. 2020. Estudio de las aplicaciones de «Machine Learning» a proyectos de marketing.

11. Ruiz Brückel T. 2020. Desarrollo e implementación de modelos de «Machine Learning» para aplicaciones de gestión y eficiencia energética.

12. Galindo ÁJ, García H. 2010. Minería de Datos en la Educación. Universidad Carlos III: 1-8.

13. Amo D, Santiago R. 2017. Learning Analytics: la narración del aprendizaje a través de los datos (Vol. 2). Editorial UOC.

14. Oliver Jeffrey. 2021. Data science students don’t know a lot about ethics — and that’s a problem. Disponible en: https:// thenextweb.com/

15. Sclater N, Peasgood A, Mullan J. 2016. Learning analytics in higher education. London: Jisc. Accessed February; 8(2017): 176.

This article is from: