Factores condicionantes de la calidad de los programas de ciclo corto en América Latina y el Caribe
Cuadro 4.2 Estimación de las contribuciones de los factores condicionantes de la calidad a los resultados académicos y del mercado laboral: un enfoque de regresión LASSO Para estimar las contribuciones de las prácticas e insumos de los programas a los resultados académicos y del mercado laboral, la Encuesta de Programas de Ciclo Corto del Banco Mundial (EPCCBM) tiene la fantástica ventaja de proporcionar un amplio conjunto de variables explicativas que pueden considerarse como factores condicionantes de la calidad. Sin embargo, el gran número de variables explicativas plantea dos cuestiones. La primera es la selección del conjunto «adecuado» de variables explicativas. Por un lado, utilizar muy pocos controles o los inadecuados puede crear un sesgo de variables omitidas. Por otro lado, utilizar demasiados puede llevar a un sobreajuste del modelo. La segunda cuestión es que el tamaño de las muestras de algunos países es pequeño. Por ejemplo, en la República Dominicana solo existen 80 PCC. Dado que puede haber más variables que observaciones, cabe la posibilidad de no identificar el modelo. Para abordar la primera de estas cuestiones, se podrían crear índices dentro de cada una de las cinco categorías de factores condicionantes mediante el uso de técnicas estadísticas de reducción de datos, como los análisis de factores condicionantes o de componentes principales. Sin embargo, esta técnica precisa de datos a nivel de intervalo, requisito que no cumplen algunas de las variables de la encuesta. Además, los tipos de variables (variables a nivel de intervalo o dummy) variarían dentro de cada factor condicionante, lo que impediría el uso de estas técnicas. Por lo tanto, para resolver los problemas de selección de las variables explicativas y la posible subidentificación o no identificación del modelo, los parámetros de interés se estiman mediante la técnica de operador de selección y contracción mínima absoluta (LASSO, por sus siglas en inglés). Esta técnica se utiliza en la literatura especializada para estimar parámetros en modelos lineales con varios controles, a fin de mejorar el ajuste del modelo. De forma intuitiva, LASSO descarta las variables que contribuyen poco al ajuste. Se sigue un proceso en dos fases. La primera fase utiliza una metodología LASSO adaptativa y estima el siguiente modelo para cada resultado de interés: y jc = α 0 +
∑
6
Q djc ′α 1 + C jc ′α 2 + φc + ∈jc (B4.2.1)
d =1
donde yjc representa el resultado promedio académico (tasas de deserción y tiempo adicional para graduarse) o laboral (empleo formal y salarios) de interés para los graduados del PCC j en el país c. Q jcd es un vector que incluye todas las variables dentro de cada una de las seis categorías de factores condicionantes de la calidad. Cjc es un vector de variables de control a nivel de programa e institución de educación superior (IES). Estos controles son características del programa o de la IES que no constituyen un factor condicionante de la calidad, como los años de funcionamiento de la IES y la antigüedad del programa, entre otros. Algunas de estas características (como que la IES sea una institución con ánimo de lucro, sea pública o privada, o sea una universidad) se «fijan» continúa en la siguiente página
155