

Aprendizaje Supervisado – Regresión y Caslificación
PROPÓSITO
Este documento entrega una visión práctica y estructurada del aprendizaje supervisado para que el estudiante sea capaz de construir modelos de regresión y de clasificación, preparar sus datos de forma correcta y evaluar el rendimiento con métricas objetivas. Todo el contenido sienta las bases para las actividades de laboratorio y para la resolución de problemas reales en entornos empresariales y académicos.
OBJETIVOS GENERALES
• Comprender la lógica matemática de la regresión lineal y aplicar la métrica MSE para cuantificar errores.
• Implementar clasificadores k-Nearest Neighbors y Árboles de decisión, comparando su exactitud (accuracy).
• Realizar la preparación, normalización y división de datos en conjuntos entrenamiento-prueba garantizando replicabilidad.
• Seleccionar la métrica adecuada a cada tarea y analizar sus implicaciones prácticas.
RESUMEN DE CONTENIDOS
Regresión lineal: ecuación y = β₀ + β₁x, ajustes con mínimos cuadrados.

Clasificación: intuición geométrica de k-NN; reglas IF-THEN de los Árboles.

Preparación y división de datos: limpieza, codificación, train/test split 80-20, validación cruzada k-fold.

Métricas de desempeño: cuándo usar accuracy, cuándo MSE, cómo interpretar resultados en modelos desbalanceados.

IMPORTANCIA PROFESIONAL
Los modelos supervisados impulsan sistemas de recomendación, diagnósticos médicos y previsiones de ventas. Dominar estas técnicas permitirá al estudiante diseñar soluciones reproducibles con Scikit-learn, justificar decisiones con cifras claras y comunicar hallazgos de forma convincente.
