

APRENDIZAJE NO SUPERVISADO: CLUSTERING Y PCA
MOOC Habilidades Computacionales – PUCE

MOOC Habilidades Computacionales – PUCE
Algoritmo iterativo: inicializar centroides, asignar puntos, recalcular hasta converger.
Selección de k: método del codo y Silhouette.
Ejemplo: segmentación de clientes por gasto y frecuencia.
Estrategias aglomerativas: enlace completo, promedio y ward.
El dendrograma muestra el orden y la distancia de fusiones; el corte define los clústeres.
Ventaja: no exige fijar k al inicio.
Calcula autovalores y autovectores de la matriz de covarianza.
Los primeros componentes concentran la mayor varianza; facilita la visualización 2-D.
Scree plot: conserva componentes que sumen ≥ 80 % de varianza.
Índice Silhouette (–1 a 1): cohesión interna vs. separación externa.
Inercia intra-clúster: menor valor implica grupos compactos.
Relación PCA → k-means: reducir ruido antes de agrupar mejora Silhouette.