

APRENDIZAJE NO SUPERVISADO: CLUSTERING Y PCA
MOOC Habilidades Computacionales – PUCE

![]()


MOOC Habilidades Computacionales – PUCE

Algoritmo iterativo: inicializar centroides, asignar puntos, recalcular hasta converger.
Selección de k: método del codo y Silhouette.
Ejemplo: segmentación de clientes por gasto y frecuencia.

Estrategias aglomerativas: enlace completo, promedio y ward.
El dendrograma muestra el orden y la distancia de fusiones; el corte define los clústeres.
Ventaja: no exige fijar k al inicio.

Calcula autovalores y autovectores de la matriz de covarianza.
Los primeros componentes concentran la mayor varianza; facilita la visualización 2-D.
Scree plot: conserva componentes que sumen ≥ 80 % de varianza.

Índice Silhouette (–1 a 1): cohesión interna vs. separación externa.
Inercia intra-clúster: menor valor implica grupos compactos.
Relación PCA → k-means: reducir ruido antes de agrupar mejora Silhouette.

