2_merged

Page 1


Guía Clustering y PCA

APRENDIZAJE NO SUPERVISADO: CLUSTERING Y PCA

MOOC Habilidades Computacionales – PUCE

Clustering con k-means

Algoritmo iterativo: inicializar centroides, asignar puntos, recalcular hasta converger.

Selección de k: método del codo y Silhouette.

Ejemplo: segmentación de clientes por gasto y frecuencia.

Agrupación jerárquica

Estrategias aglomerativas: enlace completo, promedio y ward.

El dendrograma muestra el orden y la distancia de fusiones; el corte define los clústeres.

Ventaja: no exige fijar k al inicio.

Reducción de dimensión con PCA

Calcula autovalores y autovectores de la matriz de covarianza.

Los primeros componentes concentran la mayor varianza; facilita la visualización 2-D.

Scree plot: conserva componentes que sumen ≥ 80 % de varianza.

Evaluar la calidad del modelo

Índice Silhouette (–1 a 1): cohesión interna vs. separación externa.

Inercia intra-clúster: menor valor implica grupos compactos.

Relación PCA → k-means: reducir ruido antes de agrupar mejora Silhouette.

Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.