3 minute read

Análisis de Varianza - ANOVA

Un ANOVA («Análisis de varianza») es una técnica estadística que se utiliza para determinar si existe o no una diferencia significativa entre las medias de tres o más grupos independientes. Los dos tipos más comunes de ANOVA son el ANOVA unidireccional y el ANOVA bidireccional

Suposiciones en el análisis de la varianza (ANOVA)

Advertisement

1. Las poblaciones siguen la distribución normal.

2. Las poblaciones tienen desviaciones estándares iguales

3. Las poblaciones son independientes.

El análisis de la varianza es un procedimiento creado por Fisher en 1925 para descomponer la variabilidad de un experimento en componentes independientes que puedan asignarse a causas distintas.

El problema general que vamos a estudiar es el siguiente: disponemos de ���� elementos que se diferencian en un factor: por ejemplo,

 alumnos de distintas clases (factor clase),

 coches de distintas marcas (factor marca),

En cada elemento observamos una característica continua (X) que varía aleatoriamente de un individuo a otro:

 notas de Estadística de los alumnos,

 consumo de gasolina

A esta característica se le llama variable respuesta.

Nuestro objetivo será conocer si existe o no relación entre la variable respuesta y el factor:

 ¿habrá diferencias en las notas de los distintos grupos de Estadística?,

 ¿tendrán coches similares de distintas marcas el mismo consumo de gasolina?

Comprobación de las hipótesis previas

Normalidad.

Se comprueba con los contrastes Kolmogorov-Smirnov-Lillefors, Shapiro-Wilk, y los test de Asimetría (próximo a 0 implica normalidad) y de Kurtosis (cercano a 3). La violación del supuesto de normalidad no afecta de forma importante al estadístico F de Fisher-Snedecor, siempre que los tamaños muestrales sean grandes (n>30 0 n>50, según el investigador/a), porque al tratarse de un test de comparativa de medias, se puede aplicar el Teorema Central del Límite.

Homocedasticidad

Comprobación: Análisis gráfico de residuos, Test de Esfericidad de Bartlett, Test de Hartley y el Test de Levene de homogeneidad de varianzas. El ANOVA es robusto frente a la violación de la hipótesis de homocedasticidad, si los tamaños muestrales de los grupos o tratamientos son idénticos o, al menos, muy parecidos.

Independencia y aleatoriedad de las muestras

Comprobación: Análisis gráfico de los residuos. El Test ANOVA no resulta robusto frente a la violación de la hipótesis de independencia y aleatoriedad de las muestras.

Análisis de varianza de un Factor

Para realizar el contraste ANOVA, se requieren k muestras independientes de la variable de interés. Una variable de agrupación denominada Factor y clasificar las observaciones de la variable en las distintas muestras.

Suponiendo que la hipótesis nula es cierta, el estadístico utilizado en el análisis de varianza sigue una distribución F de Fisher-Snedecor con k-1 y n-k grados de libertad, siendo k el número de muestras y n el número total de observaciones que participan en el estudio.

Tres profesores dan clases de inglés en una misma escuela. Se desea contrastar, si existen diferencias significativas en la forma de enseñanza de los tres profesores. Para ello se seleccionan tres muestras de alumnos y se anota el número de preguntas correctas en el examen.

Contrastar al 5 % de significación si existen diferencias entre los profesores.

Se sospecha que hay diferencias en la preparación del examen de selectividad entre los diferentes centros de bachillerato de una ciudad. Con el fin de comprobarlo, de cada uno de los 5 centros, se eligieron 8 alumnos al azar, con la condición de que hubieran cursado las mismas asignaturas, y se anotaron las notas que obtuvieron en el examen de selectividad.

Los resultados fueron: a) Crear las variables nota y centro e introducir los datos de la muestra. b) Dibujar el diagrama de dispersión. ¿Qué conclusiones sacas sobre la nota media de selectividad en los distintos centros? c) Realizar el contraste de ANOVA. ¿Se puede confirmar la sospecha de que hay diferencias entre las notas medias de los centros? d) ¿Qué centros son los mejores en la preparación de la selectividad? a) Realizar un diagrama de cajas para analizar cada centro la relación entre dos variables utilizando el para estimar la relación lineal entre dos

Seleccionar Post hoc y activar las opciones de Bonferroni, para ver los intervalos de diferencias entre centros, y de Duncan para establecer grupos de comportamiento homogéneo.

En este caso hay que interpretar la columna de significación, si esta es menor o igual que 0,05 , las diferencias entre los grupos formados por la variable 1 son significativas, y a la izquierda podemos ver entre qué grupos exactamente hay diferencias.

Si el nivel de significación es mayor que 0,05, como en nuestro caso, no hay diferencias significativas.

 Evaluar una ecuación de regresión para predecir la variable dependiente. erminación. confianza y de predicción.

Cuando se estudia la relación entre dos variables en escala de intervalo (o de razón), es usual comenzar con un diagrama de dispersión. Este procedimiento proporciona una representación visual de la relación entre las variables

This article is from: