Bioestadistica Aplicada con R y RKTeaching

Page 178

Bioestad´ıstica Aplicada con R y RKTeaching ´ de individuos con problemas gastrointestinales es la misma mos analizar si la proporcion en ambas. ´ ´ Por ultimo, aunque el test de la Chi-cuadrado es muy importante en el analisis de las relaciones ´ puede conducir a errores en determinadas situaciones; soentre variables cualitativas, su aplicacion ˜ muestrales son pequenos, ˜ bre todo cuando los tamanos lo cual conduce a que en algunas categor´ıas ´ del test; y tambien ´ cuando teneapenas tengamos individuos y ello invalida los supuestos de aplicacion mos variables cualitativas con valores s´ı o no analizadas en los mismos individuos pero en diferentes ´ tiempos, es decir, mediante datos pareados. Para el primer caso, cuando el numero de individuos en ˜ se utiliza el test Exacto de Fisher, mientras que en el segundo, con alguna categor´ıa es muy pequeno, datos pareados, se utiliza el test de McNemar.

1.1 Contraste χ2 de Pearson para ajuste de distribuciones ´ antiguo y es valido ´ Es el contrate de ajuste mas para todo tipo de distribuciones. Para analizar una ´ muestra de una variable agrupada en categor´ıas (aunque sea cuantitativa), evaluando una hipotesis ´ previa sobre probabilidad de cada modalidad o categor´ıa, se realiza un contraste de hipotesis Chicuadrado de bondad de ajuste. El contraste se basa en hacer un recuento de los datos y comparar las frecuencias observadas de ´ cada una de las modalidades con las frecuencias esperadas por el modelo teorico que se contrasta. De este modo, se calcula es estad´ıstico: χ2 =

k X (Oi − Ei )2 , Ei i=1

donde Oi son las frecuencias observadas en la muestra en la modalidad i, y Ei son las frecuencias ´ el modelo teorico. ´ esperadas para la misma modalidad segun Las frecuencias esperadas se calculan ˜ de la muestra por la probabilidad de la correspondiente modalidad segun ´ el multiplicando el tamano ´ modelo teorico, es decir Ei = npi , siendo pi la probabilidad de la modalidad i. ´ de la que se ha obtenido la muestra sigue el modelo de distribucion ´ teorica, ´ Si la poblacion el ´ estad´ıstico anterior se distribuye como χ2 con k − 1 grados de libertad, donde k es el numero de modalidades de la variable. Un valor del estad´ıstico χ2 grande indica que las distribuciones de las frecuencias ˜ del estad´ıstico indica observadas y esperadas son bastantes diferentes, mientras que un valor pequeno que hay poca diferencia entre ellas. ´ La prueba χ2 de bondad del ajuste es valida si todas las frecuencias esperadas son mayores o ´ de un 20 % de ellas tienen frecuencias esperadas menores que 5. Si no se cumiguales que 1 y no mas ple lo anterior, entonces las categor´ıas implicadas deben combinarse con categor´ıas adyacentes para ´ Si las categor´ıas corresponden a variables cuantitativas garantizar que todas cumplen la condicion. categorizadas, no tienen necesariamente que corresponder a la misma amplitud de variable.

1.2 Contraste χ2 en tablas de contingencia Como ya hemos visto, el contraste de la χ2 en tablas de contingencia sirve para establecer relaciones entre variables cualitativas (o cuantitativas categorizadas), entre las que no puede realizarse ´ ´ y correlacion, ´ y tanto para determinar independencia entre variables, como un analisis de regresion ´ de una determinada caracter´ıstica). Para ello, deshomogeneidad entre poblaciones (igual proporcion ´ ´ cribimos el proceso metodologico en el caso de independencia entre variables, que en la practica, ´ para la homogeneidad entre y aunque conceptualmente son casos diferentes, es el mismo tambien poblaciones. Por tablas de contingencia se entiende aquellas tablas de doble entrada donde se realiza una ´ de la muestra de acuerdo a un doble criterio de clasificacion. ´ Por ejemplo, la clasificacion ´ clasificacion de unos individuos de acuerdo a su sexo y su grupo sangu´ıneo crear´ıa una tabla donde cada celda de la tabla representar´ıa la frecuencia bivariante de las caracter´ısticas correspondientes a su fila y ˜ n columna (por ejemplo mujeres de grupo sangu´ıneo A). Si se toma una muestra aleatoria de tamano en la que se miden ambas variables y se representan las frecuencias de los pares observados en una

170


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.