Estadistica para las cs agrop 6ta ed

Page 270

Análisis de Datos Categóricos

intervalo" pero no para una nominal. En este Capítulo no se enfatizarán los tipos diferentes de análisis ya que se necesitaría de una introducción a otros tópicos de modelación propiamente dichos, lo cual escapa a los objetivos de este libro. Una variable puede ser nominal, ordinal o de intervalo, según lo que se mida o cómo se lo mida. Por ejemplo, la variable educación es nominal, si se refiere al tipo de educación: pública o privada; ordinal si mide el nivel de educación: preescolar, primario, secundario, terciario o universitario, mientras que es de intervalo si se cuantifica la cantidad de años de educación formal: 0, 1, 2,..., etc. (Agresti, 1990). Cuando los individuos extraídos de una población son clasificados de acuerdo a, por lo menos, dos características observadas en ellos, se dice que los mismos están estudiándose en forma bivariada, esto es, por medio de dos variables aleatorias. Para analizar esa información se puede construir, entre otras cosas, una tabla de contingencia. Una tabla de contingencia se obtiene cuando el conjunto de individuos o entidades, como pueden ser semillas, personas, hojas, potreros, novillos, árboles, etc., son clasificados de acuerdo a uno o más criterios. Por ejemplo, las hojas de una hortaliza pueden ser clasificadas según tengan o no síntomas de enfermedad virósica y al mismo tiempo según provengan de la parte baja, media o alta de la planta. Para el análisis de tablas de contingencia es necesario indagar primeramente en la clasificación de las variables que la definen. Ellas pueden ser: variables de respuesta o variables de clasificación. Las primeras, esto es las variables de respuesta o dependientes, son aleatorias y describen lo que fue observado en las unidades muestrales. Las segundas, las variables de clasificación o independientes o factores, son fijas por condicionamiento y las combinaciones de sus niveles definen estratos, poblaciones o subpoblaciones a las cuales las unidades muestrales pertenecen. De acuerdo con esta clasificación se definen dos tipos básicos de tablas de contingencia: Tablas donde todas las variables son de respuesta; Tablas donde algunas variables son de respuesta y otras de clasificación. En el primer caso lo que interesa, usualmente, es verificar si existe asociación entre las variables, y cuando existe, construir algún coeficiente para medir ese grado de asociación. En el segundo caso, generalmente, el objetivo es estudiar los efectos de las variables de clasificación sobre la distribución conjunta de las variables de respuesta o sobre alguna característica específica de esa distribución. Un caso particular de gran importancia es aquel en que se considera sólo una variable de respuesta y las restantes como de clasificación. En este caso, como en el ANAVA, el objetivo es estudiar la influencia aislada o combinada de los factores en la distribución de la variable de

256


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.