Estadística - Variables y agrupamiento de datos

Page 1

Estadística

• Variables. Tipos • Agrupamiento de datos • Gráficos

Hugo Andrés Chamorro – Octubre 2014


¿Cómo se definen la variables para un estudio o investigación? Problemas o preguntas iniciales: son el impulso para un estudio o investigación de una realidad dada. Universo: es el conjunto de objetos o personas incluidas Unidad de análisis: es cada objeto o persona del universo Variables: son características o propiedades de los objetos o personas incluidas. • Las unidades de análisis pueden caracterizarse o medirse a través de una gran diversidad de variables. ¿Deben registrarse todas estas características para un estudio dado? . Solamente las variables necesarias para dar respuesta a las preguntas que dan origen al estudio.


EJEMPLO 1 Problemas o preguntas iniciales: • Una universidad necesita modificar y ampliar sus acciones de soporte para los alumnos ingresantes: horario de clases, frecuencia de tutorías, cantidad de becas, material de información sobre carreras, etc. • Los responsables del ingreso consideran necesario antes de modificar estas acciones y políticas contar con información de los ingresantes del año en curso. • Para ello decide modificar el formulario de inscripción a fin de incluir datos que consideran necesarios, pertinentes Universo: es el conjunto de alumnos ingresantes Unidad de análisis: cada alumno ingresante Variables: son características o propiedades de los alumnos ingresantes que los responsables del ingreso consideran necesarias para diseñar e implementar adecuadamente las acciones previstas u otras no previstas.


¿Cuáles variables seleccionarías? Variable Nombre y Apellido

Género Edad Año de finalización de secundaria Nacionalidad Altura Peso Nivel de instrucción máximo en el hogar Estado civil Película favorita Cantidad de libros leídos en el último año

Deportes que practica Carrera en la que se inscribe ¿?

No


• Las variables que se utilizarán en un estudio las definen sus responsables de acuerdo con las teorías que utilizan, su experiencia previa, su ideología y sistema de valores, etc. • Por lo tanto es posible que dos investigadores coincidan en algunas de las variables como necesaria y discrepen en el caso de otras. • Para este ejemplo seleccionamos: • • • • • • •

Género Edad Año de finalización de secundaria Altura Nivel máximo de instrucción alcanzado por otro miembro del hogar Estado civil Área de la carrera elegida


TIPOS DE VARIABLES VARIABLES CATEGÓRICAS: Resultan de la clasificación de cada unidad de análisis en una clase o categoría. Ejemplos: 1) Género: una persona será clasificada como "Femenino", "Masculino", "Otro". 2) Estado civil: soltero, casado, divorciado, etc. VARIABLES NUMÉRICAS (O CUANTITATIVAS) Resultan de un conteo o de una medición. En ambos casos los valores son números, enteros en el primero, reales en el segundo. Ejemplos: 1) Cantidad de libros leídos completamente en el último año: sus valores pueden ser 0, 1, 2, … 2) Altura: debe medirse con un instrumento. Por ejemplo decimos que un hombre adulto mide 170 cm. Pero si utilizamos un instrumento de mayor precisión podríamos medir 170,5 cm, medición que también podría mejorarse a 170,53 cm …


¿Cuál es el tipo de estas variables? Variable Edad Año de finalización de secundaria

Nacionalidad Peso Nivel de instrucción máximo en el hogar Estado civil Película favorita Cantidad de integrantes del hogar Deportes que practica Carrera en la que se inscribe Gasto en transporte para llegar a la universidad

Categórica

Numérica


VOLVAMOS AL EJEMPLO 1 Antes habíamos mencionado las variables que seleccionamos para el ejemplo. Analizaremos una muestra de 20 casos simulados (no corresponden a ningún estudio real encarado por universidad alguna) En la siguiente diapositiva incluimos la planilla con los datos. Algunas variables categóricas se han codificado: se utiliza un código numérico para cada clase. Glosario y codificación: Género: "F", femenino; "M", Masculino Año_Fin_Sec: año de finalización de los estudios de nivel medio Niv_Instr_Máx: nivel máximo de instrucción alcanzado por otro miembro del hogar del estudiante 1: "Sin estudios", 2: "Nivel Primario", 3: "Nivel Secundario", 4:"Nivel terciario o universitario" Est_Civil: estado civil del estudiante: 1: Soltero; 2: Casado, 3: Unión de hecho, 4: Viudo, 5: Divorciado. Area_Carrera: área de la carrera elegida. "Salud": Ciencias de la Salud; "Soc_y_Admin": Ciencias Sociales y Administración"; "Ing_Agron": Ingeniería y Agronomía.


Muestra de 20 casos del ejemplo Estudiante 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Género F F M M F F F M F F M M F M F F M F F M

Edad Año_Fin_Sec 22 2012 27 2006 30 2000 36 1999 21 2012 23 2009 21 2011 32 2000 29 2004 33 2001 25 2013 22 2013 20 2013 21 2012 27 2012 31 2009 25 2007 24 2008 24 2008 30 2005

Altura Niv_Instr_Máx 151 2 147 3 172 3 169 4 160 3 162 4 155 4 178 4 167 4 145 2 165 2 162 2 154 2 174 4 145 2 161 3 158 4 156 4 157 3 173 4

Est_Civil Area_Carrera 3 Salud 1 Salud 2 Salud 2 Soc_y_Admin 1 Soc_y_Admin 1 Salud 1 Salud 4 Ing_Agron 5 Salud 1 Ing_Agron 1 Soc_y_Admin 1 Salud 1 Ing_Agron 2 Soc_y_Admin 3 Ing_Agron 2 Salud 3 Salud 5 Soc_y_Admin 1 Soc_y_Admin 2 Ing_Agron


Sutil diferencia: ¿DATOS ES LO MISMO QUE INFORMACIÓN? No hay una respuesta única. • Si se necesita saber la edad de un estudiante, obtenerla es a la vez contar con un dato y una información, en tanto con ese dato puede tomarse una decisión, como otorgar una beca. • Si lo que se necesita saber es la cantidad de estudiantes dentro de determinados rangos de edades, la edad de un estudiante, digamos Carlos Pérez, es un dato pero no información. Para transformar datos en información es necesario: • agrupar los datos en TABLAS, y/o • Representar estas agrupaciones en GRÁFICOS. Estos procedimientos se suelen denominar reducción estadística y facilitan ocultar los datos de los individuos, porque sólo muestran información sobre el conjunto.


Tablas con datos agrupados sobre los 20 casos de la muestra de estudiantes (I) Área de la carrera

Nº de estudiantes

Ciencias de la Salud

9

Ciencias Sociales y Administración

6

Ingeniería y Agronomía

5

Total

20

¿Cuál de los dos tipos de gráficos, circular o barras, es más adecuado? ¿Por qué? Nota: los gráficos y tablas deben contar con títulos adecuados y referencias de tiempo, lugar y fuentes de los datos.


¿Cómo se elaboran estas tablas y gráficos? Una alternativa es realizar los conteos de casos manualmente. Es posible en este ejemplo que son sólo 20 casos. Más difícil si tenemos que trabajar con cientos o miles de casos. Contamos con medios informáticos que permiten automatizar la tarea y utilizar programas informáticos especializados como Microsoft Office, Open Office o Libre Office. El primero es pago. Los dos últimos son de uso y distribución libre y gratuito.


Tablas con datos agrupados sobre los 20 casos de la muestra de estudiantes (II) Género

Nº de estudiantes

Femenino

12

Masculino

8

Total

20

Edad (años) 21 o menos 22 a 25 26 a 30 31 a 35 36 o más Total

Nº de estudiantes 4 7 5 3 1 20


Tablas con datos agrupados sobre los 20 casos de la muestra de estudiantes (III) Altura (cm) 150 o menos 151 a 160 161 a 170 171 o mรกs Total

Mujer Hombre Total 3 0 3 6 1 7 3 3 6 0 4 4 12 8 20


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.