Tablas de distribución de frecuencias con datos agrupados
Jorge Hernán Álvarez Pérez
Procedimiento para determinar la tabla de distribución de frecuencias con datos agrupados en intervalos. Para aplicar el procedimiento se explicará paso a paso en un ejemplo. Ejemplo Se seleccionó una muestra de 30 estudiantes de un curso de Estadística, con el fin de conocer su peso en kilos. 74 88 68
67 52 83
94 58 74
70 69 61 71 76 57 72 66 92 (Martínez, 2013).
79 48
47 56
85 63
82 71
55 60
65 64
A partir de los datos presentados construir la tabla de distribución de frecuencias agrupadas en intervalos. Definir la variable de estudio (Xi) La variable estudio es aquella que presenta los datos observados, para este ejemplo peso en kilos de los estudiantes de Estadística. Se determinan los intervalos Para identificar la clase, se debe desarrollar los siguientes pasos. a) Ordenar los datos de forma ascendente. 47 67 85
48 68 88
52 69 92
55 70 94
56 71
57 71
58 72
60 74
61 74
63 76
64 79
65 82
66 83
b) Se determina el número mayor y el menor Para este ejemplo el número mayor es 94 y el menor es 47. c) Se calcula el rango, que es la diferencia entre el número mayor y el menor 94 – 47 = 47.
d) Se determina el nĂşmero de intervalos que es igual 1 + 3,3 log(n), donde n es el tamaĂąo de la muestra, para este ejemplo n = 30; nĂşmero de intervalos = 1 + 3,3 * log (30) = 5,8745, este valor se aproxima a 6, utilizando la funciĂłn de Excel Redondear =REDONDEAR(1 + 3,3 * log (30);0), donde el nĂşmero 0, hace referencia a la cantidad de decimales. Nota: el nĂşmero de intervalos debe ser un nĂşmero entero. e) Se đ??´=
calcula
la
amplitud
del
intervalo,
que
es
igual
a:
đ?‘…đ?‘Žđ?‘›đ?‘”đ?‘œ 47 = = 7,83333 ≈ 8 đ?‘ Ăşđ?‘šđ?‘’đ?‘&#x;đ?‘œ đ?‘‘đ?‘’ đ?‘–đ?‘›đ?‘Ąđ?‘’đ?‘&#x;đ?‘Łđ?‘Žđ?‘™đ?‘œđ?‘ 6
El nĂşmero se aproxima al entero prĂłximo, porque el cĂĄlculo se estĂĄ realizando con nĂşmeros enteros. Utilizando La funciĂłn de Excel REDONDEAR.MAS, se logra aproximar al entero prĂłximo =REDONDEAR.MAS(47/6;0), donde el nĂşmero 0, hace referencia a la cantidad de decimales. f) Se determina el rango ampliado, que es igual al producto de la Amplitud * NĂşmero de intervalos = 8 * 6 = 48 g) Se determina K, que es la diferencia del rango ampliado y del rango original, 48 – 47 = 1, este valor se resta al valor mĂnimo, 47 - 1 = 46, ahora se inicia la construcciĂłn de los intervalos iniciando en el valor mĂnimo, con una amplitud de 8.
Peso en Kilos estudiantes de EstadĂstica (46 – 54] (54 – 62] (62 – 70]
(70 – 78] (78 – 86] (86 – 94]
El valor de K, determina en que número inicia y terminan los intervalos, para el ejemplo los intervalos inician en 46 y terminan en 94 Análisis de los diferentes valores que puede tomar K El número 1 se resta al mínimo valor que se encontró en los datos.
Si K = 1 Ejemplo
K=1
Mínimo = 47 - 1 = 46
Si K = es número par
Se divide por 2, uno de los números se resta al mínimo y el otro se suma al máximo.
Ejemplo
K=
1
Mínimo = 47 - 1 = 46
1
Máximo = 94 + 1 = 95
2 2
Si K = es número impar mayor que 1
Se buscan dos números que al ser sumadas se obtenga K y las restarlos el resultado sea 1. El número menor se le resta al mínimo y el número mayor se le suma al máximo
Ejemplo K = 3, dos números que al sumarlos se obtenga k y al restarlos el resultado sea 1. Estos números son 2 y 1; porque 2 + 1 = 3 y 2 – 1 = 1 Número menor
1
Mínimo = 47 - 1 = 46
2
Máximo = 94 + 2 = 96
K=3
Número mayor K = 5, dos números que al sumarlos se obtenga k y al restarlos el resultado sea 1. Estos números son 3 y 2; porque 3 + 2 = 5 y 3 – 2 = 1 Número menor
2
Mínimo = 47 - 2 = 45
3
Máximo = 94 + 3 = 97
K=5
Número mayor
Para determinar la frecuencia absoluta simple (ni) es importante tener: Datos ordenados 47 67 85
48 68 88
52 69 92
55 70 94
56 71
57 71
58 72
60 74
61 74
63 76
64 79
65 82
66 83
Intervalos De forma que se pueda contar los números que se encuentran en cada uno de los intervalos. Peso en Kilos estudiantes de Estadística (46 – 54] (54 – 62] (62 – 70] (70 – 78] (78 – 86] (86 – 94] Total
ni 3 6 8 6 4 3 30
47, 58, 62 55, 56, 57, 58, 60, 61 63, 64, 65, 66, 67, 68, 69, 70 71, 71, 72, 74, 74, 76 79, 82, 83, 85 88, 92, 94
Luego de tener los intervalos y la frecuencia absoluta simple, se procede a realizar el cálculo de la frecuencia relativa simple, frecuencia absoluta acumulada y frecuencia relativa acumulada. Tabla 1. Distribución de frecuencias peso en kilos estudiantes de Estadística. Peso en kilos estudiantes de Estadística 46 – 54 54 – 62 62 – 70 70 – 78 78 – 86 86 – 94 Total
ni
fi
Ni
Fi
3 6 8 6 4 3 30
10% 20% 27% 20% 13% 10% 100%
3 9 17 23 27 30
10% 30% 57% 77% 90% 100%
Con la tabla de distribución de frecuencias construida se procede a realizar lectura e interpretación de la tabla de distribución de frecuencias. Lectura de la tabla de distribución de frecuencias Ejemplos 3 estudiantes pesan 54 kilos o menos Tabla 1. Distribución de frecuencias peso en kilos estudiantes de Estadística. Peso en Kilos estudiantes ni fi Ni Fi de Estadística 46 – 54 3 10% 3 10% 54 – 62 6 20% 9 30% 62 – 70 8 27% 17 57% 70 – 78 6 20% 23 77% 78 – 86 4 13% 27 90% 86 – 94 3 10% 30 100% Total 30 100%
23 estudiantes pesan 78 kilos o menos Tabla 1. Distribución de frecuencias peso en kilos estudiantes de Estadística. Peso en Kilos estudiantes ni fi Ni Fi de Estadística 46 – 54 3 10% 3 10% 54 – 62 6 20% 9 30% 62 – 70 8 27% 17 57% 70 – 78 6 20% 23 77% 78 – 86 4 13% 27 90% 86 – 94 3 10% 30 100% Total 30 100%
Interpretación de la tabla de distribución de frecuencia Ejemplo ¿Cuántos estudiantes pesan 62 kilos o menos? Para responder la pregunta se debe ubicar en la columna Peso en kilos estudiantes de Estadística, buscar el intervalo 54 – 62 y observar el valor de Ni que corresponde al intervalo, para este ejemplo 9. Respuesta el número de estudiantes que pesan 62 kilos o menos es 9. Tabla 1. Distribución de frecuencias peso en kilos estudiantes de Estadística. Peso en Kilos estudiantes de Estadística 46 – 54 54 – 62 62 – 70 70 – 78 78 – 86 86 – 94 Total
ni
fi
Ni
Fi
3 6 8 6 4 3 30
10% 20% 27% 20% 13% 10% 100%
3 9 17 23 27 30
10% 30% 57% 77% 90% 100%
Referencias Anderson, D., Sweeney, D., & Williams, T. (2008). Estadística para administración y economía (Decima ed.). México: Cengage Learning. Martínez, C. (2011). Estadística básica aplicada (Cuarta ed.). Bogotá: Ecoe Ediciones. Martínez, C. (2012). Estadística y Muestreo (Décimo tercera ed.). Bogotá: Ecoe Ediciones