ESPE-CICASD-ESTADISTICA I
ESCUELA POLITECNICA DEL EJERCITO DEPARTAMENTO DE CIENCIAS DE LA VIDA CARRERA DE INGENIERIA EN CIENCIAS AGROPECUARIAS
ESTADISTICA I DESCRIPCIÓN ESTADISTICA vinicio.uday@gmail.com
NIVEL: III
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
DESCRIPCIÓN ESTADISTICA
METODOS TABULARES METODOS GRAFICOS MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE DISPERSIÓN MEDIDAS DE ASOCIACIÓN COEFICIENTE
DE
ASIMETRÍA
Y
DOS
MEDIDAS
ALTERNATIVAS DE TENDENCIA CENTRAL
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS TABULARES PARA ORGANIZAR CONJUNTOS DE DATOS
La Estadística está relacionada con la colección de grandes conjuntos de datos con un fin determinado, una vez obtenidos los datos el problema que surge inmediatamente, es el de interpretar correctamente los mismos. Entonces es importante Disponer de métodos que permitan organizar y presentar las observaciones de tal forma que los aspectos más sobresalientes de la misma sean rápidos y fácilmente entendibles. ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS TABULARES PARA ORGANIZAR CONJUNTOS DE DATOS
Características de los métodos tabulares son:
a)
Que proporcionen la máxima información contenida en los datos en forma rápida y fácil de visualizar.
b)
Que posean sencillez operativa.
c)
Que permitan presentar los datos de una manera estética.
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS TABULARES PARA ORGANIZAR CONJUNTOS DE DATOS
De dos encabezados
Es común que en muchos reportes, ya sean científicos, de negocios o de administración pública, así como en revistas y periódicos, los datos se presenten por medio de cuadros. Los que sobresalen por su sencillez y claridad son los que constan únicamente de dos encabezados (columnas):
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS TABULARES PARA ORGANIZAR CONJUNTOS DE DATOS
Cuadro 1. Tabla de número de estudiantes en algunas Carreras de la Universidad XX, durante el año de 2010.
Carreras Ciencias de la Educación
Total Estudiantes 2 136
Ciencias Administrativas
1 420
Ciencias Médicas
636
Ciencia y Tecnología
251
Ciencias Agrícolas
242
Artes
32 ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS TABULARES PARA ORGANIZAR CONJUNTOS DE DATOS
Cuadro 2. Tabla de calificaciones obtenidas por un grupo de estudiantes en el Curso de Estadística, universidad XX, 2010. 31 31
52
58
60
66
89
70
75
83
88
91
93
81
57
61
74
64
77
87
62
85
80
68
76
80
82
71
85
62
72
72
82
71
87
73
72
79
84
81
79
96 96
73
77
62
73
84
81
79
72
79
81
84
67
62
89
76
61
57
64
74 ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS TABULARES PARA ORGANIZAR CONJUNTOS DE DATOS Es mejor resumir la información sobre el número de estudiantes que obtuvieron una determinada calificación, en una tabla con dos encabezados: EJERCICIO: En una tabla de dos encabezados, resuma la información que se presenta en el cuadro 2.
Cuadro 3. Tabla de calificaciones obtenidas por un grupo de estudiantes en el Curso de Estadística, universidad XX, 2010. Calificación N° Estudiantes 31 52 57 58 60 …… …… 96
1 1 2 1 1 ….. ……. 1
Este tipo de tablas permiten exhibir en forma concisa el número de veces que se presenta una determinada cantidad en un conjunto de datos. La utilidad de este tipo de presentación es máxima cuando el número de datos es pequeño y se acompaña la tabla de algún texto que indique el tipo de observaciones de que se trata. ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS Una forma de presentación que será muy útil para nuestros propósitos es la que resulta de organizar los datos en Tablas de Frecuencias. En este tipo de tablas se divide la amplitud de los valores numéricos de los datos en un cierto número de Intervalos o Clases, y se cuenta cuántas observaciones pertenecen a cada una de ellas. Para ilustrar la construcción de tablas de frecuencias considérense los datos del cuadro 3. ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS Cuadro 3. Tabla de calificaciones obtenidas por un grupo de estudiantes en Diseño experimental, en el año 2010. 36
71
84
74
77
81
55
86
100 53
73
85
76
80
83
65
89
93
44
72
82
74
78
84
55
87
99
51
76
85
73
79
82
63
88
98
46
72
82
74
78
87
85
55
87
92
54
77
86
73
80
83
66
90
46
72
82
74
79
85
56
87
52
73
85
76
80
83
64
88
54
73
86
77
80
84
70
92
48
72
82
76
79
85
62
36
64
Rango Es la diferencia entre el menor y mayor de los datos.
Rango = 100 – 36 = 64
100 ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS Número de intervalos de clase.- Los IC no debe ser menor a 5 ni mayor a 20. Deben ser de igual anchura Fijado el número de clases, el IC se obtiene dividiendo el Rango/número de clases. Regla de Sturges
𝑁° 𝐼𝐶 = 1 + 3,3log(𝑁) Si el resultado no es un entero, conviene redondear al entero superior: Rango 64 Para el ejemplo 7 clases: IC = = = 9,14 10 7 N° Clases
9,14 * 7 = 64 Ideal
9 * 7 = 63– 64 = - 1 Falta ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS Lo anterior altera el valor del rango lo que obliga a efectuar un ajuste. Nuevo rango = (Intervalo)(Número de clases) 10 * 7 = 70 – 64 = 6 2 = 3 Límite inferior = 36 – 3 = 33 36
Límite superior = 100 + 3 = 103 64
100
70
33
Exceso
103
En el ejemplo, se distribuye en el limite inferior 30
70
100
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS 1er intervalo: 2do intervalo:
30 - 40 40 - 50
36
39
Pertenecen al 1er intervalo
30
40
Pertenecen al ? intervalo
Para prevenir ambigüedades:
Otra forma
1er intervalo:
30,5 – 40,5
31 - 40
2do intervalo:
40,5 – 50,5
41 – 50
1er intervalo:
( 30 ; 40]
2do intervalo:
( 40 ; 50]
Datos > 30 y 40
51 – 60 31
40 41
50 51
60
Con ello queda definido el intervalo de clase, también llamado ancho de clase.
Datos > 40 y 50 ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS TABULARES PARA ORGANIZAR CONJUNTOS DE DATOS
Un intervalo se forma por dos límites que van ha definir la clase Límites.- Valores extremos de un intervalo de clase y son de dos tipos, Límite Superior (L) y Límite Inferior (l). 1er intervalo: 2do intervalo:
l: L:
30 - 40 40 - 50
1er intervalo____ 2do intervalo____ 1er intervalo____ 2do intervalo____ ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS TABULARES PARA ORGANIZAR CONJUNTOS DE DATOS
Para nuestro ejemplo el número de clases es 7 y los intervalos de clase van de 10 en 10. Entonces: Intervalos o Clases ( 30 ; 40]
( 40 ; 50] ( 50 ; 60] ( 60 ; 70] ( 70 ; 80] ( 80 ; 90] ( 90 ; 100] ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS TABULARES PARA ORGANIZAR CONJUNTOS DE DATOS
Es conveniente elegir un número que represente a cada una de las clases, este se llama marca de clase o punto medio. Marca de clase o punto medio (Vi).- Es el punto medio de un intervalo de clase y se calcula con la siguiente formula:
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS TABULARES PARA ORGANIZAR CONJUNTOS DE DATOS
Cálculo del punto medio para nuestro ejemplo: Intervalos o Clases
Valor medio Vi
( 30 ; 40]
( 30 + 40) / 2 = 35
( 40 ; 50]
( 40 + 50) / 2 = 45
( 50 ; 60]
( 50 + 60) / 2 = 55
( 60 ; 70]
( 60 + 70) / 2 = 65
( 70 ; 80]
( 70 + 80) / 2 = 75
( 80 ; 90]
( 80 + 90) / 2 = 85
( 90 ; 100]
( 90 + 100) / 2 = 95
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS TABULARES PARA ORGANIZAR CONJUNTOS DE DATOS
Frecuencia absoluta: se refiere al número observaciones que pertenecen a cada clase.
de
Intervalo o Clases
Valor medio Vi
( 30 ; 40]
( 30 + 40) / 2 = 35
1
36 36
( 40 ; 50]
( 40 + 50) / 2 = 45
4
44 72 73 85 76 80 83 65 89 93 44
( 50 ; 60]
( 50 + 60) / 2 = 55
9
( 60 ; 70]
( 60 + 70) / 2 = 65
6
78 87 85 55 87 92 54 77 86 73
( 70 ; 80]
( 70 + 80) / 2 = 75
30
80 83 66 90 46 46 72 82 74 79 85
( 80 ; 90]
( 80 + 90) / 2 = 85
29
56 87 52 73 85 76 80 83 64 88
( 90 ; 100]
( 90 + 100) / 2 = 95
fi
Datos originales 71 84 74 77 81 55 86 100 53
82 74 78 84 55 87 99 51 76 85
6
85
73 79 82 63 88 98 46 72 82 74
48 72 54 73 86 77 80 84 70 92 48
82 76 79 85 62
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS TABULARES PARA ORGANIZAR CONJUNTOS DE DATOS
Frecuencia relativa: Indican que proporción del total de observaciones pertenece “entran” a cada clase. dividiendo la fa entre el total de observaciones n.
Se calcula
Intervalo o Clases
Valor medio
pi
( 30 ; 40]
( 30 + 40) / 2 = 35
1
1/85
( 40 ; 50]
( 40 + 50) / 2 = 45
4
4/85
( 50 ; 60]
( 50 + 60) / 2 = 55
9
9/85
( 60 ; 70]
( 60 + 70) / 2 = 65
6
6/85
( 70 ; 80]
( 70 + 80) / 2 = 75
30
30/85
( 80 ; 90]
( 80 + 90) / 2 = 85
29
29/85
( 90 ; 100]
( 90 + 100) / 2 = 95
6
6/85
85
85/85=1
fi
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS TABULARES PARA ORGANIZAR CONJUNTOS DE DATOS
Frecuencia acumulada: hace referencia al numero de datos cuyo valor numérico es menor o igual que el límite superior de cada clase. La frecuencia acumulada puede calcularse usando frecuencia absoluta o relativa, ello da lugar a lo llamado frecuencia acumulada absoluta y frecuencia acumulada relativa.
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS TABULARES PARA ORGANIZAR CONJUNTOS DE DATOS
Cuadro n. Clases
Tabla de frecuencias para los datos del cuadro 3. Vi
fi
pi
Fi
Pi
(30
40]
35
1
0,012
1
0,012
(40
50 ]
45
4
0,047
5
0,059
(50
60 ]
55
9
0,106
14
0,165
(60
70 ]
65
6
0,071
20
0,235
(70
80 ]
75
30
0,353
50
0,588
(80
90 ]
85
29
0,341
79
0,929
(90
100 ]
95
6
0,071
85
1,00
85
1,000
¿Cuántos alumnos tienen en promedio 75 de nota? ¿Las calificaciones que mas frecuentemente se encuentran están entre? ¿Qué porcentaje de las calificaciones tienen un valor ≤ a 90 puntos? ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS TABULARES PARA ORGANIZAR CONJUNTOS DE DATOS
Propiedades de las frecuencias: -
-
-
Las frecuencias absolutas son cantidades enteras positivas Las frecuencias relativas se pueden expresar en tanto por uno; también pueden expresarse en porcentajes, es decir: 0 ≤ fr ≤ 1 ó 0% ≤ fr ≤ 100% La suma de las frecuencias absolutas de todas las clases es igual al número de total de datos La suma de las frecuencias relativas es igual a uno o 100% La frecuencia absoluta acumulada de la última clase es igual al número total de datos La frecuencia relativa acumulada de la última clase es igual a 1 ó 100%.
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS TABULARES PARA ORGANIZAR CONJUNTOS DE DATOS
Desventajas de las tablas de frecuencias: 1. Pérdida de información al presentar las observaciones en intervalos, sin especificar cuáles son los datos que pertenecen a ellos. Así, no se sabe cuáles son los valores numéricos de datos que pertenecen al intervalo (80 ; 90]. 2. Confiabilidad, el haber escogido como valor representativo de la clase al Vi implica que los datos de la clase tienen en promedio un valor cercano a éste. Si esta suposición no es correcta, la información que proporciona Vi es poco confiable.
3. Representación el número de clases y la anchura se eligen en forma arbitraria, no existe una representación única de los datos en las tablas de frecuencias. ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
REPRESENTACION TABULAR DE DOS CONJUNTOS DE DATOS
Para presentar dos conjuntos de datos en una tabla es necesario construir las tablas de frecuencias de doble entrada. Para que éstas no resulten complicadas en su lectura, solo se utilizan tres columnas usadas en las TDF, a saber: clases valor medio frecuencias relativas de clase ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
REPRESENTACION TABULAR DE DOS CONJUNTOS DE DATOS
Si denotamos por X a la característica que corresponde a uno de los conjuntos y por Y a la del otro, se tendrá: Vi, li, Li, valores medios y límites de clase para X. V'j, l'j, L'j, valores medios y límites de clase para Y. La tabla queda así:
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS TABULARES PARA ORGANIZAR CONJUNTOS DE DATOS X Y
(l`1,L`1) V`1 (l`2,L`2) V`2 . . (l`j,L`j) V`j . . (l`m,L`m) V`m
(l1,L1) V1
(l2,L2) V2
….
(li,Li) Vi
p11
p12
….
p1i
p21
p22
….
p2i
. .
. .
. .
. .
pj1
pj2
….
pji
. .
. .
. .
. .
pm1
pm2
….
pmi
….
(lk,Lk) Vk
Total
En se observa que …. el cuadro p1k las frecuencias relativas (p) tienen dos p2k subíndices, esto …. con el objeto de indicar a . clase pertenecen; . que así, . ejemplo,. pji indica que por esta frecuencia relativa …. pjk pertenece a la clase cuyos . . y límites de valores medios . . clase son respectivamente V'j, l'j, L'j para Y y Vi, li, Li, …. pmk para X.
Total
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS TABULARES PARA ORGANIZAR CONJUNTOS DE DATOS
Obs.
X
Y
1
69,6
1,123
La construcción de este tipo de tablas, se presenta en el siguiente ejemplo.
2
65,0
0,938
3
64,4
0,956
4
63,0
1,050
5
64,0
0,962
6
65,2
0,958
7
68,6
0,999
8
69,6
1,145
9
61,2
0,948
10
66,4
0,933
11
66,0
0,964
12
64,4
0,949
13
63,4
0,987
14
64,8
0,858
Donde: X= variable altura Y= variable peso
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS TABULARES PARA ORGANIZAR CONJUNTOS DE DATOS
Para el ejemplo se eligieron tres intervalos de clase para la variable altura y tres para la variable peso. Cuadro x. Tabla de frecuencias de doble entrada para los datos xx X Y
[0,858;0,954] 0,906
[61,2;64,0] 62,6
(64,0;66,8] 65,4
(66,8;69,6] 68,2
TOTAL
1/14
4/14
…
5/14
X Y 61,2 0,948
Interpretación:
(0,954;1,050] 1,002
3/14
3/14
1/14
7/14
(1,050;1,146] 1,098
…
…
2/14
2/14
TOTAL
4/14
7/14
3/14
De 14 parcelas existen 4 que tienen en promedio 65,4 cm de altura y 0,906 kg de peso
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS TABULARES PARA ORGANIZAR CONJUNTOS DE DATOS
De la tabla de doble entrada, se pueden obtener tablas de frecuencias para cada una de las variables; así por ejemplo, la tabla que corresponde a la variable X será: Cuadro x. Clases, valores medios y frecuencias relativas para la variable altura, obtenida de la tabla de doble entrada. Clase Vi pi [61,2;64,0] 62,6 4/14 (64,0;66,8] 65,4 7/14 (66,8;69,6] 68,2 3/14 ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS TABULARES PARA ORGANIZAR CONJUNTOS DE DATOS
Igualmente para Y
Cuadro y. Clases, valores medios y frecuencias relativas para la variable peso, obtenida de la tabla de doble entrada. Clase
Vi
pi
[0,858;0,954] (0,954;1,050] (1,050;1,146]
0,906 1,002 1,098
5/14 7/14 2/14 ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS GRÁFICOS PARA REPRESENTAR CONJUNTOS DE DATOS
Una representación gráfica de los datos a menudo ayuda a que se distingan en forma inmediata algunas de las características más importantes de las observaciones. Los métodos gráficos permiten presentar gráficamente a los tipos de tablas estudiadas antes. Las principales graficas son: Diagramas de Puntos, Histogramas, Polígonos de Frecuencias y Ojivas.
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS GRÁFICOS PARA REPRESENTAR CONJUNTOS DE DATOS
DIAGRAMAS DE PUNTOS
Sirven para presentar gráficamente tablas en las cuales se consideran únicamente una variable y una cantidad asociada a cada valor de la misma. Existen dos tipos de diagramas de puntos, los dos muestran la misma información en diferente forma y con diferente propósito.
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS GRÁFICOS PARA REPRESENTAR CONJUNTOS DE DATOS
1ro. Se coloca en el eje horizontal los valores de la variable (los cuales en muchos casos son arbitrarios) y en el eje vertical las cantidades asociadas a éstos. Finalmente, para cada valor de la variable y cada cantidad asociada se dibujan puntos cuya altura corresponde a la magnitud de dicha cantidad. Con objeto de simplificar la presentación, a cada Carrera SE IDENTIFICA con un número; así, la Carrera en Ciencias de la Educación con el número 1, la de Ciencias Administrativas con el número 2, y así sucesivamente…… ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS GRÁFICOS PARA REPRESENTAR CONJUNTOS DE DATOS
Ej: Con los datos presentados en el cuadro siguiente, el cual muestra el número de estudiantes en algunas carreras de la Universidad XX. 2250
N° Carreras
2000
1
Ciencias de la Educación
2136
2
Ciencias Administrativas
1420
3
Ciencias Médicas
636
4
Ciencia y Tecnología
251
750
5
Ciencias Agrícolas
242
500
6
Artes
32
Estudiantes
1750
Estudiantes
1500 1250
1000
250 0 1
2
3
Carreras Figura 1……………
4
5
6
Hecho lo anterior, se tiene que variable en cuestión corresponde a las diferentes Carreras (X) y los valores numéricos que pueden tomar son 1, 2, 3, 4, 5 y 6. Las cantidades asociadas a estos números son los totales de estudiantes.
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS GRÁFICOS PARA REPRESENTAR CONJUNTOS DE DATOS
2do. Para construir el segundo tipo de diagramas de puntos se colocan en el eje horizontal los valores de la variable y sobre cada valor se dibujan tantos puntos como veces aparezcan éstos.
30
35
45
50
Figura 1……………
55
60
65
70
75
80
85
90
95
31 70 81 87 80 72 79 77 72 89
52 75 57 62 82 82 84 62 79 76
58 83 61 85 71 71 81 73 81 61
60 88 74 80 85 87 79 84 84 57
66 91 64 68 62 73 96 81 67 64
89 93 77 76 72 72 73 79 62 74
100
Calificación
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS GRÁFICOS PARA REPRESENTAR CONJUNTOS DE DATOS
HISTOGRAMA
Es una figura de barras verticales sin espaciamiento entre ellas. Se construye colocando en el eje vertical a las frecuencias absolutas o relativas y en el eje horizontal a los límites de clase de una tabla de frecuencias.
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS GRÁFICOS PARA REPRESENTAR CONJUNTOS DE DATOS
HISTOGRAMA
Las etapas que se deben cubrir en la construcción de un histograma son las siguientes: Colocar en el eje horizontal a los límites de clase. Colocar en el eje vertical las frecuencias absolutas o relativas .
Erigir rectángulos cuya base es la clase y su altura la frecuencia que corresponden a cada clase.
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS GRÁFICOS PARA REPRESENTAR CONJUNTOS DE DATOS
Número de estudiantes
HISTOGRAMA Clases
fi
35
( 30 ; 40]
1
30
( 40 ; 50]
4
25
( 50 ; 60]
9
20
( 60 ; 70]
6
15
( 70 ; 80]
30
10
( 80 ; 90]
29
5
( 90 ; 100]
6
0
30
40
50
60
70
80
90
100
Calificaciones
Figura 1……………
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS GRÁFICOS PARA REPRESENTAR CONJUNTOS DE DATOS
HISTOGRAMA
Se puede observar en la figura un cierto grado de asimetría, lo que indica, para este ejemplo, que la mayoría de los datos pertenecen a las clases intermedias, esto es, a los intervalos (70, 80] y (80, 90], y el resto ocurren asimétricamente alrededor de ellas. Claramente este hecho se capta en el histograma más fácilmente que en la tabla de frecuencias.
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS GRÁFICOS PARA REPRESENTAR CONJUNTOS DE DATOS
POLIGONO DE FRECUENCIAS
Un PF es una figura de líneas rectas que unen los puntos obtenidos al colocar en el eje horizontal a los valores medios de clase y en el vertical a las frecuencias relativas o absolutas. Colocar en el eje horizontal los valores medios de clase. Colocar en el eje vertical las frecuencias relativas o absolutas. Colocar los puntos. Unir los puntos con segmentos de líneas rectas.
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS GRÁFICOS PARA REPRESENTAR CONJUNTOS DE DATOS
N° Estudiantes
POLIGONO DE FRECUENCIAS Vi
fi
35
35
1
30
45
4
25
55
9
20
65
6
15
75
30
85
29
95
6
10 5 0
30 35
45
55
65
75
85
100 95 100
Calificaciones
Figura 1……………
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS GRÁFICOS PARA REPRESENTAR CONJUNTOS DE DATOS
OJIVA O PFA Una ojiva o PFA es una figura construida con segmentos de líneas rectas que unen los puntos obtenidos al colocar en el eje horizontal a los límites superiores de clase y en el vertical a las frecuencias acumuladas absolutas o relativas. Colocar en el eje horizontal los límites superiores de clase. Colocar en el eje vertical frecuencias relativas o absolutas acumuladas.
Colocar los puntos. Unir los puntos con segmentos de líneas rectas. ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS GRÁFICOS PARA REPRESENTAR CONJUNTOS DE DATOS
OJIVA O PFA Fi
40
1
85 80
90
50
5
70
60
14
70
20
80
50
90
79
100
85
Nº Estudiantes
Li
60 50 40 30 20 10 0
30
40
50
60
70
80
90
100
Calificaciones
Figura 1……………
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
Gráficos para variables cualitativas • Diagramas de barras – Alturas proporcionales a las frecuencias (abs. o relativas) – Se pueden aplicar también a variables discretas
100
Porcentaje
80 60 40 20 0 Solter@
Casad@
Separad@ Unión Libre
Categoría
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
Gráficos para variables cualitativas • Diagramas de sectores (tortas, polares) – No usarlo con variables ordinales. – El área de cada sector es proporcional a su frecuencia (absolutas o relativas)
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
Gráficos para variables cualitativas • Diagrama de sectores
PROFESION
Frecuencia
%
Ingenieros Civiles
120
57,1
Arquitectos
60
28,6
Ingenieros Eléctricos
20
9,5
Otros
10
4,8
TOTAL
210
Ingeniero s Eléctricos 9,5%
Arquitect os 28,6%
Otros 4,8%
Ingeniero s Civiles 57,1%
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
Gráficos para variables cualitativas • Pictogramas – Fáciles de entender. – El área de cada modalidad debe ser proporcional a la frecuencia.
¿De los dos, cuál es incorrecto?
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
Gráficos diferenciales para variables numéricas Diagramas de barras para variables discretas Se deja un hueco entre barras para indicar los valores que no son posibles 250
Histogramas para variables continuas Recuento
El área que hay bajo el histograma entre dos puntos cualesquiera indica la cantidad (porcentaje o frecuencia) de individuos en el intervalo.
200
150
100
50
20
40
60
80
Edad del e ncue stado
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
Diagrama de Tallo y Hojas • Un diagrama de tallo y hojas muestra tanto el orden de rangos como la forma de un conjunto de datos. • Es similar a un histograma de lado, pero tiene la ventaja de mostrar los valores actuales de los datos. • Los primeros dígitos de cada elemento de los datos son acomodados a la izquierda de una línea vertical • A la derecha de la línea vertical se registra el ultimo digito por cada elemento (ordenadas en un segundo paso) • Cada línea en el diagrama es referida como un tallo • Cada digito en un tallo es una hoja
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
• Diagrama de tallo y hojas 5 2 7 6 2 2 2 2 5 6 7 8 8 8 9 9 9 7 1 1 2 2 3 4 4 5 5 5 6 7 8 9 9 9 8 0 0 2 3 5 8 9 9 1 3 7 7 7 8 9 10 1 4 5 5 9
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
Diagrama de Tallo y Hojas • Si consideramos que el diagrama original de tallo y hojas ha condensado mucho los datos, podemos ampliar el diagrama utilizando dos o mas renglones por cada uno o mas dígitos. • Cuando un valor de tallo se indica dos veces, el primer valor corresponde a las hojas de 0-4 y el segundo valor corresponde a los valores de 5-9.
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
• Diagrama de tallo y hojas extendido 5 5 6 6 7 7 8 8 9 9 10 10
2 7 2 2 2 2 5 6 7 8 8 8 9 9 9 1 1 2 2 3 4 4 5 5 5 6 7 8 9 9 9 0 0 2 3 5 8 9 1 3 7 7 7 8 9 1 4 5 5 9
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
Ejemplo: unidad de hoja = 0,1 Si tenemos datos con valores como los siguientes: 8,6
11,7
9,4
9,1
10,2
11,0
8,8
Un diagrama de tallo y hojas de estos datos será: Unidad de hoja = 0,1 8 6 8 9 1 4 10 2 11 0 7
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
METODOS GRÁFICOS PARA REPRESENTAR CONJUNTOS DE DATOS
Series de Tiempo. población 31 40 50 63 76 92 106 123 132 151 179 203 227
250 200
Millones
año 1860 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980
150 100 50 0 1860
70
80
90
1900
10
20
30
40
50
60
70
80
Años
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
GRAFICO DE TRAZOS
año
Tn_trigo 75 76 77 78 79 80 81 82
Tn_maíz 200 185 225 250 240 195 210 225
Total 75 90 100 85 80 100 110 105
Porcentual trigo 275 73 275 67 325 69 335 75 320 75 295 66 320 66 330 68
exc
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
GRAFICO DE TRAZOS 400
350
300
Tn trigo
250
Tn_maiz
200
Tn_trigo 150
100
50
0 75
76
77
78
79
80
81
82
Años
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
Gráfico de Barras Porcentuales 120 100 80 Maiz
Tn 60
Trigo
40 20 0 75
76
77
78
79
80
81
82
Años
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
Gráfico circular abierto. praderas 34% bosques 12% areas urbanas desiertos bosques desiertos 10%
praderas huertas 10%
huertas areas sem bradas
areas urbanas 6% areas sem bradas 28%
ING. VINICIO UDAY
ESPE-CICASD-ESTADISTICA I
El diagrama de Pareto Es un caso especial del diagrama de barras, que se usa con frecuencia en control de calidad. Este tipo de diagrama consiste en barras que describen las componentes de una línea de producción o de montaje. ING. VINICIO UDAY