Issuu on Google+

Estadística básica CUADERNO DE TRABAJO

SECRETARÍA DE EDUCACIÓN PÚBLICA Alonso Lujambio Irazábal SUBSECRETARÍA DE EDUCACIÓN SUPERIOR Rodolfo Tuirán Gutiérrez PROGRAMA DE EDUCACIÓN SUPERIOR ABIERTA Y A DISTANCIA COORDINACIÓN GENERAL Manuel Quintero Quintero COORDINACIÓN ACADÉMICA Soila del Carmen López Cuevas DISEÑO INSTRUCCIONAL Eloísa Alpízar Gómez EVALUACIÓN Y ACREDITACIÓN DE PROGRAMAS EDUCATIVOS Alicia Pérez Godínez DISEÑO GRÁFICO DE CONTENIDOS Y COMUNICACIÓN INSTITUCIONAL Paulina López Barrios ACCESIBILIDAD César Palvacini y Javier Bustos

AGRADECEMOS LA COLABORACIÓN EN EL DESARROLLO DE ESTE MATERIAL A: Dr. Abelardo Mercado Herrera de la Universidad Politécnica de Baja California Y MUY ESPECIALMENTE A: Mtra. Elsa Marlene Escobar Cristiani

Secretaría de Educación Pública, 2010 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

1


Estadística básica CUADERNO DE TRABAJO PRESENTACIÓN Seguramente has escuchado alguna vez la frase “La práctica hace al maestro”, este material lo hemos desarrollado con la finalidad de que ejercites los algunos procedimientos que se trabajarán a lo largo de la asignatura, pensando que entre más los practiques, será mucho mayor la comprensión que tengas de ellos. Este material es de estudio independiente, lo puedes utilizar como material de apoyo, para reforzar conocimientos, para autoevaluarte, o como preparación para tu evaluación presencias. Lo importante es que te sirva para que identifiques cuáles son los temas que necesitas reforzar y para que te des cuenta de los logros que has tenido La estructura del material es la siguiente: Para cada tema, se presenta un breve resumen del contenido, enseguida se presenta un ejemplo del procedimiento y, al final, se encuentran los ejercicios que tendrás que resolver. Hemos anexado un documento donde encontrarás todas las fórmulas que manejamos en el curso. Esperamos que te sea de utilidad.

2

Educación Superior Abierta y a Distancia • Primer Cuatrimestre


Estadística básica CUADERNO DE TRABAJO FORMULARIO

Unidad 1. Fórmulas para determinar el tamaño de la muestras Cuando se conoce el tamaño de la población

Cuando no se conoce el tamaño de la población

Unidad 2. Estadística descriptiva

Tema. Medidas de tendencia central

Media en datos no agrupados Población

Muestra

Unidad 2. Estadística descriptiva

Tema. Medidas de tendencia central

Media en datos agrupados por frecuencias simples Población

Muestra

Unidad 2. Estadística descriptiva

Tema. Medidas de tendencia central

Media en datos agrupados por intervalos Población

Muestra

Educación Superior Abierta y a Distancia • Primer Cuatrimestre

3


Estadística básica CUADERNO DE TRABAJO FORMULARIO

Unidad 2. Estadística descriptiva

Tema. Medidas de tendencia central

Media en datos agrupados por intervalos Población

Muestra

Unidad 2. Estadística descriptiva

Tema. Medidas de tendencia central

Moda en datos agrupados por intervalos Población

Muestra

Unidad 2. Estadística descriptiva

Tema. Medidas de dispersión Recorrido

Unidad 2. Estadística descriptiva

Tema. Medidas de dispersión

Varianza para datos no agrupados y agrupados en frecuencias simples Población

4

Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Muestra


Estadística básica CUADERNO DE TRABAJO FORMULARIO

Unidad 2. Estadística descriptiva

Tema. Medidas de dispersión

Varianza para datos agrupados por intervalos Población

Muestra

Unidad 2. Estadística descriptiva

Tema. Medidas de dispersión

Desviación estándar para datos no agrupados y agrupados en frecuencias simples Población

Muestra

Unidad 2. Estadística descriptiva

Tema. Medidas de dispersión

Desviación estándar para datos agrupados por intervalos Población

Muestra

Educación Superior Abierta y a Distancia • Primer Cuatrimestre

5


Estadística básica CUADERNO DE TRABAJO FORMULARIO

Unidad 3. Introducción a la teoría de probabilidad

Tema. Reglas de la probabilidad

Probabilidad de la unión de dos sucesos

Probabilidad de la unión de tres sucesos

Probabilidad de la suma de dos eventos mutuamente excluyentes

Probabilidad de la suma de tres o más eventos mutuamente excluyentes

Unidad 3. Introducción a la teoría de probabilidad

Tema. Postulados de la probabilidad

Probabilidad condicional

6

Educación Superior Abierta y a Distancia • Primer Cuatrimestre


Estadística básica CUADERNO DE TRABAJO FORMULARIO

Unidad 4. Modelos de probabilidad

Tema. Distribuciones de probabilidad Valor esperado

Modelo Binomial

Modelo de Poisson

Modelo Normal

Curva normal estándar

Educación Superior Abierta y a Distancia • Primer Cuatrimestre

7


Estadística básica CUADERNO DE TRABAJO UNIDAD 1. Introducción a la estadística Determinar el tamaño de la muestra Recuerda que para seleccionar el tamaño de una muestra, se ocupan las siguientes fórmulas. Fórmula para cuando no se conoce el tamaño de la población

Fórmula para cuando se conoce el tamaño de la población

Donde: n es el tamaño de la muestra Z es el nivel de confianza p es la variabilidad positiva q es la variabilidad negativa N es el tamaño de la población E es la precisión o error Veamos un ejemplo: Una fábrica de artículos para cocina, desea determinar las proporciones de los artículos defectuosos de una de sus producciones. A. Si se quiere hacer un estudio con un 95% de confianza y un margen de error del 2%, ¿cuántos artículos se deben seleccionar para tener una muestra representativa?

Se utiliza la fórmula p=0.5 q=1-0.5=0.5

}

porque desconocemos el tamaño de la población.

Porque no hay estudios anteriores

Z= 1.96 (para un 95% de confianza) E= 2% = 0.02

Por lo tanto, la muestra de artículos de cocina que se seleccionará será de 2401. 8

Educación Superior Abierta y a Distancia • Primer Cuatrimestre


Estadística básica CUADERNO DE TRABAJO UNIDAD 1. Introducción a la estadística B. Queremos determinar el tamaño de la muestra, de la misma producción de artículos del inciso A, pero tomando en cuenta que existe un estudio anterior según el cual, el 18% de la

p= 82%= 0.82 (variabilidad positiva = % de aceptación de la hipótesis = % de éxito) q= 1-0.82=0.18 Z= 1.96 (para un 95% de confianza) E= 2% = 0.02

Entonces, la muestra se compone de 1417 artículos.

C. Supongamos que la producción de artículos de cocina de la que se seleccionará la muestra tiene un total de 25,000 artículos, ¿cuántos artículos debemos seleccionar para realizar un estudio con el 95% de confianza y el 2% de margen de error?

Entonces aplicamos la fórmula p=0.5

}

q=1-0.5=0.5

porque conocemos el total de la población.

Porque no hay estudios anteriores

Z= 1.96 (para un 95% de confianza) E= 2% = 0.02 N= 25,000

Entonces, nuestra muestra se compone de 2,190 artículos de cocina.

Educación Superior Abierta y a Distancia • Primer Cuatrimestre

9


Estadística básica CUADERNO DE TRABAJO UNIDAD 1. Introducción a la estadística D. ¿Cuántos artículos habrá que seleccionar para realizar un estudio con el 95% de confianza y un margen de error del 2% en un población de 25, 000 artículos? Tomando en cuenta que un estudio anterior arrojó un resultado de 18 artículos defectuosos por cada 100. Como se tiene un estudio anterior, donde se determinó que el 18% de la producción es defectuosa, entonces, la variabilidad positiva (porcentaje de éxito) es igual a 82%.

p=0.82 q=1-0.82=0.18 Z= 1.96 (para un 95% de confianza) E= 2% = 0.02 N= 25,000

La muestra debe tener 1,341 artículos.

10

Educación Superior Abierta y a Distancia • Primer Cuatrimestre


Estadística básica CUADERNO DE TRABAJO UNIDAD 1. Introducción a la estadística Ejercicios 1. Se quiere realizar un estudio sobre los niveles de colesterol en la sangre, en mujeres y hombres adultos de entre 35 y 50 años. • ¿De qué tamaño debe elegirse una muestra representativa para realizar dicho estudio con un nivel de confianza del 95% si se acepta un margen de error de hasta el 6%? • En una población del tamaño de la ciudad de México, ¿de qué tamaño deberá elegirse una muestra representativa para realizar dicho estudio con un nivel de confianza del 95% si se acepta un margen de error de hasta el 6%?

2. Se desea estudiar la preferencia de un nuevo partido político en una población. No se han realizado estudios anteriores acerca de esto. El margen de error máximo a aceptar en el estudio es del 2% • Determina el tamaño de la muestra para un nivel de confianza del 90% • En una población con un número de habitantes igual a la delegación Cuauhtémoc, determina el tamaño de la muestra para un estudio con un nivel de confianza del 90%. Investiga primero el número de personas que viven en dicha delegación.

3. Se desea saber el cuál es el gasto promedio de los turistas extranjeros que visitan Mérida. De un estudio anterior se determinó que dichos gastos están por encima de los 150 dólares. La aceptación de dicha hipótesis fue del 85%. • ¿De qué tamaño debe ser la muestra seleccionada si se aceptará un margen de error del 5% y se desea un nivel de confianza del 90%? • Investiga la cantidad de turistas extranjeros que visitan Mérida. Con base en esta población indica ¿de qué tamaño debe ser la muestra seleccionada para dicho estudio si se aceptará un margen de error del 5% y se desea un nivel de confianza del 90%?

4. Un investigador desea determinar los efectos de la presión y la temperatura en la producción de galones de petróleo. En un estudio anterior, se determinó una hipótesis con un porcentaje de aceptación del 92%. • En una producción de 250, 000 litros, ¿cuántos galones deben estudiarse si se acepta un margen de error del 6% y se desea un nivel de confianza del 99%? Recuerda que para un nivel de confianza del 99% la z estimada es igual a 2.575 • Si se desconoce el tamaño de la producción, ¿cuántos galones deben estudiarse si se acepta un margen de error del 6% y se desea un nivel de confianza del 99%?

Educación Superior Abierta y a Distancia • Primer Cuatrimestre

11


Estadística básica CUADERNO DE TRABAJO Unidad 2. Estadística descriptiva La función descriptiva de la estadística se enfoca en la presentación y clasificación de los datos obtenidos de la población que se analiza. Esta presentación y clasificación se realiza a través de tablas, gráficas y obtención de medidas que nos ayudan a ver cómo se comportan los datos. Para organizar los datos utilizamos diferentes tipos de tablas: • Tablas de datos • Tablas de frecuencias simples • Tablas de frecuencias agrupadas • Tablas de intervalos La representación de datos se hace a través de diferentes tipos de gráficas: • Histogramas • Gráficas de barras • Gráficas de líneas • Gráficas de área o de pastel La organización y la organización y la representación gráfica de los datos nos permiten obtener las medidas de tendencia central y de dispersión, que nos sirven para saber cómo se distribuyen los datos, estas medidas son: • Medidas de tendencia central: • Media • Mediana • Moda • Medidas de dispersión: • Rango • Varianza • Desviación típica o estándar

12

Educación Superior Abierta y a Distancia • Primer Cuatrimestre


Estadística básica CUADERNO DE TRABAJO Unidad 2. Estadística descriptiva Ejercicios 1. Se tomaron 11 mediciones de diámetro de los anillos para los pistones del motor de un automóvil. Los resultados en milímetros fueron: 74.001, 74.003, 74.025, 74.005, 74.000, 74. 015, 74.005, 74.002, 74.005, 74.002 y 74.004. Realiza lo siguiente: • Construye una tabla de datos • Construye una tabla de frecuencias • Construye una gráfica de línea y una gráfica de barras

2. En un grupo de 30 estudiantes se preguntó cuánto dinero llevaban en ese momento. Los resultados obtenidos, en pesos, fueron los siguientes: 45.00, 11.55, 25.00, 30.00, 17.50, 8.00, 2.50, 268.00, 60.50, 78.50, 159.50, 230.00, 500.00, 120.00, 10.00, 5.00, 18.00, 20.00, 67.50, 50.00, 37.50, 150.00, 20.50, 98-50, 18.50, 12.50, 31.50, 42.50, 56.00 y 110.00. Realiza lo siguiente: • Organiza los datos en orden ascendente (del menor al mayor) • Obtén el rango de los datos • Realiza una tabla con 10 intervalos con las siguientes columnas: • Intervalo • Límite inferior • Límite superior • Marca de clase • Frecuencia • Frecuencia acumulada • Frecuencia relativa • Frecuencia relativa acumulada • Obtén la medias de tendencia central para datos agrupados por intervalos • Obtén las medidas de dispersión para datos agrupados por intervalos

Educación Superior Abierta y a Distancia • Primer Cuatrimestre

13


Estadística básica CUADERNO DE TRABAJO Unidad 2. Estadística descriptiva 3. En una escuela se midió el peso de 21 alumnos en kilogramos y se obtuvieron los siguientes resultados: 58, 42, 51, 54, 40, 39, 49, 56, 58, 57, 59, 63, 58, 63, 70, 72, 71, 69, 70, 68, 64 Realiza lo siguiente: • Organiza los datos en una tabla de datos • Organiza los datos en una tabla de frecuencias • Organiza los datos en una tabla que tenga 7 intervalos • Calcula las medidas de tendencia central para cada una de las tablas • Calcula las medidas de dispersión para cada una de las tablas

4. Una compañía que fabrica llantas investiga la duración promedio de un nuevo compuesto de caucho. Para ello se probaron 30 llantas en una carretera hasta alcanzar la vida útil de éstas. Los resultados obtenidos, en kilómetros, fueron:

60, 613

59, 836

60, 135

60, 222

59, 554

60, 252

60, 613

59, 784

60, 221

59, 997

60, 311

50, 040

60, 222

60, 220

60, 545

60, 222

60, 257

60, 000

59, 997

59, 997

69, 947

60, 135

60, 220

60, 311

59, 784

60, 222

60, 554

60, 225

59, 838

60, 523

Realiza lo siguiente: • Organiza los datos en una tabla de datos • Organiza los datos en una tabla de frecuencias • Organiza los datos en una de intervalos que tenga 10 intervalos • Saca la media, la mediana y la moda para cada una de las tablas • Saca el rango, la varianza y la desviación estándar para cada una de las tablas

14

Educación Superior Abierta y a Distancia • Primer Cuatrimestre


Estadística básica CUADERNO DE TRABAJO UNIDAD 3. Introducción a la teoría de probabilidad Postulados de probabilidad Los postulados de la probabilidad, que se aplican cuando el espacio muestral (S) es finito, son: 1. Todo espacio muestral tiene la probabilidad 1: P(S) = 1 para cualquier evento S. 2. La probabilidad de un evento es un número real mayor o igual a cero y menor o igual a uno: 0≤P (E) ≤ para cualquier evento A. 3. Si dos eventos son mutuamente excluyentes, la probabilidad de que uno u otro ocurran equivale a la suma de sus probabilidades. P (A

B)=P(A)+P (B)

para dos eventos mutuamente excluyentes cualesquiera, A y B.

Reglas de la probabilidad Con frecuencia es más fácil calcular la probabilidad de algún evento si conocemos la probabilidad de otro evento. Esto puede suceder si el evento en cuestión se puede representar como la unión de otros dos eventos o como el complemento de algún evento. Existen varias reglas que facilitan el cálculo de las probabilidades, éstas son: • La probabilidad de la unión de dos sucesos es la suma de sus probabilidades, restándose la probabilidad de su intersección. Simbólicamente se representa como:

• La probabilidad de la unión de tres sucesos es la suma de sus probabilidades, restándose la probabilidad de su intersección.

En este caso, se suma la intersección de los tres o más eventos porque al restar las intersecciones de dos en dos se resta de más la intersección de los tres. • La probabilidad de la suma de dos eventos mutuamente excluyentes A y B, es la suma de sus probabilidades: • La probabilidad de la suma de tres o más eventos mutuamente excluyentes A y B, es la suma de sus probabilidades, es decir:

Educación Superior Abierta y a Distancia • Primer Cuatrimestre

15


Estadística básica CUADERNO DE TRABAJO UNIDAD 3. Introducción a la teoría de probabilidad Probabilidad condicional La probabilidad condicional es aquella en la que la probabilidad de que ocurra un evento depende de lo que ha ocurrido con otro evento, se denota como P (B|A) (Probabilidad de B dado A), y para calcularla aplicamos la siguiente fórmula:

Por ejemplo: Las enfermedades E1 , E2 y E3 son comunes en una población. Se supone que, eventualmente: 10% de la población contraerá E1 17% contraerá E2 15% contraerá E3 4% contraerá E1 y E2 5% contraerá E1 y E3 3% contraerá E2 y E3 3% contraerá las tres enfermedades.

• ¿Cuál es la probabilidad de que una persona elegida al azar contraiga al menos una de las tres enfermedades? Tenemos que: P (E1)= 10

P(E2)= 17

P(E3)= 15

Sustituimos en la fórmula P (E1 E2 E3)= P(E1) + P(E2) + P(E3) - P(E1 10+17+15-4-5-3+3= 42-9=33

E2) - P(E1

E3) - P(E2

E3) + P(E1

E2

• ¿Cuál es la probabilidad de que una persona elegida al azar contraiga E3 dado que ya contrajo E1? Tenemos que:

Por lo tanto, la probabilidad de que una persona contraiga E3 una vez que contrajo E1 es de 50%. 16

Educación Superior Abierta y a Distancia • Primer Cuatrimestre

E3)=


Estadística básica CUADERNO DE TRABAJO UNIDAD 3. Introducción a la teoría de probabilidad Ejercicios 1. En un experimento aleatorio se contó el número de bacterias en una producción de un alimento. Algunos eventos importantes fueron: A: El alimento contiene 110 bacterias B: El alimento contiene más de 200 bacterias C: El alimento contiene entre 100 y 300 bacterias La probabilidad de que suceda A es del 7%, mientras que la probabilidad de que suceda B es del 4% y la probabilidad que suceda C es del 13% • ¿Cuál es la probabilidad de que suceda A

B?

• ¿Cuál es la probabilidad de que suceda C dado que ya sucedió A? 2. Petróleos Mexicanos encuentra petróleo o gas natural en el 10% de sus perforaciones. Si se perforan dos pozos, los eventos simples posibles son: E�: Éxito en ambas perforaciones (ya sea encontrando petróleo o gas natural) E�: Éxito en la primera perforación y fracaso en la segunda E�: Fracaso en la primera perforación y éxito en la segunda E�: Fracaso en ambas perforaciones (no encuentran ni petróleo ni gas natural) Las probabilidades asociadas a dichos eventos son: E� tiene el 1% de probabilidad de ocurrir, mientras que E� tiene el 9% y E� tiene el 81%. • ¿Cuál es la probabilidad de que ocurra E�? • ¿Cuál es la probabilidad de que se encuentre petróleo en al menos una de las dos perforaciones? 3. Al examinar unos pozos de agua potable, la Comisión Nacional de Agua encontró que en el 40% se presenta una partícula A, mientras que el 50% se presentó la partícula B y en el 20% no se presentó ninguna de estas dos partículas. Se escoge un pozo al azar. Determina los eventos utilizando las letras de las partículas que se presentan, es decir: A, B y L. • ¿Cuál es la probabilidad de que un pozo escogido al azar presente los dos tipos de impureza? Es decir, P(A B). • ¿Cuál es la probabilidad de que se presente la partícula A, habiéndose presentado ya la B? Es decir, P(A|B) • ¿Cuál es la probabilidad que se encuentre la partícula B en el pozo si ya presenta la partícula A? • ¿Cuál es la probabilidad de que se presentan ambas partículas? • ¿Cuál es la probabilidad de A

B

L? Educación Superior Abierta y a Distancia • Primer Cuatrimestre

17


Estadística básica CUADERNO DE TRABAJO UNIDAD 4. Modelos de probabilidad Variables aleatorias, distribuciones de probabilidad y valor esperado Primero veamos los conceptos y, después, un ejemplo: • Las variables aleatorias son asignaciones numéricas a los resultados de un experimento aleatorio. • Una distribución de probabilidad es la asignación de probabilidad a cada valor de una variable aleatoria X. Esto es, distribuir la probabilidad entre los valores o rango de la variable. El evento formado por todos los resultados para los que X=x se denota como {X=x} y su probabilidad como P(X=x). • El valor esperado, también llamado media o esperanza de una variable aleatoria discreta X se denota por U(X) o E(X) y es:

Si X es una variable aleatoria, y el experimento aleatorio que determina el valor de X se repite muchas veces, entonces se obtiene una secuencia de valores para X. Puede emplearse un resumen de estos valores, tal como el promedio (media), para identificar el valor central de la variable aleatoria. Por ejemplo, imaginemos el siguiente experimento aleatorio: En un taller mecánico cinco bujías defectuosas han sido mezcladas, accidentalmente, con tres en buen estado. Uno de los empleados escogió tres bujías al azar para instalarlas en una máquina • Describe el experimento aleatorio. • Describe los eventos posibles de dicho experimento • Encuentra la variable aleatoria para dicho experimento • Encuentra la distribución de probabilidad para esa variable • Encuentra el valor esperado El empleado escogió tres bugías, llamémoslas: B�, B� y B� Construyamos tercias para determinar cómo pueden haber sido elegidas las bujías. Consideremos que hay cinco bujías en buen estado y tres bujías defectuosas. Obtenemos las siguientes tercias que representan las formas en las que el empleado pudo haber escogido tres bujías: B1 Buena Buena Buena Buena Defectuosa Defectuosa Defectuosa Defectuosa 18

B2 Buena Buena Defectuosa Defectuosa Buena Buena Defectuosa Defectuosa

Educación Superior Abierta y a Distancia • Primer Cuatrimestre

B3 Buena Defectuosa Buena Defectuosa Buena Defectuosa Buena Defectuosa


Estadística básica CUADERNO DE TRABAJO UNIDAD 4. Modelos de probabilidad Simbolicemos con BE una bujía en buen estado y con D una bujía defectuosa. Entonces, la tabla anterior se traduce en los eventos posibles siguientes: Evento E1 E2 E3 E4 E5 E6 E7 E8

(B1, B2, B3) (BE, BE, BE) (BE, BE, D) (BE, D, BE) (BE, D, D) (D, BE, BE) (D, BE, D) (D, D, BE) (D, D, D)

Para construir una variable aleatoria le asignamos un número a cada evento, a los eventos que tiene el mismo final se les asignan números iguales, es decir, sacar una bujía en buen estado y dos defectuosas podrían ser representadas por los eventos E�, E� y E�, pues como se observa en la tabla: E� = (BE, D, D); E� = (D, BE, D), y E� = (D, D, BE). Así, la asignación de la variable aleatoria será: Evento E� E� E� E� E� E� E� E�

(B�, B�, B �) (BE, BE, BE) (BE, BE, D) (BE, D, BE) (BE, D, D) (D, BE, BE) (D, BE, D) (D, D, BE) (D, D, D)

Asignación 3 2 2 1 2 1 1 0

Hemos determinado que hay 8 eventos posibles. Ahora bien, dado que hay cinco bujías en buen estado y 3 defectuosas, entonces la probabilidad de escoger primero una bujía en buen estado es de 5/8, mientras que la de escoger primero una bujía defectuosa es de 3/8. Vayamos por partes: E� = (BE, BE, BE): La probabilidad de escoger una primera bujía en buen estado es de 5/8. Quedan 7 bujías, tres en mal estado y 4 en buen estado. La probabilidad de escoger la segunda bujía en buen estado es de 4/7. Quedan seis bujías, 3 en buen estado y 3 defectuosas. La probabilidad de elegir una bujía en buen estado es de 3/6. Educación Superior Abierta y a Distancia • Primer Cuatrimestre

19


Estadística básica CUADERNO DE TRABAJO UNIDAD 4. Modelos de probabilidad Así que la probabilidad de escoger las tres bujías en buen estado es de:

E� = (BE, BE, D): La probabilidad de escoger una primera bujía en buen estado es de 5/8. Quedan 7 bujías, tres en mal estado y 4 en buen estado. La probabilidad de escoger la segunda bujía en buen estado es de 4/7. Quedan seis bujías, 3 en buen estado y 3 defectuosas. La probabilidad de elegir una bujía defectuosa es de 3/6. Así que la probabilidad de escoger las dos primeras bujías en buen estado y la última defectuosa es de:

E� = (BE, D, BE): La probabilidad de escoger una primera bujía en buen estado es de 5/8. Quedan 7 bujías, 3 en mal estado y 4 en buen estado. La probabilidad de escoger la segunda bujía defectuosa es de 3/7. Quedan seis bujías, 4 en buen estado y 2 defectuosas. La probabilidad de elegir una bujía en buen estado es de 4/6. Así que la probabilidad de escoger las dos primeras bujías en buen estado y la última defectuosa es de:

E� = (BE, D, D): La probabilidad de escoger una primera bujía en buen estado es de 5/8. Quedan 7 bujías, 3 en mal estado y 4 en buen estado. La probabilidad de escoger la segunda bujía defectuosa es de 3/7. Quedan seis bujías, 4 en buen estado y 2 defectuosas. La probabilidad de elegir una bujía defectuosa es de 2/6. Así que la probabilidad de escoger las dos primeras bujías en buen estado y la última defectuosa es de:

E� = (D, BE, BE): La probabilidad de escoger una primera bujía defectuosa es de 3/8. Quedan 7 bujías, 2 en mal estado y 5 en buen estado. La probabilidad de escoger la segunda bujía en buen estado es de 5/7. Quedan seis bujías, 4 en buen estado y 2 defectuosas. La probabilidad de elegir una bujía en buen estado es de 4/6. Así que la probabilidad de escoger la primera bujía defectuosa y las otras dos en buen estado es de:

20

Educación Superior Abierta y a Distancia • Primer Cuatrimestre


Estadística básica CUADERNO DE TRABAJO UNIDAD 4. Modelos de probabilidad E� = (D, BE, D): La probabilidad de escoger una primera bujía defectuosa es de 3/8. Quedan 7 bujías, 2 en mal estado y 5 en buen estado. La probabilidad de escoger la segunda bujía en buen estado es de 5/7. Quedan seis bujías, 4 en buen estado y 2 defectuosas. La probabilidad de elegir una bujía defectuosa es de 2/6. Así que la probabilidad de escoger la primera y la tercera bujías defectuosas y la segunda en buen estado es de:

E� = (D, D, BE): La probabilidad de escoger una primera bujía defectuosa es de 3/8. Quedan 7 bujías, 2 en mal estado y 5 en buen estado. La probabilidad de escoger la segunda bujía defectuosa es de 2/7. Quedan seis bujías, 5 en buen estado y 1 defectuosa. La probabilidad de elegir una bujía en buen estado es de 5/6. Así que la probabilidad de escoger las dos primeras bujías defectuosas y la otra en buen estado es de:

E� = (D, D, D): La probabilidad de escoger una primera bujía defectuosa es de 3/8. Quedan 7 bujías, 2 en mal estado y 5 en buen estado. La probabilidad de escoger la segunda bujía defectuosa es de 2/7. Quedan seis bujías, 5 en buen estado y 1 defectuosa. La probabilidad de elegir una bujía defectuosa es de 1/6. Así que la probabilidad de escoger las tres bujías defectuosas es de:

Entonces, asignando la probabilidad a cada evento tenemos que la distribución de probabilidad es la siguiente: Evento E�

(B�, B�, B �) (BE, BE, BE)

Asignación 3

E�

(BE, BE, D)

2

E�

(BE, D, BE)

2

E�

(BE, D, D)

1

E�

(D, BE, BE)

2

E�

(D, BE, D)

1

E�

(D, D, BE)

1

E�

(D, D, D)

0

Probalidad 5 28 5 28 5 28 5 56 5 28 5 56 5 56 1 56

Educación Superior Abierta y a Distancia • Primer Cuatrimestre

21


Estadística básica CUADERNO DE TRABAJO UNIDAD 4. Modelos de probabilidad Así que:

La probabilidad para 0 es igual a la probabilidad del evento 8. Esta es igual a

La probabilidad para 1 es la suma de las probabilidades de los eventos 4, 6 y 7. Esto es igual a

La probabilidad para 2 es la suma de las probabilidades de los eventos 2, 3 y 5.+

Y la probabilidad de 3 es igual a la probabilidad del evento 1, que es igual a

De ahí que el valor esperado para x es:

22

Educación Superior Abierta y a Distancia • Primer Cuatrimestre


Estadística básica CUADERNO DE TRABAJO UNIDAD 4. Modelos de probabilidad Ejercicios 1. Petróleos Mexicanos encuentra petróleo o gas natural en el 10% de sus perforaciones. Si se perforan dos pozos al azar, los eventos simples posibles son: E�: Éxito en ambas perforaciones (ya sea encontrando petróleo o gas natural) E�: Éxito en la primera perforación y fracaso en la segunda E�: Fracaso en la primera perforación y éxito en la segunda E�: Fracaso en ambas perforaciones (no encuentran ni petróleo ni gas natural) Las probabilidades asociadas a dichos eventos son: E� tiene el 1% de probabilidad de ocurrir, mientras que E� tiene el 9% y E� tiene el 81%. • Encuentra una variable aleatoria para dicho experimento • Encuentra la distribución de probabilidad de dicha variable aleatoria • Encuentra el valor esperado 2. Un grupo de ingenieros elaboró 10 propuestas para la construcción de un edificio, 6 de las propuestas tienen un error en la descripción de los recursos. Los ingenieros decidieron revisar cada una de las propuestas para encontrar los errores y corregirlos. • Determina el experimento aleatorio para encontrar los componentes defectuosos • Describe los eventos posibles de dicho experimento • Encuentra la variable aleatoria para dicho experimento • Encuentra la distribución de probabilidad para esa variable • Encuentra el valor esperado 3. Un estudiante de psicología está realizando una investigación sobre el aprendizaje en los niños, donde se solicita, a niños de entre 5 y 6 años, que peguen, abajo del dibujo de un animal, la palabra correspondiente a su nombre. A cada diño se le presentan tres dibujos con sus nombres. Imagina que es el turno de un 6 años para realizar el experimento y determina lo siguiente: • Describe el experimento aleatorio • Describe los eventos posibles para este experimento • Encuentra la variable aleatoria de dicho experimento • Encuentra la distribución de probabilidad para esta variable • Encuentra el valor esperado

Educación Superior Abierta y a Distancia • Primer Cuatrimestre

23


Estadística básica CUADERNO DE TRABAJO UNIDAD 4. Modelos de probabilidad Distribución Binomial Las propiedades del modelo de distribución binomial son: A. Los ensayos son independientes. B. Cada ensayo tiene sólo dos resultados posibles, “éxito” o “fracaso”. C. La probabilidad de éxito en cada ensayo p permanece constante. La variable aleatoria X sería igual al número n de ensayos donde el resultado es “éxito”, y tiene una distribución de probabilidad binomial, con parámetros p (probabilidad de éxito) y n=1,2,… El modelo binomial es ejemplo de una distribución que se utiliza para analizar experimentos aleatorios con variables discretas. La distribución binomial refleja el número de secuencia de diferentes ensayos con x éxitos y n-x fracasos. Ésta se obtiene con la fórmula:

Donde: n! el factorial de n (número total de ensayos del experimento) y se obtiene multiplicado todos los números naturales desde 1 hasta n, es decir, n!= (1)(2)(3)(4)...(n―2)(n―1)(n) Por ejemplo: 7!= (1)(2)(3)(4)(5)(6)(7) = 5040 P es la probabilidad de tener éxito, obtener el resultado que buscamos.. 1-p es la probabilidad de fracaso. X es el número de ensayos exitosos. Por ejemplo: De acuerdo con datos obtenidos, el 30% de las personas afectadas con la enfermedad X se recuperan. Un laboratorio desarrolló una medicina que resultó totalmente ineficaz. Se seleccionaron diez personas enfermas al azar y se les suministró la medicina. ¿Cuál es la probabilidad de que al menos nueve de las diez personas infectadas se recuperen al tomar la medicina? Esto se modela con base a la distribución binomial, ya que se tiene un experimento binomial pues de las diez personas escogidas al azar sólo pueden pasar dos casos: o se recuperan al tomar la medicina (éxito), o siguen enfermos al tomar la medicina (fracaso).

24

Educación Superior Abierta y a Distancia • Primer Cuatrimestre


Estadística básica CUADERNO DE TRABAJO UNIDAD 4. Modelos de probabilidad Por lo tanto, utilizamos la fórmula para la distribución binomial:

Donde:

n es el número total de pruebas del experimento, en este caso 10.

x es el número de personas que se desea saber si se recuperan, 9.

Como la medicina es totalmente ineficaz, la probabilidad de que se recuperen es del 30%, esto significa que la

probabilidad de éxito es p = 0.3, mientras que la de fracaso, es decir, de que sigan enfermos, es q = 1 – p = 1 – 0.3 =0.7 Como se pide la probabilidad de que al menos nueve personas se recuperen, entonces, se debe encontrar P(x≥9). Esto sería igual a la probabilidad de que se recuperen exactamente 9 personas más la probabilidad de que se recuperen exactamente 10 personas, o bien, P(9)+P(10). Recuerda que 0!=1 y que x^0=1 para cualquier x Así que la probabilidad P(x ≥ 9) = P(9) + P(10) = 0.000137781+0.0000059049 = 0.0001436859 Por lo tanto, la probabilidad de que se recuperen al menos nueve de diez personas tomadas al azar al tomar la medicina es de 0.0001436859, redondeando tendríamos 0.000144.

Educación Superior Abierta y a Distancia • Primer Cuatrimestre

25


Estadística básica CUADERNO DE TRABAJO UNIDAD 4. Modelos de probabilidad Ejercicios 1. Un sistema de protección contra ladrones está compuesto por 5 unidades independientes, cada una con probabilidad 0.9 de detectar si alguien entra un lugar después de que ha sido prendido el sistema. Para probar el sistema en una fábrica, éste se encendió y se pidió a un empleado que entrara. • ¿Cuál es la probabilidad de que exactamente 4 unidades detecten al empleado? • ¿Cuál es la probabilidad de que el empleado no sea detectado por el sistema? 2. Las líneas telefónicas de una agencia de viajes están ocupadas el 40% del tiempo. Suponga que los eventos en los que las líneas están ocupadas en llamadas sucesivas son independientes. Se realizan 10 llamadas a la agencia. • ¿Cuál es la probabilidad de que al llamar exactamente 3 veces las líneas estén ocupadas? • ¿Cuál es la probabilidad de que en al menos una de las llamadas las líneas no estén ocupadas? 3. Una persona atraviesa, en su carro, todas las mañanas a la misma hora por una calle donde no hay semáforo, y 20% de las veces hay embotellamiento. Suponga que cada mañana representa un ensayo independiente. • En 5 mañanas, ¿cuál es la probabilidad de encontrar despejado todos los días? • En 20 mañanas, ¿cuál es la probabilidad de que encuentre embotellamiento todos los días?

26

Educación Superior Abierta y a Distancia • Primer Cuatrimestre


Estadística básica CUADERNO DE TRABAJO UNIDAD 4. Modelos de probabilidad Distribución de Poisson La distribución de Poisson se utiliza cuando lo que se busca es determinar el número de eventos que suceden en un tiempo o espacio finito. El modelo de Poisson tiene las siguientes propiedades: 1. El número de resultados que ocurren en un intervalo de tiempo o región es independiente de los resultados que puedan ocurrir en otro intervalo o región. 2. La probabilidad de que un resultado ocurra en un intervalo de tiempo o región es proporcional a la duración de éstos. 3. La probabilidad de más de una ocurrencia en el intervalo es cero.

Entonces, podemos asumir lo siguiente: Para cada intervalo de tiempo muy pequeño, la probabilidad de que ocurra un suceso en ese intervalo es proporcional a la amplitud del intervalo y no pueden ocurrir dos o más sucesos en un intervalo. Utiliza la siguiente fórmula: Donde

x= 0, 1, 2,… λ= un número positivo que representa el promedio de ocurrencias esperadas en el intervalo (frecuencia de ocurrencia). e= representa al número irracional ya estudiado en cursos de álgebra, igual a 2.7182818284590452354… Recuerda: cuando utilices el número e, sólo debes tomas 4 cifras después del punto, es decir, usa el número 2.7182.

Por ejemplo: En un crucero peligroso ocurren en promedio seis accidentes diarios. ¿Cuál es la probabilidad de que en un día ocurran solamente dos accidentes? ¿Cuál es la probabilidad de que no ocurra ningún accidente en el día en que te tocó pasar por ahí?

Educación Superior Abierta y a Distancia • Primer Cuatrimestre

27


Estadística básica CUADERNO DE TRABAJO UNIDAD 4. Modelos de probabilidad Por lo tanto, la probabilidad de que un día ocurran solamente dos accidentes es de 0.044625, o bien, del 4.4625%.

Recuerda que 0!=1 y que x⁰=1, para cualquier número x distinto de cero. Por lo tanto, la probabilidad de que un día no ocurra ningún accidente es de 0.002479, es decir, de 0.2479% (muy muy baja, ¿no crees?)

28

Educación Superior Abierta y a Distancia • Primer Cuatrimestre


Estadística básica CUADERNO DE TRABAJO UNIDAD 4. Modelos de probabilidad Ejercicios 1. El número promedio de llamadas telefónicas que recibe una empresa pequeña es de 10 llamadas por hora. La empresa puede atender un máximo de 15 llamadas por hora. • ¿Cuál es la probabilidad de que se reciban exactamente 5 llamadas en una hora? • Si realizas una llamada ¿cuál es la probabilidad de que las líneas de la empresa estén funcionando al tope de su capacidad? 2. El promedio de turistas que atraviesan una comunidad en su camino para llegar a la playa, a medio kilómetro de la comunidad, es de 35 turistas por semana. Los habitantes de la comunidad desean saber qué tan redituable sería desarrollar una empresa de servicios para captar a los turistas como clientes potenciales. La capacidad de atención de la empresa, sin necesidad de pedir capital externo y con una ganancia aceptable, sería de 50 personas cada semana. • ¿Cuál es la probabilidad de que la empresa se saturara? • ¿Cuál sería la probabilidad de que no atendieran a ninguna persona? 3. El número promedio de errores en un libro de texto es de 3 errores por cada 100 páginas. • ¿Cuál es la probabilidad de que aparezcan diez errores en un libro de 200 páginas? • ¿Cuál es la probabilidad de que adquieras un libro que no tenga ningún error?

Educación Superior Abierta y a Distancia • Primer Cuatrimestre

29


Estadística básica CUADERNO DE TRABAJO UNIDAD 4. Modelos de probabilidad Distribución normal Se le conoce como distribución normal o gaussiana. A su curva característica se le llama curva normal o campana, por la forma parecida a una campana que presenta. La distribución normal tiene las siguientes propiedades: 1. El máximo ocurre para x= μ 2. La curva es simétrica alrededor de μ. 3. La curva tiene sus puntos de inflexión (puntos donde la curva cambia de cóncava a convexa) en x= μ± σ 4. La curva se aproxima al eje horizontal de forma asintótica. 5. El área total de la curva normal es igual a 1 (toda posible gama de posibilidades está contemplada p=[0,1]). La distribución normal depende de dos parámetros, la media μ y la deviación estándar σ. La fórmula para la distribución normal de una variable discreta es la siguiente:

Donde: μ es la media σ es la desviación estándar π es 3.14159… e es igual a 2.7182… Recuerda: cuando utilices el número e, sólo debes tomas 4 cifras después del punto, es decir, usa el número 2.7182.

Variable aleatoria normal estándar Una variable aleatoria normal con µ=0 y σ=1 recibe el nombre de variable aleatoria normal estándar o normal tipificada y se denota con la letra Z. La ventaja de las variables normales estándar radica en que hay tablas donde se recoge la probabilidad acumulada para cada punto de la curva de esta distribución. Toda distribución normal se puede transformar en una normal tipificada, para transformarla se crea una nueva variable (Y) que será igual a la anterior (X) menos su media y dividida por su desviación típica, se denota como:

30

Educación Superior Abierta y a Distancia • Primer Cuatrimestre


Estadística básica CUADERNO DE TRABAJO UNIDAD 4. Modelos de probabilidad Por ejemplo: En el sistema de una estación de radio para captar una señal digital, el ruido de fondo tiene una distribución normal con media de 0.05 voltios y desviación estándar de 0.45 voltios. Si el voltaje es mayor que 0.95 voltios, el sistema reconoce que se ha recibido una señal. ¿Cuál es la probabilidad de que sea detectada una señal cuando ésta no ha sido transmitida? Es decir, de que sea ruido de fondo. Utilizaremos la fórmula para el modelo de distribución normal:

Se pide la probabilidad de que se detecte una señal sin que esta haya sido transmitida, es decir, que la señal detectada sea ruido de fondo. Ahora bien, se reconoce una señal si el voltaje es mayor a 0.95 voltios. Esto implica que debemos encontrar la probabilidad de que el voltaje sea mayor a 0.95 voltios para la media y la desviación del ruido de fondo. Substituimos en la fórmula para obtener:

Esto quiere decir que la probabilidad de que una señal sea detectada cuando no se ha transmitido nada es de 0.0805. Estandarizando la x para buscar el valor en la tabla tenemos que:

Es decir,

Buscando en la tabla para z=2 tenemos que la probabilidad acumulada hasta z=2 es de 0.97725. Por ello debemos hacer la resta para obtener para z>2 Así que, P(z>2) = 1-0.97725 = 0.02275 La diferencia entre un método y el otro es algo considerable y se debe a que manejamos números redondeados hasta seis cifras y no utilizamos todos los decimales después del punto. Educación Superior Abierta y a Distancia • Primer Cuatrimestre

31


Estadística básica CUADERNO DE TRABAJO UNIDAD 4. Modelos de probabilidad Ejercicios 1. Los resultados en el examen de admisión a ESAD tienen una distribución normal con media 75 y desviación estándar 10. • ¿Qué fracción de los resultados quedó entre 80 y 90? • Obtén la variable aleatoria normal estándar. 2. En una compañía refresquera se ajusta una máquina de refrescos de tal manera que llena las latas de refresco con un promedio de 300 mililitros. El número de mililitros por lata tiene una distribución normal con una desviación estándar de 10 mililitros. • ¿Cuál debe ser la capacidad mínima de las latas para que se derrame cuando mucho el 1% de ellas? • Obtén la variable aleatoria normal estándar. 3. El diámetro del agujero de las tuercas de una fábrica tienen una distribución normal con una media de 15.0 milímetros y una desviación estándar de 0.1 milímetros. Los tornillos diseñados aceptan tuercas de entre 14.888 y 15.112 • ¿Cuál es la probabilidad de que una tuerca escogida al azar no sirva? • Obtén la variable aleatoria normal estándar.

32

Educación Superior Abierta y a Distancia • Primer Cuatrimestre


Cuaderno de ejercicios eb