Tarea # 9

Page 1

TAREA # 9 Facultad: Ciencias De La Ingeniería

Carrera: Ing. Industrial “K” Modulo: Estadística Aplicada A Las Empresas Docente: Ing. Teresa Llerena Estudiante: Juan Burneo

RESOLVER EL SIGUIENTE CRUCIGRAMA: 1.- Es el número de valores que podemos escoger libremente. 2.- Muestreo estratificado es la división de la población en grupos relativamente.

3.- Es un rango de valores que se utiliza para estimar un parámetro de la población. 4.- Es un número que se utiliza para estimar un parámetro de población desconocido. 5.- Conjunto de técnicas y pasos para llevar a cabo el proceso de la selección obtenida 6.- Emplea el conocimiento y la opinión personal para identificar a los elementos de la población.

2 H O M O G 3 E N E O S

4 6 M U E S T R E O →D E →J U I C I O S T I M 5 A M C U I E S T I M A C I O N →P O R →I N T E R V A L O S N T ↓ R P E U O N T U A 1 G R A D O S →D E →L I B E R T A D


7.-

ORDENE SECUENCIALMENTE LOS ELEMENTOS QUE COMPRENDE EL

MUESTREO: 1.- LA SELECCIÓN DE LA MUESTRA. 2- CONJUNTO DE TÉCNICAS 3.- LLEVAR A CABO EL PROCESO DE 4.- LE LLAMAMOS MUESTREO AL 5.- Y PASOS A DAR PARA

A)

1,2,3,4,,5

B)

5,4,3,2,1,

C)

4,2,5,3,1

D)

3,4,2,1,5

E)

4,5,3,2,1

DETERMINE SI ES VERDADERO O FALSO 8.- Estimación puntual es un solo número que se utiliza para estimar un parámetro. A) VERDADERO ( ↙ )

B) FALSO (

)

ESCOJA EL LITERAL CORRECTO 9.- Emplea el……..y la opinión personal para……..… a los elementos de la población. A) Conocimiento- identificar

B) Conocimiento-objeto C)

Polo-norte

10.- Los factores que van a decidir en la elección de la muestra son:

A) El tiempo, los recursos económicos del estudio y las características de los elementos de la población. B) Se conserve la independencia durante la selección de la muestra.


C) Emplea el conocimiento y la opinión personal para identificar a los elementos de la población. REALIZAR: 3 EJERCICIOS SOBRE TIPOS DE MUESTREOS. 1. Una ganadería tiene 3 000 vacas. Se quiere extraer una muestra de 120.

Explica cómo se obtiene la muestra: a) Mediante muestreo aleatorio simple. b) Mediante muestreo aleatorio sistemático.

SOLUCIÓN: a) — Se numeran las vacas del 1 al 3000. — Se sortean 120 números de entre los 3000. — La muestra estará formada por las 120 vacas a las que correspondan los números obtenidos. b) Coeficiente de elevación:

h=

3000 =25 120

— Se sortea un número del 1 al 25. Supongamos que sale el 9. — Las vacas seleccionadas para la muestra serían las que correspondieran a los números 9, 34, 59, 84, 109, …, 2984. 2. Una ganadería tiene 2 000 vacas. Son de distintas razas: 853 de A, 512 de B,

321 de C, 204 de D y 110 de E. Queremos extraer una muestra de 120: a) ¿Cuántas hay que elegir de cada raza para que el muestreo sea estratificado con reparto proporcional? b) ¿Cómo ha de ser la elección dentro de cada estrato? SOLUCIÓN:


a) Llamamos

raza B,

n3

n1

al número de vacas que debemos elegir de raza A,

al de C,

n4

al de D y

n5

n2

al de

al de E.

Ha de cumplirse que: n n n n n 120 = 1 = 2 = 3 = 4 = 5 2000 853 512 321 204 110 Así, obtenemos: n 1=51,18 n2=30,72 n3=19,26 n4=12,24 n5=6,6

La parte entera de estos números suma: 51 + 30 + 19 + 12 + 6 =118. Faltan 2 para llegar a 120. Por tanto, debemos elegir: 51 vacas de raza A, 31 vacas de B, 19 de C, 12 de D y 7 de E. 3. En una fábrica que consta de 600 trabajadores queremos tomar una muestra de 20. Sabemos que hay 200 trabajadores en la sección A, 150 en la B, 150 en la C y 100 en la D. Solución: x 20 = 1 x 1=6.6 ≈ 7 trabajadores de A 600 200 x 20 = 2 x 2=5 ⟹ 5 trabajadores de B 600 150 x 20 = 3 x 3=5 ⟹ 5trabajadores de C 600 150 x 20 = 4 x 4=3.3 ≈ 3trabajadores de D 600 100 3.- REALIZAR 3 EJERCICIOS ESTIMACION PUNTUAL.


1. Dada una distribución binomial B(n,p) y sus muestras de tres elementos

{ x 1 ; x 2 ; x 3 } , comprobar que el estimador de p conseguido por el metodo de los momentos igualando la media muestral y la media poblacional es al mismo tiempo un estimador de máxima verosimilitud para p. Solución: Calculamos la expresión del estimador. La media poblacional es, en el caso de la binomial np la media muestral de las muestras de tres elementos es: Igualando ambas expresiones obtenemos: np=́x =

x1+ x2 + x3 . Despejando p, se obtiene 2

̂p =

x̂ n .

Hallamos ahora el estimador de máxima verosimilitud para p. La función de verosimilitud, será ahora el producto de las probabilidades correspondientes a los valores de la muestra: Como la función de probabilidad de la binomial es, llamando x a la variable,

( nb ) p ( 1− p )

P ( X =b )=

b

n−b

entonces la función de verosimilitud sería:

V ( x 1 , x 2 , x 3 ; p )=¿

[( )

n p x ( 1− p ) n−x x1 1

1

][( )

n p x ( 1− p ) n−x x2 2

2

][( )

]

n p x ( 1− p )n −x = p x + x + x ( 1− p )3n−( x +x x3 3

3

1

2

3

¿ [ V ( x 1 , x 2 , x 3 ; p ) ]=¿

[( )( )( )]

¿ n n n + ( x 1+ x 2 + x 3 ) ∈ p+ [ 3n−( x 1 + x 2 + x 3) ]∈ ( 1− p ) x1 x2 x3

Hallando ahora la derivada con respecto a

p e igualando a 0 obtenemos

1

2

+ x3)


1 −1 ( x 1 + x 2 + x 3 ) p − [ 3n−( x 1 + x 2 + x3 ) ] 1− p =0

(

)

2. Un grupo de investigadores de Ecología midieron la concentración de células

rojas en la sangre de 29 lagartos (Sceloporis occidentales) capturados en el campo. También observaron si los lagartos estaban infectados por el parásito de Malaria Plasmodium. Los recuentos de células rojas proporcionaron los siguientes valores.

Animales infectados:

n1 = 13

Animales no infectados:

n2 = 16

X 1 = 972,1

s1 = 245,1

X 2 = 843,4

s 2 = 251,2

a) Construye un intervalo de confianza al 99% para la diferencia entre la

concentración media de células rojas en la sangre de animales infectados y no infectados (se supone normalidad). b) ¿Se podría afirmar que la malaria reduce el número de células rojas?

Razona la respuesta. Solución: a) Se trata de comparar dos poblaciones: P1, lagartos infectados con el parásito, y

P2, lagartos no infectados. Concretamente, nos interesa comparar las medias

poblacionales. En consecuencia, buscamos

I µ1 − µ2

.

Asumimos que las varianzas poblacionales NO son conocidas. Para verificar si pueden

considerarse iguales o no, como s 22 ( 251,2 ) 2 = = 1,05 < 2 s12 ( 245,1) 2

s 2 > s1

, calculamos

Por lo tanto, consideramos que

σ 12 = σ 22

(caso b1).


X 1 − X 2 = 972,1 − 843,4 = 128,7

Como

n1 = 13, n2 = 16

s 2p =

y

α = 1%

(0,01 en tanto por uno),

tα / 2,n1 + n2 − 2 = t 0,005, 27 = 2,771

( n1 − 1) s12 + ( n2 − 1) s 22 n1 + n 2 − 2

Finalmente,

s p = 248,507

; operando se tiene

Sustituyendo en la fórmula del intervalo de confianza, obtenemos I = (−128'424, 385'82) b) Si el intervalo contuviera sólo números negativos, estaríamos diciendo que la

diferencia entre el número medio de células rojas de P1 y P2 es negativa, o equivalentemente que el número medio de células rojas de P1 (lagartos infectados con malaria) es inferior al de P2 (lagartos no infectados). En ese caso, se podría afirmar que la malaria reduce el número de células rojas. Pero vemos que el intervalo contiene tanto números negativos como positivos, con lo cuál tan aceptables es que sea mayor la media de los infectados, como la de los no infectados. En consecuencia, NO se puede afirmar que la malaria reduzca el número de células rojas. 3. En un estudio sobre el efecto del dióxido de azufre como agente

contaminante del aire, se dispuso de cierto tipo de semillas de habichuelas en cámaras que se mantuvieron a lo largo del experimento abiertas por su parte superior. Se asignaron aleatoriamente seis de esas cámaras a un tratamiento consistente en fumigarlas con dióxido de azufre, y en las otras seis no se efectuó ningún proceso. Transcurrido un mes, se registraron las cosechas totales (en kg) de habichuelas en cada cámara, obteniéndose los siguientes datos: Con Diox.

1,52

1,85

1,39

1,15

1,30

1,57

Sin Diox.

1,49

1,55

1,21

0,65

0,76

0,69


Halla un intervalo de confianza al 90% para la diferencia de producción media de habichuelas con y sin dióxido de azufre. Interprétalo. Queremos comparar dos poblaciones, P1 y P2. Llamamos:

P1: cosechas de habichuelas criadas con dióx. Podemos comprobar que

X 1 = 1,463

,

n1 = 6 s1 = 0,243 , .

P2: cosechas de habichuelas criadas sin dióx. Podemos comprobar que

X 2 = 1,058

,

n 2 = 6 s 2 = 0,410 ,

Queremos determinar un intervalo para la diferencia de medias poblacionales,

I µ1 − µ2

Para comprobar si las varianzas poblacionales (que suponemos desconocidas) pueden

considerarse iguales o no, como

consideramos que

σ 12 ≠ σ 22

s 2 > s1

, calculamos

(caso b2)

f Necesitamos calcular

Además,

α = 10%

; podemos comprobar que

f = 9,38 ≅ 9

t 0.05,9 = 1'833

. Por tanto, necesitamos

Finalmente, sustituyendo en la expresión para I = (0.049, 0.761)

s 22 = 2,847 > 2 s12

I µ1 − µ2

, tenemos

. Por lo tanto,


Como el intervalo contiene sólo números positivos, se tiene que

µ1 > µ 2

µ1 − µ 2 > 0

, luego

, es decir, la cosecha media con dióxido de azufre es superior a la cosecha

media sin él. En otras palabras, efectivamente el dióxido de azufre favorece el crecimiento de las semillas. 4. Se realizó un estudio para comparar el contenido en sodio en el plasma de las

focas peleteras australes jóvenes, con el nivel de sodio en la leche de las focas. Se obtuvieron las siguientes observaciones sobre el contenido de sodio (en minimoles) por litro de leche (o plasma) en 10 focas aleatoriamente seleccionadas: Sujeto

Leche

Plasma

1

93

147

2

104

157

3

95

142

4

81,5

141

5

95

142

6

95

147

7

76,5

148

8

80,5

144

9

79,5

144

10

87

146

Halla un intervalo de confianza del 95% para la diferencia de niveles de sodio en los dos líquidos corporales. ¿Hay pruebas de que exista alguna diferencia? ¿En qué sentido? Sea X el nivel de sodio en la Leche, y sea Y el nivel de sodio en el plasma. Queremos estudiar la diferencia de las medias de Y, y X. Sin embargo, como los valores que


tenemos para ambas provienen de los mismos individuos, en principio los valores de X e Y NO son pueden considerarse independientes. Por lo tanto, estamos ante el caso de datos emparejados. En consecuencia, formamos una nueva variable, D=X-Y, cuyos datos corresponden a las diferencias entre los valores de X e Y; es decir: Y=Sodio

en X=Sodio

en

Sujeto

Leche

plasma

D =X-Y

1

93

147

54

2

104

157

53

3

95

142

47

4

81,5

141

59,5

5

95

142

47

6

95

147

52

7

76,5

148

71,5

8

80,5

144

63,5

9

79,5

144

64,5

10

87

146

59

Total:

887

1458

571

Sobre los datos de D, calculamos media y cuasivarianza, obteni茅ndose

s D = 1.033

D = 57.1

,

t 0.025,9 = 2.262

. Como

, aplicando la f贸rmula del intervalo de confianza

se tiene I = (56.361, 57.839). Es decir, la presencia del sodio en el plasma es claramente superior. 3.- REALIZAR 3 EJERCICIOS INTERVALO DE CONFIANZA.


1. Calcular un intervalo de confianza al nivel α = 0.05 para la probabilidad de p

de que un recién nacido sea niño si en una muestra de tamaño 123 se han obtenido 67 niños. SOLUCIÓN: Teniendo en cuenta que la proporción de varones recién nacidos puede modelizarse por una variable Bernoulli de parámetro p (probabilidad de que un recién nacido sea varón), el intervalo de confianza al nivel α = 0.05 viene dado por:

(

̂p− z

1−

∝ 2

̂p ( 1− ̂p ) ̂p (1−̂p ) , ̂p + z ∝ 1− n n 2

)

Donde n = 123. ̂p =

67 y z =z =1.96 , es decir, 123 1− ∝2 0.975

( 0.544715−0.0880096,0 .544715+0.0880096 ) y por tanto, el intervalo ( 0.0456706,0 .632725 ) contendrá a la proporción de varones nacidos con una probabilidad del 95%. 2. Calcular un intervalo de confianza al nivel α = 0.001 para el peso exacto

mediante los resultados obtenidos con 10 básculas: 7.20, 7.01, 7.36, 6.91, 7.22, 7.03, 7.11, 7.12, 7.03, 7.05 SOLUCIÓN: Suponiendo que las medidas del peso de las básculas sigue una distribución normal N ( μ , σ 2 ) con media el peso exacto, estamos interesados en encontrar un intervalo de confianza que contenga a la media de esta distribución, que a un nivel α = 0.001 y desviación típica desconocida, está determinado por:


(

X́ −t

α n−1 ;1− 2

S ́ S , X +t α n−1 ;1− √ n √n 2

)

n

∑ Xi

Donde

n=10, X́ = i=1 n

=7.1040, S =

de la distribución t de Student

t

n−1 ;1−

α 2

n

( Xi − X́ )2 ∑ ❑ n−1

=0.1286, y utilizando la tabla

=t 9 ; 0.9995=4.78091.

Por tanto, el intervalo de

confianza al nivel 0.001 es: (6.9096,7 .2984) Y representa que la media del peso estará en dicho intervalo con una probabilidad de acierto del 99.9%. 3. Calcular un intervalo de confianza al nivel α = 0.05 para

σ

2

mediante las

desviaciones que se producen en un proceso de fabricación cuya distribución es

N (0, σ ) a partir de la muestra 1.2, -2.2, -3.1, -0.2, 0.5, 0.6, -2.1, 2.2, 1.3

SOLUCIÓN: Sabiendo que el proceso de fabricación sigue una distribución normal de media conocida μ=0 , un intervalo de confianza para la varianza

σ

2

al nivel α = 0.05 es

el siguiente:

(

T

n

X

,n

2 n ;1−

α 2

T X

2 n ;−

α 2

) n

Donde n=9 ,

X

2

se tiene

∑ ( Xi− μ )2

T = i=1

X2

n ;1−

α 2

n

=3.05333 y utilizando la tabla de la distribución

= X 29 ; 0.975=2.7004

, es decir, (1.44458,10.1763)


Es el intervalo que contendr谩 con un 95% de acierto las desviaciones que se producen en el proceso de fabricaci贸n.


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.