Page 1

STATISZTIKA II. 2.előadás Sokasági arány és variancia becslése FAE mintából Becslés EV mintából

1


Adatszerzési módok 1. Adatfelvételek Teljes körű felvétel

Kísérleti eredmények gyűjtése

Részleges felvétel

Reprezentatív megfigyelések

Véletlen kiválasztás

Egyéb részleges adatfelvétel

Nemvéletlen kiválasztás

2. Adminisztratív nyilvántartások 2


Statisztikai következtetések

Becslések

Hipotézisek ellenőrzése Becslés  (theta) paraméter

Pontbecslés

Intervallumbecslés 3


Sokasági jellemző (  ) Becslőfüggvény: ˆ  ˆn  ˆ  y 1 , y 2 ,..., y n  - a mintából származó megfigyelések  y1 , y2 , . . . , yn  függvénye - valószínűségi változó - a sokasági jellemző közelítő értékének meghatározására szolgál 4


Becslőfüggvények  Sokasági jellemző (  )

 Yi , Y  N

 Becslőfüggvény (ˆ )

 yi y , n

K P N 2  ( Y  Y ) i 2  N

Me

k p n 2  y  y  s2   i ,

n 1

2  y  y  s2   i

n

5


Becslési kritériumok  Torzítatlanság: E (ˆ ) 

Torzítás mértéke: Bs (ˆ )  E (ˆ )    Minimális variancia Torzítatlan becslőfüggvények esetén:

Var ( ˆ1 )  Var ( ˆ 2 )  Átlagos négyzetes hiba Ha az egyik becslőfüggvény torzított: MSE (ˆ )  Var (ˆ )  Bs 2 (ˆ )

6


Mintavételi módok és sokasági jellemzők 

FAE minta Sokasági átlag és értékösszeg becslése Sokaság egy arányának becslése Sokasági variancia becslése

EV minta Átlag és értékösszeg becslés Aránybecslés

Rétegezett EV minta Átlagbecslés

Független részminták módszere

7


Várható érték becslése FAE mintából Normális eloszlás (Y), ismert szórás ( kis minta)     P y  z1 / 2    < y  z1 / 2    1   n n 

Normális eloszlás (Y), ismeretlen szórás (kis minta) 2

s s   P  y  t1 / 2    < y  t1 / 2    1 n n  

y  y 2 s  n 1

Tetszőleges eloszlás, nagy minta

y  z1 / 2

 n

vagy

y  z1 / 2

s n

8


Konfidencia intervallum a sokasági várható értékre     P y  z1 / 2    < y  z1 / 2    1 n n 

y

y

hibahatár

Int 1   (  )  y  

y

Ismételt mintavétel esetén az esetek átlagosan (1   )  100 százalékában igaz az, hogy az intervallum tartalmazza a sokasági jellemzőt. 9


Mintanagyság    z1/2  n Az előírt pontosság és megbízhatóság teljesítéséhez szükséges mintanagyság: 1    95% z0,975  1,96 1    98% z0,99  2,33 1    99% z0,995  2,58

 z1 / 2   n    

2  2

4n

10


Sokasági arány Becslőfüggvény:

K (P  ) N

becslése

k ˆ P p n

Jellemzői: E ( p)  P

torzítatlan

P(1  P) Var ( p ) = n

p(1  p ) becslése: s  n 2 p

11


Sokasági arány becslése Eloszlása: - binomiális - elegendően nagy minta esetén közelíthető normálissal

pP z  N (0,1) sp 12


Sokasági arány becslése A normális eloszlással való közelítéshez szükséges mintanagyság:

min nP , n (1  P )   10 Konfidencia intervallum:

p(1 p) p  z1 / 2  = p  p n Mintanagyság:

n

2 z1 / 2

 P  (1  P) 2

13


Becslés a magyar termékek minőségében megbízók arányára 

n=1000

1    95 %

p  40 %

p(1  p) p  z1 / 2  = p p n

0, 4  0,6 0, 4  1,96  = 0, 4  0,03 1000

Int ( P )  37  43  % 14


Mintanagyság max. 0,25

n Ha

2 z1 / 2

 P  (1  P ) 2

1    95,5%

n 

z 2

1 2 15


Maximális hibahatár n=1000 1    95 %

z 0 ,975  1,96

0,25  p  1,96   0,031 1000

3,1%

16


2

Variancia ( ) becslése FAE mintából Becslőfüggvények: n

2 ( y  y )  i

2 s  i 1 1)

n 2 n 1 2  2 2 E (s )     2 n n n

 ( yi  y )

2) s 2  i 1 2

(torzított becslés)

2

n 1

E (s )  

2

(torzítatlan becslés)

17


Variancia becslése FAE mintából n 2

 ( yi  y )

2

Pontbecslés: s  i 1

Intervallumbecslés Feltétel: a sokasági eloszlás normális 2 ( n  1 ) s Az 2

n 1

változó   n  1 szabadságfokú

 2 eloszlású valószínűségi változó.

18


 Valószínűségi megállapítások:

 2  ( n  1) s 2 2 P   / 2    1 / 2   1   2    2 Átrendezve  -re : 2

 ( n  1) s ( n  1) s 2 P  2   2    1 / 2  /2

2

   1    2   Konfidencia intervallum -re: 2  ( n  1) s 2 ( n  1) s  2  2   / 2 ( )    1 / 2 ( ) 19

Nem szimmetrikus a pontbecslésre!


Példa szórásnégyzet becslésére  101 véletlenszerűen kiválasztott gyermek

születési átlagsúlya 3200 g, 212 g-os szórással.  Szórásnégyzet becslése ( 1    95% )  (101  1)  2122 (101  1)  2122    34679  60571   129,6 74,2  

 Szórás konfidencia-intervalluma:

34679 

60571  186 , 2  246 ,1g 20


BECSLÉS EGYSZERŰ VÉLETLEN (EV) MINTÁBÓL 

Homogén, véges elemszámú sokaságból visszatevés nélkül választjuk ki a mintát, minden lehetséges n elemű minta kiválasztásának azonos valószínűséget biztosítva.

Feltétel: lista a sokaság egységeiről

Tulajdonságai: - fontos jellemző az N - az egymást követően kiválasztott mintaelemek nem függetlenek egymástól - a mintajellemzők eloszlásának meghatározása bonyolultabb. 21


Egyszerű véletlen minta (EV) Kizárólag nagyminta: a mintából számított átlag, értékösszeg és arány közelítőleg normális eloszlást követ. Pontbecslés a sokasági átlagra:

 yi y n

A becslőfüggvény várható értéke: E yEV   Y 22


A becslés varianciája 2

Var y EV  

  y2( EV )

2

  N n     n  N 1  n

n  1    N

Az EV mintából való becslés pontosabb, mint az ugyanilyen elemszámú FAE mintából. n Ez kis kiválasztási aránynál   nem számottevő. N

n  Véges korrekciós faktor: 1    N 23


Az átlagbecslés konfidencia intervalluma y y  n  y  z1 2  y( EV)  z1 2  1 n N Illetve, ha a szórás nem ismert:

s n y  z1 2  sy(EV)  z1 / 2  1 n N 24


Az EV becslés tulajdonságai   

Torzítatlan Konzisztens becslés EV és FAE mintából készült átlagbecslés hatásosságának összehasonlítása: 2 2   n 2  2  y ( FAE )   y ( EV )  1   n n  N Var  y FAE Var  y EV

 

1 n 1 N

1

A FAE becslés hibája nagyobb (legfeljebb ugyanakkora) mint az EV becslésé.

25


GY.137. Egy bank öt budapesti fiókjában a foglalkoztatottak száma: 26, 25,13,12, ill.10 fő. Sokasági jellemzők: 26  25  13  12  10 Y  17,2 fő 5 2 2 ( 26  17 , 2 )  ...  ( 10  17 , 2 ) 2   46,96 5

  6,853 fő 26


GY.137. Összes lehetséges 4 elemű EV -

 N  5! minta:  n   4 ! 1!  5

2 2 26  25  13  10 ( 26  18 , 5 )  .....  ( 10  18 , 5 ) y1   18 ,5 s12   67 4 3

2 2 ( 26  18 , 5 )  .....  ( 10  18 , 5 ) s12   50,25 4

27


GY.137. 1. kérdés:

Y  17,2

 2  46,96

18,5  19  18,25  15  15,25 ( y )   17 ,2 5 torzítatlan

2. kérdés:

67  56,67  70,92  46  52,92 ( s )   58,7 5 2

torzított

50,25  42,5  53,19  34,5  39,69 (s )   44,03 5 2

torzított 28


GY.137.

Y  17,2

3. kérdés: var  y EV   s

 2  46,96 2 y ( EV )

s2  n

n   1   N 

(18,5  17,2) 2  (19  17,2) 2  ...  (15,25  17,2) 2 Var y EV    2,935 5  s2    n

n   (s 2 )  n  58 ,7  4   1   1   1         2 ,935 N  n  N 4  5 

torzítatlan 29


A szükséges mintaelemszám EV mintavételnél nEV s   z1 / 2  1 nEV N ebből:

n EV

2 z1 / 2

s

2

n FAE  2  2 n FAE z1 / 2  s 2   1 N N

nagyobb szóródás, nagyobb minta (ceteris paribus) - nagyobb megbízhatóság, nagyobb minta (ceteris paribus) - nagyobb pontosság, nagyobb minta (ceteris paribus) -

30


Értékösszeg becslés EV mintából N

A sokasági értékösszeg: Y    Yi  N  Y i 1

Pontbecslés: Yˆ   N  y E(Yˆ )  E ( N  y )  N  E ( y )  N  Y  Y 

Konfidencia intervallum: N  ( y   y ) 31


A P sokasági arány becslése EV mintából p(1  p) n p  z1 / 2  1- = p   p n N Az 1 -

n N

elhagyható, ha nagyobb 0,99-nél.

32


Stat_proba  

Próbaverzió az issuu kipróbálására

Read more
Read more
Similar to
Popular now
Just for you