Issuu on Google+

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA DESCRITTIVA Stefania Naddeo


INDICE 1. DISTRIBUZIONI DI FREQUENZA E FUNZIONE DI RIPARTIZIONE

3

2. VALORI CARATTERISTICI DELLE DISTRIBUZIONI

20

3. INDICI DI VARIABILITA’

31

4. DISTRIBUZIONI BIVARIATE

39

APPENDICE Tavola A: Tavola B:

47 48

Funzione di ripartizione della normale standardizzata Quantili della normale standardizzata

2


1. DISTRIBUZIONI DI FREQUENZA E FUNZIONE DI RIPARTIZIONE (Gli esercizi contenuti in questa sezione si riferiscono al capitolo 2 delle dispense)

Esercizio 1.1 La seguente serie è relativa ad una variabile discreta X rilevata su 20 individui: 0 1 1 0 0 1 1 2 2 2 4 2 2 2 4 4 4 4 4 4 Determinare la distribuzione di frequenza della variabile e rappresentarla graficamente. Soluzione La distribuzione assume la forma riportata nella tabella successiva. X freq. ass. freq. rel. 0 3 0,15 1 4 0,20 2 6 0,30 4 7 0,35 totale 20 1,00 Una rappresentazione grafica adeguata per una variabile quantitativa discreta è il diagramma per ordinate che nel caso esaminato assume la forma riportata nella figura successiva. 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 0

1

2

3

4

Esercizio 1.2 La seguente serie è relativa ad una variabile continua X rilevata su 10 individui: 1,2 1,5 2,0 2,1 2,8 3,3 3,6 4,2 5,9 6,8 sintetizzare i dati in una distribuzione costituita dalle classi 1-|2, 2-|4 e 4-|7 e disegnarne l’istogramma corrispondente. Soluzione La distribuzione espressa in termini di frequenze relative assume la forma riportata nella tabella successiva. X freq. ass. freq. rel. ampiezza classe densità 1 -| 2 3 0,3 1 0,3 2 -| 4 4 0,4 2 0,2 4 -| 7 3 0,3 3 0,1 totale 10 1,0

L’istogramma assume la forma seguente

3


0,3

0,2

0,1

0 0

1

2

3

4

5

6

7

Esercizio 1.3 Data la seguente distribuzione relativa ad una variabile X qualitativa sconnessa, X freq. ass. cum. a 25 b 75 c 95 d 100 calcolare le frequenze relative e rappresentare graficamente la distribuzione cosÏ ottenuta mediante un grafico a nastri. Soluzione La distribuzione espressa in termini di frequenze relative è la seguente X freq. rel. a 0,25 b 0,50 c 0,20 d 0,05 totale 1,00 Il grafico a nastri corrispondente assume la forma

d c a b 0

0,1

0,2

0,3

0,4

0,5

Da notare che le modalitĂ  della variabile sono state elencate in base ai valori delle frequenze associate.

4


Esercizio 1.4 Rappresentare graficamente la seguente distribuzione relativa ad una variabile discreta X X freq. rel. -1 0,25 0 0,40 1 0,20 2 0,10 3 0,05 totale 1,00 determinare l’espressione formale della funzione di ripartizione corrispondente e calcolare la quota di individui con un valore della variabile compreso nell’intervallo (0, 2]. Soluzione La rappresentazione grafica della distribuzione assume la forma 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 -2

-1

0

1

2

3

4

L’espressione formale della funzione di ripartizione risulta x < -1 0 0,25 -1≤ x < 0  0 ≤ x <1 0,65 F(x) =  1≤ x < 2 0,85 0,95 2 ≤ x<3  1 x ≥3 La quota di individui con un valore della variabile compreso nell’intervallo (0, 2] è dato da F(2) – F(0) = 0,95 – 0,65 = 0,30.

Esercizio 1.5 Data la seguente distribuzione relativa ad una variabile discreta X X freq. rel. cum. 2 0,55 4 0,75 6 1,00 rappresentarla graficamente, determinare l’espressione formale della funzione di ripartizione e disegnarne il grafico.

5


Soluzione La rappresentazione grafica della distribuzione assume la forma 0,6 0,5 0,4 0,3 0,2 0,1 0 0

1

2

3

4

5

6

L’espressione formale della funzione di ripartizione risulta x<2 0 0,55 2≤ x < 4 F(x) =  4≤ x<6 0,75 1 x≥6 e la rappresentazione grafica corrispondente è data da 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 0

2

4

6

8

Esercizio 1.6 Data la seguente distribuzione relativa ad una variabile continua X X freq. rel. cum. 3 -| 4 0,5 4 -| 6 0,8 6 -| 10 1,0 disegnarne l’istogramma corrispondente. Soluzione Sulla base dei risultati riportati nella nella tabella successiva X freq. rel. ampiezza classe densità 3 -| 4 0,5 1 0,50 4 -| 6 0,3 2 0,15 6 -| 10 0,2 4 0,05 totale 1,0

6


lâ&#x20AC;&#x2122;istogramma assume la forma seguente 0,5 0,4 0,3 0,2 0,1 0 2

3

4

5

6

7

8

9

10

11

12

Esercizio 1.7 Data la seguente serie di valori relativa ad una variabile discreta X 1 3 4 2 2 1 3 3 2 2 determinare la distribuzione di frequenza della variabile espressa mediante le frequenze relative cumulate. Rappresentare graficamente la funzione di ripartizione corrispondente e calcolare la quota di individui con un valore della variabile minore o uguale a 3. Soluzione La distribuzione è la seguente X freq. ass. freq. rel. 1 2 0,2 2 4 0,4 3 3 0,3 4 1 0,1 totale 10 1,0

freq. rel. cum 0,2 0,6 0,9 1,0

Il grafico della funzione di ripartizione assume la forma 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 -2

-1

0

1

2

3

4

5

6

La quota di individui con un valore della variabile minore o uguale a 3 è data da F(3) = 0,9.

7


Esercizio 1.8 La seguente serie è relativa ad una variabile discreta X rilevata su 10 individui: 242, 245, 244, 248, 247, 242, 248, 244, 246, 242. Scrivere l’espressione analitica della funzione di ripartizione corrispondente e disegnarne il grafico. Determinare la quota di individui con un valore della variabile minore o uguale a 243. Soluzione L’espressione analitica della funzione di ripartizione è data da x < 242 0 0,3 242 ≤ x < 244  244 ≤ x < 245 0,5 F(x) = 0,6 245 ≤ x < 246 0,7 246 ≤ x < 247 0,8 247 ≤ x < 248  1 x ≥ 248 ed il grafico corrispondente assume la forma 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 240

241

242

243

244

245

246

247

248

249

250

La quota di individui con un valore della variabile minore o uguale a 243 è data da F(243) = 0,3.

Esercizio 1.9 Data la seguente distribuzione relativa ad una variabile continua X X freq. rel. 18 -| 20 0,06 20 -| 25 0,10 25 -| 30 0,30 30 -| 60 0,54 totale 1,00 calcolare la quota di individui con un valore della variabile: inferiore a 19, b) superiore a 22, c) compreso fra 40 e 50.

8


Soluzione L’espressione analitica della funzione di ripartizione è data da x ≤ 18 0 0,03(x -18 ) 18 < x ≤ 20  20 < x ≤ 25 0,06 + 0,02(x - 20 ) F(x) =  25 < x ≤ 30 0,16 + 0,06(x - 25 ) ( ) 0,46 + 0,018 x 30 3 0 < x ≤ 60  1 x > 60 per cui le quote richieste sono: a) F(19) = 0,03, b) 1−F(22) = 1−(0,06+0,02×2) = 0,9, c) F(50)−F(40) = 0,46+0,018×20−(0,46+0,018×10) = 0,18. Esercizio 1.10 Data la seguente distribuzione relativa ad una variabile continua X X densità 2 -| 10 0,025 10 -| 20 0,020 20 -| 40 0,030 calcolare la quota di individui con un valore della variabile: a) inferiore a 5, b) superiore a 30, c) compreso fra 10 e 15. Soluzione Sulla base delle informazioni riportate nella tabella seguente le quote richieste risultano X freq. rel. freq. rel. cum. 2 -| 10 0,2 0,2 10 -| 20 0,2 0,4 20 -| 40 0,6 1,0 totale 1,0 a) F(5) = 0,025(5−2) = 0,075, b) 1−F(30) = 1−[0,4+0,03(30−20)] = 0,30, c) F(15)−F(10) = 0,2+0,02(15−10) – 0,2 = 0,10. Esercizio 1.11 Data la seguente serie di valori di una variabile continua X rilevata su 10 individui 8,0 6,4 7,8 7,4 7,6 7,8 7,0 6,4 8,4 8,8 costruire la distribuzione di frequenza nelle classi 6-|7, 7-|8 e 8-|9. Disegnare i grafici sovrapposti delle funzioni di ripartizione della serie originaria e della distribuzione in classi. Soluzione La distribuzione in classi è data da X freq. rel. freq. rel. cum. 6 -| 7 0,3 0,3 7 -| 8 0,5 0,8 8 -| 9 0,2 1,0 totale 1,0

9


Pertanto i grafici sovrapposti delle due funzioni di ripartizione assumono la forma riportata nel grafico seguente 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 5 5,2 5,4 5,6 5,8 6 6,2 6,4 6,6 6,8 7 7,2 7,4 7,6 7,8 8 8,2 8,4 8,6 8,8 9 9,2 9,4 9,6 9,8 10

Esercizio 1.12 Data la seguente serie di valori di una variabile continua X rilevata su 6 individui 2,6 2,0 2,2 2,0 2,3 2,4 determinare l’espressione analitica della funzione di ripartizione e disegnarne il grafico. Determinare la quota di individui con un valore della variabile superiore a 2,5. Soluzione La serie ordinata è 2,0 2,0 2,2 2,3 2,4 2,6 L’espressione analitica della funzione di ripartizione è data da x < 2,0 0 0,3 2,0 ≤ x < 2,2  0,5 2,2 ≤ x < 2,3  F(x) =  2,3 ≤ x < 2,4 0,6 0,83 2,4 ≤ x < 2,6 1 x ≥ 2,6  ed il grafico corrispondente assume la forma 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 1,8

1,9

2

2,1

2,2

2,3

2,4

2,5

2,6

2,7

2,8

2,9

3

La quota di persone con un valore di X maggiore di 2,5 è data da 1−F(2,5) = 1− 0,83 = 0,16 .

10


Esercizio 1.13 Data la seguente serie relativa al numero di figli rilevati su una collettività di 10 famiglie, 2 1 3 4 4 3 2 2 1 2 costruire la distribuzione di frequenza e farne la rappresentazione grafica corrispondente. Soluzione La distribuzione assume la forma riportata nella tabella successiva. X freq. rel. 1 0,2 2 0,4 3 0,2 4 0,2 totale 1,0 Una rappresentazione grafica adeguata è il diagramma per ordinate 0,4

0,2

0 0

1

2

3

4

Esercizio 1.14 Date le frequenze cumulate relative alle ore di funzionamento di un componente elettronico, determinare le frequenze relative associate a ciascuna classe e le frequenze assolute corrispondenti sapendo che la numerosità complessiva è pari a 20. ore freq. rel. cum. 2.000 -| 3.000 0,10 3.000 -| 5.000 0,25 5.000 -| 7.500 0,40 7.500 -| 10.000 0,65 10.000 -| 14.000 0,90 14.000 -| 20.000 1,00 Soluzione Le frequenze richieste sono riportate nella tabella successiva. ore freq. relative freq. assolute 2.000 -| 3.000 0,10 2 3.000 -| 5.000 0,15 3 5.000 -| 7.500 0,15 3 7.500 -| 10.000 0,25 5 10.000 -| 14.000 0,25 5 14.000 -| 20.000 0,10 2 totale 1,00 20

11


Esercizio 1.15 La seguente serie di dati si riferisce alle altezze (in centimetri) di 15 piantine 17,4 20,4 20,0 20,0 18,4 18,6 18,6 15,3 16,5 18,0 16,3 18,0 11,8 15,5 18,0 Sintetizzare la serie con un raggruppamento nelle classi 11-|16, 16-|18, 18-|22 e disegnare l’istogramma ed il grafico della funzione di ripartizione corrispondente. Soluzione Dalla serie originaria si ottengono i dati contenuti nella tabella successiva altezze freq. ass. freq. rel. ampiezza intervallo densità 11 -| 16 3 0,2 5 0,04 16 -| 18 6 0,4 2 0,20 18 -| 22 6 0,4 4 0,10 totale 15 1,0 L’istogramma assume la forma seguente

freq. rel. cum 0,2 0,6 1,0

0,2 0,15 0,1 0,05 0 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

ed il grafico della funzione di ripartizione risulta 1 0,8 0,6 0,4 0,2 0 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

Esercizio 1.16 Data una variabile X la cui distribuzione è riportata nella tabella seguente X freq. ass. 2 -| 4 28 4 -| 10 12 10 -| 20 10 totale 50 determinare l’espressione formale della funzione di ripartizione e disegnarne il grafico.

12


Soluzione Sulla base della distribuzione precedente si ottengono le informazioni riportate nella tabella successiva X freq. rel. freq. rel. cum. densità 2 -| 4 0,56 0,56 0,28 4 -| 10 0,24 0,80 0,04 10 -| 20 0,20 1,00 0,02 totale 1,00 Pertanto l’espressione formale della funzione di ripartizione risulta x≤2 0 0,28(x − 2) 2< x ≤ 4  F(x) = 0,56 + 0,04(x − 4 ) 4 < x ≤ 10 0,8 + 0,02(x −10 ) 10 < x ≤ 20 1 x > 20  ed il grafico corrispondente assume la forma 1 0,8 0,6 0,4 0,2 0 0

2

4

6

8

10

12

14

16

18

20

22

24

Esercizio 1.17 Data una variabile X la cui distribuzione è riportata nella tabella seguente X freq. rel. cum. 5 -| 20 0,60 20 -| 30 0,80 30 -| 35 0,95 35 -| 40 1,00 determinare l’espressione formale della funzione di ripartizione e disegnarne il grafico Soluzione Sulla base della distribuzione precedente si ottengono le informazioni riportate nella tabella successiva X freq. rel. amp. classe densità 5 -| 20 0,60 15 0,04 20 -| 30 0,20 10 0,02 30 -| 35 0,15 5 0,03 35 -| 40 0,05 5 0,01 totale 1,00 Pertanto l’espressione formale della funzione di ripartizione risulta

13


x≤5 0 0,04(x − 5 ) 5 < x ≤ 20  0,6 + 0,02(x − 20 ) 20 < x ≤ 30 F(x) =  0,8 + 0,03(x − 30 ) 30 < x ≤ 35 0,95 + 0,01(x − 35 ) 35 < x ≤ 40 1 x > 40 ed il grafico corrispondente assume la forma 1 0,8 0,6 0,4 0,2 0 0

5

10

15

20

25

30

35

40

45

Esercizio 1.18 Data una variabile discreta X la cui funzione di ripartizione è data da x<0 0 0,4 0 ≤ x <1  F(x) = 0,6 1≤ x < 2 0,9 2≤ x <3 1 x≥3  disegnare il grafico corrispondente, determinare la distribuzione della variabile X e farne il grafico. Soluzione Il grafico della funzione di ripartizione è 1 0,8 0,6 0,4 0,2 0 -1

0

1

2

3

la distribuzione di frequenza assume la forma seguente

14

4


X freq. rel. 0 0,4 1 0,2 2 0,3 3 0,1 totale 1,0 La rappresentazione grafica corrispondente assume la forma 0,4 0,3 0,2 0,1 0 0

1

2

3

Esercizio 1.19 Data una variabile X la cui funzione di ripartizione è data da x≤5 0 0,1(x − 5 ) 5< x ≤7  7 < x ≤ 10 0,2 + 0,1(x − 7 ) F(x) =  0,5 + 0,03(x −10 ) 10 < x ≤ 20 0,8 + 0,01(x − 20 ) 20 < x ≤ 40 1 x > 40 determinare la distribuzione di frequenza corrispondente e disegnare l’istogramma. Soluzione La distribuzione di frequenza è data da X densità ampiezza intervallo 5 -| 7 0,10 2 7 -| 10 0,10 3 10 -| 20 0,03 10 20 -| 40 0,01 20 totale per cui l’istogramma assume la forma seguente

freq. rel. 0,2 0,3 0,3 0,2 1,0

0,1 0,08 0,06 0,04 0,02 0 4

6

8

10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40

15


Esercizio 1.20 Data una variabile X la cui distribuzione è approssimata da una distribuzione normale di parametri µ=10 e σ=2, determinare la quota di individui che presentano un’intensità di X: a) inferiore a 8, b) superiore a 13, c) compresa fra 9 e 11. Soluzione

X −µ per poter utilizzare le tavole della σ distribuzione normale standard. In questo modo le soluzioni sono  8 −10  a) F(8) = Φ  = Φ (−1) = 1− Φ (1) = 0,159  2   13 −10  b) 1−F(13) = 1− Φ  = 1− Φ(1,5 ) = 0,067  2   11−10   9 −10  c) F(11) −F(9) = Φ  − Φ  = 2Φ (0,5 )−1= 0,382  2   2 

Bisogna ricorrere alla variabile standardizzata U =

Esercizio 1.21 Data una variabile X la cui distribuzione è approssimata da una distribuzione normale di parametri µ=25 e σ=6, determinare la quota di individui che presentano un’intensità di X: a) superiore a 28, b) compresa fra 24 e 26. Soluzione Una volta effettuata la standardizzazione le quote richieste risultano  28 − 25  a) 1−F(28) = Φ  = 1− Φ(0,5 ) = 0,309  6   26 − 25   24 − 25  b) F(26) −F(24) = Φ  − Φ  = 2Φ(0,17 )−1= 0,134  6   6  Esercizio 1.22 Data una variabile X la cui funzione di ripartizione è approssimata dal seguente modello teorico x ≤ −1 0  1 F(x) =  x 3 +1 −1< x < 1 2  1 x ≥1 determinare la funzione di densità di frequenza corrispondente.

(

)

Soluzione Data la funzione di ripartizione, la funzione di densità corrispondente si ottiene effettuando dF(x ) 3 2 la derivata. Risulta = x , per cui la funzione di densità di frequenza è data da dx 2 3 2 −1< x < 1  x f(x) =  2 0 altrove 

16


Esercizio 1.23 Data una variabile X la cui distribuzione è approssimata dal seguente modello teorico 2 0 < x <1 3x f(x) =  0 altrove si determini la funzione di ripartizione corrispondente Soluzione Data la precedente funzione di densità, la funzione di ripartizione si ottiene effettuando l’integrale x

x

x

t3   x3  3t dt = 3 t dt = 3   = 3 − 0  = x 3  3 0  3  0 0 per cui risulta x≤0 0  F(x) = x 3 0 < x <1  x ≥1 1

2

2

Esercizio 1.24 Data una variabile X la cui distribuzione è approssimata dal seguente modello teorico  x +1 1≤ x ≤ 3  f(x) =  6 0 altrove  si determini la funzione di ripartizione corrispondente Soluzione La funzione di ripartizione si ottiene effettuando l’integrale da 1 a x della funzione di densità. Dato che x

x

x

2 1 x2 t +1 1 1 t2   1  x x 1 dt = (t +1)dt =  + t  =  + x −  +1 = + − 6 61 6  2 1 6  2  2  12 6 4 1 la funzione di ripartizione assume la forma x <1 0  2 x x 1 F(x) =  + − 1≤ x ≤ 3 12 6 4  1 x >3 

Esercizio 1.25 Data una variabile X la cui distribuzione è approssimata dal seguente modello teorico 20x 3 (1− x ) 0 ≤ x ≤1 f(x) =  0 altrove si determini la funzione di ripartizione corrispondente

17


Soluzione Dato che x

x

x

t4 t5  20t (1- t )dt = 20 t - t dt = 20  −  = 5x 4 − 4x 5  4 5 0 0 0 la funzione di ripartizione assume la forma x<0 0  4 F(x) = 5x − 4x 5 0 ≤ x ≤1  x >1 1

3

3

4

Esercizio 1.26 Data una variabile X la cui funzione di ripartizione è approssimata dal seguente modello teorico x≤0 0  1 F(x) =  x(6 − x ) 0 < x <1 5  1 x ≥1 determinare la funzione di densità di frequenza corrispondente. Soluzione dF(x ) 1 Risulta = (6 − 2x ) per cui la funzione di densità di frequenza è data da dx 5 1 0 < x <1  (6 − 2x ) f(x) =  5 0 altrove  Esercizio 1.27 Data una variabile X la cui distribuzione è approssimata dal seguente modello teorico 3 2 x − 2x -2 ≤ x ≤ 0  f(x) =  20 0 altrove  si determini la funzione di ripartizione corrispondente

(

)

Soluzione Dato che x

∫ (

x

)

3 3 2 3 t3 2  3  x3  3  x 2  8 2 20  t - 2t dt =  − t  =  − x −  − − 4  =  −x +  20 20  3 3  3  20  3  -2 20  3 -2

la funzione di ripartizione assume la forma x < -2 0  1 3 F(x) =  x − 3x 2 +1 -2 ≤ x ≤ 0 20  1 x >0

(

)

18


Esercizio 1.28 Data una variabile X la cui funzione di ripartizione è data da x ≤ -1 0 0,3 + 0,3 x -1< x ≤ 0  F(x) = 0,3 + 0,25x 0< x ≤2 0,4 + 0,2x 2< x ≤3 1 x >3  disegnarne il grafico corrispondente e calcolare la quota di individui con un valore della variabile: a) minore di 0, b) superiore a 1, d) maggiore di 5. Soluzione I valori delle funzione di ripartizione in corrispondenza degli estremi delle classi si ottengono sostituendo tali valori nelle rispettive espressioni formali e risultano pari a quelli riportati nella tabella seguente, X freq. rel. cum. -1 -| 0 0,30 0 -| 2 0,75 2 -| 3 1,00 per cui il grafico assume la forma 1 0,8 0,6 0,4 0,2 0 -2

-1

0

1

2

3

4

5

Le quote richieste si ottengono dalle diverse espressioni formali e risultano: a) F(0) = 0,3 b) 1−F(1) = 1−(0,3+0,25) = 0,45 c) 1−F(5) = 1-1 = 0

19


2. VALORI CARATTERISTICI DELLE DISTRIBUZIONI (Gli esercizi contenuti in questa sezione si riferiscono al capitolo 3 delle dispense)

Esercizio 2.1 Data la seguente serie di valori di una variabile continua X rilevata su 6 individui 2,6 2,0 2,2 2,0 2,3 2,4 determinare il valore dei tre quartili della variabile Soluzione Si consideri innanzitutto la serie ordinata 2,0 2,0 2,2 2,3 2,4 2,6 Non c’è nessuna intensità della variabile in corrispondenza della quale la funzione di ripartizione assume il valore 0,25, pertanto come primo quartile si prende quella intensità in corrispondenza della quale per la prima volta la F(x) assume un valore maggiore di 0,25. Per cui x0,25=2,0 perchè F(2,0) = 0,3. Lo stesso discorso vale per il terzo quartile che risulta x0,75=2,4. Per quanto riguarda la mediana, c’è tutto un intervallo di valori in corrispondenza del quale la F(x) vale 0,5. Come mediana si prende la semisomma degli estremi di questo intervallo 2,2 + 2,3 x 0,5 = = 2,25. 2

Esercizio 2.2 Data la seguente serie di valori di una variabile continua X rilevata su 12 individui 6,0 6,4 10,2 10,0 11,8 7,2 4,5 8,1 5,1 9,8 10,9 10,0 determinare il valore dei tre quartili della variabile Soluzione La serie ordinata è 4,5 5,1 6,0 6,4 Risulta quindi 6 + 6,4 x 0,25 = = 6,2, 2 8,1+ 9,8 x 0,5 = = 8,95, 2 10 +10,2 x 0,75 = = 10,1. 2

7,2

8,1

9,8

10,0 10,0 10,2 10,9

11,8

Esercizio 2.3 Data la seguente serie ordinata di valori di una variabile continua X rilevata su 14 individui 2,1 2,3 2,7 2,9 3,0 4,1 5,1 5,2 6,2 6,4 7,1 8,2 9,0 9,3 determinare il valore dei tre quartili

20


Soluzione I tre quartili risultano x 0,25 = 2,9, 5,1+ 5,2 = 5,15, 2 x 0,75 = 7,1.

x 0,5 =

Esercizio 2.4 Sulla base della seguente distribuzione di frequenza X freq. rel. 5 -| 7 0,2 7 -| 10 0,3 10 -| 20 0,3 20 -| 40 0,2 totale 1,0 determinare il valore dei tre quartili della variabile Soluzione Data una distribuzione in classi, il valore del quantile xp di ordine p, che supponiamo contenuto nella classe i-esima, si ottiene ponendo p − F(x i −1 ) x p = x i −1 + f i (x) Pertanto, date le frequenze relative cumulate riportate nella tabella seguente X freq. rel. cum. 5 -| 7 0,2 7 -| 10 0,5 10 -| 20 0,8 20 -| 40 1,0 il primo quartile corrisponde a 0,25 − 0,20 x 0,25 = 7 + = 7,5 0,1 La mediana si ottiene direttamente dai dati della tabella e risulta x0,5=10 ed il terzo quartile è dato da 0,75 − 0,5 x 0,75 = 10 + = 18,3 0,03

Esercizio 2.5 Sulla base della seguente distribuzione di frequenza X densità 5 -| 9 0,025 9 -| 15 0,100 15 -| 25 0,030 determinare il valore dei primi due decili e la quota di individui con un valore della variabile inferiore o uguale a 10.

21


Soluzione Sulla base dei dati si ottengono le informazioni riportate nella tabella successiva X freq. rel. freq. rel. cum. 5 -| 9 0,1 0,1 9 -| 15 0,6 0,7 15 -| 25 0,3 1,0 totale 1,0 dalle quali risulta x0,1 = 9 0,2 − 0,1 x 0,2 = 9 + = 10 0,1 F(10) = 0,1+0,1 = 0,2.

Esercizio 2.6 Data la seguente distribuzione relativa ad una variabile discreta X X freq. rel. cum. -1 0,25 0 0,65 1 0,85 2 0,95 3 1,00 determinare la quota di individui con un valore di X maggiore di 1, la moda e la media aritmetica. Soluzione La quota di individui con un valore di X maggiore di 1 è data da 1–F(1) = 1–0,85 = 0,15. Ottenuta la distribuzione espressa mediante le frequenze relative X freq. rel. -1 0,25 0 0,40 1 0,20 2 0,10 3 0,05 totale 1,00 risulta che la moda è pari a 0, mentre la media è E(X) = -1×0,25 + 1×0,2 + 2×0,1 + 3×0,05 = 0,30.

Esercizio 2.7 Sulla base della seguente funzione di ripartizione x <1 0 0,2 1≤ x < 2  F(x) = 0,6 2≤ x <3 0,8 3≤ x <4 1 x≥4  determinare la distribuzione di frequenza corrispondente e calcolare il valore della media aritmetica della variabile.

22


Soluzione Sulla base della funzione di ripartizione si ottiene la distribuzione riportata nella tabella successiva. X freq. rel. cum freq. rel. 1 0,2 0,2 2 0,6 0,4 3 0,8 0,2 4 1,0 0,2 totale 1,0 Pertanto la media della variabile risulta E(X)=2,4.

Esercizio 2.8 Sulla base della seguente funzione di ripartizione x ≤1 0  1< x ≤ 2 0,3(x -1)  F(x) = 0,3 + 0,25(x − 2) 2< x ≤ 4  4< x≤8 0,8 + 0,05(x − 4 ) 1 x >8  calcolare il valore della media aritmetica della variabile.

Soluzione Si ottiene la distribuzione riportata nella tabella successiva. X freq. rel. cum freq. rel. 1 -| 2 0,3 0,3 2 -| 4 0,8 0,5 4 -| 8 1,0 0,2 totale 1,0 Pertanto la media della variabile risulta E(X) = 1,5×0,3 + 3×0,5 + 6×0,2 = 3,15. Esercizio 2.9 Date le seguenti informazioni relative ai prezzi unitari ed alle quantità di un certo bene acquistato in 4 diversi esercizi, calcolare la media dei prezzi ponderata con le quantità. prezzo (in euro) quantità 3,15 7 3,20 6 3,30 2 3,35 5 Soluzione La media dei prezzi ponderata con le quantità risulta 3,15×7 + 3,20×6 + 3,30× 2 + 3,35×5 E (X ) = = 3,23 . 7+ 6+ 2+5

23


Esercizio 2.10 Date le seguenti informazioni relative al prezzo al quintale ed alle quantità di un certo bene acquistato in 5 diverse occasioni, calcolare il prezzo medio al quintale del bene considerato. prezzo quantità (al quintale) (in quintali) 40,00 150 41,00 450 41,50 500 42,00 300 43,00 1000 Soluzione La media dei prezzi ponderata con le quantità risulta 100800 E (X ) = = 42,00 . 2400 Esercizio 2.11 Data la seguente distribuzione in classi X freq. ass. 3 -| 5 8 5 -| 8 6 8 -| 15 7 15 -| 40 4 totale 25 determinare l’espressione formale della funzione di ripartizione, calcolare la mediana e la quota di individui con un valore della variabile maggiore di 10. Soluzione Dai dati si ottengono le informazioni riportate nella tabella successiva X freq. rel. freq. rel. cum. densità 3 -| 5 0,32 0,32 0,1600 5 -| 8 0,24 0,56 0,0800 8 -| 15 0,28 0,84 0,0400 15 -| 40 0,16 1,00 0,0064 totale 1,00 L’espressione formale della funzione di ripartizione risulta quindi x ≤3 0 0,16(x − 3 ) 3< x≤5  5< x≤8 0,32 + 0,08(x − 5 ) F(x) =  8 < x ≤ 15 0,56 + 0,04(x − 8 ) 0,84 + 0,0064(x −15 ) 15 < x ≤ 40 1 x > 40 La mediana è contenuta nella seconda classe e risulta 0,5 − 0,32 x 0,5 = 5 + = 7,25 . 0,08 La quota di individui con un valore di X maggiore di 10 corrisponde a 1−F(10) = 1−[0,56+0,04(10−8)] = 0,36. 24


Esercizio 2.12 Data la seguente serie di osservazioni relativa ad una variabile continua 2,8 1,7 4,8 3,5 3,9 3,7 1,2 5,7 7,1 2,0 individuare i tre quartili. Costruire inoltre la distribuzione sintetica nelle classi di valori 1-|2, 2-|4, 4-|8 e individuare la classe modale. Soluzione Una volta ordinata la serie, risulta x0,25 = 2 3,5 + 3,7 x 0,5 = = 3,6 2 x0,75 = 4,8 La classe modale è la prima classe, 1-|2, dato che è questa la classe con la maggiore densità di frequenza (pari a 0,3). Esercizio 2.13 Sulla base della seguente distribuzione di frequenza X freq. rel. cum. 5 -| 20 0,15 20 -| 30 0,55 30 -| 35 0,80 35 -| 40 1,00 costruire l’istogramma, determinare la classe modale e la media aritmetica. Soluzione Sulla base della distribuzione precedente si ottengono le seguenti informazioni X freq. rel. densità val. centrale 5 -| 20 0,15 0,01 12,5 20 -| 30 0,40 0,04 25,0 30 -| 35 0,25 0,05 32,5 35 -| 40 0,20 0,04 37,5 totale 1,00 L’istogramma assume la forma seguente 0 ,0 5 0 ,0 4 0 ,0 3 0 ,0 2 0 ,0 1 0 0

2

4

6

8

10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40

La classe modale è 30-|35. La media è E(X)=12,5×0,15+25×0,4+32,5×0,25+37,5×0,2=27,5.

25


Esercizio 2.14 Data la seguente serie di valori di una variabile continua X rilevata su 6 individui 5,1 3,2 3,1 2,4 4,9 5,2 4,1 4,0 calcolare il terzo decile, la mediana, la media e il secondo momento dall’origine. Soluzione Data la serie ordinata risulta x0,3=3,2 4 + 4,1 x 0,5 = = 4,05 2 La media della variabile è E(X)=4 e infine la media dei quadrati è E(X2)=16,935

Esercizio 2.15 Data una variabile X la cui distribuzione è riportata nella tabella seguente X freq. ass. 2 -| 4 28 4 -| 10 12 10 -| 20 10 totale 50 calcolare la media e il secondo momento centrale della variabile. Soluzione Sulla base della distribuzione precedente si ottengono le seguenti frequenze relative X freq. rel. 2 -| 4 0,56 4 -| 10 0,24 10 -| 20 0,20 totale 1,00 per cui E(X) = 6,36. La media dei quadrati è E(X2) = 61,8 e il secondo momento centrale è quindi E[(X−mx)2] = E(X2) – [E(X)]2 = 61,8 – (6,36)2 = 21,3504 Esercizio 2.16 Sulla base della distribuzione riportata nella nella tabella successiva. X freq. ass. 2 -| 5 18 5 -| 8 22 8 -| 12 10 totale 50 calcolare: a) la classe modale, b) la media aritmetica, c) il secondo momento centrale. Soluzione a) La classe modale è 5-|8 perchè a questo intervallo è associata la massima densità di frequenza, pari a 0,146 . b) E(X) = 3,5×0,36 + 6,5×0,44 + 10×0,2 = 6,12. c) E[(X−mx)2] = 5,5456 dato che E(X2) = 43. 26


Esercizio 2.17 Sulla base della distribuzione espressa mediante le densità di frequenza X densità 5 -| 15 0,038 15 -| 35 0,016 35 -| 50 0,020 calcolare la media della variabile X, il primo quartile e la quota di individui con un valore della variabile compreso fra 10 e 30. Soluzione Una volta ottenute le frequenze relative a partire dalle densità di frequenza si ha E(X) = 10×0,38 + 25×0,32 + 42,5×0,3 = 24,55, 0,25 x 0,25 = 5 + ≅ 11,5789 , 0,038 F(30)−F(10) = 0,38+0,016(30−15) − [0,038(10−5)] = 0,43. Esercizio 2.18 Data una variabile X la cui distribuzione è approssimata dal seguente modello teorico 3 2 −1< x < 1  x f(x) =  2 0 altrove  calcolare la media e la quota di individui con un valore della variabile: a) inferiore o uguale a –0,5; b) superiore a 0,5. Soluzione La media della variabile X risulta 1

1

1

3 3 3 3 x4  3 1 1 E(x) = x x 2 dx = x dx =   =  −  = 0 . 2 2 −1 2  4  −1 2  4 4  −1 Per calcolare le quote richieste è opportuno determinare la forma della funzione di ripartizione della variabile, che si ottiene effettuando l’integrale x

x

x

3 2 3 2 3 t3  3  x3 t dt = t dt =   =  2 2 −1 2  3  −1 2  3 −1

(

)

 1  1 −  −  = x 3 +1  3  2 per cui la funzione di ripartizione assume la forma x ≤ −1 0  1 F(x) =  x 3 +1 −1< x < 1 2 1 x ≥1 La quota di individui con un valore della variabile inferiore o uguale a –0,5 è data da 1 F( −0,5) = − 0,5 3 +1 = 0,4375 , 2 mentre la quota di individui con un valore della variabile superiore a 0,5 corrisponde a 1 1−F(0,5) = 1− 0,5 3 +1 = 0,4375 . 2

(

)

(

)

(

)

27


Esercizio 2.19 Determinare il valore modale di una variabile X la cui funzione di ripartizione è approssimata dal seguente modello teorico x≤0 0  4 F(x) = 3x − 8x 3 + 6x 2 0 < x <1  x ≥1 1 Soluzione Per trovare la moda occorre individuare il punto di massimo della funzione di densità 12x 3 − 24x 2 +12x 0 < x <1 f(x) =  0 altrove Derivando la funzione e uguagliandola a zero si ottiene l’equazione 36x2−48x+12=0 che ammette le due soluzioni 4m 2 6 di cui la soluzione x=1/3 è il punto di massimo, come risulta dal segno della derivata seconda calcolata in corrispondenza di questo valore. Esercizio 2.20 Data una variabile X la cui funzione di ripartizione è approssimata dal seguente modello teorico x≤0 0  3 F(x) = x 0 < x <1 1 x ≥1  calcolare l’ottavo centile, la mediana, la media e il secondo momento centrale.

Soluzione Il generico quantile di ordine p della variabile X, xp, si ottiene uguagliando il valore della funzione di ripartizione a p e determinando il valore della variabile X che soddisfa l’uguaglianza. Per quanto riguarda la mediana si ha quindi (x0,5)3 = 0,5 da cui si ottiene x 0,5 = 3 0,5 ≅ 0,7937 . Per calcolare la media e la varianza è necessario determinare la funzione di densità della variabile, che si ottiene effettuando la derivata rispetto ad x della funzione di ripartizione. Risulta 3x 2 0 < x <1 f(x) =  0 altrove per cui la media è data da 1

1

x4  1  3 E(X ) = 3x dx = 3   = 3 − 0  = = 0,75 ,  4 0  4  4 0

3

28


la media dei quadrati è 1

1

( )∫

 x5  1  3 E X = 3x dx = 3   = 3 − 0  = = 0,6 ,  5 0  5  5 0 2

4

per cui il secondo momento centrale risulta E[(X−mx)2] = 0,6−0,752 = 0,0375. Esercizio 2.21 Data una variabile X la cui funzione di densità è approssimata dal seguente modello teorico 0< x<2 1− 0,5x f(x) =  altrove 0 calcolare la media e il secondo momento dall’origine. Soluzione La media è pari a 2

2

∫(

2

)

 x2 x3   8  4 E(X ) = x(1- 0,5x )dx = x - 0,5x dx =  −  =  2 −  = = 0,6 ,  2 6 0  6  6 0 0 e la media dei quadrati è

2

( )∫

2

2

∫(

2

)

 x3 x4   8  2 E X = x (1- 0,5x )dx = x - 0,5x dx =  −  =  − 2  = = 0,6 .  3 8 0  3  3 0 0 2

2

2

3

Esercizio 2.22 Data una variabile X la cui funzione di ripartizione è approssimata dal seguente modello x ≤ -1 0  1 2 F(x) =  (x +1) -1< x < 1 4  1 x ≥1 calcolare la mediana e la media. Soluzione Per quanto riguarda la mediana si pone 1 (x 0,5 +1)2 = 0,5 4 da cui si ottiene l’unica soluzione accettabile x 0,5 = −1+ 2 ≅ 0,4142 . Per calcolare la media è necessario determinare la funzione di densità della variabile  x +1 -1< x < 1  f(x) =  2 0 altrove  per cui la media è data da 1

∫ (

)

1

1 2 1  x3 x2  1 E (X ) = x + x dx =  +  = = 0,3 . 2 2  3 2  -1 3 -1

29


Esercizio 2.23 Data una variabile X la cui distribuzione è approssimata da una normale di parametri µ=8 e σ=4, determinare: a) il primo decile, b) la mediana, c) la quota di individui che presentano un’intensità di X compresa fra 6 e 10. Soluzione a) x0,1= µ + σu0,1 = 8 + 4×(-1,282) = 2,872 b) x0,5= 8  10 − 8   6 − 8  c) F(10) −F(6) = Φ  − Φ  = 2Φ (0,5 )−1= 0,382  4   4 

Esercizio 2.24 Data una variabile X la cui distribuzione è approssimata da un modello normale di parametri µ=40 e σ=0,5, determinarne il primo quartile. Calcolare inoltre la quota di individui che presentano un’intensità di X: a) inferiore a 39, b) compresa fra 39 e 41, c) maggiore di 41. Soluzione Il venticinquesimo centile x0,025= 40 + 0,5×(-0.674) = 39,663  39 − 40  a) F(39) = Φ  = Φ(− 2) = 1− Φ (2) = 1− 0,977 = 0,023  0,5   41− 40   39 − 40  b) F(41)−F(39) = Φ  − Φ  = Φ(2)− Φ(− 2) = 2× Φ (2)−1= 0,954  0,5   0,5   41− 40  c) 1−F(41) = 1− Φ  = 1− Φ(2) = 0,023  0,5 

30


3. INDICI DI VARIABILITA’ (Gli esercizi contenuti in questa sezione si riferiscono al capitolo 4 delle dispense)

Esercizio 3.1 Data la seguente distribuzione relativa ad una variabile discreta X X freq. assolute 10 4 20 3 30 2 40 1 totale 10 calcolare la media e la varianza. Soluzione E(X) = 10×0,4 + 20×0,3 + 30×0,2 + 40×0,1 = 20 E(X2) = 102×0,4 + 202×0,3 + 302×0,2 + 402×0,1 = 500 V(X) = 500−202 = 100.

Esercizio 3.2 Data la seguente distribuzione relativa ad una variabile discreta X X freq. rel. cum. 2 0,25 4 0,75 6 1,00 calcolare la media e lo scarto quadratico medio. Soluzione E(X) = 2×0,25 + 4×0,5 + 6×0,25 = 4 E(X2) = 4×0,25 + 16×0,5 + 36×0,25 = 18 V(X) = 2 Sx = (2)1/2 ≅ 1,4142. Esercizio 3.3 Date le seguenti intensità relative ad una variabile discreta X rilevata su 20 individui 2 3 5 5 3 2 2 2 6 6 2 2 2 3 2 3 3 3 5 5 calcolare media e varianza. Soluzione La distribuzione di frequenza risulta X freq. rel. 2 0,4 3 0,3 5 0,2 6 0,1 totale 1,0

31


Gli indici richiesti assumono i valori seguenti E(X) = 3,3 E(X2) = 12,9 V(X) = 2,01.

Esercizio 3.4 Date le seguenti intensità relative ad una variabile discreta X rilevata su 20 individui 0 0 1 3 2 2 2 0 0 1 3 0 0 0 1 0 1 2 2 2 calcolare il coefficiente di variazione s/m. Soluzione La distribuzione di frequenza risulta X freq. rel. 0 0,4 1 0,2 2 0,3 3 0,1 totale 1,0 E(X) = 1,1 E(X2) = 2,3 V(X) = 1,09 s 1,09 = ≅ 0,9491 m 1,1

Esercizio 3.5 Data la seguente di variazione X 5 -| 6 6 -| 8 8 -| 12

distribuzione relativa ad una variabile continua X calcolare il coefficiente densità 0,4500 0,1500 0,0625

Soluzione La distribuzione espressa mediante le frequenze relative risulta X val. centr. freq. rel. 5 -| 6 5,5 0,45 6 -| 8 7,0 0,30 8 -| 12 10,0 0,25 totale 1,00 Gli indici richiesti assumono i valori seguenti E(X) = 7,075 E(X2) = 53,3125 V(X) = 3,256875 s 3,256875 = ≅ 0,2551 m 7,075

32


Esercizio 3.6 Data una variabile X con una media pari a 15 ed una varianza pari a 2, si determini media e varianza della variabile trasformata Y=3X−5. Soluzione In base alle proprietà della media e varianza di una trasformazione lineare risulta E(Y) = 3E(X)−5 = 3×15−5 =40, V(Y) = 32×V(X) = 9×2=18. Esercizio 3.7 Data una variabile X la cui distribuzione è riportata nella tabella seguente X freq. rel. cum. 1 0,4 2 0,7 3 0,9 4 1,0 calcolare la media e la varianza della variabile. Data inoltre la variabile Y=2+4X, se ne determini media e varianza. Soluzione Una volta ottenute le frequenze relative, risulta E(X) = 2 E(X2) = 5 V(X) = E(X2) – [E(X)]2 = 5–4 = 1. In base alle proprietà della media e varianza di una trasformazione lineare risulta E(Y) = 2+4E(X) = 2+4×2 = 10, V(Y) = 42V(X) = 16×1 = 16.

Esercizio 3.8 Sulla base della distribuzione riportata nella nella tabella successiva. X freq. ass. cum. 0 25 1 75 2 95 3 100 calcolare il coefficiente di variazione della variabile X. Soluzione Risulta E(X) = 1,05 E(X2) = 1,75 V(X) = 0,6475 s 0,6475 = ≅ 0,7664 . m 1,05

33


Esercizio 3.9 Sulla base della distribuzione riportata nella nella tabella successiva. X freq. rel. 3 -| 4 0,5 4 -| 6 0,3 6 -| 10 0,2 totale 1,0 calcolare il coefficiente di variazione della variabile X. Soluzione Risulta E(X) = 4,85 E(X2) = 26,425 V(X) = 2,9025 s 2,9025 = ≅ 0,3513 . m 4,85

Esercizio 3.10 Sulla base della distribuzione riportata nella nella tabella successiva. X freq. rel. cum. 5 -| 7 0,1 7 -| 15 0,4 15 -| 35 0,8 35 -| 80 1,0 calcolare il coefficiente di variazione della variabile Y=4X. Soluzione Una volta calcolate le frequenze relative si ottiene E(X) = 25,4 E(X2) = 951,15 V(X) = 305,99 da cui risulta E(Y) = 101,6 V(Y) = 4.895,84 s 4.895,84 = ≅ 0,6887 . m 101,6

Esercizio 3.11 Data la seguente distribuzione relativa ad una variabile continua X X freq. rel. 0 -| 2 0,25 2 -| 8 0,50 8 -| 10 0,25 totale 1,00 disegnare l’istogramma e determinare il valore dell’indice di asimmetria a3.

34


Soluzione Sulla base della forma dell’istogramma 0,125 0,1 0,075 0,05 0,025 0 0

2

4

6

8

10

si nota che la distribuzione è simmetrica, per cui l’indice di asimmetria è pari a zero.

Esercizio 3.12 Data una variabile X la cui distribuzione è approssimata da una distribuzione normale di parametri µ=−1 e σ=3, determinare: a) il primo quartile, b) la media e lo scarto quadratico medio della variabile trasformata Y=–5x+4. Soluzione a) x0,25= µ + σu0,25 = −1 + 3(-0,674) = −3,022 b) E(Y) = −5E(X)+4 = −5(−1)+4 = 9 c) V(Y) = 25V(X) = 225 per cui s y = 225 = 15

Esercizio 3.13 Data la seguente funzione di ripartizione relativa ad una variabile X determinare la distribuzione di frequenza corrispondente, la media e la varianza. x<3 0 3≤ x<5 0,3 F(x) =  5≤ x<8 0,8 x≥8 1 Soluzione La distribuzione di frequenza è X freq. rel. 3 0,3 5 0,5 8 0,2 totale 1,0 E(X) = 5 E(X2) = 28 V(X) = 3

35


Esercizio 3.14 Data la variabile definita nel precedente esercizio si determini il coefficiente di variazione della variabile Y = 3X−4. Soluzione E(Y) = 3×5−4 = 11 V(Y) = 9×3 = 27 sy 27 = ≅ 0,4724 . my 11

Esercizio 3.15 Dato il seguente modello teorico che approssima la distribuzione di una variabile continua X 1< x < 1,5 8(x −1) f(x) =  0 altrove  si calcoli media e varianza. Soluzione 1,5

E (X ) = 8

∫(

1,5

)

[

)]

(

 x3 x2  x - x dx = 8  −  = 8 (1,125 −1,125 )− 0,3 − 0,5 = 1,3  3 2 1 2

1 1,5

( ) ∫(

1,5

)

[

(

)]

 x4 x3  E X = 8 x - x dx = 8  −  = 8 (1,265625 −1,125 )− 0,25 − 0,3 = 1,7916  4 3 1 1 V (X ) = 0,0138 2

3

2

Esercizio 3.16 Dato il seguente modello teorico che approssima la funzione di ripartizione di una variabile continua X x < -1 0  1 1 F(x) =  x 3 + −1< x < 1 2 2 1 x >1 se ne calcoli media e varianza. Soluzione Dall’espressione precedente si ottiene la seguente funzione di densità 3 2 −1< x < 1  x f(x) =  2 0 altrove  e quindi risulta 1

1

3 3 3 x4  E(X ) = x dx =   = 0 2 -1 2  4  -1

36


1

1

( ) ∫

3 3  x5  3 2 3 E X = x 4 dx =   = × = = V (X ) 2 -1 2  5  -1 2 5 5 2

Esercizio 3.17 Dato il seguente modello teorico che approssima la distribuzione di una variabile X 0 < x <1 2x f(x) =  altrove 0 se ne calcoli il terzo ed il quarto momento dall’origine. Soluzione 1

( )∫

1

 x5  2 E X = 2x dx = 2  = = 0,4  5 0 5 0 3

4

1

( ) ∫

1

 x6  2 E X = 2x dx = 2  = = 0,3  6 0 6 0 4

5

Esercizio 3.18 Dato il modello teorico dell’esercizio 3.17 si calcoli l’espressione del generico momento dall’origine di ordine r. Soluzione 1

( )∫

E X = 2x r

0

1

 x r +2  2 dx = 2  =  r +2 0 r +2

r +1

Esercizio 3.19 Dato il seguente modello teorico che approssima la distribuzione di una variabile X 3 2 −1< x < 1  x f(x) =  2 0 altrove  si determini l’espressione generica del momento dall’origine di ordine r e si calcoli il terzo e il quarto momento dall’origine. Soluzione Il generico momento di ordine r è dato da 1

( )∫

1

3 3  x r +3  E X = x r +2 dx =   2 2 r + 3   -1 -1 r

per cui si ha 3 1 1 E X3 =  −  = 0 2 6 6 

( )

37


( )

3 1 1 3 E X 4 =  +  = ≅ 0,4286 2 7 7  7

Esercizio 3.20 Dato il seguente modello teorico che approssima la funzione di ripartizione di una variabile continua X x≤5 0   x -5 F(x) =  5 < x < 10  5 1 x ≥ 10 se ne calcoli media e varianza. Soluzione Dall’espressione precedente si ottiene la seguente funzione di densità 1 5 < x < 10  f(x) =  5 0 altrove  e quindi risulta 10

10

1 1 x2  1  100 − 25  E (X ) = xdx =   =   = 7,5 55 5  2 5 5  2 

10

( ) ∫

10

1 2 1  x3  1  1000 −125  EX = x dx =   =   = 58,3 55 5  3 5 5  3  2

V (X ) = 2,083

38


4. DISTRIBUZIONI BIVARIATE (Gli esercizi contenuti in questa sezione si riferiscono ai capitoli 5-6 delle dispense)

Esercizio 4.1 Date le seguenti coppie di osservazioni (xi, yi) delle variabili X e Y rilevate su 10 individui, (1, 1) (1, 0) (0, 1) (0, 2) (0, 2) (1, 0) (1, 1) (0, 2) (0, 2) (1,0) costruire la distribuzione di frequenza corrispondente espressa mediante le frequenze relative. Calcolare inoltre le distribuzioni della variabile Y condizionata a X. Soluzione La tabella a doppia entrata assume la forma seguente Y 0 1 2 totale X 0 0,0 0,1 0,4 0,5 1 0,3 0,2 0,0 0,5 totale 0,3 0,3 0,4 1,0 Le distribuzioni di Y|x sono 0 Y X 0 0,0 1 0,6

1

2

totale

0,2 0,4

0,8 0,0

1,0 1,0

Esercizio 4.2 Date le seguenti coppie di osservazioni (xi, yi) di una variabile discreta X e di una variabile continua Y rilevate su 10 individui, (2; –0,4) (0; –2,8) (0; 0,3) (4; 2,6) (4; 1,9) (0; –1) (4; 4,8) (2, –1,6) (2; 1,0) (2; 3,6) costruire la distribuzione di frequenza corrispondente considerando le classi –3-|–1, –1-|1, 1-|5 per la variabile Y. Calcolare inoltre le distribuzioni della variabile X condizionata a Y. Soluzione La tabella a doppia entrata assume la forma seguente Y –3-|–1 –1-|1 1-|5 totale X 0 0,2 0,1 0,0 0,3 2 0,1 0,2 0,1 0,4 4 0,0 0,0 0,3 0,3 totale 0,3 0,3 0,4 1,0 Le distribuzioni di X|y sono Y –3-|–1 –1-|1 X 0 0,66 0,33 2 0,33 0,66 4 0,00 0,00 totale 1,00 1,00

1-|5 0,00 0,25 0,75 1,00 39


Esercizio 4.3 Completare la seguente tabella sotto ipotesi di indipendenza assoluta fra le due variabili Y a b c totale X 0 0,3 1 0,2 2 0,5 totale 0,2 0,5 0,3 1,0 Soluzione Y X 0 1 2 totale

a

b

c

totale

0,06 0,04 0,10 0,20

0,15 0,10 0,25 0,50

0,09 0,06 0,15 0,30

0,30 0,20 0,50 1,00

Esercizio 4.4 Date le seguenti coppie di osservazioni (xi, yi) delle variabili X e Y rilevate su 10 individui, (0, 1) (0, 2) (0, 1) (0, 2) (0, 2) (2, 1) (2, 1) (2, 2) (2, 1) (2, 1) costruire la distribuzione di frequenza espressa mediante le frequenze relative. Calcolare il valore dell’indice χ2/n e indicare il valore minimo e massimo che può assumere l’indice per la tabella. Soluzione La tabella a doppia entrata assume la forma seguente 1 2 totale Y X 0 0,2 0,3 0,5 2 0,4 0,1 0,5 totale 0,6 0,4 1,0 La formula più semplice per calcolare l’indice richiesto assume la forma fij2 χ2 = ∑∑ −1 n i j fi. f.j e nel caso esaminato si ottiene χ2 0,2 2 0,3 2 0,4 2 0,12 = + + + −1= 0,16 . n 0,5×0,6 0,5×0,4 0,5×0,6 0,5×0,4 I valori estremi dell’indice sono  χ2   2  = 0 , max  χ  = min( 2, 2) −1= 1 min  n      n  dato che il valore minimo è sempre pari a zero ed il massimo corrisponde al minore fra il numero di righe e di colonne della tabella diminutio di 1.

40


Esercizio 4.5 Data la seguente distribuzione doppia calcolare le frequenze interne sotto ipotesi di indipendenza assoluta fra le due variabili e determinare il valore del χ2/n. Y 0 1 totale X 0 0,2 0,2 0,4 2 0,1 0,3 0,4 4 0,0 0,2 0,2 totale 0,3 0,7 1,0 Soluzione La tabella sotto ipotesi di indipendenza assoluta fra le due variabili è Y 0 1 totale X 0 0,12 0,28 0,40 2 0,12 0,28 0,40 4 0,06 0,14 0,20 totale 0,30 0,70 1,00 χ2 0,2 2 0,2 2 0,12 0,3 2 0,2 2 = + + + + −1= 0,16 n 0,3×0,4 0,7×0,4 0,3×0,4 0,7×0,4 0,7×0,2

Esercizio 4.6 Data la seguente distribuzione doppia calcolare il valore del χ2/n ed indicare il suo valore minimo e massimo per la tabella in esame. Y 0 2 4 totale X 1 0,03 0,05 0,02 0,10 2 0,09 0,15 0,06 0,30 3 0,18 0,30 0,12 0,60 totale 0,30 0,50 0,20 1,00 Soluzione Dalla tabella si nota che le due variabili sono indipendenti in senso assoluto, dato che χ2 fij = fi. f.j , pertanto risulta =0 n  χ2   2  = 0 , max  χ  = min(3, 3) −1= 2 min  n      n 

Esercizio 4.7 Date le seguenti coppie di osservazioni (xi, yi) delle variabili X e Y rilevate su 6 individui, (0, 3) (1, 2) (2, 1) (2, 3) (3, 2) (4, 3) disegnare lo scatter e calcolare la covarianza fra le due variabili.

41


Soluzione 4 3 2 1 0 0

1

2

3

4

E(X) = 2 E(Y) = 2,3 E(XY) = 4,6 sxy= E(XY) − E(X)E(Y) = 0. Esercizio 4.8 Date le seguenti coppie di osservazioni (xi, yi) delle variabili X e Y rilevate su 8 individui, costruire la distribuzione doppia e calcolare il primo momento misto dall’origine (0, 1) (3, 2) (0, 1) (0, 1) (3, 1) (3, 2) (1, 1) (3, 1) Soluzione La distribuzione doppia assume la forma 1 2 totale Y X 0 0,375 0,000 0,375 1 0,125 0,000 0,125 3 0,250 0,250 0,500 totale 0,750 0,250 1,000 E(XY) = 2,375

Esercizio 4.9 Date due variabili X ed Y per le quali le varianze sono rispettivamente V(X)=10 e V(Y)=5 e la cui covarianza è Cov(X,Y)=4, calcolare la varianza delle variabili: a) S=X+Y, b) D=X-Y. Soluzione V(S) = V(X)+ V(Y)+2Cov(X,Y) = 10 + 5 + 2×4 = 23 V(D) = V(X)+ V(Y)−2Cov(X,Y) = 10 + 5 − 2×4 = 7 Esercizio 4.10 Date le seguenti coppie di osservazioni (xi, yi) delle variabili X e Y rilevate su 4 individui, (0, 5) (1, 3) (2, 1) (3, 1) calcolare il coefficiente di correlazione lineare fra le due variabili.

42


Soluzione E(X) = 1,5 E(X2) = 3,5 E(Y) = 2,5 E(Y2) = 9 E(XY) = 2 sxy= −1,75 −1,75 r= ≅ −0,9439 . 2,75 ∗1,25

V(X) = 1,25 V(Y) = 2,75

Esercizio 4.11 Date le seguenti coppie di osservazioni (xi, yi) delle variabili X e Y, calcolare la covarianza fra le due variabili (2, 1) (0, 2) (1, 1) (1, 2) (2, 1) (0, 3) (1, 2) (1, 2) (0, 3) (2, 1) Soluzione Sistemate le osservazioni in una tabella a doppia entrata Y 1 2 3 totale X 0 0,0 0,1 0,2 0,3 1 0,1 0,3 0,0 0,4 2 0,3 0,0 0,0 0,3 totale 0,4 0,4 0,2 1,0 si ottiene facilmente E(X) = 1 E(Y) = 1,8 E(XY) = 1,3 sxy = E(XY) – E(X)E(Y) = −0,5.

Esercizio 4.12 Sulla base dei dati dell’esercizio precedente, determinare l’equazione della retta di regressione della Y sulla X. Soluzione Il modello di regressione assume la forma Y* = a + bx in cui a = my – bmx s xy b= 2 . sx Sulla base dei risultati dell’esercizio precedente e della varianza della X E(X2) = 1,6 V(X) = 0,6 si ottiene quindi 0,5 b=− = −0,83 0,6 a = 1,8 + 0,83∗1= 2,63 Y* = 2,63 − 0,83x .

43


Esercizio 4.13 Data la seguente distribuzione doppia calcolare la covarianza fra le due variabili Y 8-|12 12-|18 18-|22 totale X 0,5-|1,5 0,00 0,15 0,15 0,30 1,5-|2,5 0,20 0,10 0,20 0,50 2,5-|3,5 0,10 0,10 0,00 0,20 totale 0,30 0,35 0,35 1,00 Soluzione Y 10 15 X 1 0,00 0,15 2 0,20 0,10 3 0,10 0,10 totale 0,30 0,35 E(X) = 1,9 E(Y) = 15,25 E(XY) = 27,75 sxy = E(XY) – E(X)E(Y) = −1,225.

20

totale

0,15 0,20 0,00 0,35

0,30 0,50 0,20 1,00

Esercizio 4.14 Data la seguente distribuzione doppia calcolare i parametri della retta di regressione della Y sulla X e stimare il valore teorico di Y per x=1 e x=3 Y 0 1 2 totale X 0 0,2 0,1 0,0 0,3 2 0,0 0,3 0,1 0,4 4 0,0 0,0 0,3 0,3 totale 0,2 0,4 0,4 1,0 Soluzione E(X) = 2,0 E(Y) = 1,2 E(XY) = 3,4

E(X2) = 6,4

V(X) = 2,4

sxy = E(XY) – E(X)E(Y) = 1.

I paramentri della retta di regressione sono quindi 1 b= = 0,416 2,4 a = 1,2 − 0,416× 2 = 0,36 Dato il modello di regressione Y* = 0,36 + 0,416x i valori stimati della variabile dipendente assumono i valori: Y* = 0,36 + 0,416×1= 0,783 per x=1 per x=3 Y* = 0,36 + 0,416×2 = 1,19 44


Esercizio 4.15 Date le seguenti coppie di osservazioni (xi, yi) delle variabili X e Y (−3, −4) (−1, −3) (1, 1) (1, 3) (2, 6) disegnare lo scatter e calcolare il primo momento misto dall’origine. Soluzione

-3

-2

6 5 4 3 2 1 0 -1 0 -2 -3 -4

-1

1

2

E(X) = 0 E(Y) = 0,6 E(XY) = 6,2

Esercizio 4.16 Sulla base dei dati dell’esercizio precedente calcolare l’equazione della retta di regressione della Y sulla X e stimare il valore teorico di Y per x=0. Soluzione sxy = E(XY) – E(X)E(Y) = 6,2 E(X2) = 3,2 V(X) = 3,2 I parametri della retta di regressione sono quindi pari a 6,2 b= = 1,9375 3,2 a = 0,6 −1,9375×0 = 0,6 Dato il modello di regressione lineare Y* = 0,6 +1,9375 x il valore stimato della Y è per x=0 y* = 0,6

Esercizio 4.17 Date le seguenti coppie di osservazioni (xi, yi) delle variabili X e Y (1, −5) (2, −3) (3, 0) (3, 1) (4, 2) calcolare il coefficiente di determinazione lineare.

45


Soluzione E(X) = 2,6 E(Y) = −1 E(XY) = 0 r

2

2 s xy ) ( = =

s 2x s 2y

E(X2) = 7,8 E(Y2) = 7,8 sxy = 2,6

V(X) = 1,04 V(Y) = 6,8

2,6 2 ≅ 0,9559 1,04× 6,8

Esercizio 4.18 Data la seguente distribuzione doppia calcolare la covarianza fra le due variabili Y 0-|3 3-|5 5-|10 totale X 0 0,15 0,12 0.03 0,30 2 0,25 0,20 0.05 0,50 4 0,10 0,08 0,02 0,20 totale 0,50 0,40 0,10 1,00 Soluzione Le variabili risultano indipendenti in senso assoluto, pertanto la loro covarianza è pari a zero.

Esercizio 4.19 Data la seguente distribuzione doppia calcolare il coefficiente di determinazione lineare fra le due variabili Y 0 1 2 totale X 40 0 0 40 −1,5-|−0,5 0 40 40 80 −0,5-| 0,5 0,5-| 1,5 0 20 60 80 totale 40 60 100 200 Soluzione Y X −1 0 1 totale E(X) = 0,2 E(Y) = 1,3 E(XY) = 0,7 r

2

2 ( s xy ) = =

s 2x s 2y

0 0,2 0,0 0,0 0,2

1 0,0 0,2 0,1 0,3 2 E(X ) = 0,6 E(Y2) = 2,3 sxy = 0,44

2

totale

0,0 0,2 0,3 0,5 V(X) = 0,56 V(Y) = 0,61

0,2 0,4 0,4 1,00

0,44 2 ≅ 0,5667 0,56×0,61

46


Tavola A Funzione di ripartizione della variabile casuale normale standardizzata u

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

0,0

0,500

0,504

0,508

0,512

0,516

0,520

0,524

0,528

0,532

0,536

0,1

0,540

0,544

0,548

0,552

0,556

0,560

0,564

0,567

0,571

0,575

0,2

0,579

0,583

0,587

0,591

0,595

0,599

0,603

0,606

0,610

0,614

0,3

0,618

0,622

0,626

0,629

0,633

0,637

0,641

0,644

0,648

0,652

0,4

0,655

0,659

0,663

0,666

0,670

0,674

0,677

0,681

0,684

0,688

0,5

0,691

0,695

0,698

0,702

0,705

0,709

0,712

0,716

0,719

0,722

0,6

0,726

0,729

0,732

0,736

0,739

0,742

0,745

0,749

0,752

0,755

0,7

0,758

0,761

0,764

0,767

0,770

0,773

0,776

0,779

0,782

0,785

0,8

0,788

0,791

0,794

0,797

0,800

0,802

0,805

0,808

0,811

0,813

0,9

0,816

0,819

0,821

0,824

0,826

0,829

0,831

0,834

0,836

0,839

1,0

0,841

0,844

0,846

0,848

0,851

0,853

0,855

0,858

0,860

0,862

1,1

0,864

0,867

0,869

0,871

0,873

0,875

0,877

0,879

0,881

0,883

1,2

0,885

0,887

0,889

0,891

0,893

0,894

0,896

0,898

0,900

0,901

1,3

0,903

0,905

0,907

0,908

0,910

0,911

0,913

0,915

0,916

0,918

1,4

0,919

0,921

0,922

0,924

0,925

0,926

0,928

0,929

0,931

0,932

1,5

0,933

0,934

0,936

0,937

0,938

0,939

0,941

0,942

0,943

0,944

1,6

0,945

0,946

0,947

0,948

0,949

0,951

0,952

0,953

0,954

0,954

1,7

0,955

0,956

0,957

0,958

0,959

0,960

0,961

0,962

0,962

0,963

1,8

0,964

0,965

0,966

0,966

0,967

0,968

0,969

0,969

0,970

0,971

1,9

0,971

0,972

0,973

0,973

0,974

0,974

0,975

0,976

0,976

0,977

2,0

0,977

0,978

0,978

0,979

0,979

0,980

0,980

0,981

0,981

0,982

2,1

0,982

0,983

0,983

0,983

0,984

0,984

0,985

0,985

0,985

0,986

2,2

0,986

0,986

0,987

0,987

0,987

0,988

0,988

0,988

0,989

0,989

2,3

0,989

0,990

0,990

0,990

0,990

0,991

0,991

0,991

0,991

0,992

2,4

0,992

0,992

0,992

0,992

0,993

0,993

0,993

0,993

0,993

0,994

2,5

0,994

0,994

0,994

0,994

0,994

0,995

0,995

0,995

0,995

0,995

2,6

0,995

0,995

0,996

0,996

0,996

0,996

0,996

0,996

0,996

0,996

2,7

0,997

0,997

0,997

0,997

0,997

0,997

0,997

0,997

0,997

0,997

2,8

0,997

0,998

0,998

0,998

0,998

0,998

0,998

0,998

0,998

0,998

2,9

0,998

0,998

0,998

0,998

0,998

0,998

0,998

0,999

0,999

0,999

3,0

0,999

0,999

0,999

0,999

0,999

0,999

0,999

0,999

0,999

0,999

47


Tavola B Quantili della variabile casuale normale standardizzata p

up

0,001

-3,090

0,005

-2,576

0,010

-2,326

0,025

-1,960

0,050

-1,645

0,100

-1,282

0,150

-1,036

0,200

-0,842

0,250

-0,674

0,300

-0,524

0,350

-0,385

0,400

-0,253

0,450

-0,126

0,500

0,000

0,550

0,126

0,600

0,253

0,650

0,385

0,700

0,524

0,750

0,674

0,800

0,842

0,850

1,036

0,900

1,282

0,950

1,645

0,975

1,960

0,990

2,326

0,995

2,576

0,999

3,090

48


Esercizi di statistica (prima parte)