19/11/2009
Cours de Statistique descriptive (les moyennes) Prof. M. EL MEROUANI
Prof. M. EL MEROUANI
1
Méthode graphique de détermination de la médiane : • On trace la courbe des fréquences (ou des effectifs) cumulées croissantes et on trace aussi la droite horizontale d’équation nicc=N/2 sur le même repère. • La projection du point d’intersection de la courbe et la droite sur l’axe des abscisses donne la position (la valeur) de la médiane.
Prof. M. EL MEROUANI
2
1
19/11/2009
Exemple : • Soit la distribution de l’exemple précédent : [ei-1, ei[
ni
nicc
[40, 50[
12
12
[50, 60[
14
26
[60, 70[
20
46
[70, 80[
30
76
[80, 90[
14
90
[90,100[
10
100
N=100 Prof. M. EL MEROUANI
3
• Traçons la courbe des nicc et la droite horizontale d’équation nicc=N/2 sur le même repère.
on voit que la médiane est presque égale à la valeur trouvée algébriquement 71,33 Prof. M. EL MEROUANI
4
2
19/11/2009
Les moyennes : • Généralement, il y a quatre types de moyennes : • arithmétique, • géométrique, • harmonique • et quadratique.
Prof. M. EL MEROUANI
5
Moyenne arithmétique ( )X : • La moyenne arithmétique d’une variable statistique est égale à la somme des valeurs de la variable pondérées par les fréquences relatives. k
x = • donc
∑
fi x
i
i= 1
k
ni 1 k x = ∑ xi = ∑ n i xi N i =1 i =1 N Prof. M. EL MEROUANI
6
3
19/11/2009
• d’où
1 x = N
k
∑
n ix i
i=1
Exemple : Soient les notes d’un groupe de 30 étudiants:
Prof. M. EL MEROUANI
7
xi
ni
ni xi
fi
fi x i
7 8 9 13 14 15
4 5 6 7 6 2
28 40 54 91 84 30
0,133 0,167 0,2 0,233 0,2 0,067
0,931 1,336 1,8 3,029 2,8 1,005
N=30
327
∑f
10,901
Total
i
=1
i
Prof. M. EL MEROUANI
8
4
19/11/2009
• La note moyenne de ce groupe est :
1 x = N
k
∑
n ix i =
i=1
1 ⋅ 327 = 10,9 sur 20 30
k
x =
∑
fi x
i
=10,901 ≈ 10,9
i= 1
Prof. M. EL MEROUANI
9
Variable statistique continue : • Pour le calcul de la moyenne arithmétique dans le cas de la variable statistique continue, il faut procéder par la formule suivante :
1 x = N
k
∑
n ic i
i=1 des classes. • où ci représente les centre
Prof. M. EL MEROUANI
10
5
19/11/2009
Exemple : • L’âge des salariés d’une entreprise est distribué comme suit : [ei-1, ei[
ni
ci
ni ci
[10, 20[
2
15
30
[20, 30[
15
25
375
[30,40[
33
35
1155
[40, 50[
13
45
585
plus de 50
7
55 ?
385
Total
N=70 Prof. M. EL MEROUANI
2530
11
• Lorsque la borne n’est pas définie, il faut la définir soit par le "bon sens" soit par extrapolation des données. Ici, on peut dire que : • L’âge de la retraite est de 60 ans, donc la classe "plus de 50 ans" est : [50, 60[, • On a des classes d’amplitude 10, donc la dernière sera de [50, 60[. • Ainsi • 36,14 est l’âge moyen des 70 salariés de l’entreprise. 1 k 1 x = n ici = ⋅ 2530 ≅ 36,14 ∑ 70 N i = 1 • Prof. M. EL MEROUANI
12
6
19/11/2009
Calcul de par changement d’origine : • Lorsque les valeurs xi et ni sont trop grandes et que le calcul devient volumineux, il est préférable de procéder à un changement d’origine par la transformation suivante : • Si ci0 est une origine quelconque, soit le changement x’i=xi- ci0,
Prof. M. EL MEROUANI
13
alors la moyenne sera
x' = x − ci0 d’où la moyenne arithmétique recherchée sera
x = x' + ci0 Prof. M. EL MEROUANI
14
7
19/11/2009
Exemple : • Soit la série statistique suivante : [ei-1, ei[
ni
ci
ci – c3=c’i
ni c’i
[400, 500[
8
450
-200
-1600
[500, 600[
10
550
-100
-1000
[600,700[
12
650
0
0
[700, 800[
50
750
100
5000
[800, 900[
20
850
200
4000
N=100
6400 Prof. M. EL MEROUANI
15
cio = c3 = 650 ; le choix de cette valeur s’est fait par le choix de la valeur centrale des observations.
x' = x − c3 or donc
x' =
x = x' + c3
1 × 6400 = 64 100
x = 64 + 650 = 714 Prof. M. EL MEROUANI
16
8
19/11/2009
Propriétés de la moyenne arithmétique : 1. La somme des écarts à la moyenne arithmétique est nulle : k
∑
n i (x i − x ) = 0
i =1
2. La somme des carrées des écarts à minimale, c'est-à-dire : k
∑
n i (x i − x )
2
est x
est minimale.
i =1 Prof. M. EL MEROUANI
17
1. En effet : k
k
k
∑ n (x − x ) = ∑ n x − x ∑ n i
i =1
i
i i
i =1
2. En effet : Soit la fonction
=N x−xN =0
i
i =1
k
g ( x) = ∑ ni (xi − x )
2
i =1
on va démontrer que la dérivée g’ s’annule en et de dérivée x seconde g’’ positive (concavité vers le haut). Prof. M. EL MEROUANI
18
9
19/11/2009
y
x
x
Prof. M. EL MEROUANI
• On a:
k
19
(
g ( x) = ∑ ni xi2 − 2 xi x + x 2
)
i =1 k
k
= ∑ n x − 2 x ∑ ni xi + x 2 i i
i =1
i =1
k
2
∑n
i
i =1
k
k
k
i=1
i=1
i=1
k
g' (x) = −2∑ni xi + 2x∑ni = 0 ⇔ x ∑ni = ∑ni xi ⇔x= Prof. M. EL MEROUANI
1 N
i=1 k
∑n x
i i
=x
i =1 20
10
19/11/2009
• Donc g admet un extremum (optimum) en
x
• De plus la dérivée seconde de g est positive: k
g ′′( x) = 2∑ ni = 2 N > 0 i =1
• D’où g admet un minimum en le haut).
x(concavité vers
Prof. M. EL MEROUANI
21
Moyenne géométrique G : • Elle est égale à la racine Nième du produit des k valeurs d’une série statistique.
Prof. M. EL MEROUANI
22
11
19/11/2009
Cas d’une série simple : • Tous ses N valeurs sont d’effectifs égaux à 1, alors : N
G=N
∏x
i
i =1
G = N x1 ⋅ x2 ⋅ L ⋅ x N Prof. M. EL MEROUANI
23
N 1 log G = log ∏ xi N i =1 Donc
1 log G = N
N
∑ log x
i
i =1
où on a supposé que
xi > 0 ; ∀ i = 1,L , N Prof. M. EL MEROUANI
24
12
19/11/2009
Cas d’une série pondérée : • Ses valeurs x1,……, xk ont des effectifs différents n1,……., nk respectivement. k
G=N
ni x ∏ i i =1
G = N x1n1 ⋅ x2n2 ⋅ L ⋅ xknk
• Avec
N = n1 + n2 + L + nk Prof. M. EL MEROUANI
25
On a
G=
N
n1 1
n2 2
x .x .......... x
= ∏ x in i i=1 k
nk k
k
Alors:
G =
∏
x
1 N
k
=∏x
ni N
i=1
fi i
i=1
K fi log G = log ∏ x i i=1
k k fi = ∑ logx i = ∑ fi logx i i=1 i=1
ici, aussi, on a supposé que xi > 0 ∀ i=1, ………, k Prof. M. EL MEROUANI
26
13
19/11/2009
Remarque : • La moyenne géométrique est utilisée pour le calcul des taux d’accroissements moyens, des moyennes de coefficients multiplicateurs…c'est-à-dire, dans les cas où la variable représente des variations cumulatives.
Prof. M. EL MEROUANI
27
Exemple 1 : • Calculer la moyenne géométrique de la distribution de fréquence suivante : xi 1 2 3
ni 2 5 3 N = 10
Prof. M. EL MEROUANI
28
14