08txtI.qxp_Layout 1 31/01/17 18:58 Pagina 173
173
La correlazione tra variabili
Y
9 8 7 6 5 4 3 2 1 1
2
3
4
5
6
7
8
9
X
Il diagramma di dispersione riflette in maniera evidente il valore del coefficiente di correlazione. Essendo esso molto vicino a 1, i punti si dispongono, con trascurabili oscillazioni, intorno a un’immaginaria retta, inclinata verso l’alto da sinistra a destra.
Abbiamo visto come si procede al calcolo del coefficiente rs di Spearman quando sono presenti ranghi uguali (attribuzione del rango medio). Tuttavia, quando sono presenti molti ranghi uguali in una o in entrambe le variabili, la differenza tra ranghi di X e di Y risulterebbe molto ridotta. Ciò causerebbe una stima per eccesso di r, che pertanto dovrebbe essere corretto attraverso una formula di correzione molto complessa (Ercolani, Areni e Leone, 2001). Per tale motivo, generalmente si preferisce ricorrere a un altro coefficiente di correlazione tra ranghi, che è il coefficiente tau di Kendall. La sua formula è la seguente. tau =
S 1 ⋅ N ⋅ ( N − 1) 2
(8.5)
dove: S = somma dei valori attribuiti ai confronti di tutte le possibili coppie della graduatoria N = numero delle osservazioni o casi Gli step per procedere al suo calcolo sono i seguenti. 1. Si trasformano in graduatorie i punteggi delle due variabili X e Y. 2. Si pone una delle due graduatorie, per esempio quella della variabile X, nell’ordine naturale crescente (1, 2, 3, ….). 3. Si ordinano i corrispondenti valori dell’altra graduatoria (Y) in base a questa graduatoria. 4. Si procede al calcolo di S confrontando ciascun valore di Y con tutti quelli che lo seguono in graduatoria. 5. Ogni volta che la coppia di valori a confronto si trova nell’ordine naturale corretto (per es., 1 2) si attribuisce +1, in caso di ordine naturale non corretto (per es., 4 2) si attribuisce -1. In caso di ranghi uguali (all’interno della stessa graduatoria o nella graduatoria dell’altra variabile) si attribuisce 0. 6. La somma di tutti questi valori (S) viene messa in rapporto con il valore massimo possibile che da un confronto del genere si potrebbe ottenere (cioè il valore che si otterrebbe se fosse sempre rispettato l’ordine naturale, ossia se anche la graduatoria di Y rispettasse l’ordine naturale), che è 1/[2N(N - 1)], mediante l’applicazione della Formula (8.5).