En primer lugar se calculará la media aritmética de cada variable marginal: X = 74,5 y Y = 1,71 h
k
En segundo lugar, hay que calcular el primer sumando deSXY, ∑∑
xi y j ·ni j
. Por n ello, es necesario calcular primero los productos, sumarlos todos y luego dividir el resultado por el número total de datos: i=1 j=1
Por tanto tendremos:
60 * 1,6 * 2 =
192
60 * 1,7 * 1 =
102
70 * 1,6 * 2 =
224
70 * 1,7 * 4 =
476
70 * 1,8 * 2 =
252
80 * 1,6 * 1 =
128
80 * 1,7 * 1 =
136
80 * 1,8 * 4 =
576
90 * 1,7 * 2 =
306
90 * 1,8 * 1 =
162
TOTAL SUMA =
2554
h
k
∑∑ x ·y ·n = 2554 i
i=1 j=1 h
k
∑∑
j
ij
xi y j ·ni j n
i=1 j=1
h
k
Sxy = ∑∑ i=1 j=1
=
2554 20
xi y j ·ni j n
– X·Y=
2554 = – 74,5 · 1,71 = 20 = 127,7 – 127,395 = 0,305
Correlación lineal La covarianza permite discernir si dos variables X y Y tienen una relación positiva, negativa o cero, pero no aporta información del grado de dependencia de una variable respecto a la otra (referencias bibliográficas 6, 10 y 17). Además, la covarianza depende de las unidades de medida empleadas para X y Y –si, por ejemplo, X se mide en m3 y Y en mm3, cada desviación de X aumenta Sxy 109 veces–. Para hacer frente a estas dos dificultades se define el concepto ya introducido anteriormente de correlación lineal rxy: rxy =
S XY S X · SY
siendo Sx y Sy las desviaciones típicas de X y Y.
Es evidente que, por definición, el coeficiente de correlación lineal informa de las mismas cosas que lo hace la covarianza. Además, cumple una propiedad muy importante, está acotado por 1 y por –1. Así pues rxy , se caracteriza por: • • • •
Ser adimensional y siempre estar comprendido entre –1 y 1. Si hay relación lineal fuerte positiva, rxy > 0 y está cerca de 1. Si hay relación lineal negativa fuerte, rxy < 0 y está cerca de –1. Si no hay relación lineal rxy será 0.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1
82
Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100