Page 1

Casos y problemas

resueltos Correlación Fi Correlación de Spearman Correlación de Pearson

Estadística Estadística Aplicada a las Ciencias Sociales Aplicada a las Ciencias Sociales I: Estadística Descriptiva

-3-

Patricio Alcaíno Martínez Reservados PatricioDerechos Alcaíno Martínez


Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadística Descriptiva: Cálculos y análisis de correlación Patricio Alcaíno Martínez – Derechos Reservados

2

Palabras iniciales

Estimados usuari@s: 

Este material que pongo a su disposición está creado a partir de casos e investigaciones reales de distintos ámbitos de las Ciencias Sociales. Los datos han sido cambiados para ajustarlos a situaciones didácticas más claras para los estudiantes. Por ello, la información y conclusiones no son necesariamente válidas en otros contextos.

Este volumen está dirigido a tratar el tema del cálculo e interpretación de los coeficientes de correlación más frecuentes de encontrar en Ciencias Sociales. A saber: Coeficiente de correlación  , apropiado para análisis de correlación de variables dicotómicas, el coeficiente de correlación de rangos de Spearman, para casos de variables ordinales y el coeficiente de correlación lineal de Pearson para variables numéricas.

. El lector deberá manejar los conceptos y procedimientos elementales de Estadística y exhibir competencia en el uso de la calculadora científica de dos variables para calcular el coeficiente de correlación.

El uso de este material con fines comerciales no está permitido.

Atentamente;

Patricio Alcaíno Martínez


Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadística Descriptiva: Cálculos y análisis de correlación Patricio Alcaíno Martínez – Derechos Reservados

3

Caso 1: Embarazo adolescente Debido a la alta prevalencia de madres adolescentes en una región del norte de Argentina, las autoridades ordenan una investigación, que estudió las siguientes variables en una muestra de niñas de 13 a 20 años, utilizando la escala que se especifica en cada una: W = Embarazo adolescente: 1 = Sí; 0 = No. X = Grupo de edad: 2 = Menos de 18 años; 1 = Más de 18 años. Y = Educación básica completa: 1 = Sí; 0 = No. Z = Situación socioeconómica: 2 = suficiente; 1 = pobreza; 0 = extrema pobreza. La investigación llegó a establecer las siguientes correlaciones:

r(W, X )  O,756;

r(W, Y )  -O,673;

r(W, Z )  -O,597;

r( X, Y )  0,107

Sobre la base de estos resultados: 1.1. ¿Cuál es el coeficiente de correlación más adecuado para calcular r(Y, Z)? 1.2. ¿Qué relación es posible afirmar entre el embarazo adolescente y el hecho de haber completado o no la educación básica? 1.3. ¿Qué conclusión puede construirse a partir de la correlación entre X e Y? 1.4. ¿Qué conclusión se puede construir a partir de la correlación entre W y X? 1.5. ¿Cuál sería el perfil de las adolescentes en riesgo de embarazo adolescente?

Solución: 1.1. ¿Cuál es el coeficiente de correlación más adecuado para calcular r(Y, Z)? La variable Y está medida a escala dicotómica, mientras que Z es ordinal. Por lo tanto el coeficiente más adecuado es el de Spearman. 1.2. ¿Qué relación es posible afirmar entre el embarazo adolescente y el hecho de haber completado o no la educación básica? Observando la correlación entre W e Y, es posible afirmar la existencia de una asociación de mediana a alta, de tipo negativa, entre el embarazo adolescente y la educación, de modo que el embarazo está asociado en forma muy clara a las niñas que no han completado la educación básica. 1.3. ¿Qué conclusión puede construirse a partir de la correlación entre X e Y? La correlación entre X e Y es muy baja, tal que puede ser despreciable. De este modo, el hecho de completar o no la educación básica es independiente de la edad de la persona. 1.4. ¿Qué conclusión se puede construir a partir de la correlación entre W y X?

r(W, X )  O,756 es una correlación alta, estrecha y positiva. De acuerdo a la escala utilizada, el embarazo adolescente está muy asociado a niñas menores de 18 años. 1.5. ¿Cuál sería el perfil de las adolescentes en riesgo de embarazo adolescente? Sobre la base de las correlaciones calculadas, las niñas que podrían ser protagonistas de embarazo adolescente, se caracterizan por tener menos de 18 años, educación básica incompleta y situación económica de pobreza o extrema pobreza.


Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadística Descriptiva: Cálculos y análisis de correlación Patricio Alcaíno Martínez – Derechos Reservados

4

Caso 2: IVE y nacionalidad en España La IVE (interrupción voluntaria del embarazo) es la intervención quirúrgica ginecológica más practicada en España desde 1991. Una investigación con 48 mujeres españolas y 30 de nacionalidad extranjera que se realizaron una IVE, consultó a estas si se habían realizado una IVE anterior. De las españolas, 18 lo habían hecho, mientras que de las extranjeras, 21. 2.1. Realice un análisis de correlación para determinar la asociación entre nacionalidad e IVE anterior, construyendo las conclusiones del caso.

Solución: Primero se ordenan los datos en una tabla de contingencia de 2x2, ya que ambas variables están dadas a nivel dicotómico. IVE anterior

Nacionalidad

Total

Española

Extranjera

18

21

39

No

30

9

39

Total

48

30

78

En segundo lugar, se calcula el coeficiente de correlación fi:



18 · 9  21· 30 39·39·48·30

= -0,316

Se trata de una correlación baja, del tipo negativo, que asocia la IVE anterior con las extranjeras. La asociación es baja pero podría llegar a ser significativa, ya que está mostrando una tendencia. Conclusión: La realización de una IVE por parte de una mujer, habiéndose realizado una anterior, está asociada en forma baja, pero definida, a la nacionalidad extranjera.


Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadística Descriptiva: Cálculos y análisis de correlación Patricio Alcaíno Martínez – Derechos Reservados

5

Caso 3: Empleo y salud mental Se hizo un estudio respecto de su salud mental con personas que recientemente habían perdido su empleo, usando como variables de control el sexo y el estado civil. Las correlaciones encontradas son las siguientes: Sexo y estado de salud mental:  = –0,671 Estado civil y estado de salud mental:  = –0,742 Siendo: Estado civil: 1 = casado; 0 = soltero. Sexo: 1 = masculino; 0 = femenino. Estado de salud mental: 1 = bueno; 0 = malo. 3.1. Realice un análisis de la situación y construya conclusiones con cada una de las correlaciones dadas.

Solución: Sexo y estado de salud mental: correlación de mediana a alta, indicando una estrecha asociación lineal entre sexo y estado de salud mental, de modo que los malos estados de salud mental aparecen asociados al sexo masculino. En conclusión, el perder el empleo afecta la salud mental preferentemente a los hombres. Estado civil y estado de salud mental: correlación alta y negativa, indicando una estrecha asociación lineal entre estado civil y estado de salud mental, de modo que los malos estados de salud mental aparecen asociados a los casados. En conclusión, el perder el empleo afecta la salud mental más a los casados que a los solteros.


Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadística Descriptiva: Cálculos y análisis de correlación Patricio Alcaíno Martínez – Derechos Reservados

6

Caso 4: peso corporal y estado general de salud El gráfico de la figura presenta, en N° de casos, la evaluación del estado general de salud de una muestra de sujetos estudiados, según si presentan peso normal o sobrepeso. Nº de casos

18 15 12 09 06 03 00

Peso normal Sobrepeso

ESTADO Bueno

Malo

Estado general de salud, según peso

4.1. Indique el % en lo que se afirma acerca de la muestra: 4.1.1. De las personas con Sobrepeso, 5 de cada . . . . . presentan Mal estado general de salud. 4.1.2. De los que tienen un Buen estado general de salud, el . . . . . . % tiene un peso Normal. 4.1.3. De las personas de peso Normal, solo el . . . . . .% presenta Mal estado general de salud. 4.2. Analice la correlación entre estado general de salud y peso. Construya una conclusión.

Solución: 4.1. Indique el % en lo que se afirma acerca de la muestra: 4.1.1. Las personas con sobrepeso son: 12 + 15 = 27. De estas, 15 presentan Mal estado general de salud. De 27 personas con sobrepeso

 15 presentan Mal estado general de salud.

De x personas con sobrepeso

 5 presentan Mal estado general de salud.

Calculando x = 9. De las personas con Sobrepeso, 5 de cada 9 presentan Mal estado general de salud.

4.1.2. Tienen un Buen estado general de salud = 30 Tiene un Buen estado general de salud y peso Normal = 18 Llevando a %:

P

18 ·100 = 60,0%. 30


Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadística Descriptiva: Cálculos y análisis de correlación Patricio Alcaíno Martínez – Derechos Reservados

7

De los que tienen un Buen estado general de salud, el 60,0% tiene un peso Normal. 4.1.3. Tienen un peso Normal = 18 + 6 = 24 Presentan Mal estado general de salud = 6. Llevando a %:

P

6 ·100 = 25,0%. 24

De las personas de peso Normal, sólo un 25% presenta Mal estado general de salud.

4.2. Analice la correlación entre estado general de salud y peso. Construya una conclusión. Reorganizando los datos en una tabla de 2x2 según análisis solicitado: Estado General de Salud Bueno Malo 18 6 12 15 30 21

PESO Normal Sobrepeso TOTAL

TOTAL 24 27 51

Cálculo del estadígrafo  :



18  15  12  6 24  27  30  21

= 0,310

Análisis: La correlación entre peso y estado general de salud es positiva, baja, pero perceptible. Conclusión: El mal estado general de salud está asociado en forma baja, pero definida, al sobrepeso.


Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadística Descriptiva: Cálculos y análisis de correlación Patricio Alcaíno Martínez – Derechos Reservados

8

Caso 5: Tabaquismo y problemas vasculares La siguiente tabla recoge datos médicos relacionados con Tabaquismo y Problemas vasculares en una muestra aleatoria de personas que participarán en una investigación de un medicamento. Problemas vasculares

Sexo Hombres

tabaquismo

Con problemas

tabaquismo

Fuman

22

103

125

17

151

168

39

254

293

23

81

104

Fuman No fuman

total

Total

No fuman total Mujeres

Sin problemas

9

127

136

32

208

240

5.1. Sobre la base de los datos dados, calcule, en esta muestra: 5.1.1. De los hombres, ¿qué % fuma? 5.1.2. De los que presentan problemas vasculares, ¿qué % NO fuma? 5.1.3. De las mujeres, ¿qué % presenta problemas vasculares? 5.1.4. De los hombres que presentan problemas vasculares, ¿qué % fuma? 5.1.5. De la muestra, ¿qué % son hombres que fuman y presenta problemas vasculares? 5.2. Realice un análisis de correlación entre tabaquismo y sexo y construya las conclusiones correspondientes. 5.3. Realice un análisis de correlación entre tabaquismo y problemas vasculares y construya las conclusiones correspondientes. 5.4. Realice un análisis de correlación entre sexo y problemas vasculares y construya las conclusiones correspondientes.

Solución: 5.1. Sobre la base de los datos dados, calcule, en esta muestra: 5.1.1. De los hombres, ¿qué % fuma? Total de hombres = 293 Total hombres que fuman = 125 Llevando a %:

P

125 ·100  42,7% 293

El 42,7% de los hombres, fuma.

5.1.2. De los que presentan problemas vasculares, ¿qué % NO fuma? Presentan problemas vasculares = 71 Presentan problemas vasculares y no fuman = 17 Llevando a %:

17 ·100  23,9% 71 De los que presentan problemas vasculares, el 23,9% no fuma. P


Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadística Descriptiva: Cálculos y análisis de correlación Patricio Alcaíno Martínez – Derechos Reservados

9

5.1.3. De las mujeres, ¿qué % presenta problemas vasculares? Número de mujeres = 240 Mujeres con problemas vasculares = 32 Llevando a %:

P

32 ·100  13,3% 240

De las mujeres, el 13,3% presenta problemas vasculares.

5.1.4. De los hombres que presentan problemas vasculares, ¿qué % fuma? Hombres con problemas vasculares = 39 Hombres con problemas vasculares y fuman = 22 Llevando a %:

22 ·100  56,4% 39 El 56,4% de los hombres que presentan problemas vasculares, fuma. P

5.1.5. De la muestra, ¿qué % son hombres que fuman y presenta problemas vasculares? Total muestra = 533 Hombres que fuman y presentan problemas vasculares = 17 Llevando a %:

P

17 ·100  3,2% 533

El 3,2% la muestra son hombres que fuman y presentan problemas vasculares.

5.2. Realice un análisis de correlación entre tabaquismo y sexo y construya las conclusiones correspondientes. Reorganizando los datos en una tabla, se tiene:

TABAQUISMO Fuman NO fuman TOTAL

SEXO Hombres 125 168 293

Mujeres 104 136 240

TOTAL 229 304 533

Cálculo del estadígrafo  :



125  136  104  168 229  304  168  136

= -0,0067

Análisis: Correlación prácticamente nula entre sexo y tabaquismo. Conclusión: En la muestra estudiada, el tabaquismo no está asociado al sexo. Hombre y mujeres fuman por igual.


Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadística Descriptiva: Cálculos y análisis de correlación Patricio Alcaíno Martínez – Derechos Reservados

10

5.3. Realice un análisis de correlación entre tabaquismo y problemas vasculares y construya las conclusiones correspondientes. Reorganización de datos en una tabla de 2x2 según análisis solicitado.

TABAQUISMO Fuman NO fuman TOTAL

PROBLEMAS VASCULARES Con problemas Sin problemas 45 184 26 278 71 462

TOTAL 229 304 533

Cálculo del estadígrafo  :



45  278  184  26 229  304  71  462

= 0,162

Análisis: Correlación positiva, pero baja, despreciable. No se puede afirma la existencia de asociación entre la presencia de problemas vasculares y el hecho de fumar. Conclusión: No se puede afirma la existencia de asociación entre la presencia de problemas vasculares y el hecho de fumar.

5.4. Realice un análisis de correlación entre sexo y problemas vasculares y construya las conclusiones correspondientes. Reordenamiento de datos en una tabla de 2x2 según análisis solicitado.

SEXO Hombres Mujeres TOTAL

PROBLEMAS VASCULARES Con problemas Sin problemas 39 254 32 208 71 462

TOTAL 293 240 533

Cálculo del estadígrafo  :



39  208  254  32 293  240  71  462

= -0,00033

Análisis: La correlación entre sexo y problemas vasculares es prácticamente nula. Conclusión: No existe asociación entre problemas vasculares y sexo, de modo que hombres y mujeres se ven igualmente afectados.


Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadística Descriptiva: Cálculos y análisis de correlación Patricio Alcaíno Martínez – Derechos Reservados

11

Caso 6: Diagnóstico de salud Se realiza una investigación con una muestra aleatoria de pacientes con problemas cardiovasculares de un hospital público, para lo cual se han recogido datos de las siguientes variables en las escalas que se indica en paréntesis: X1 = Sexo (1 = femenino; 2 = masculino). X 2 = Edad (años cumplidos). X 3 = Nivel de ejercicio semanal (0 = Ninguno; 1 = Moderado y 2 = Intenso). X 4 = Fuma cigarrillos (1 = Sí; 0 = No). X 5 = Consumo de grasas saturadas (en g/semana).

Indique qué coeficiente de correlación recomendaría para el análisis de correlación entre las variables que se indican. Fundamente cada propuesta. 6.1. X1 con X 3

6.2. X1 con X 4

6.4. X 3 con X 5

6.5. X1 con X 2

6.3. X 2 con X 5

Solución: 6.1. X1 está medida a escala binomial y X 3 a escala ordinal. Es recomendable calcular el coeficiente de correlación de rangos, más conocido como coeficiente de Spearman. En este caso la variable dicotómica es tratada como ordinal. 6.2. Tanto X1 como X 4 están medidas a escala binomial. Es recomendable el coeficiente  , ideal para la correlación de variables categóricas dicotómicas. 6.3. Las variables X 2 y X 5 son numéricas. Es posible calcular el coeficiente de correlación de Pearson. 6.4. La variable X 3 es ordinal, mientras de X 5 es numérica. En este caso es aplicable el coeficiente de correlación de Spearman. La variable numérica debería reducirse a ordinal, convirtiendo sus valores a rangos.


Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadística Descriptiva: Cálculos y análisis de correlación Patricio Alcaíno Martínez – Derechos Reservados

12

Caso 7: Tiempo frente al TV y competencia lectora Se mide en una muestra aleatoria de estudiantes de educación básica el tiempo semanal (horas) que pasan frente al televisor y los puntos obtenidos en una prueba de competencia lectora con escala de 0 a 20 puntos (0 = mínima competencia; 20 = máxima competencia). El propósito del estudio es determinar la posible asociación entre las variables. Nº 1 2 3 4 5 6 7 8

X = Tiempo de TV (hrs) 9 16 20 7 10 25 5 18

Y = Competencia lectora (pts) 15 11 8 18 14 7 12 10

7.1. Seleccione el coeficiente de correlación más apropiado para realizar un análisis de correlación en el marco del caso. Fundamente su propuesta. 7.2. Calcule el coeficiente de correlación de acuerdo al punto anterior. 7.3. Sobre la base de los resultados numéricos, analice y construya la conclusión.

Solución: 7.1. Seleccione el coeficiente de correlación más apropiado para realizar un análisis de correlación en el marco del caso. Fundamente su propuesta. Considerando que la variable Tiempo es numérica y que el Puntaje en la prueba es ordinal (mientras no se trate de un test estandarizado), es conveniente utilizar el coeficiente de correlación de Spearman. 7.2. Calcule el coeficiente de correlación de acuerdo al punto anterior. Para los efectos de cálculo, se convertirán ambas variables a rangos, asignado el rango 1 al valor más bajo, y así en forma creciente. X = Tiempo de TV (hrs) 9 16 20 7 10 25 5 18

Y = Competencia lectora (pts) 15 11 8 18 14 7 12 10

Rg(X)

Rg(Y)

3 5 7 2 4 8 1 6

7 4 2 8 6 1 5 3


Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadística Descriptiva: Cálculos y análisis de correlación Patricio Alcaíno Martínez – Derechos Reservados

13

Ya calculados los rangos de cada variable, se puede proceder de dos maneras: una es calcular directamente con la calculadora el coeficiente de correlación de Pearson de estos rangos, y dos, completar la tabla con las diferencias de los rangos y sus cuadrados. En el primer caso el coeficiente da rS = -0,857142857

Para el segundo caso, se completa la tabla: Rg(X)

Rg(Y)

d  Rg(X) - Rg(Y)

d2

3 5 7 2 4 8 1 6

7 4 2 8 6 1 5 3

-4 1 5 -6 -2 7 -4 3 Suma =

16 1 25 36 4 49 16 9 156

Como no hay empates en los valores de la variable, para el cálculo de rS se puede emplear la fórmula simplificada: rS  1 

6 ·156 2

8 (8  1)

= 1

936 = -0,857142857 504

7.3. Sobre la base de los resultados numéricos, analice y construya la conclusión.

rS = -0,857142857 se trata de una correlación alta y negativa. En conclusión, la competencia lectora está alta e inversamente asociada al tiempo que los estudiantes pasan mirando televisión, de modo a que a mayor tiempo de TV, menor es su competencia lectora.


Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadística Descriptiva: Cálculos y análisis de correlación Patricio Alcaíno Martínez – Derechos Reservados

14

Caso 8: aborto y edad Se estudia la asociación entre la edad al momento del embarazo y el mes de embarazo de aborto provocado, en una muestra de 12 mujeres. Caso

1

2

3

4

5

6

7

8

9

10

11

12

E (años)

15

14

16

16

18

20

21

22

23

25

28

29

M (meses)

2

3

2

3

1

2

2

3

3

4

4

3

E = edad de la mujer al momento del embarazo M = meses de embarazo al momento del aborto Se desea establecer la correlación entre las variables y construir una conclusión. 8.1. Fundamente el tipo de coeficiente a utilizar. 8.2. Calcule el coeficiente indicado para los propósitos deseados. 8.3. Realice un análisis de los resultados y concluya.

Solución: 8.1. Fundamente el tipo de coeficiente a utilizar. Ambas variables son numéricas, por lo tanto es utilizable el coeficiente de correlación de Pearson. 8.2. Calcule el coeficiente indicado para los propósitos deseados. Ingresando los valores a la calculadora, el resultado directo es: r = 0,557945788 8.3. Realice un análisis de los resultados y concluya. Esta es una correlación positiva, mediana, que indica que a mayor edad de la mujer, más meses de embarazo al momento del aborto provocado. Conclusión: las mujeres de mayor edad tienden a provocarse abortos con más meses de embarazo, las más jóvenes, con menos tiempo de embarazo.


Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadística Descriptiva: Cálculos y análisis de correlación Patricio Alcaíno Martínez – Derechos Reservados

15

Caso 9: análisis de datos socioeconómicos El Almanaque Mundial, en edición 1994, entrega datos socioeconómicos de los países del mundo. Los siguientes datos corresponden a una muestra aleatoria de países de América: X1 = País. X2 = Esperanza de vida, años. X3 = Ingreso Per Cápita, en dólares. X4 = Analfabetismo, en %. X5 = Población Urbana, en %. X1 Canadá Guatemala Cuba Honduras Brasil Chile Perú Uruguay Bahamas Haití Trinidad y T. Panamá México

X2 77,0 65,3 75,7 65,8 66,0 72,0 64,6 72,4 69,5 54,1 71,0 72,8 70,3

X3 20.470 900 2.000 590 2.680 1.940 1.160 2.560 11.420 370 3.610 1.830 2.490

X4 4,4 44,9 6,0 26,9 19,0 6,6 9,9 3,8 10,0 47,0 3,9 11,9 12,7

X5 77,0 39,0 73,0 86,0 75,0 86,0 72,0 86,0 59,0 28,0 69,0 53,0 73,0

Realice un análisis de correlación entre las variables que se identifican y construya las conclusiones del caso: 9.1. X2 con X4 9.2. Población urbana y esperanza de vida. 9.3. Ingreso per cápita y Población urbana.

Solución: 9.1. Se calcula el coeficiente de correlación de Pearson. Ingresando los valores a la calculadora, resulta: r(X2, X4)=-0,81460685. Correlación alta y negativa. A mayor analfabetismo, menor esperanza de vida. Entonces: La población de países americanos con mayor analfabetismo tiene menor esperanza de vida. La población de países americanos con menor analfabetismo tiene mayor esperanza de vida.


Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadística Descriptiva: Cálculos y análisis de correlación Patricio Alcaíno Martínez – Derechos Reservados

16

9.2. Se calcula el coeficiente de correlación de Pearson. Ingresando los valores a la calculadora, resulta: r(X2, X5)= 0,60135272 Correlación moderada y directa. A mayor población urbana, mayor esperanza de vida. Entonces: En los países americanos, a mayor % de población urbana, mayor es la esperanza de vida de la población. En los países americanos, a menor % de población urbana, menor es la esperanza de vida de la población.

9.3. Se calcula el coeficiente de correlación de Pearson. Ingresando los valores a la calculadora, resulta: r(X3, X5)= 0,15114664 Correlación baja, casi nula, despreciable. Entonces: El ingreso per cápita no está asociado a la población urbana. En los países americanos, su ingreso per cápita es independiente del % población urbana.


Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadística Descriptiva: Cálculos y análisis de correlación Patricio Alcaíno Martínez – Derechos Reservados

17

Caso 10: Evaluación del Transantiago Se realiza un estudio de opinión en 12 sujetos acerca de la calidad del servicio de locomoción colectiva (Transantiago), utilizando para evaluar la siguiente escala: Muy bueno, Bueno, Más que suficiente, Suficiente, Menos que suficiente, Malo, Muy malo. Según edad del encuestado (años), los datos obtenidos son los siguientes: Obs 1 2 3 4 5 6 7 8 9 10 11 12

Evaluación Muy bueno Bueno Bueno Más que suficiente Más que suficiente Suficiente Suficiente Suficiente Menos que suficiente Malo Malo Muy malo

Edad (años) 21 35 20 22 44 45 37 32 29 62 55 58

10.1. Realice un análisis de correlación y concluya, en el marco del caso.

Solución: Por tratarse de una variable numérica y otra ordinal, se debe calcular el coeficiente de correlación de rangos de Spearman. Se realiza una transformación de los valores de las variables a rangos. Se comenzará asignado el valor 1 para el rango de menor categoría, es decir, Muy malo = 1. Se recordará que para asignar los rangos, en casos de empates o repeticiones, se asigna a cada uno un rango igual al promedio entre los rangos. Por ejemplo, a los valores Malo, le corresponde rango 2 y 3, Por tratarse de una repetición tomarán cada uno el rango promedio 2,5. Así, se construye la siguiente tabla: Obs 1 2 3 4 5 6 7 8 9 10 11 12

X = Evaluación Muy bueno Bueno Bueno Más que suficiente Más que suficiente Suficiente Suficiente Suficiente Menos que suficiente Malo Malo Muy malo

Y = Edad (años) 21 35 20 22 44 45 37 32 29 62 55 58

Rg(X)

Rg(Y)

12 10,5 10,5 8,5 8,5 6 6 6 4 2,5 2,5 1

2 6 1 3 8 9 7 5 4 12 10 11


Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadística Descriptiva: Cálculos y análisis de correlación Patricio Alcaíno Martínez – Derechos Reservados

Con los rangos de X y de Y, es más breve el cálculo del coeficiente de correlación de Pearson de los rangos. Usando calculadora esto da: rS  -0,76466

Alta correlación negativa. A mayor edad, peor es la evaluación del servicio del Transantiago. Es decir, los jóvenes dan una mejor evaluación del servicio del Transantiago que los de mayor edad.

18


Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadística Descriptiva: Cálculos y análisis de correlación Patricio Alcaíno Martínez – Derechos Reservados

19

Caso 11: Pobreza y problemática social Un estudio con una muestra de países incluye las siguientes variables: W = Índice de pobreza (1 = alto; 2 = medio; 3 = bajo) X = tasa de homicidios (5 = alta; 3 = media; 1 = baja) Y = Índice de robos (3 = alto; 2 = medio; 1 = bajo) Z = Índice de ataques sexuales (2 = alto; 1 = medio; 0 = bajo) Estableciéndose las siguientes correlaciones de Spearman: 11.2. rS (W, Y) = –0,586; 11.1. rS (W, X) = –0,832; 11.4. rS (X, Y) = 0,683. 11.3. rS (W, Z) = –0,109; Construya una conclusión por cada una de las correlaciones dadas, en el marco del caso.

Solución: 11.1. rS (W, X) = –0,832. Valores altos de W, es decir 3 = bajo, está asociado a los valores bajos de X, es decir 1 = baja. Entonces: La alta tasa de homicidios está estrechamente asociada a altos índices de pobreza. La baja tasa de homicidios está estrechamente asociada bajos índices de pobreza. 11.2. rS (W, Y) = –0,586. Valores altos de W, es decir 3 = bajo, está asociado a los valores bajos de Y, es decir 1 = bajo. Entonces: El alto índice de robos está asociado medianamente a altos índices de pobreza. Los bajos índices de robos están asociados medianamente a bajos índices de pobreza. 11.3. rS (W, Z) = –0,109. Correlación muy baja, despreciable. Entonces: Los ataques sexuales no están asociados a los índices de pobreza. Los índices de ataques sexuales son independientes de los índices de pobreza. 11.4. rS (X, Y) = 0,683. Valores altos de X, es decir 5 = alto, están asociado a los valores altos de Y, es decir 3 = alto. Entonces: Los altos índices de homicidios aparecen asociados a altos índices de robos. Los altos índices de robos están asociados a altos índices de homicidios.

ESTADÍSTICA DESCRIPTIVA EN CIENCIAS SOCIALES-3  

Set de ejercicios, casos y problemas resueltos de correlación contextualizados en las Ciencias Sociales. Se incluye el coeficiente de correl...