Issuu on Google+

PUNTUACIONES INDIVIDUALES A.González Galán Dpto. MIDE. Uned OBJETIVOS • • • • • • • •

Aprender a elaborar una matriz de datos Codificar adecuadamente los datos procedentes de un estudio Identificar e interpretar correctamente las puntuaciones directas Reconocer cuándo es necesario transformar una puntuación directa Calcular e interpretar correctamente las puntuaciones diferenciales, porcentuales, típicas, cuantiles y normalizadas Comprender el concepto de distribución normal Utilizar adecuadamente las tablas de la curva normal Aplicar el modelo de curva normal al cálculo de probabilidades asociadas a las puntuaciones individuales

ESQUEMA 1. INTRODUCCIÓN 2. LA CODIFICACIÓN DE LAS PUNTUACIONES INDIVIDUALES: PUNTUACIONES DIRECTAS (XI) 3. PROBLEMAS DE INTERPRETACIÓN DE LAS PUNTUACIONES DIRECTAS: TRANSFORMACIONES PERMISIBLES 3.1. PUNTUACIONES PROPORCIONALES Y PORCENTUALES 3.2. LAS PUNTUACIONES DIFERENCIALES 3.3. LAS PUNTUACIONES TÍPICAS 3.4. PUNTUACIONES TIPIFICADAS O ESCALAS DERIVADAS 3.5. LAS PUNTUACIONES CUANTILES 4. LAS PUNTUACIONES TÍPICAS EN LA CURVA NORMAL 4.1. LAS PUNTUACIONES INDIVIDUALES NORMALIZADAS BIBLIOGRAFÍA

---------------------------

Introducción Como hemos visto, la medición es uno de los problemas más graves en educación y en psicología. Cuando medimos la altura o el peso de un sujeto, realizamos una medida exacta de dichas características. Pero, cuando lo que medimos son características como la inteligencia, el rendimiento o la personalidad, ¿obtenemos también medidas exactas? La respuesta es negativa. En este tipo de medidas, se acepta que se comete algún tipo de error de medida. Pensemos que

1


nos estamos enfrentando en muchas ocasiones a la medida de lo que se denominan constructos, es decir, características de las personas que no son directamente mensurables. Lo que medimos son las manifestaciones observables que atribuimos a dichos constructos. Así, por ejemplo, cuando medimos la inteligencia a través de un test, lo que medimos son las manifestaciones observables que teóricamente atribuimos a la inteligencia, como la capacidad verbal, numérica, abstracta, etc. que son más fácilmente mensurables. Se sigue el mismo procedimiento para medir el rendimiento académico, la memoria, la capacidad de resolución de problemas, las aptitudes, las actitudes, etc. En la investigación psico-educativa también se utilizan variables que permiten una medición exacta como la edad, el curso escolar o el número de hermanos. Si realizáramos una investigación sobre la ansiedad ante los exámenes, también podríamos obtener medidas fiables como el ritmo cardíaco o la presión arterial. Lo que debe quedar claro es que necesitamos uno o varios instrumentos adecuados para recoger los datos que iluminen la investigación. Una vez elaborados los instrumentos de medida, se aplican a la muestra, se recogen los datos (puntuaciones de los sujetos) y se elabora la matriz de datos. La matriz de datos es simplemente una tabla de doble entrada en la que las filas representan a los sujetos y las columnas a las distintas variables medidas. Los noveles pueden configurarla en cualquier hoja de cálculo, aunque lo más usual en la investigación es utilizar programas estadísticos avanzados como el SPSS. Veamos un ejemplo: Esta matriz de datos, construida con una conocida hoja de cálculo, muestra 23 sujetos (las filas)

2


a los que se les ha aplicado cinco pruebas distintas (las cinco últimas columnas; la primera es el número de identificación de cada sujeto). La primera fila contiene los nombres de las variables (EF1, EF2, etc.). Por tanto, el sujeto 1 tiene una puntuación de 37,04 en la primera prueba (EF1), de 3 en la segunda (EF2) y no realizó las tres siguientes. Pues bien, esta será siempre la forma de realizar la matriz de datos, ya sean los datos numéricos o alfanuméricos (caracteres): las filas son los sujetos y las columnas las variables.

2. Codificación de las puntuaciones individuales: directas (Xi) Una puntuación directa (Xi), es la puntuación que obtiene un sujeto tras aplicarle un instrumento de medida (una pregunta, un test, una escala, etc.). Según hemos podido ver en capítulos anteriores, existen distintos tipos de niveles de medida de las variables (nominal, ordinal, intervalo, etc.). El nivel de medida de las variables tiene repercusiones en la forma de codificar los datos. La codificación consiste en la asignación de números o caracteres a los valores de la variable. Así, por ejemplo, cuando tenemos un grupo de alumnos medidos en distintas variables, podemos encontrarnos que algunas de ellas son de tipo clasificatorio (nivel nominal), como el sexo y el grupo o el centro al que pertenecen, y otras con nivel de medida de intervalo como las puntuaciones obtenidas en distintas pruebas objetivas. Cuando tenemos variables con nivel de medida nominal podemos codificarlas con números, con letras o de forma alfanumérica (letras y números). Es decir, cuando asignemos los posibles valores de la variable a la variable “sexo”, podremos asignarle indistintamente cualquier letra o número a dichos valores: Valores de la variable y nombre Codificación o asignación de números o (etiquetas) de los valores caracteres a los valores Hombre 0 1 A A1 SEXO Mujer 1 0 B A2 Verdaderamente, cuando utilizamos una variable de clasificación, como su valor no indica magnitud, tenemos cualquier posibilidad de asignación de números a los valores de la variable. Sin embargo, cuando nos enfrentamos con variables con nivel de medida ordinal, de intervalo o de razón, debemos transcribir la puntuación obtenida por el sujeto en la variable (un 110 en cociente intelectual, un 8,5 en rendimiento, un 18 en actitud, 4 hijos, etc.), ya que dicho valor le sitúa a lo largo de un continuo que indica la magnitud o el grado de presencia de dicha característica en el sujeto. Variable

El proceso de codificación de las variables debe hacerse antes de la aplicación de los instrumentos, de modo que puede llegar a construirse el denominado “libro de códigos”. En el libro de códigos aparecen las variables en el mismo orden en el que aparecerán en la matriz de datos (fichero de datos). En primer lugar se pone el nombre de la variable tal y como aparecerá en el fichero de datos y que generalmente no podrá superar los ocho caracteres (limitación de los programas de análisis). A continuación, si es necesario, se le asigna una etiqueta, es decir, un nombre más largo o una descripción breve de la variable. Por ejemplo, “EF1” podría ser el nombre de la variable, y “Evaluación formativa nº 1” su etiqueta. Posteriormente se anotan los posibles valores de la variable (códigos) y, si procede, se les asigna también una etiqueta a dichos valores. En el caso de variables continuas basta con escribir el recorrido de la escala (por ejemplo 5-20).

3


Si tuviéramos, por tanto, la variable “nivel socioeconómico” medida con un nivel ordinal (alto, medio y bajo), podríamos codificarla del siguiente modo: Nombre

Etiqueta

Códigos Etiqueta Valores 1 bajo Nivel NSOCEC 2 medio socioeconómico 3 alto Después hay que asignar el número correspondiente a los “valores perdidos” o valores missing. Un valor perdido es el un valor en una variable desconocido para un sujeto particular, bien porque no se le ha podido medir en dicha variable, bien porque el sujeto no haya contestado a lo que se le pregunta por despiste o deliberadamente. En la codificación de los valores perdidos (especialmente en las encuestas) puede distinguirse entre “no contesta”, dejando la casilla en blanco, valor que suele llamarse “missing del sistema” y “no sabe”, valor al que se le asigna un número fijo (tiene que ser un valor fuera del recorrido de la variable, frecuentemente un 9 o un 99) y recibe el nombre de “missing del usuario”. Una vez que hayamos aplicado los instrumentos de medida, partiendo del libro de códigos, debemos construir el “fichero de datos”, fichero que contiene la matriz de datos. La matriz de datos no proporciona gran información con un simple golpe de vista, menos aún cuando tenemos muchos sujetos y muchas variables. Por tanto, procede ordenar y categorizar los datos, de modo que podamos apreciar mejor las características del grupo en cada una de las variables. Este primer análisis recibe el nombre de estadística descriptiva, y nos referiremos a él posteriormente. En cualquier caso, para explicar otro tipo de puntuaciones individuales, tenemos que referirnos necesariamente a los dos índices más importantes utilizados para describir un grupo de sujetos: la media aritmética y la desviación típica.

X=

Suma de todas las puntuaciones Número total de puntuaciones

X=

∑ xi N

Generalmente, para describir a un grupo de sujetos, primero se estudia su tendencia central, es decir, hacia qué puntuación tiende. El índice más conocido es la media aritmética, que se calcula sumando todas las puntuaciones y dividiendo dicha suma por el número total de puntuaciones. Su símbolo es x (si se trata de un estadístico) o µ (si se trata de un parámetro). Después de aplicar la fórmula, podríamos obtener que el cociente intelectual medio (la media aritmética) de un grupo de cuatro sujetos es 104. Sin embargo, este dato por sí solo nos proporciona suficiente información como para hacernos una idea del grupo. ¿La mayoría de los sujetos tiene unas puntuaciones cercanas a 104 o hay sujetos con puntuaciones muy altas y muy bajas? En otras palabras, nos estamos preguntando si el grupo es homogéneo en torno a la media (la mayoría de las puntuaciones están cerca de 103) o heterogéneo (muchas puntuaciones distan considerablemente de la media, tanto por arriba como por abajo). Dicho de otra forma, ¿hay o no hay dispersión de las puntuaciones en torno a la media aritmética?

4


Veamos un ejemplo sencillo. Supongamos que tenemos dos grupos de cuatro sujetos cada uno a los que pasamos un test de inteligencia. Los resultados son los siguientes: La media aritmética es la misma en los dos grupos y, sin embargo, son grupos muy diferentes. Por esta razón, el índice de tendencia central debe ir acompañado por un índice de dispersión o variabilidad que indique en qué medida las puntuaciones de los Grupo 1 Grupo 2 sujetos se dispersan o varían en torno a la media aritmética. Este X1= 104 X1= 80 índice (existen otros) se denomina desviación típica y se X2= 104 X2= 80 representa por “s” (estadístico) o σ (parámetro). Como podrá X3= 104 X3= 128 deducirse, la desviación típica del primer grupo será igual a cero puesto que el grupo es absolutamente homogéneo, no hay ninguna X4= 104 X4= 128 desviación de la media aritmética. Otro índice muy utilizado para x = 104 x = 104 expresar la variabilidad de los grupos es la varianza (s2 o σ2). Conceptualmente se interpreta exactamente igual que la desviación típica. Su cálculo se realiza elevando al cuadrado la desviación típica. Veamos la fórmula para su cálculo: s=

(Suma de las diferencias entre cada puntuación directa y la media aritmética) 2 , esto es, Número total de sujetos

s=

Σ (x i − x ) 2 N

Como puede verse, el numerador expresa las distancias de cada puntuación directa a la media aritmética. Dichas distancias se elevan al cuadrado para evitar la distorsión que provocarían las diferencias negativas. Pongamos un ejemplo: Se ha utilizado una terapia para reducir la agresividad en cierto tipo de pacientes. Para probar la efectividad de la terapia, se han formado dos grupos: el grupo experimental (al que se le aplica la terapia) y el grupo de control (al que no se le aplica la terapia). Después de la aplicación de la terapia al grupo experimental, se utiliza un instrumento para medir el grado de agresividad (supongamos una escala 0 – 50 puntos) en los dos grupos. Los resultados son los siguientes: GRUPO GRUPO DE EXPERIMENTAL CONTROL x = 28 x = 41 s=7 s = 12 N = 50 N = 50 Este tipo de tablas es muy frecuente encontrarlas en informes y artículos de investigación. En ésta puede observarse que cada grupo está formado por 50 sujetos. Comparando las medias aritméticas se deduce que la terapia parece haber producido un efecto beneficioso para reducir la agresividad, puesto que los sujetos del grupo experimental presentan una media 13 puntos más baja que los del grupo de control, que no han sido sometidos al tratamiento. Por otra parte, la desviación típica es más baja en el grupo experimental, lo que nos indica que los sujetos están

5


más igualados entre sí en cuanto al nivel de agresividad que los del grupo de control, en donde habrá mayores diferencias inter-individuales. Una vez comprendidos los conceptos de media y desviación, podemos pasar a explicar la transformación de las puntuaciones directas en otro tipo de puntuaciones.

3. Problemas de interpretación transformaciones permisibles

de

las

puntuaciones

directas:

Una puntuación directa (Xi) es la puntuación que obtiene un sujeto al aplicarle un instrumento de medida. Supongamos que hemos elaborado una prueba objetiva de 40 preguntas o ítems para evaluar el rendimiento de los alumnos en Literatura. Un sujeto obtiene una puntuación directa de 18 puntos (X1 = 18). En un momento posterior del curso, elaboramos una segunda prueba objetiva, esta vez de 20 ítems, en la que este alumno obtiene la misma puntuación (X2 = 18). ¿Son comparables estas dos puntuaciones directamente? Parece claro que no, puesto que el recorrido de la variable “rendimiento en Literatura” es distinto en las dos pruebas (0-40 frente a 0-20 respectivamente). En el primer caso sería una puntuación medio-baja, mientras que en el segundo sería una puntuación excelente. En consecuencia, necesitamos transformar las puntuaciones X1 y X2 para poderlas comparar correctamente. Veamos distintas posibilidades de transformación. 3.1. Puntuaciones proporcionales y porcentuales

Una forma rápida y sencilla de comparar aquella Xi = 18 en las dos pruebas es convertirla en una proporción (nº de respuestas correctas / nº total de preguntas) de respuestas correctas o un porcentaje de respuestas correctas (multiplicando la proporción por cien). De este modo, este sujeto ha tenido en el primer test una proporción de respuestas correctas de 0,45 (18/40), frente a una proporción de 0,9 (18/20) en el segundo. O lo que es lo mismo, un 45 % de aciertos en la primera prueba frente a un 90 % en la segunda. Evidentemente, ahora se pueden comparar los resultados en ambas pruebas, concluyendo que el resultado ha sido mucho mejor en la segunda prueba que en la primera. Sin embargo, no siempre es posible ni pertinente hacer esta transformación. Por ejemplo, si hemos construido un instrumento para evaluar la calidad de un profesor a partir de la opinión de los alumnos u otro para evaluar la actitud hacia el estudio, no se puede hablar de respuestas correctas e incorrectas. Si tenemos una escala de actitud hacia el estudio con un recorrido de 0 a 50 puntos, una Xi de 30 puntos manifiesta cierta actitud hacia el estudio, pero no es transformable en un porcentaje de respuestas correctas. Por otra parte, cuando decíamos anteriormente que un sujeto que obtiene un 45 % de respuestas correctas en una prueba objetiva se corresponde con un resultado medio-bajo o que un 90 % implica un resultado excelente es discutible. ¿Por qué? La respuesta es sencilla. Podría ocurrir que el test hubiese sido tan difícil, que el sujeto que obtuvo un 45 % de aciertos fue el mejor de su grupo. Entonces, quizás podríamos interpretar que esta puntuación no fue tan mala. En el caso

6


de la actitud hacia el estudio, una puntuación de 30 puntos puede parecer una puntuación media teniendo en cuenta el recorrido de la variable. Pero probablemente podríamos interpretar mejor dicha puntuación si la comparamos con las puntuaciones del grupo al que hemos aplicado el instrumento de medida. 3.2. Las puntuaciones diferenciales

Una puntuación diferencial (x) es una puntuación individual relativa a la media aritmética del grupo de referencia. Por tanto, para calcular una puntuación diferencial es necesario haber aplicado un instrumento de medida a un grupo de sujetos. Para calcularla, simplemente se le resta a la puntuación directa del sujeto la media aritmética del grupo al que pertenece. Por tanto, una puntuación directa superior a la media aritmética será una puntuación diferencial

x = xi - x positiva, mientras que si es inferior a la media, será negativa. Siguiendo con el ejemplo anterior, si en la primera prueba la x = 23 y en la segunda x = 9, tendríamos que las puntuaciones diferenciales del sujeto en cada prueba son, respectivamente,

x1 = x1 - x = 18 – 23 = -5

x2 = x2 - x = 18 – 9 = 9 Ahora bien, una puntuación diferencial sólo nos permite saber si una puntuación está por encima o por debajo de la media aritmética, pero de nuevo nos encontramos con el mismo problema que en las puntuaciones directas. ¿Son comparables dos puntuaciones diferenciales que proceden de distintos instrumentos de medida? ¿Una puntuación diferencial de 2 en la primera prueba significa lo mismo que esa misma puntuación en la segunda prueba? Evidentemente, no es lo mismo separarse dos puntos de la media cuando tenemos un recorrido de 5 puntos que cuando el recorrido es de 100 puntos. Necesitamos, por tanto, una puntuación que permita situar a un sujeto con respecto a su grupo de referencia y que permita hacer comparaciones independientemente de la amplitud del instrumento del que procedan las puntuaciones directas que deseamos comparar. Consecuentemente, las puntuaciones diferenciales no son muy utilizadas como puntuaciones individuales. Sin embargo, sí son muy utilizadas en el cálculo de otras puntuaciones (las puntuaciones típicas) y de algunos índices, como los índices de variabilidad. Nótese que el numerado de la fórmula de la desviación típica hay una puntuación diferencial. 3.3. Las puntuaciones típicas

Una puntuación típica (z) indica el número de desviaciones típicas que se desvía una puntuación directa de la media aritmética. Las dos propiedades más importantes de las puntuaciones típicas

7


es que la media de dichas puntuaciones es igual a cero y la desviación típica igual a uno. Trataremos de clarificar esta definición y sus propiedades en los párrafos siguientes. Las puntuaciones típicas son un tipo de puntuaciones muy utilizadas porque nos permiten comparar cualquier puntuación entre sí, independientemente del instrumento de medida o de la amplitud de la escala utilizada. Sigamos con el ejemplo anterior: tenemos dos tests de rendimiento en Literatura, uno de 40 preguntas y otro de 20. Si en ambos tests un sujeto obtiene una Xi = 18, esta puntuación no significa lo mismo. Sin embargo, sí podemos compararlas si las convertimos en puntuaciones típicas, que son unas puntuaciones relativas a la media y la desviación típica del grupo, tal y como se ve en la fórmula siguiente:

Z =

Xi - x s

Z =

x s

De ella se desprende, como en las puntuaciones diferenciales (numerador de la fórmula), que a toda puntuación directa superior a la media le corresponderá una puntuación típica positiva, y si es inferior a la media, negativa. La media aritmética siempre coincide con una Z = 0. Por tanto, si en el test de 40 preguntas, la media es 23 y la desviación típica 5, y en el de 20 preguntas la media es 9 y la desviación típica 3, para comparar una puntuación directa de 18 en los dos tests, podemos calcular su puntuación típica en ambos aplicando la fórmula anterior:

Z =

18 - 23 = −1 5

Z =

18 - 9 =3 3

Esto indica que ha destacado mucho más respecto al grupo en el primer test (se aleja 3 desviaciones típicas por encima de la media) que en el segundo (se aleja una desviación típica por debajo de la media, puesto que la z es negativa). Debe entenderse que una puntuación típica, como hemos dicho, es una puntuación que depende tanto de la media como de la variabilidad del grupo. En consecuencia, las puntuaciones típicas variarán dependiendo de la homogeneidad o heterogeneidad del grupo. Si un grupo es muy homogéneo, su desviación típica será pequeña y, por tanto, a una puntuación que no se aleje mucho de la media le puede corresponder una puntuación típica mucho mayor que la que le correspondería si el grupo fuese heterogéneo. Por ejemplo, supongamos que se ha pasado un examen a dos grupos. En ambos la media es de 5,5. El primer grupo es bastante homogéneo (todos sacan puntuaciones cercanas a la media), por lo que su desviación típica es de s = 0,4. en el segundo grupo la desviación típica es de s = 2,5. ¿Qué puntuación típica le corresponde en cada grupo a un sujeto que ha sacado un 7 en el examen? En el primer caso la Z = 3,75, mientras que en el segundo la Z = 0,6. Es decir, en el primer grupo, un sujeto con una Xi = 7 se aleja 3,75 desviaciones típicas (3,75 · 0,4 = 1,5 puntos) por encima de la media del grupo ( x = 5,5), mientras que en el segundo grupo, un sujeto con la misma puntuación directa sólo se desvía 0,6 desviaciones típicas por encima de la media del grupo. En este sentido se podría decir que la obtención de un 7 en el primer grupo tiene más valor o destaca más (mayor puntuación típica) que esa misma puntuación en el segundo grupo.

8


Como veremos posteriormente, una de las utilidades más importantes de las puntuaciones típicas, tanto es estadística descriptiva como inferencial, es la correspondencia que existe entre estas puntuaciones y la distribución normal. De esta forma, se podrá saber qué probabilidad existe de obtener determinada puntuación. 3.4. Puntuaciones tipificadas o escalas derivadas

Las puntuaciones tipificadas consisten en una simple transformación de las puntuaciones típicas, creadas con el ánimo de evitar las puntuaciones decimales y las negativas. La transformación se reduce a multiplicar por una constante a la puntuación típica, valor que se convertirá en la nueva desviación típica y sumarle otra constante, valor que se convertirá en la nueva media de las puntuaciones tipificadas: T = a · z + b, donde b = x , a = s y z = puntuación típica

Entre las puntuaciones tipificadas más usadas, se encuentran las siguientes: T = 10 z + 50 S=2z+5 Entonces, un sujeto con una puntuación directa igual a la media tendrá una puntuación T = 50 y una S = 5. 3.5. Las puntuaciones cuantiles Un cuantil indica el porcentaje de sujetos que deja por debajo de sí una puntuación determinada. La puntuaciones cuantiles más utilizadas son los percentiles, que dividen una distribución de frecuencias en cien partes, de modo que el percentil 85 corresponde a aquella puntuación directa que deja por debajo de sí al 85 % de los sujetos de su grupo. Otros cuantiles utilizados son los deciles (diez divisiones) y los cuartiles (cuatro divisiones). Como podrá suponerse, el percentil 75 (P75) es igual al cuartil 3 (Q3), o que el percentil 50 (P50) se corresponde con el decil 5 (D5) y el cuartil 2 (Q2). Como vemos, un cuantil es una medida relativa al grupo de referencia. Es decir, un sujeto puede encontrarse en el P90 y tener una mala puntuación en valor absoluto. Supongamos que un profesor pone un examen y por diversas razones el grupo no ha estudiado. Un alumno que tuviera un 4 (en una escala 0-10) podría superar al 90 % de los sujetos de su grupo, sin que esto signifique haber sacado una buena nota. Los percentiles son utilizados para construir los baremos de los tests estandarizados. Los tests que encontramos en las casas comerciales y que son utilizados en los centros escolares y los gabinetes psicopedagógicos para la orientación y el diagnóstico, ofrecen siempre la transformación de las puntuaciones directas en percentiles, con el fin de que podamos

9


interpretar mejor las puntuaciones. Estos baremos están construidos con muestras grandes de sujetos, generalmente muestras que pueden considerarse representativas de la población. De este modo, cuando aplicamos un test a un sujeto y transformamos su puntuación directa en un percentil según los baremos del test, simplemente estamos situando al sujeto en una posición (de 1 a 100) en referencia al grupo normativo. Es decir, lo comparamos con lo que es normal en la población. En consecuencia, si nos encontramos entre los percentiles 40 y 60 en cociente intelectual, podemos considerar que tenemos una inteligencia normal en comparación con el grupo normativo. Existen dos formas de obtener los percentiles. La forma más sencilla es el cálculo de percentiles por el procedimiento denominado cálculo directo, esto es, los percentiles correspondientes a cada una de las puntuaciones directas que obtienen los sujetos en el test (si el grupo no es grande los sujetos no obtendrán todas las puntuaciones posibles). Estos percentiles se obtienen directamente al realizar la distribución de frecuencias y multiplicar por cien las frecuencias relativas a las frecuencias acumuladas (fr · 100 / N). Veamos, no obstante, un ejemplo sencillo: ACT1_01 Puntuación directa 7 6 5 4 3 2 1 Total

Frecuencia absoluta 266 131 108 128 107 93 179 1012

Frecuencia relativa * 100 26,3 12,9 10,7 12,6 10,6 9,2 17,7 100,0

Frecuencia acumulada 1012 746 615 507 379 272 179

Porcentaje acumulado 100,0 73,7 60,8 50,1 37,5 26,9 17,7

Percentil Pc 100 74 61 50 38 27 18

El ejemplo que mostramos procede de un estudio sobre las actitudes sociales de los adolescentes (Moraleda, Glez. Galán y Gª-Gallo1, 1998). Los resultados que se muestran proceden de la respuesta al primer ítem de la escala construida al efecto (ACT1_01), cuya formulación es la siguiente: «Cuando un compañero viene a mí contándome algo desagradable que le ha pasado, me gusta escucharle y comprenderle». Las respuestas posibles están escaladas desde 1 (“no se da nada en mi”) hasta 7 (“se da muchísimo en mi”). Como vemos, en la primera columna empezando por la izquierda aparecen las puntuaciones directas, es decir, la respuesta numérica elegida por los sujetos. En la segunda columna aparece la frecuencia absoluta. Así, la respuesta “1” ha sido elegida por 179 sujetos, la “2” por 93 y así sucesivamente. El número total de sujetos que han respondido a la pregunta se halla sumando todas las frecuencias absolutas (N=1012). En la tercera columna aparece la frecuencia relativa multiplicada por cien ((fi /N)*100). Esto nos indica que la respuesta “1” ha sido elegida por el 17,7 % de los sujetos, la respuesta “2” por el 9,2 1

MORALEDA, M.; GLEZ. GALÁN, A. y Gª-GALLO, J. (1998): AECS: Actitudes y Estrategias Cognitivas Sociales. Ed. TEA. Madrid.

10


%, etc. La columna siguiente muestra las frecuencias acumuladas. Por fin, el porcentaje acumulado (frecuencia acumulada relativa [fac/N] multiplicada por cien) nos indica el porcentaje de sujetos que deja por debajo de sí el límite superior (puntuación directa más 0,5) de una puntuación determinada. Así, por ejemplo, un sujeto con una Xi = 5 supera casi a un 61 % de los sujetos de su grupo. En este caso, los percentiles corresponden a la última columna redondeando los decimales. Es decir, un sujeto que obtenga una puntuación directa de 6 está en el percentil 74. Los percentiles suelen mostrarse ordenados de mayor a menor. En algunas ocasiones hay que calcular percentiles que no aparecen en la distribución de frecuencias. Por ejemplo, para calcular la mediana (puntuación de tendencia central que deja por encima y por debajo de sí al 50 % de los sujetos de la muestra) necesitamos saber el percentil 50, o para calcular la desviación semi-intercuartílica (medida de dispersión, ver capítulo siguiente) necesitamos los percentiles 25 y 75 (cuartiles 1 y 3). El cálculo de estos percentiles se denomina cálculo por interpolación, siendo los únicos percentiles que se expresan con decimales. Este cálculo es también sencillo. Por ejemplo, para hallar el P25 se puede utilizar la fórmula siguiente:

c⋅N − fa 100 Pc = L inf(i +1) + ⋅i f i (i +1)

25 ⋅ 1012 − 179 100 P = 1,5 + ⋅ 1 = 2,5 + 0,80 = 2,3 25 93

En esta fórmula, lo primero que se resuelve es el numerador del segundo término, que indica el número de sujetos correspondientes al percentil 25, esto es, una simple regla de tres. Si 1012 sujetos son el 100 % de la muestra, ¿cuántos sujetos son el 25 %? 25 · 1012 /100 = 253. Esta cifra debemos buscarla en la columna de las frecuencias acumuladas, quedándonos con las más alta que no supere dicha cifra, que en nuestro caso es 179, que corresponde a la Xi = 1. Restamos dicha frecuencia al dato anterior (253-179 = 74), para ver cuántos sujetos nos faltan a partir de este intervalo para llegar a los 253 que necesitamos. Este valor lo dividimos por la frecuencia absoluta del intervalo superior (fi = 93) para coger una parte proporcional de la puntuación de dicho intervalo (nuestra distribución de frecuencias tiene intervalos de un punto, por lo que el intervalo siguiente, que corresponde a Xi = 2, va de 1,5 a 2,5), por tanto 74/93 = 0.80. Esta cifra se multiplica por el valor del intervalo. En este caso i=1. Una vez aquí, le sumamos el límite inferior del intervalo en el que se encuentra esta frecuencia absoluta, es decir, el límite inferior de Xi = 2, que es 1,5 (la puntuación directa menos 0,5), y ya tenemos el P25 = 1,5 + 0,8 = 2,3. 4. Las puntuaciones típicas en la curva normal Acabamos de ver un ejemplo de una distribución de frecuencias. Una distribución de frecuencias puede representarse gráficamente, como vimos en el capítulo 15, mediante un polígono de frecuencias, donde el eje de las “x” representa las puntuaciones obtenidas por los sujetos y el eje de las “y” indica las frecuencias. De este modo, la distribución de frecuencias anterior puede representarse del modo siguiente:

11


Este polígono muestra cómo gran parte de los sujetos se sitúa en torno a las dos puntuaciones extremas, el 1 y el 7. Pues bien, entre las distintas formas que pueden adoptar las distribuciones de frecuencias en distintas variables, se descubrió que muchas variables adoptan un tipo de distribución característica que se denomina distribución normal o campana de Gauss. La curva normal es una distribución teórica, simétrica y asintótica, en la que los puntos de inflexión corresponden con las puntuaciones típicas ±1 y donde la media, la mediana y la moda (puntuación que más se repite) coinciden (por tanto, la ACT1_01 z en este punto es cero): 300

200

Frecuencia

100

0

0

1

2

3

4

5

6

7

8

Polígono de frecuencias absolutas

x = Md = Mo Curva normal Parece ser que los primeros que llegaron a describir el modelo teórico de distribución normal fueron De Moivre en 1733, en el contexto de los juegos de azar y, por otra parte, Laplace y Gauss entre finales del XVII y principios del XVIII en el contexto de las matemáticas y la astronomía. Las aplicaciones de la distribución normal y otras distribuciones teóricas como la binomial, t, F, χ2, etc. (ver capítulo 23) son fundamentales en el campo de la inferencia estadística, donde reciben el nombre de distribuciones muestrales. Como se podrá ver en el capítulo 23, estas distribuciones nos permiten conocer cuándo una diferencia (por ejemplo, entre dos medias aritméticas en rendimiento correspondientes a dos grupos que han seguido dos métodos de enseñanza diferentes) es o no es explicable por efecto del azar. Muchas variables educativas, psicológicas y biológicas se distribuyen según el modelo normal, sobre todo si contamos con muestras grandes de sujetos: rendimiento académico, inteligencia, peso, altura, etc. La distribución viene a indicar cómo la mayoría de las personas nos encontramos en torno a los valores medios de la distribución, y según nos alejamos hacia valores extremos, el número de sujetos existentes va disminuyendo progresivamente. Es decir, la mayoría de los sujetos somos medianamente inteligentes (“normales”), pero cuanto más nos alejamos de estas puntuaciones vamos encontrando menos sujetos muy inteligentes o muy poco inteligentes. La reiterada observación empírica de la distribución de estas variables permitió crear un modelo

12


matemático teórico que respondía a dicha distribución, de modo que es posible conocer la probabilidad asociada a cada uno de los valores de la curva, con lo cual podemos saber si la obtención de un valor procedente de cualquier medición es más o menos probable que aparezca, es decir, si se parece mucho o poco a lo que entendemos como “normal”. Para realizar este tipo de interpretaciones, debemos asumir necesariamente (aunque sea desde un punto de vista teórico) que la distribución poblacional de la variable de estudio es normal. Precisamente, para poder llevar a efecto dichas interpretaciones, necesitamos una unidad de medida universal, por lo que las tablas de la curva normal están construidas a partir de las puntuaciones típicas, de modo que podamos establecer la equivalencia con cualquier sistema de puntuaciones directas. En casi todos los textos de Estadística se pueden encontrar las tablas de la curva normal con las probabilidades asociadas a cada puntuación típica. La interpretación de las tablas es muy sencilla. Tenemos que pensar que una puntuación típica divide la curva normal en dos partes: una grande y otra pequeña (excepto z = 0 que la divide en dos partes iguales). En este caso, hemos utilizado la puntuación típica 1,25. Si trazamos una línea vertical a partir de dicha Z, el área de la curva normal queda dividida en dos partes. El área mayor, lógicamente, es el área más grande que queda al realizar dicha división, es decir, desde la línea gruesa hasta - ∞ .

Por tanto, una puntuación típica igual a 1,25 tiene una probabilidad acumulada de aparición de p = 0,8944, esto es, el 89,44 % obtienen una puntuación Z ≤ 1,25. Consecuentemente, en este caso, el área menor indica la probabilidad de obtener una puntuación Z ≥ 1,25 (p = 0,1056). También podemos saber cuál es la probabilidad de obtener una puntuación entre la media y Z = 1,25 (p = 0,3944 = 0,5 - 0,1056). Si la puntuación típica hubiera sido Z = - 1,25, ¿qué probabilidad existe de obtener una puntuación igual o inferior a dicha Z [p(Z≤1,25)]? En este caso, puesto que la distribución normal es simétrica, consultaríamos el área menor de Z = 1,25 (p = 0,1056). Veamos un ejemplo de la curva normal con algunas puntuaciones típicas y sus probabilidades asociadas de obtener una puntuación mayor o menor a sí mismas (página siguiente). Evidentemente, la probabilidad de obtener una puntuación superior a la media es de p= 0,5, es decir, en la curva normal el 50 % de los sujetos se encuentran por encima de la media y el otro 50 % por debajo (recordemos que en las puntuaciones Z la media siempre es igual a cero). Por poner otro ejemplo, el 84,14 % (área de la parte mayor; p= 0,8414) de los sujetos obtienen una puntuación típica inferior a 1, por lo que el 15,87 % restante la obtienen superior a 1. Con estos valores, también

13


p = 0,5

p = 0,5

p = 0,8413

p = 0,1587

p 0,025

p = 0,025 p = 0,005

z

0

-1,96

1

1,96

2,57

xi x − 1,96 s

x

x + 2,57 s

x + 1s

Puntuaciones típicas y probabilidades asociadas en la curva normal podemos deducir que entre la Z=0 y la Z=1 se encuentra el 34,13 % de los sujetos (0,5-0,1587), y el mismo porcentaje encontraremos entre Z=0 y Z= -1, puesto que la curva es simétrica. En el gráfico siguiente podemos hacernos una idea de la distribución de sujetos a lo largo de la curva normal, de modo que prácticamente todas las puntuaciones (el 99,74 %) se encuentran entre las Z = ± 3.

0,9974 0,9544 0,6426

p = 0,0013

z

-3

-2

-1

60

70

80

0

1

2

3

xi

x = 90

100

110

120

Como vemos, cuando tenemos una distribución normal, la obtención de una puntuación típica superior a 2 o inferior a –2 puede considerarse una puntuación extrema, ya que es obtenida solamente por menos del 5 % de los sujetos. La probabilidad de obtener una puntuación típica igual o superior a 3 es de p = 0,0013, esto es, en 1,3 casos de cada mil. En términos porcentuales, podemos decir que entre las puntuaciones típicas de ± 1 se encuentra el 64 % de los sujetos, entre ± 2 el 95 % y entre ± 3 casi el 100 % (el 99,7 %).

14


Del mismo modo, si tenemos una distribución de frecuencias con puntuaciones directas y sabemos que dicha distribución es normal, nos basta saber su x y su s (desviación típica) para extrapolar las aplicaciones de la curva normal. Supongamos que tenemos un test de aptitud numérica (cuyas puntuaciones se distribuyen normalmente) con una x = 90 y una s = 10. Mediante una simple transformación podemos saber que la puntuación directa que corresponde a Z = 1 (se aleja una desviación típica por encima de la media) es Xi = 100 (90 + 1 · 10; también se llega aquí despejando de la fórmula Z=(xi- x )/s) y que un sujeto con esta puntuación superará al 84 % de los sujetos de su grupo (área mayor p= 0,8413) y es superado por el 16 %. Este sujeto se encontrará, por tanto, en el percentil 84. 4.1. Las puntuaciones individuales normalizadas

En algunas ocasiones se utiliza un tipo de puntuaciones individuales denominadas puntuaciones normalizadas. La puntuación normalizada es la puntuación individual que le corresponde a un sujeto si la distribución de frecuencias original es una distribución normal. En el caso de que no lo sea, esta transformación estará tanto más distorsionada cuanto más se diferencie dicha distribución de la normal. Concretamente suelen utilizarse cuando en un test conocemos la media y la desviación típica, pero carecemos de los baremos. Si hemos aplicado un test en estas condiciones y sabemos o es razonable suponer que la distribución de frecuencias del test original era una distribución normal, entonces a partir de estos datos podemos construir fácilmente nuestros propios baremos. Supongamos que queremos aplicar un test de inteligencia y sabemos que este test fue aplicado anteriormente a una muestra grande de sujetos, obteniéndose una distribución normal de las puntuaciones directas. Conocemos también que en aquella aplicación se obtuvo una media aritmética de 100 puntos y una desviación típica de 15. ¿Cómo construir los baremos para interpretar las puntuaciones al aplicar nosotros el test? Como sabemos que la distribución es normal, nos bastaría mirar en las tablas para saber a qué percentil corresponde cada puntuación típica. Por ejemplo, el P10 es aquella puntuación que deja por debajo de su límite superior al 10 % de los sujetos, por tanto, a una proporción de 0,01 sujetos. Buscamos en las tablas de la curva normal p = 0,01 en el área de la parte menor y encontramos que corresponde a una Z = - 2,33 (esta es la Z normalizada, es decir, la puntuación típica correspondiente a dicho percentil si la distribución es normal). Ahora basta con aplicar la fórmula para saber la puntuación directa equivalente al P10.

- 2,33 =

X i - 100 ⇒ X i = 65,05 15

Por tanto, una puntuación directa de 65 equivale al percentil normalizado P10. Si la muestra es de 150 sujetos, ¿a cuántos sujetos superaría uno que obtiene una puntuación directa de 65? Simplemente multiplicamos el número de sujetos (N=150) por la probabilidad de

15


obtener una Xi ≤ 65; p (Xi ≤ 65) = 0,01 ⇒ n = 150·0,01 = 1,5 ≈ 2 sujetos. Aproximadamente 2 sujetos de los 150 sacarían una puntuación igual o inferior a 65. Finalmente, a veces se utiliza otro tipo de puntuaciones normalizadas consistentes en una agrupación por intervalo de las puntuaciones típicas, utilizando la desviación típica como unidad de agrupación. Así, por ejemplo, los pentas son unas puntuaciones que dividen a la curva normal en cinco partes (ver gráfico), de modo que cada puntuación penta (excepto los extremos 1 y 5) contiene una desviación típica. También existen los eneatipos o estaninos que dividen a la curva normal en nueve partes, por lo que cada uno contiene media desviación típica. Del mismo modo se puede construir la escala 20 (los intervalos comprenden 0,25 desviaciones típicas, excepto los extremos) o cualquier división que creamos oportuna. La utilización de estas puntuaciones en vez de los percentiles se justifica en muchas ocasiones porque los instrumentos de medida que utilizamos no son tan precisos como para pensar que los sujetos son clasificables en torno a 100 categorías ordenadas, por lo que resulta más coherente disminuir el número de categorías de clasificación. De este modo, basta mirar en las tablas para saber que el estanino 5 comprende desde el P40 al P60 (desde Z = -0,25 a Z = 0,25).

z

-3

-2

1

Pentas Estaninos

-1,5

1

-1

-0,5

3

0,5

1

3

2 2

0

4

5

1,5

4 6

7

2

3

5 8

9

Como vemos, cuando consideramos que una distribución es normal, podemos deducir algunas conclusiones basándonos en dicha distribución teórica. 1. Es posible saber, como hemos visto, el porcentaje de sujetos que deja por encima y por debajo de sí una puntuación individual o, lo que es lo mismo pero dicho en términos proporcionales, la probabilidad de aparición de una puntuación igual o superior e igual o inferior a una puntuación individual. Para ello basta con consultar las tablas de la curva normal. 2. En la curva normal (y sólo cuando la distribución es normal), existe una correspondencia directa entre las puntuaciones típicas y los percentiles y demás cuantiles. Un percentil indica el porcentaje de sujetos que deja por debajo de sí

16


una puntuación individual determinada. Por tanto, dada una puntuación típica, basta mirar el área que deja a su izquierda para transformarla en un percentil multiplicando dicha área por cien y redondeando el valor obtenido. Así, un sujeto con una Z = -2 (p = 0,0228) estaría en el percentil 2 (P2), con una Z = 0 en el P50 y con una Z = 2 en el P98. 3. Si tenemos una muestra de sujetos cuya distribución de frecuencias es una distribución normal, nos basta con saber el número de sujetos de la muestra, su media aritmética y su desviación típica para saber cuántos sujetos se encuentran por encima o por debajo de una puntuación directa o entre dos puntuaciones directas. Basta multiplicar la probabilidad encontrada por el número de sujetos de la muestra. BIBLIOGRAFÍA BOTELLA, J., LEÓN, G. O. y SAN MARTÍN, R. (1993): “Análisis de datos en Psicología I”. Madrid, Pirámide. FERNÁNDEZ DÍAZ, M. J., GARCÍA RAMOS, J. M., FUENTES VICENTES, A. y ASENSIO MUÑOZ, I. (1990): “Resolución de problemas de estadística aplicada a las ciencias sociales. Guía práctica para profesores y alumnos”. Madrid, Síntesis. GONZÁLEZ GALÁN, A. (en prensa). La investigación en Educación Especial. En R. Fernández, E. Ceballos, T. Feliz y A. González Galán “Bases Psicopedagógicas de la Educación Especial”. Universidad de Alcalá. Madrid. MORALES, P. (2000). Estadística descriptiva aplicada a las Ciencias Sociales. Universidad Pontificia Comillas Madrid. Documento de trabajo inédito. PEREZ JUSTE, R. (1998). Estadística descriptiva. Universidad Nacional de Educación a Distancia. Madrid.

EJERCICIOS A) Preguntas de interpretación 1. En las puntuaciones típicas la media es cero y la desviación típica 1: A. Siempre B. Sólo cuando la distribución es normal 2. Si un sujeto se encuentra en el percentil 75 en una prueba de Inglés y en el 50 en una prueba de francés, se puede concluir que sabe más inglés que francés... A. Sí, sin duda B. Sí, si la distribución del grupo de referencia es normal

17


C. No o faltan datos para afirmar esto 3. Si un sujeto se encuentra en la percentil 95, significa que le supera el 5% del grupo de referencia A. Verdadero B. Sí, si la distribución del grupo de referencia es normal C. Falso 4. Si en un test estás en el percentil 45, tu puntuación típica es negativa: A. Siempre B. Sólo si la distribución es normal C. Falso o faltan datos 5. Una puntuación típica expresa cuántas preguntas se desvía la puntuación de un sujeto de la media. A. Verdadero B. Sí, si la distribución del grupo de referencia es normal C. Falso 6. Cuando la media aritmética de un grupo es muy baja, puede haber puntuaciones típicas superiores a la media con signo negativo. A. Verdadero B. Sí, si la distribución del grupo de referencia es normal C. Falso 7. Si tenemos una muestra de 500 sujetos cuya distribución de frecuencias es asimétrica positiva, ¿cuántos sujetos dejará por debajo de sí un individuo con una puntuación típica igual a cero? A. Ninguno B. 500 C. 250 D. No lo podemos saber con estos datos 8. Si sabemos que un grupo tiene una x = 35 y una s = 3, ¿qué puntuación directa le corresponderá a un sujeto con una z = -3: A. 32 B. -3 C. 26 D. 44 E. No lo podemos saber con estos datos

9. Una Z A. B. C.

normalizada coincide con la puntuación típica cuando: Siempre Cuando la distribución es normal Depende de los casos

18


10. Si en una distribución normal queremos saber la probabilidad de obtener una puntuación igual o menor a una puntuación típica negativa, bastará con: a) Mirarlo en el área de la parte mayor de las tablas correspondiente a dicha puntuación b) Mirarlo en el área de la parte menor de las tablas correspondiente a dicha puntuación c) Transformarla en una puntuación directa y hacer una regla de tres d) Calcular la z normalizada y mirar el área de la parte mayor en las tablas

B) Problema Un director de un centro educativo decide implantar un aula de alto rendimiento en segundo de Bachillerato. Para ello se pone en contacto con el pedagogo del Departamento de Orientación y le pide que seleccione a los doce alumnos con mayor potencial académico. El pedagogo aplica una batería de tests a los 150 alumnos de 1º de Bachillerato para realizar la selección de cara al curso próximo. Después de la aplicación de la batería, se obtiene una puntuación global para cada sujeto en una escala que va desde 25 a 150 puntos. Tras realizar la distribución de frecuencias, se comprueba que la distribución es normal. La media aritmética del grupo es de 81 puntos y la desviación típica de 16,8. a) ¿Qué puntuación directa debe obtener un sujeto para ser seleccionado? b) ¿A qué percentil corresponde dicha puntuación? c) ¿Qué probabilidad existe de encontrar una puntuación mayor que 140 puntos? d) ¿Entre qué puntuaciones típicas y directas se encuentra el 50 % central de la distribución?

SOLUCIONES A) Preguntas de interpretación 1. A 2. C. No lo podemos saber porque depende de las puntuaciones de las puntuaciones del grupo en ambas pruebas. 3. A 4. B. En una distribución asimétrica negativa, el P45 puede estar por encima de la media, y por tanto su puntuación típica ser positiva. Sin embargo, en la distribución normal el P50 (Z=0) siempre coincide con la media, y por tanto cualquier puntuación típica inferior a dicho percentil será negativa. 5. C. Expresa cuántas desviaciones típicas se desvía de la media, no cuántas preguntas. 6. D. Al ser asimétrica, necesitaríamos conocer la distribución de frecuencias para responder. Si la distribución hubiera sido normal, la respuesta habría sido la C. 7. C 8. C 9. A 10. B

19


B) Problema a) El director nos pide seleccionar para el aula especial 12 sujetos de un total de 150. Se trata, por tanto, del 8 % de la muestra o, lo que es lo mismo, una proporción de 0,08. Como sabemos que la distribución es normal, en primer lugar tenemos que buscar la puntuación típica que deja por encima de sí al 8 % (p = 0,08, área menor) o por debajo al 92 % (área mayor p= 0,92). Encontramos en las tablas que dichas proporciones corresponden a una Z = 1,41. Como preguntan por la puntuación directa, despejamos de la fórmula de las puntuaciones típicas:

1,41 =

X i - 81 ⇒ X i = 104,69 ≅ 105 16,8

b) Como hemos dicho, esta puntuación deja por debajo de sí al 92 % de los sujetos, luego le corresponde el percentil normalizado P92. c) Convertimos la Xi = 140 en una puntuación típica y posteriormente miramos la probabilidad en el área menor:

Z =

140 - 81 ⇒ Z = 3,51; p( Z ≥ 3,51) = 0,0002 16,8

d) Acotamos el 50 % central de la distribución. Tendremos una puntuación típica negativa que deja por debajo de sí al 25 % de la muestra. La Z simétrica positiva dejará por encima de sí el otro 25 %. Por tanto, buscamos la Z correspondiente a p = 0,25, a saber, Z = ±0,67. Transformamos dichas puntuaciones en directas y obtenemos que el 50 % de la distribución se encuentra entre las puntuaciones Xi= 69,74 y Xi= 92,26. Veamos el problema representado gráficamente:

50% p = 0,25 p = 0,08

p = 0,0002

z

-0,67

0

0,67

1,41

70

81

92

105

140

75

92

99

2

3,51

xi Pc

20 25

50


Puntuaciones Individuales