
12 minute read
3.2 Definición y Naturaleza de la Confiabilidad: El Método de Test-retest, El Método de los Test
from La medicion
3.2 Definición y Naturaleza de la Confiabilidad: El Método de Test-retest, El Método de los Test
Paralelos, El Método de la División por Mitades, Los Métodos de Kuder Richardson, El Método Alpha de Lee Cronbach.
Advertisement
Método de TESTS -RETES
La aplicabilidad de un instrumento en la práctica depende de la calidad de la información que este puede generar. La confiabilidad, como principal variable de estudio, se define como una propiedad psicométrica que hace referencia a la ausencia de errores de medida, lo que es lo mismo, al grado de consistencia y estabilidad de las puntuaciones obtenidas a lo largo de sucesivos procesos de medición con un mismo instrumento. Este instrumento del Test -Retes, Según Sampieri 2006, indica que esta se calcula aplicando a los participantes la misma prueba dos veces y luego obteniendo un coeficiente de correlación entre las puntuaciones de ambas aplicaciones. En definición consiste en aplicar repetidas veces el mismo cuestionario a las mismas personas. Este método utiliza la técnica de coeficiente de correlación de Pearson y como propósito la consistencia en el tiempo de los puntajes. Es decir que, la evaluación de la confiabilidad mediante el procedimiento test retest implica la aplicación del mismo test dos veces a los mismos sujetos. Las aplicaciones se pueden realizar inmediatamente o dejando un intervalo de tiempo entre el test y el retest. Con este método el coeficiente de Confiabilidad se calcula pasando mismo test dos veces a los mismos sujetos. Se pueden pasar inmediatamente, o dejando un intervalo de tiempo entre el test y el retest. Después se calcula la correlación de Pearson entre las puntuaciones de ambas aplicaciones, y el resultado obtenido será el coeficiente de fiabilidad. Se considera un caso específico de formas paralelas, dado que evidentemente un test es paralelo a sí mismo. Al resultado obtenido se le denomina coeficiente de estabilidad, al servir de indicador de hasta qué punto son estables las mediciones realizadas durante la primera aplicación del test. Las diferencias en los resultados se atribuyen al grado de consistencia interna o muestreo de los ítems de la prueba en el caso de pasar el retest de forma inmediata, y se le suman las fluctuaciones en el tiempo en el caso del intervalo temporal.
Características de este método
El investigador debe aplicar el mismo instrumento dos veces al mismo grupo después de cierto periodo. calcular la confiabilidad del instrumento antes de la aplicación definitiva del mismo. Coeficiente de correlación de Pearson altamente positivo =instrumento confiable.
Es importante que, para la aplicación de estas pruebas, se tome un lapso de tiempo lo suficientemente largo para que los sujetos se olviden de lo que contestaron y, por el otro, no tanto que produzcan cambios importantes. (Pérez 1998:72). Este método tiene la desventaja de que los puntajes pueden verse afectados por el recuerdo, la práctica, etc. También el periodo de tiempo (corto o largo) entre las mediciones puede confundir el coeficiente de confiabilidad. ●Respecto al tiempo que debe transcurrir: A menor tiempo mayor efecto de la memoria de las respuestas dadas, del aprendizaje debido al propio test y de la fatiga producida por el propio test (si la segunda medición sucede de un modo más o menos inmediato). A mayor tiempo, mayor posibilidad de que los sujetos hayan cambiado realmente en la variable de interés debido a múltiples factores permanentes o circunstanciales: aprendizaje, cambios evolutivos, experiencias emocionales, enfermedad, condiciones ambientales y sociales, etc. Este procedimiento no es adecuado para aplicarlo a pruebas de conocimientos sino, para la medición de aptitudes físicas y atléticas, test de personalidad y motores. Por lo tanto, se debe tener presente que utilizar cualquier de estos instrumentos como métodos de medición deben ir unidos la confiabilidad, la valides y la objetividad, ya que si uno de estos hace falta el instrumento no es útil y válido y porque el test-retest permite establecer la estabilidad de las medidas obtenidas a partir de los mismos sujetos con el mismo instrumento en dos momentos diferentes. La razón de su selección radica en la simplicidad y bajo coste que su pone el test-retest. Como ejemplo de este instrumento de medición de test- retes tenemos: Suponga que toma un grupo de 104 niños y hace que cada uno de ellos complete el CTAS. Un mes después, haz que completen el CTAS nuevamente. Usted correlaciona sus puntuaciones y obtiene un coeficiente de estabilidad de 0,92. Sus hallazgos indican que el CTAS tiene una excelente confiabilidad test-retest. Por lo tanto, los resultados de CTAS son consistentes a lo largo del tiempo. Suponga que un grupo de estudiantes de último año de secundaria tomó las Escalas de Inteligencia para Adultos de Wechsler (WAIS) al final del primer semestre de su último año. Seis meses después, los mismos estudiantes volvieron a tomar el WAIS. Las puntuaciones se correlacionaron, dando un coeficiente de estabilidad de 0,7. Este es un coeficiente de confiabilidad aceptable. Tras un análisis más detallado, observa que las puntuaciones T2 fueron más altas que las puntuaciones T1. Dado que los estudiantes recibieron conocimientos adicionales y adquirieron nuevas habilidades en esos seis
meses entre T1 y T2, es de esperar un ligero aumento en los puntajes en el WAIS.
Para concluir el test retes como método para estimar la confiabilidad es un recurso que se utiliza para registrar la información que se desea obtener o medir, como instrumento de medición debe reunir los siguientes requisitos valides, confiabilidad y objetividad. La confiabilidad del test re test se da de una forma de estimar por medio del test de cuestionario administrándolo dos veces al mismo grupo y luego correlacionar el puntaje obtenido. En base al test retes no existe un criterio único respecto de cuál debe ser el lapso adecuado entre la primera y segunda aplicación. La correlación resultante es el coeficiente de estabilidad: cuanto más similares son las puntuaciones, mayor es la correlación. La confiabilidad test-retes depende en gran medida de la cantidad de tiempo que pasa entre las dos ocasiones.
El método de Test paralelo
Confiabilidad es cuando decimos que un test es confiable cuando al aplicarlo dos o más veces, al mismo individuo o grupo en circunstancias similares obtenemos resultados análogos. Es decir, una prueba aplicada en diferentes ocasiones en una misma muestra y en condiciones de constancia, debería arrojar resultados similares. El método de test paralelo es la construcción de dos o más test paralelos(equivalentes) a partir de cuestiones de naturaleza y de dificultad análoga, pero de apariencia distinta. Entre las cuales tiene características como:
Entre las cuales tiene características como:
• Mismo número de ítems. • Dificultad análoga • Deben medir lo mismo • Las instrucciones, tiempo, limites, ejemplos y otros aspectos de cada uno de los test tienen que ser equiparables . • Si a una misma muestra de sujetos se le aplican dos test, X y X' podemos considerar que son paralelos si, además de cumplirse los supuestos de Spearman, se cumplen dos condiciones:
• Las puntuaciones verdaderas de los sujetos son iguales en ambos tests. • La varianza de los errores de medida es la misma en ambos tests . • Método de las formas paralelas: consiste en comparar las notas de dos pruebas muy similares (paralelas), de modo que la correlación entre ambas revela el coeficiente de
fiabilidad. No obstante, la dificultad de este método estriba, precisamente, en redactar dos pruebas que sean efectivamente paralelas. • Los patrones de esta debe variar poco y entre las aplicaciones. Una variación de este método es el de las formas alternas prueba-posprueba (Creswell, 2005), cuya diferencia reside en que el tiempo que transcurre entre la administración de las versiones es mucho más largo, que es el caso de algunos experimentos. Un ejemplo de test paralelo son test de inteligencia y aptitudes, donde se demuestra la equivalencia de las formas, se aplican ambas pruebas, una inmediatamente después de la otra, al mismo grupo de sujetos. La correlación entre las dos series de puntuaciones será el coeficiente de confiabilidad del test, las diferencias obtenidas estarán producidas en su mayor parte por los fallos que existen por las semejanzas o equivalencias de los ítems, a parte de la influencia que puede ejercer los errores muestrales. Si los tests se aplican con un intervalo de tiempo, el coeficiente ya no será solo equivalencia de ítems, sino también de estabilidad temporal.
➢ Desventaja: suele exigir una considerable cantidad de trabajo preparatorio.
➢ Ventaja: resulta útil en casos en los que interesa hacer un retes orillando los inconvenientes del aprendizaje o las posibilidades del fraude. Por ejemplo, cuando dos grupos de personas, que puede establecer contactos ente sí, han de pasar el mismo test de diferentes días (las pruebas de ingreso en ciertos centros de enseñanza o en los exámenes de conocimiento). Aportes Test paralelos: En la forma clásica de este método, se construyen dos test tratando de satisfacer lo mejor posible las condiciones de estricto paralelismo. Los dos test se aplican con un intervalo de tiempo dado, y la confiabilidad se calcula como la correlación de los resultados de las dos medidas. Métodos de división por mitades: Se construyen dos test paralelos, para probar su confiabilidad, son aplicados en la misma ocasión, con ítem escogidos alternadamente de cada uno de los test. También con dos momentos de aplicación. Dos medidas de cada individuo, pero elegimos el test y otro equivalente que mide las mismas características, pero desde otro modelo teórico. Nos da información de la consistencia externa del test. Conclusión
El método de test paralelo también llamado formas alternativas se calcula a través de un coeficiente de correlación entre los resultados de dos pruebas supuestamente equivalentes Este procedimiento es el que se deriva naturalmente del modelo. Requiere que se utilicen dos pruebas o instrumentos paralelos, esto es, que midan lo mismo de forma diferente. La dificultad de este procedimiento radica en conseguir que dos
instrumentos sean realmente "paralelos", dada la dificultad que supone realizar dos pruebas que midan exactamente lo mismo, pero con diferentes ítems. No obstante, en condiciones ideales en las que se pueda garantizar el paralelismo de ambas formas, este es el método más recomendable. Conclusión en este esquema no se administra el mismo instrumento de medición, sino dos o más versiones equivalentes de éste. Las versiones (casi siempre dos) son similares en contenido, instrucciones duración y otras características, y se administran a un mismo grupo de personas simultáneamente o dentro de un periodo relativamente corto. El instrumento es confiable si la correlación entre los resultados de ambas administraciones es positiva de manera significativa.
Los Métodos de Kuder Richardson
La confiabilidad de tipo consistencia interna se refiere al grado en que los ítems, puntos o reactivos que hacen parte de una escala se correlacionan entre ellos, la magnitud en que miden el mismo constructo. Si los puntos que componen una escala teóricamente miden el mismo constructo deben mostrar una alta correlación, es decir, la escala debe mostrar un alto grado de homogeneidad el mismo principio de las fórmulas más tradicionales y conocidas en el contexto de la psicometría. Sin embargo, las más conocidas son la prueba de alfa de Cronbach y la fórmula 20 de Kuder-Richardson. La fórmula 20 de Kuder-Richardson se indica para el cálculo de la consistencia interna de escalas dicotómica.
Se emplea para establecer la fiabilidad de un examen a partir de las características estadísticas de las preguntas del mismo, concretamente sus medias y sus varianzas. La media de una pregunta dicotómica (esto es, aquella que se puntúa como correcta o incorrecta) es la proporción de individuos que la responden correctamente (p); su varianza es el producto de p y q (siendo q el número de individuos que responden incorrectamente). La Fórmula KR20 utiliza información acerca de la dificultad de cada pregunta, ya que se basa en el número de preguntas del examen, la suma de sus varianzas y la varianza total del examen. Este método consiste en evaluar la consistencia interna de una prueba, para lo cual se requiere de una sola aplicación y la confiabilidad se estima a partir de las respuestas de los sujetos a todos los reactivos de la prueba, la forma más común de evaluar este tipo de consistencia es utilizando la fórmula Kuder-Richardson que hace un examen de la ejecución década elemento. Las fuentes de error que influyen en este método son el muestreo de contenido y la heterogeneidad de lo que se pretenda medir. Para que sea efectiva la aplicación de este método se deben seguir los siguientes supuestos: El denominador es la varianza de las puntuaciones totales del test. El numerador es la varianza verdadera, o la suma de covarianzas de los ítems.
Si los ítems no discriminan sus desviaciones típicas serán pequeñas, el numerador será menor y por consiguiente la fiabilidad también será menor. Si las desviaciones típicas son grandes pero los ítems no guardan relación bajara la fiabilidad, porque esa no relación entre los ítems hace que las puntuaciones totales no estén diferenciadas. La fuerza del contenido es compleja de obtener.
Primero, es necesario revisar cómo ha sido utilizada la variable por otros investigadores. Y en base a esta revisión se elaborará un universo de ítems posibles para medir la variable y sus dimensiones.
Los instrumentos cuyo nivel de medición en su respuesta es dicotómico (acierto – error, si – no, presencia – ausencia) para su cálculo de su confiabilidad requieren un procedimiento adecuado para sus condiciones. Es por ello que se muestra el procedimiento de cálculo de la confiabilidad de consistencia interna por medio de la fórmula de Kuder y Richardson (KR-20).
Ejemplo: Identificar los estilos de aprendizaje de los estudiantes. 15 preguntas tratan sobre cosas que el respondiente ha sentido o hecho. Formato de respuesta SÍ – No 416 estudiantes universitarios
Análisis
Escribimos el nombre de los datos que es necesario calcular: Sí = número de respuestas “Sí” en el ítem. p = proporción de sujetos que respondieron “Sí” sobre el número total de sujetos n sí/N q = que es la resta de 1 – p pq = multiplicación de los valores de p * q Vt = Varianza total de la distribución de puntaje ∑ pq = sumatoria de las pq [varianza individual de los ítems
Método de la división por mitades
Método de Alpha de Lee Cronbach
