

Asignatura




El modelo lineal clásico (MLC) en psicometría es una metodología estadística utilizada para analizar datos en contextos donde se espera que las variables sigan una relación lineal Aquí tienes un resumen de sus características y aplicaciones (Barrios, Bonillo, et al, 2013)
Cómo funciona: Imagina que quieres predecir los resultados de un examen basado en horas de estudio y asistencia a clases El MLC ayuda a cuantificar cuánto influye cada una de estas variables en el resultado del examen (Pietro & Delgado , 2010)
Supuestos básicos:
Relación lineal: Se asume que hay una relación directa y proporcional entre las variables
Independencia: Las observaciones no deben influirse entre sí
Consistencia: La variabilidad de los errores en las predicciones debe ser similar en todos los casos
Es una herramienta fundamental en la investigación para ayudar a comprender y predecir fenómenos
Ejemplo:Un profesor quiere predecir las calificaciones finales de sus estudiantes
Variables:
Variable dependiente (Y): Calificación final
Variables independientes:
X1: Horas de estudio por semana
X2: Porcentaje de asistencia a clases
: El modelo sugiere que:
¿qué nos indica?
Cada hora adicional de estudio aumenta la calificación en 2 puntos
Cada 10% de asistencia aumenta la calificación en 1 punto
En La teoría clásica de los test es un enfoque utilizado para evaluar y medir características psicológicas y habilidades a través de cuestionarios o tests (Córtes Peña, et al, 2013)
Puntuación Observada: Es el resultado que obtiene una persona en un test
Puntuación Verdadera: Es la puntuación que reflejaría el verdadero nivel de habilidad o rasgo de la persona, sin errores
Error de Medición: La diferencia entre la puntuación observada y la puntuación verdadera, que se debe a factores como el azar, el estado de ánimo del evaluado, o la claridad de las preguntas
ELa TCT se basa en la idea de que la puntuación observada (X) de un individuo en un test se compone de su puntuación verdadera (T) y un error de medición (E): X=T+EX = T + EX=T+E La puntuación verdadera representa el nivel real del rasgo, mientras que el error puede ser sistemático o aleatorio (Gonzáles, MJ 2012)
Error de medición
Un aspecto crucial es la naturaleza del error de medición Este puede surgir de diversas fuentes, como la ambigüedad de los ítems, el estado emocional del evaluado durante la prueba, o incluso el ambiente en el que se realiza el test La TCT enfatiza la importancia de minimizar estos errores para obtener puntuaciones más fiables .
Validez
La TCT también aborda la validez, que se refiere a la capacidad del test para medir lo que pretende medir Existen diferentes tipos de validez, como la validez de contenido (qué tan representativos son los ítems), la validez de criterio (cómo se relacionan las puntuaciones del test con otros criterios) y la validez de constructo (qué tan bien el test refleja la teoría subyacente del constructo) ( Crocker L 2008)
Ejemplo
Imagina que una madre quiere evaluar las habilidades culinarias de su hijo en una competencia familiar de cocina
La madre elige que el reto consiste en preparar un platillo específico, como una pasta El platillo se evaluará en base a sabor, presentación y creatividad, con un total de 30 puntos
Puntuaciones Observada
Después de que su hijo prepara la pasta, la madre le da una puntuación de 22 de 30
Puntuación Verdadera y Error:
La puntuación observada (22) refleja tanto la verdadera habilidad culinaria de su hijo como algunos factores que pueden haber influido, como el tiempo de cocción o distracciones en la cocina
Supongamos que su verdadera habilidad en la cocina es de 25 puntos El error de medición podría ser:
Puntuación observada (22) = Puntuación verdadera (25) + Error ( 3)
Estimación de la Fiabilidad:
Si la madre decide hacer otra competencia la siguiente semana y su hijo obtiene 22 puntos nuevamente, eso sugiere que su puntuación es consistente Sin embargo, si el resultado cambia drásticamente, podría indicar que las condiciones de la prueba (como ingredientes o el estado de ánimo) afectaron su rendimiento
La madre puede usar la puntuación de su hijo para comprender mejor sus habilidades culinarias y darle retroalimentación constructiva Es importante que ella considere el contexto de la competencia, ya que factores externos pued i fl i di i
Supuestos:
La puntuación de un test se puede descomponer en una puntuación verdadera y un error
Los errores son aleatorios y se distribuyen normalmente
Fiabilidad: La fiabilidad se refiere a la consistencia de un test Un test confiable producirá puntuaciones similares en diferentes momentos o condiciones
Validez: La validez evalúa si el test mide realmente lo que pretende medir Un test válido proporciona información útil y relevante sobre la característica que se evalúa
Ejemplo
Un estudiante realiza un examen de ciencias con un total de 100 puntos
1
Puntuación Observada:
El estudiante obtiene 68 puntos en el examen
2 Puntuación Verdadera:
Basado en su conocimiento previo y su desempeño en prácticas y tareas, se estima que su puntuación verdadera es de 80 puntos
3 Error de Medición:
La diferencia entre la puntuación observada (68) y la puntuación verdadera (80) es de 12 puntos
Cálculo: 80 68=1280 - 68 = 1280 68=12
Puntuación Observada: 68 puntos (lo que realmente obtuvo)
Puntuación Verdadera: 80 puntos (lo que podría haber obtenido sin errores)
Los test paralelos son dos o más versiones diferentes de un mismo test que están diseñadas para medir la misma habilidad o constructo, y se espera que tengan propiedades psicométricas similares, como la media y la varianza Se utilizan para evaluar la fiabilidad de las mediciones Al comparar los resultados de diferentes versiones, se puede determinar si las puntuaciones son consistentes (Lopera)
Características
Equivalencia: Los test deben ser equivalentes en términos de dificultad y contenido, de modo que un individuo obtenga puntuaciones similares independientemente de la versión que realice
Uso en Diferentes Contextos: Permiten realizar evaluaciones en distintos momentos o con diferentes grupos sin que la variabilidad en las puntuaciones se deba a diferencias en el test
Ejemplo
Ejemplo: Imagina un test de matemáticas que se aplica en dos versiones: Test A y Test B Ambos test evalúan las mismas habilidades matemáticas, pero contienen diferentes preguntas Si un estudiante saca 75 en el Test A y 76 en el Test B, esto sugiere que el test es fiable y que mide de manera consistente la habilidad matemática
Los supuestos básicos en la teoría de los test son fundamentales para asegurar que las evaluaciones sean válidas y confiables Primero, la equivalencia implica que diferentes versiones de un test deben medir el mismo constructo con un nivel de dificultad comparable, lo que significa que un individuo debería obtener puntuaciones similares en diferentes versiones del mismo test En segundo lugar, la consistencia establece que las puntuaciones de un individuo deben ser similares al realizar distintas versiones del test, lo que refleja la estabilidad de la habilidad o rasgo que se mide (N, 2004)
Luego está la homocedasticidad, que requiere que la variabilidad de las puntuaciones sea uniforme entre las diferentes versiones del test, asegurando que no haya diferencias significativas en la dispersión de los resultados
La independencia de los errores es otro supuesto clave, que establece que los errores de medición deben ser aleatorios y no estar correlacionados entre versiones, de modo que un error en una puntuación no influya en las puntuaciones de otras versiones Finalmente, el supuesto de normalidad indica que las puntuaciones de un test deben seguir una distribución normal en la población, lo que facilita el uso de métodos estadísticos y permite realizar comparaciones significativas Cumplir con estos supuestos es crucial para que los resultados de las evaluaciones sean interpretables y útiles (Lopera)
El índice de fiabilidad es una medida que evalúa la consistencia y estabilidad de un test Indica en qué medida las puntuaciones obtenidas son reproducibles en diferentes condiciones o momentos Este índice se expresa generalmente en una escala de 0 a 1, donde un valor más cercano a 1 sugiere una alta fiabilidad, indicando que el test produce resultados similares bajo condiciones similares Un índice de fiabilidad bajo puede indicar problemas en el diseño del test o en la medición del constructo La fiabilidad es esencial para asegurar que los resultados sean válidos y útiles en la evaluación de habilidades o rasgos (Lacave Rodero, et al, 2015)
Valor numérico (0 a 1) que cuantifica la fiabilidad de un test Un coeficiente de 085 indica que el test es bastante fiable Si el coeficiente es 060, podría ser necesario revisar el test para mejorar su consistencia (N, 2004)
El error típico de medida es una estimación del error de medición que se espera en las puntuaciones de un test Indica cuánto puede variar la puntuación observada de la puntuación verdadera Un menor error típico sugiere que las puntuaciones son más precisas y fiables, permitiendo una mejor interpretación de los resultados (Pietro & Delgado , 2010)
Ejemplo
Ejemplo: Imagina que un test de personalidad da una puntuación de 65, y el error típico de medida es 4 Esto sugiere que la puntuación verdadera del individuo podría estar entre 61 y 69 Esto ayuda a entender que la puntuación observada no es exacta y que hay un rango de incertidumbre (Ato, M 2013)
Los tipos de estimación de la fiabilidad se utilizan para evaluar la consistencia de un test y incluyen:
1
División por Mitades: Se divide el test en dos partes y se correlacionan las puntuaciones Por ejemplo, en un test de 30 preguntas, se pueden usar las primeras 15 para una parte y las últimas 15 para la otra
2 Consistencia Interna: Evalúa cómo las preguntas del test se correlacionan entre sí Por ejemplo, en un test de conocimientos sobre historia, se mide si las respuestas a preguntas sobre eventos similares son coherentes
procedimientos para estimar la precisión de las puntuaciones
división por mitades
El test se divide en dos partes (por ejemplo, preguntas pares e impares) y se correlacionan las puntuaciones para evaluar la consistencia
Se refiere a la correlación entre ítems de un test Un test con alta consistencia interna implica que los ítems están relacionados y miden el mismo constructo, lo que resulta en puntuaciones coherentes entre ellos
Alpha de Cronbach: Mide la correlación promedio entre todos los pares de ítems Un valor de 07 o más suele considerarse aceptable
Método de dos mitades: Divide el test en dos mitades y calcula la correlación entre ellas
Kuder-Richardson: Específico para tests dicotómicos (respuestas correctas o incorrectas), mide la consistencia de los ítems
Test-Retest:
El mismo test se aplica a un grupo en dos momentos diferentes, y se correlacionan las puntuaciones para evaluar la estabilidad a lo largo del tiempo
Los procedimientos de dos administraciones son métodos utilizados para evaluar la fiabilidad de un test al administrarlo dos veces a los mismos participantes Este enfoque ayuda a determinar la consistencia de las puntuaciones a lo largo del tiempo
El propósito principal es medir la estabilidad de las puntuaciones del test Se busca verificar si los resultados obtenidos en la primera administración son similares a los de la segunda (Cosculluela et al, 2013)
Es importante considerar el tiempo entre las dos administraciones Este intervalo puede variar desde unos días hasta varias semanas, dependiendo del constructo medido Un intervalo demasiado corto puede no reflejar cambios reales, mientras que uno muy largo podría introducir variabilidad debida a otros factores Después de ambas administraciones, se calculan correlaciones entre las puntuaciones obtenidas Una alta correlación sugiere que el test es estable y mide consistentemente el mismo constructo en ambas ocasiones
Este procedimiento se centra en evaluar cómo las distintas preguntas de un test están correlacionadas entre sí en una única aplicación Se utiliza para verificar si todas las preguntas miden el mismo constructo de manera coherente (Pietro & Delgado , 2010)
Imagina que un profesor aplica un test de 15 preguntas sobre literatura a sus alumnos Las preguntas abarcan temas como géneros literarios, análisis de poemas y biografías de autores Tras la administración del test, el profesor analiza las respuestas y encuentra que las preguntas sobre géneros literarios tienen una alta correlación con las de análisis de poemas, lo que sugiere que los estudiantes que comprenden bien un tema también comprenden bien el otro Al calcular el alpha de Cronbach, obtiene un valor de 087, lo que indica una buena consistencia interna Esto significa que las puntuaciones reflejan de manera confiable el conocimiento literario de los estudiantes en una sola administración del test (Lacave Rodero, et al, 2015)
La técnica de "dos mitades" evalúa la consistencia interna de un test dividiéndolo en dos partes y comparando sus resultados
El test se divide en dos mitades, que pueden ser seleccionadas al azar o siguiendo un criterio específico, como ítems alternos
Se mide la relación entre las puntuaciones de las dos mitades Una alta correlación sugiere que ambas mitades están midiendo el mismo constructo de manera similar (Graham, J W 2012)
A partir de la correlación, se utiliza el coeficiente de Spearman-Brown para ajustar y calcular la fiabilidad total del test
Este método permite identificar ítems que pueden no alinearse bien con el resto del test, ofreciendo una oportunidad para mejorar la calidad de la evaluación
En pruebas adaptativas, donde las preguntas se seleccionan según el rendimiento del participante, la técnica de dos mitades puede ayudar a validar la consistencia de la selección de ítems en diferentes niveles de dificultad
Basado en la técnica de covarianza, permite comparar las covarianzas entre diferentes subgrupos (por ejemplo, género, edad, nivel educativo) Esto puede ayudar a identificar si el test es igualmente válido para todas las poblaciones (León, 2019)
Al examinar las diferencias en las puntuaciones de las dos mitades, se pueden analizar los residuos para identificar patrones de respuesta inusuales o sesgos que podrían no ser evidentes en una evaluación general La covarianza puede ayudar a revelar la estructura subyacente del test Si las dos mitades muestran una covarianza baja, podría indicar que el test abarca múltiples constructos que no están adecuadamente representados
El coeficiente de fiabilidad es una medida estadística que indica la consistencia y estabilidad de un instrumento de evaluación (como un test o cuestionario) Se expresa generalmente como un valor entre 0 y 1, donde valores cercanos a 1 indican que el instrumento produce resultados coherentes y confiables a lo largo del tiempo o entre diferentes ítems, mientras que valores cercanos a 0 sugieren que hay una alta variabilidad en las puntuaciones, lo que implica una baja consistencia interna o estabilidad del test (Closas, 2013)
Longitud del Test: Un test más largo, con más preguntas, generalmente tiene una mayor fiabilidad porque puede capturar mejor el rendimiento del evaluado
Homogeneidad del Constructo: Si el test mide un solo tema de manera clara (por ejemplo, solo matemáticas), es más probable que tenga una alta fiabilidad Si mide temas variados (matemáticas, lenguaje, ciencias), puede haber inconsistencias
Diversidad de la Muestra: Cuando los participantes son muy diferentes entre sí en habilidades o características, es más fácil medir diferencias reales, lo que puede aumentar la fiabilidad del test
Errores en la Medición: Cualquier error en las preguntas o en cómo los evaluados responden puede afectar la fiabilidad Preguntas confusas o mal formuladas pueden llevar a respuestas inconsistentes Gonzáles, MJ (2012)
Método de Cálculo: La forma en que se calcula la fiabilidad (por ejemplo, usando diferentes análisis estadísticos) puede afectar el valor obtenido Diferentes métodos pueden dar resultados distintos
Al adentrarnos a los diferentes métodos psicométricos y verificar sobre los diversos temas que hemos explorado, se determina la conexión que tienen los diferentes tipos de test, y como influyen en todos los aspectos de la evaluación psicológica La consistencia interna, los coeficientes de fiabilidad y los procedimientos de administración nos proporcionan las herramientas necesarias para asegurar que nuestras mediciones sean precisas y significativas Cada uno de estos elementos juega un papel crucial en la validación de los tests y en la comprensión de la complejidad de la experiencia humana
La importancia de entender los factores que afectan la fiabilidad no puede ser subestimada Cada test que administraremos no solo mide habilidades o rasgos, sino que también refleja las circunstancias y el contexto de cada individuo El conocimiento de esta temática, nos hace más consciente de la responsabilidad que tenemos como futuros psicólogos: no solo evaluar, sino también entender y respetar la historia personal de cada persona
A lo largo del estudio de los diversos métodos y enfoques en psicometría, se ha evidenciado la relevancia de la fiabilidad y validez en la construcción de instrumentos de evaluación La consistencia interna y los coeficientes de fiabilidad son esenciales para garantizar que los resultados obtenidos reflejen de manera precisa el constructo que se pretende medir Los procedimientos que requieren dos administraciones, así como el análisis de tests paralelos, proporcionan un marco robusto para evaluar la estabilidad y la precisión de las puntuaciones Al mismo tiempo, la técnica de dos mitades y el análisis basado en covarianza permiten una comprensión más profunda de las interrelaciones entre ítems
Barrios, M, Bonillo , A, Cosculluela , A, & Valero Ventura , S (febrero de 2013) Psicometría Universitat Oberta de Catalunya Obtenido de https://openaccessuocedu/handle/10609/69325
Córtes Peña , O F, Fonseca Consuegra, L, García Roncallo, P, & Mariño Buitrago, J (2013) análisis desde la teoría clásica de los test y la teoría de respuesta al ítem 20(02) Obtenido de http://wwwscieloorgco/scielophp?pid=S012143812013000200006&script=sci arttext
Lacave Rodero, C, Molina Díaz, A I, Fernández Guerrero, M, & Redondo Duque, M (2015) Análisis de la fiabilidad y validez de un cuestionario Universitat Oberta La Salle Obtenido de https://upcommonsupcedu/handle/2117/76844
León, J L (2019) alfa de Cronbach Universidad Privada del Norte Obtenido de file:///C:/Users/ergom/Downloads/1037Texto%20del%20art%C3%ADculo-3049-2-10-22190124pdf
Lopera, J O (sf) Procedimientos paralelos basados en los coeficientes de Reed-Muller para la generación de patrones de test Universidad de Granada Obtenido de https://produccioncientificaugres/documentos/60caa368d08752 0e32f4881f
N, K (2004) Teoría de Respuesta al Ítem: Supuestos Básicos Laboratorio de Evaluación Psicológica y Educativa Facultad de Psicología(04) Obtenido de file:///C:/Users/ergom/Downloads/revistas,+Journal+manager,+60 0-2062-1-CEpdf
Pietro , G, & Delgado , A R (2010) Fiabilidad y validez Consejo General de Colegios Oficiales de Psicólogos, 31(01) Obtenido de https://wwwredalycorg/pdf/778/77812441007pdf
Closas, A H (Junio de 2013) Análisis multivariante, conceptos y aplicaciones en Psicología Educativa y Psicometría Universidad Tecnológica Nacional, 25(01) Obtenido de https://wwwscieloorgar/scielophp?pid=S166927212013000100005&script=sci arttext&tlng=p
Graham, J W, & Schafer, J L (2012) Missing data: Analysis and design Annual Review of Psychology, 63, 549-577 https://doiorg/101146/annurev-psych-120710-100353
Ato, M, López, J, & Vallejo, G (2013) La psicometría y su papel en la evaluación psicológica Análisis y Modificación de Conducta, 39(1), 15-34
Crocker, L, & Algina, J (2008) Error de medición y su impacto en la validez de los tests En L Crocker & J Algina, Teoría clásica y moderna de los tests (pp 145-167) Madrid: Ediciones Pirámide
González, M J, & Hernández, L (2012) Errores de medición en psicología: Implicaciones para la evaluación y la práctica clínica Psicología y Salud, 22(2), 125-138