Portafolio Estadística

Page 1

PORTAFOLIO ESTADÍSTICA

NOMBRE: GABRIELA MARYORIE MOLINA CASTILLO 20191486


Introducción: El tema de la estadística es algo común, los datos constantemente están en proceso de análisis y constante observación ante los cambios. Esos cálculos se hacen de forma automática, pero también de forma empírica, igualmente la especialización en el campo es importante. En lo personal, no tengo conocimiento profundo del tema, pero en general, las gráficas permiten que los datos sean analizados de una forma fácil y sin tener conocimiento, al tomar este curso se entenderá todo el proceso de análisis de datos y también el por qué de algunos resultados; igualmente servirá en el área profesional para hacer estimaciones que nos aporten a mejorar la calidad laboral.


Estadística Descriptiva: Se pueden encontrar diversas definiciones descriptiva, entre ellas podemos definir:

de

estadística

1. Trata de la descripción de una serie de datos (Triola, 2009). 2. Se encarga de reunir, presentar y organizar datos; dichos datos están presentados en gráficos o en elementos visuales fáciles de comprende (Matus, 2010). 3. Se compone de aquellos métodos que incluyen técnicas para recolectar, presentar, analizar e interpretar datos. Tiene como función el manejo de los datos recopilados en cuanto se refiere a su ordenación y presentación, para poner en evidencia ciertas características en la forma que sea más objetiva y útil. Investiga los métodos y procedimientos y establece reglas para el manejo de los datos sea más eficiente y para que la información entregada resulte confiable, y exprese correctamente ciertos contenidos en un lenguaje y que permita que cualquier persona los comprenda y pueda establecer comparaciones (Linás Solano, Estadística descriptiva y distribuciones de probabilidad, 2017).


Estadística Inferencial:

1. Se ocupa del análisis de datos, con el propósito de extraer conclusiones de una población de estudio (Matus, 2010). 2. Abarca métodos y conjuntos de técnicas que se utilizan para obtener conclusiones sobre leyes de comportamiento de una población, basándose en datos de muestras tomadas de una población (Martínez, 2020) 3. Las técnicas y métodos utilizados por la ciencia estadística, tanto en su parte descriptiva con la parte inferencial, son los llamados Métodos estadísticos (Linás Solano, Estadística descriptiva y distribuciones de probabilidad, 2017) 4. Involucra la utilización de una muestra para sacar alguna inferencia o conclusión sobre la población la cual procede la muestra. Se define como aquellos métodos que hacen posible la estimación de una característica de una población o la toma de una decisión referente a una población, basándose sólo en resultados de la muestra; su objetivo es obtener información acerca de la población, partiendo de la información que contiene la muestra (Facultad de Ingeniería USAC, 2011).


Cuadro comparativo entre estadística descriptiva e inferencial


Ejemplos: Descriptiva: 1. La media de goles de un jugador en la liga de campeones. 2. La opinión de personas sobre un tema, según la edad, sexo o estatus social. 3. El tipo de sangre que tiene un grupo de personas y la incidencia de las mismas en los hospitales. 4. Identificar las habilidades de un grupo de estudiantes en lectura, matemáticas, lenguaje, entre otros. Inferencial: 1. Predecir el precio de la gasolina en x cantidad de tiempo 2. Qué producto prefieren las personas en un supermercado según la posición de los productos. 3. Las horas que se le dedican a la televisión de acuerdo a una programación específica. 4. Estudios de mercado y la demanda de ciertos productos. En conclusión, la estadística abarca un campo muy amplio en el análisis de datos, estos datos pueden ser predictivos, obtenidos de otra serie de datos, comparaciones para un antes y un después, el comportamiento de algunos fenómenos y la fácil interpretación para mejorar el ambiente o identificar un problema específico.

En conclusión, la estadística abarca un campo muy amplio en el análisis de datos, estos datos pueden ser predictivos, obtenidos de otra serie de datos, comparaciones para un antes y un después, el comportamiento de algunos fenómenos y la fácil interpretación para mejorar el ambiente o identificar un problema específico.


En su trabajo profesional ¿Cuál ha sido su encuentro con la estadística? Realmente no he tenido un acercamiento profundo, simplemente el uso empírico de algunas medidas que se aplican dentro del área educativa, que permiten visualizar de algún modo datos que son importantes para los docentes, pero sin ser objetivos. En sí es una herramienta que puede proveer mucha información, pero la falta de conocimiento o aplicación de la misma, crea una barrera en la cual se desperdicia el recurso. ¿Cómo la ha integrado en su labor profesional? En el trabajo profesional su aplicación es mucho más escueta, dado que se estrecha en la aplicación de promedios o estimaciones. ¿Qué le gustaría conocer, profundizar? Diagrama de Lotus

Fuente: Elaboración propia


Enumere qué tipo de datos tiene a su alcance dentro de su trabajo y que le gustaría utilizar para aplicar las funciones de estadística que aprenderemos. Revise el programa del curso. Los datos que se tienen al alcance para el análisis estadístico son: Notas de evaluaciones diagnósticas Notas de unidades Edad de estudiantes Zonas en donde residen los estudiantes Cantidad de cursos aprobados y reprobados Datos actitudinales Para el análisis de datos sería útil utilizar: Interpretación de datos aplicados a la educación Analizar datos de acuerdo a notas de clase, según criterios específicos. Aplicación de gráficas y su explicación. ¿Qué gráficas son las más adecuadas según el caso?

Realice una autoevaluación indicando cuáles son sus fortalezas y áreas de oportunidad para trabajar en el curso de estadística descriptiva. Cree un formato para presentar su autoevaluación (5 áreas)


Medidas de tendencia Central: Definición: Informan sobre los valores medios del conjunto de datos. Utilidad, función: Son indicadores usados para señalar qué porcentaje de datos dentro de una distribución de frecuencias superan estas expresiones, cuyo valor representa el dato que se encuentra en el centro de la distribución de frecuencias, es por ello que recibe su nombre. Proceso de cálculo: Las medidas de tendencia central según el dato a calcular tiene una forma específica de cálculo, el cual se detalla en cada una de ellas posteriormente en este documento. Ejemplo: Media, Moda, Mediana, Desviación estándar. Lectura e interpretación de datos presentados: Cada una de las medidas determina el comportamiento de los datos, con ello puede evidenciarse en donde se encuentra la mayor concentración de un fenómeno ocurrido o bien, la dispersión de los datos en una o varias variables. Recomendaciones: Se debe definir específicamente si el muestreo será aleatorio o no aleatorio, con reemplazo y sin reemplazo y tomar en cuenta el tamaño de la población para aplicar la medida correcta de acuerdo a la cantidad de datos.


Media Definición: La media o promedio es una medida de posición que proporciona una descripción compacta de cómo están centrados los datos y una visualización más clara del nivel que alcanza la variable, puede servir de base para medir o evaluar valores extremos y brinda mayor facilidad para efectuar comparaciones. Es importante poner en relieve que la notación de promedio lleva implícita la idea de variación y que este número promedio debe cumplir con la condición de ser representativo del conjunto de datos. Utilidad, función: El promedio como punto típico de los datos es el valor alrededor del cual se agrupan los demás valores de la variable. Proceso de cálculo: El proceso es diferente para cada grupo de datos, si la muestra es menor a 20 datos se utiliza la fórmula de datos no agrupados, mientras siendo mayor la fórmula de datos agrupados, las cuales se presentan a continuación.

Ejemplo: Muestra de edades en un año de participantes de una universidad. 18, 18, 18, 18, 19, 19, 19, 20, 20, 21. Entonces, la media aritmética de estos datos es: X=18+18+18+18+19+19+19+20+20+2110=19 Lectura e interpretación de datos presentados: El promedio de edad, es decir, la edad de los estudiantes de una universidad está centrada en 19 años. Recomendaciones: Aunque es confiable porque refleja todos los valores del conjunto esta puede ser afectada por los valores extremos y así puede llegar a ser afectada por los valores extremos y así llegar a una medida menos representativa.


MEDIANA Mediana Definición: Es el valor de observación que ocupa la posición central de un conjunto de datos ordenados según su magnitud. Es el valor medio o la media aritmética de los valores medios. La mediana es un valor de la variable que deja por debajo de él un número de casos igual al que deja por arriba. Utilidad, función: La mediana es el valor de la variable que corresponde a la vertical que divide al histograma en dos áreas iguales.


Ejemplo: Encontrar la mediana de la siguiente serie de datos: 8, 7, 6, 5, 9, 15, 14, 13, 11, 7, 12 (impares) Caso 1: ordenando datos 5, 6, 7, 7, 8, 9, 11, 12, 13, 14, 15; siendo el total de datos 11, Se realiza el conteo y se selecciona el dato central. Me = la posición central de la serie de datos es 9. Caso 2: Calcular la mediana de la serie de datos (pares): 2, 3, 9, 21, 18, 12, 4, 4, 15, 17 Ordenando datos: 2, 3, 4, 4, 9, 12, 15, 17, 18, 21 Los elementos centrales son 9 y 12; por lo tanto, la mediana es: Me=9+122=10.5 Lectura e interpretación de datos presentados: El dato que representa el 50% de los datos, por lo tanto, siendo la cantidad de datos pares, será un dato específico, mientras que, siendo datos impares, hay que determinarlo con el promedio de ambos datos centrales. Recomendaciones: Cuando determinados valores de un conjunto de observaciones son muy grandes o pequeños con respecto a los demás, entonces la media aritmética se puede distorsionar y perder su carácter representativo, en esos casos es conveniente utilizar la mediana como medida de tendencia central, es decir que la mediana no presenta el problema de estar influida por los valores extremos, pero en cambio no utiliza en su cálculo toda la información de la serie de datos (no pondera cada valor por el número de veces que se ha repetido).


Frecuencia Se refiera al proceso de conteo o cantidad de veces que se repite un evento en un intervalo. Estas se subdividen en dos tipos; 1. Frecuencia absoluta: Se denomina frecuencia absoluta (n) a la cantidad de veces que se presenta el valor Xi de la variable X en la muestra o población. Se debe tener en cuenta que el total de datos debe corresponder a la suma de las frecuencias absolutas. 2. Frecuencia relativa: La frecuencia relativa (h) se define como el porcentaje de frecuencia absoluta en relación al total de datos de la muestra (n). Se obtiene con el cociente entre la frecuencia absoluta y el total de datos.

Moda

1. Definición: Es el valor de un conjunto de datos que ocurre más frecuentemente, se considera como el valor más típico de una serie de datos (Facultad de Ingeniería USAC, 2011). 2. Utilidad, función: Para datos agrupados se define como Clase Modal el intervalo que tiene más frecuencia. La moda puede no existir o no ser única, las distribuciones que presentan dos o más máximos relativos se designan de modo general como bimodales o multimodales respectivamente. Proceso de cálculo:

Ejemplo: Encontrar la moda de la siguiente serie de datos: 8, 7, 6, 5, 9, 15, 14, 13, 11, 7, 12. Paso 1: ordenando datos 5, 6, 7, 7, 8, 9, 11, 12, 13, 14, 15; Lectura e interpretación de datos presentados: La moda para datos simples se refiere al dato que más se repite, por lo tanto, el número 7 se repite 2 veces, por lo que la moda es 7. Recomendaciones: La moda no permite conocer la mayor parte de los datos, representando más elementos que cualquier otro valor. Puede ser utilizada en datos cualitativos como cuantitativos.


Autorización del Centro Educativo para Tabular Datos

En el centro educativo se solicitó autorización para utilizar los datos de 15 estudiantes, que cursan actualmente sexto grado de nivel primario, estos resultados son tomados del curso de Tecnologías de la Información. Se seleccionan estos datos debido a que el análisis a realizar en esta entrega corresponde a datos simples. La autorización se hizo de forma verbal, se omiten nombres y datos sensibles para la protección de los estudiantes involucrados en el análisis. Elección de la información Se eligió el grupo de estudiantes de sexto primaria, debido a que muestran una variación visualmente marcada en las notas, esto puede ser un buen tema de análisis de medidas de tendencia central porque los resultados tendrían diferentes tendencias y se comprendería de mejor manera el concepto de los mismos. Descripción de la fuente de datos: La fuente de datos se obtuvo al ejecutar el proceso sumativo con diversos instrumentos de evaluación, representan las notas de la tercera unidad en la clase de Tecnologías de la Información y Comunicación, del año 2022. Se realizó en los meses comprendidos de mayo a agosto, recaudando la información a través de diversos proyectos, los cuales se clasificaban con rúbricas, listas de cotejo y observación.

Tabla de datos resultados de Tercera Unidad de los estudiantes de Sexto Primaria en un centro educativo privado La presente tabla se utilizará para el proceso estadístico y análisis de datos de la Media, Moda, Mediana y Desviación estándar, además de otras interpretaciones.


Interpretación y cálculo de los datos Ordenamiento de datos, para el cálculo de las medidas de tendencia central





1


Interpretación de los datos: según el resultado de las medidas de tendencia central, se puede observar que los datos no se encuentran tan dispersos en comparación a la mediana y moda, pero sí existe una variación respecto a la media, es decir que existen picos superiores e inferiores de datos. En la interpretación educativa, puede relacionarse como resultados sanos, puesto que la mayoría de los estudiantes ponderan de forma alta, pero no se debe descuidar a una minoría ya que pueden obtener bajas calificaciones y así cambiar el estatus de los datos a la baja. Reflexión Personal 1. ¿Qué se me facilita, qué se me dificultó? Se me dificulta la interpretación de los datos, aún no comprendo en su totalidad que representa realmente cada medida, en especial la desviación típica y las unidades en las que se interpreta cada dato. 1. ¿Qué haría diferente la siguiente vez? En función docente, establecer estrategias que mejoren ese porcentaje que se encuentra bajo, en función de cálculos, compararía estos datos con los nuevos con la finalidad de ver las tendencias y verificar el rendimiento general del grupo. 1. ¿A qué debo prestar más atención? A los cálculos, dado que pueden tender a la confusión si no se está concentrado, en el área docente a los resultados de los estudiantes que se encuentran dispersos, porque nuestra meta es que la mayoría de los estudiantes se encuentren en sobresaliente. 1. ¿Qué nuevos usos le puedo dar? Realizando una comparativa de resultados cada bimestre y así poder evidenciar el avance que hayan tenido los estudiantes en función a su avance, pensar en nuevas estrategias a implementar, así como el análisis de diversos datos que ayudados con otras ciencias, pueden brindarnos una lógica del comportamiento académico y afectivo de los estudiantes.


Constancia de Operaciones en Excel Puede verificar los cálculos realizados en Excel en la siguiente dirección:

Puntuación Directa Definición: Es el valor derivado de la medición directa de un elemento y la frecuencia de la puntuación directa es el número de veces que ese valor se repite en una serie de elementos, es decir, la muestra, estas se designan por letras mayúsculas latinas (García Pedraza, 2012). También puede definirse como la medida directa en cualquier estudio o experimento que se ha obtenido directamente sobre los objetos, individuos o entidades con los instrumentos usuales de medida (Roldán Martínez, n.d.). Este tipo de medida puede obtenerse mediante operaciones matemáticas o de ordenación, pueden establecerse otras medidas que informan el mismo fenómeno, destacando otros aspectos. Por qué es necesaria calcularla Su cálculo es importante porque se obtienen las puntuaciones directas y sus repeticiones, con la finalidad de determinar los estadísticos de tendencia central o dispersión. En estadística, la Desviación Media sería la dispersión media de las puntuaciones directas, en relación a la puntuación media o dependiendo de la frecuencia de las puntuaciones directas, también permite establecer los valores observados de una variable Se pueden tomar como medidas directas la estatura en centímetros, la edad en años, la producción de una fábrica en unidades de medida, entre otros.


Puntuaciones típicas

La puntuación típica es propia de cada persona, es decir, de un grupo de n personas, tenemos n puntuaciones típicas, pero sólo una desviación típica. Una puntuación típica expresa en cuántas desviaciones típicas se aparta una puntuación individual de la media de su grupo.

1

Las puntuaciones típicas son puntuaciones diferenciales, es decir, poseen diferencias respecto a la media, expresadas como unidad de la desviación típica. En las puntuaciones típicas si se puede decir que hay unidad, que es la desviación típica. Este tipo de puntuación se representa por medio de la letra z y se calcula de la siguiente manera:


Se observa que la puntuación directa de estas tres personas ha sido transformada a un nuevo valor. En el ejemplo puede verificarse que: - Si un dato es igual a la media, la puntuación típica será igual a cero; al restarlos de la media, se obtiene cero. - Todos los que tienen una puntuación directa superior a la media, tendrán una puntuación típica con signo positivo. - Todos los que tengan una puntuación directa inferior a la media, tendrán una puntuación típica con signo negativo. Todos los datos quedan distribuidos en torno a una media = 0. El orden de los sujetos sigue siendo el mismo, pero el valor absoluto es distinto. Los valores extremos tienden a estar entre -3 y 3, cualquiera que sea la magnitud de las puntuaciones originales; si los valores tienen decimales, únicamente se conservan dos. La utilidad de las puntuaciones típicas, es comparar y valorar resultados individuales. De todas las puntuaciones, las puntuaciones típicas son probablemente las más interesantes y más útiles.


Puntuaciones diferenciadas, puntuaciones típicas, definición de utilidad, ejemplos de su proceso La puntuación diferencial es la piedra angular para la construcción de los estadísticos de dispersión, el primero de ellos, desviación media, en donde quitándole el signo de las puntuaciones diferenciales se multiplican por la frecuencia de su respectiva puntuación directa, y el resultado final de la suma se divide entre el sumatorio de la frecuencia, la frecuencia total.

Ejemplo (Interpretación) Considerando los datos mostrados, se representan las puntuaciones obtenidas por un grupo de estudiantes en dos pruebas:

Al comparar ambos resultados, pareciera que el B es el mejor resultado, ahora bien, realicemos la diferencia entre la puntuación y la media obtenemos que:


Las puntuaciones diferenciales del primer estudiante son diferentes. En cambio, las posiciones relativas son las mismas. En conclusión, las puntuaciones diferenciales no miden la posición relativa correctamente. Al analizar los datos identificamos que lo que cambia es la variación de datos.

Como se construye un intervalo, que es lo más utilizado, como se representa colocar diferentes ejemplos. Cuando el número de valores distintos que toma la variable estadística es demasiado grande o la variable es continua no es útil elaborar una tabla de frecuencias. En estos casos se realiza un agrupamiento de los datos en intervalos, haciendo y se hace un recuento del número de observaciones que caen dentro de ellos. A estos intervalos se le denominan intervalos de clase, y el valor de la variable en el centro de cada intervalo se denomina marca de clase. De esta forma se sustituye cada medida por la marca de clase del intervalo que corresponda. A la diferencia entre el extremo superior e inferior de cada intervalo se le llama amplitud del intervalo Los valores de una variable cuantitativa se pueden agrupar por intervalo, no obstante, no se recomiendan porque se produce una pérdida significativa de información, además de permitir el análisis de todos los valores. Los intervalos se utilizan para facilitar las tomas de datos y posteriores análisis estadísticos. Para calcular el intervalo: 1. Calcular el rango de datos, el cual es la diferencia entre el dato mayor y el dato menor. 2. Determinar el número de clases: utilizando la fórmula 1 + 3.33* log (cantidad de datos). 3. Se calcula el intervalo realizando la operación intervalo =rango de datos número de clases 4. El resultado obtenido se le suma al dato menor, restando 1 en su contenido.


Ejemplo:

Percentiles El percentil es una medida estadística de posición, que divide la distribución ordenada de los datos en cien partes iguales. Esta medida de posición no central aporta información sobre el porcentaje de observaciones de una variable, ordenados de menor a mayor, que si sitúan por debajo del valor de este. Utilidad o función El percentil, en estadística, es un valor que sirve para comparar un conjunto ordenado de datos. Para resumir de forma sencilla, el percentil nos indica en el caso de los bebés y niños si, comparados con otros de su misma edad y sexo, se encuentran dentro de la media. El concepto es más sencillo de entender con unos ejemplos: Ejemplo 1 Tenemos un conjunto de datos consistente en la nota de cada uno de los alumnos de una clase. Si un alumno tiene un 9,5 y está en el P85 (percentil 85), significa que el 85% de los alumnos tiene un 9,5 o menos.


Ejemplo 2 Tenemos unas muestras con los sueldos de 10.000 trabajadores. ¿Cuál sería el percentil 60? El P60 sería aquel sueldo por debajo del cual estaría el 60% de los trabajadores, es decir, si ordenamos los trabajadores desde el que cobra menos hasta el que cobra más, el P60 sería el sueldo del trabajador número 6.000 (60% de 10.000). Ejemplo 3 Si medimos el tiempo que tarda cada uno de los atletas de una competición en recorrer una cierta distancia. ¿Cuánto tiempo tardan en recorrer esta distancia el 45% de los corredores? La respuesta es el percentil 45. La idea es simple, encontrar un porcentaje a partir del cual los valores son iguales o están por debajo. Forma de calcularlo: Para calcular un percentil correspondiente a una observación y dado que se emplea la expresión siguiente

Para encontrar el percentil de una muestra ordenada de tamaño n, se utiliza para encontrar el localizador:

Por ejemplo, considere un curso de cuarenta alumnos que se forma en línea por orden de estatura, primero los grandes y al final los chicos. Suponga, además, que se considera ‘chico’ a un alumno de la cuarta parte final de esta línea. Éste es un concepto relativo a este curso, con toda seguridad variará al referirse a otro. Es fácil aceptar que los ‘chicos’ de octavo básico tienen menor estatura que los ‘chicos’ de cuarto medio. Como la cuarta parte corresponde al 25% de la población, en el ejemplo que se menciona, los chicos de un curso, son aquellos cuya estatura no supera el ‘percentil veinticinco’ de la población formada por los alumnos del curso. Si una variable pudiese asumir muchos valores, la representación de la proporción del total, menor o igual que un valor, tendría una forma creciente parecida a la siguiente:


2. En su trabajo profesional ha tenido la oportunidad de analizar, recibir datos de percentiles, puntuaciones típicas, desviación estándar etc. Explique su experiencia. - Se han utilizado para identificar las pruebas de certificación Microsoft y la coincidencia de respuestas correctas. - Análisis del rubro de lectura comprensiva impuesta por el Ministerio de Educación. - El porcentaje de aumento y el alcance que puede tenerse en diversas áreas.

3. Enumere qué tipo de datos tiene a su alcance dentro de su trabajo y que le gustaría utilizar para aplicar las puntuaciones directas y típicas, percentiles. Los tipos de datos a los cuales se tiene acceso son de tipo cuantitativo y algunos pocos cualitativos en la aplicación del diplomado de liderazgo. Las utilizaría en función de la comparación y predecir el desempeño que puede haber en cierta unidad de tiempo en toda el área educativa.


Elección de la información Se eligió el grupo de estudiantes de sexto primaria, puesto que se evidencia una variación marcada entre la evaluación parcial de la tercera unidad y la evaluación parcial de la cuarta unidad. Las evaluaciones corresponden al presente año escolar.

Descripción de la fuente de datos: La fuente de datos se obtuvo al ejecutar el proceso de evaluación, utilizando un cuestionario como medio de recopilación de datos. En este proceso, se comparan ambos grupos de datos, debido a que la forma de aprendizaje es continua, es decir, el contenido de la unidad anterior se utiliza como presaberes de la unidad actual y, por lo tanto, se evalúan. Las notas corresponden a la asignatura de Tecnologías de la Información y Comunicación, del año 2022, realizado en los meses comprendidos de junio a septiembre.

Tabla de datos resultados de prueba parcial Tercera Unidad de los estudiantes de Sexto Primaria en un centro educativo privado La presente tabla se utilizará para el proceso estadístico y análisis estadístico de puntuación directas, diferenciales y típicas. Tabla 1: Notas de Evaluación Parcial Unidad 3 Estudiantes de la clase de Tecnologías de la Información y comunicación

Fuente: Elaboración propia


Tabla 2: Notas de Evaluación Parcial Unidad 4 Estudiantes de la clase de Tecnologías de la Información y comunicación

Fuente: Elaboración propia

Puntuación directa: Cabe recordar que esta se obtiene directamente de la medición, motivo por el cual se denomina puntuación directa, al ser producto de la medición directa de un elemento de la muestra, y de la cual dependerán las demás.


1

Interpretación y cálculo de los datos

Ordenamiento de datos, para el cálculo de las medidas de tendencia central


Se realizan los cálculos de la Media y Desviación Estándar para obtener los datos de la puntuación directa, puntuación diferenciada y típica.

El promedio de los datos de la nota parcial de tercera unidad es de 84.07 El promedio de los datos de la nota parcial de cuarta unidad es de 85.6

Se calcula la desviación estándar con la siguiente fórmula


Aplicando la fórmula antes mencionada se obtienen los siguientes resultados: La desviación de los datos de la nota parcial de tercera unidad es de 19.6 La desviación de los datos de la nota parcial de cuarta unidad es de 16.4 Ahora se procede a calcular la puntuación diferencial a partir de la fórmula:

Obteniendo como resultado:


Interpretación de los datos: Las puntuaciones que se ven en positivo se encuentran por encima de la media, caso contrario las que se muestran en negativo, que están por debajo de la media, en ese caso es en dónde hay que colocar la mayor atención, puesto que es el grupo de estudiantes que no han logrado alcanzar por lo menos la nota mínima propuesta. Igualmente muestra oscilaciones, es decir, la mejora de un estudiante, o bien, que ese estudiante bajó su productividad y por lo tanto descendió. En función a la comparación, se muestran estudiantes con puntos de mejora, mientras algunos decayeron por alguna razón. 5. Se procede a realizar el cálculo para la puntuación típica de los datos que se están analizando utilizando la siguiente fórmula:

De los cuales se obtienen los siguientes resultados:


Interpretación de los datos: En este caso, se puede identificar que al no haber ningún 0 absoluto, los estudiantes están por encima o por debajo de 85 puntos (punteos de la media); en ambas columnas se muestra que los estudiantes que tienen signo positivo han mejorado, y en el caso del estudiante A, se alejó de la media y en la cuarta unidad bajó aún más, este análisis intensifica que hay que poner mayor atención a los estudiantes A, B, i, l, N; También se muestra una gran mejoría en el estudiante E, caso contrario al J que se mantuvo y el O que también mostró mejoría.

Reflexión Personal ¿Qué se me facilita, qué se me dificultó? Se me dificulta la interpretación de los datos, aún no comprendo en su totalidad que representa realmente cada medida, también la localización de las fórmulas exactas y lo que determina cada una, puesto que no conozco del tema; aunque busqué información constantemente, me queda la inseguridad si la misma está evaluada de la forma correcta y si logré captar la información y procesarla como se debía. ¿Qué haría diferente la siguiente vez? En función docente, prestar atención a todos aquellos estudiantes que se alejen del promedio, identificar cuales son las habilidades pendientes de desarrollar y cambiar la estrategia de enseñanza aprendizaje para alcanzar las metas mínimas impuestas. Además, establecer en función al análisis, una ponderación superior a la que define el MINEDUC y elevar el nivel de aprendizaje de los estudiantes. ¿A qué debo prestar más atención? A los estudiantes que muestras de forma continua datos negativos, puesto que son los que se encuentran en riesgo. ¿Qué nuevos usos le puedo dar? Ayuda a identificar desde un inicio la mejora o baja de los estudiantes, que temas se les facilitan y cuáles se le dificultan poniendo énfasis en los que más problema causen en el aprendizaje, con esta estrategia también se puede mejorar el aprendizaje significativo, porque se puede establecer qué área es la que está fallando.


Constancia de Operaciones en Excel Puede verificar los cálculos realizados en Excel en la siguiente dirección, por favor revisar la hoja llamada Puntuaciones.

Percentiles El percentil es una medida estadística de posición, que divide la distribución ordenada de los datos en cien partes iguales. Esta medida de posición no central aporta información sobre el porcentaje de observaciones de una variable, ordenados de menor a mayor, que si sitúan por debajo del valor de este. Utilidad o función El percentil, en estadística, es un valor que sirve para comparar un conjunto ordenado de datos. Para resumir de forma sencilla, el percentil nos indica en el caso de los bebés y niños si, comparados con otros de su misma edad y sexo, se encuentran dentro de la media. El concepto es más sencillo de entender con unos ejemplos: Ejemplo e interpretación No.1 Tenemos un conjunto de datos consistente en la nota de cada uno de los alumnos de una clase. Si un alumno tiene un 9,5 y está en el P85 (percentil 85), significa que el 85% de los alumnos tiene un 9,5 o menos. Ejemplo e interpretación No. 2 Tenemos unas muestras con los sueldos de 10.000 trabajadores. ¿Cuál sería el percentil 60? El P60 sería aquel sueldo por debajo del cual estaría el 60% de los trabajadores, es decir, si ordenamos los trabajadores desde el que cobra menos hasta el que cobra más, el P60 sería el sueldo del trabajador número 6.000 (60% de 10.000).


Ejemplo e interpretación No. 3 Si medimos el tiempo que tarda cada uno de los atletas de una competición en recorrer una cierta distancia. ¿Cuánto tiempo tardan en recorrer esta distancia el 45% de los corredores? La respuesta es el percentil 45. La idea es simple, encontrar un porcentaje partir del cual los valores son iguales o están por debajo. Forma de calcularlo: Para calcular un percentil correspondiente a una observación y dado que se emplea la expresión siguiente:

Para encontrar el percentil de una muestra ordenada de tamaño n, se utiliza para encontrar el localizador:

Por ejemplo, considere un curso de cuarenta alumnos que se forma en línea por orden de estatura, primero los grandes y al final los chicos. Suponga, además, que se considera ‘chico’ a un alumno de la cuarta parte final de esta línea. Éste es un concepto relativo a este curso, con toda seguridad variará al referirse a otro. Es fácil aceptar que los ‘chicos’ de octavo básico tienen menor estatura que los ‘chicos’ de cuarto medio. Como la cuarta parte corresponde al 25% de la población, en el ejemplo que se menciona, los chicos de un curso, son aquellos cuya estatura no supera el ‘percentil veinticinco’ de la población formada por los alumnos del curso. Si una variable pudiese asumir muchos valores, la representación de la proporción del total, menor o igual que un valor, tendría una forma creciente parecida a la siguiente:


Recomendaciones y observaciones de los percentiles: Los percentiles son medidas de posición, por encontrarse en cualquier lugar de la distribución, e indica el porcentaje de cierta concentración de datos. El percentil 50, la mediana y el segundo cuartil representan el mismo dato estadístico. Los percentiles son útiles en el análisis exploratorio de datos y en análisis descriptivo, porque permiten valorar la dispersión, la simetría y la distribución de datos.

Información adicional Para ampliar el concepto general y cálculo de percentiles vea el siguiente link: https://www.youtube.com/watch?v=jB8AgphDvYw Para calcularlo en Excel https://www.youtube.com/watch?v=7yMyxaz78lI


Gráficas y organización de datos Histograma Es la representación gráfica en forma de barras, que simboliza la distribución de un conjunto de datos. Su utilidad radica en obtener una noción general de la distribución de la población o muestra, respecto a una característica cuantitativa y continua. Otra forma de describirlo es que permite resumir los datos dentro de algunos rangos, tomando en cuenta el número de observaciones dentro de cada rango. Se trata de una serie de rectángulos que tienen sus bases sobre el eje horizontal, con centros en los puntos medios de los intervalos y anchura igual a la amplitud de los intervalos. En el eje de las abscisas se colocan las frecuencias, proporciones o porcentajes acumulados se denomina histograma de frecuencias acumuladas. Construcción de un Histograma Para la construcción de un gráfico de histograma se utilizan los siguientes pasos: Dibujamos el eje de las abscisas de tal forma que incluya como mínimo el rango de los datos y, posteriormente, dividimos este rango en los intervalos dados. Dibujamos el eje de las ordenadas representando las frecuencias absolutas o relativas según sea el caso. Se dibujan los rectángulos de anchura igual y proporcional al intervalo (en nuestro caso todos tendrán la misma anchura) y de altura igual a la frecuencia absoluta o relativa, según sea el caso http://www.uco.es/zootecniaygestion/img/pictorex/27_12_49_7.pdf .


Ejemplo 2: Considerando los siguientes datos se procede a realizar el gráfico representativo, se utilizará un histograma:


Histograma de frecuencias absolutas con los datos de la tabla anterior:

Histograma de frecuencias relativas sería el siguiente


Polígono de Frecuencias Es similar al histograma en muchos aspectos, la diferencia radica en que tiene por objetivo proyectar una imagen aproximada de la “curva” definida por la distribución variable. El polígono es un gráfico útil para comparar dos distribuciones de frecuencias. Construcción del polígono de frecuencias Se utilizan los mismos ejes del histograma. Se indica en la escala horizontal el punto medio de cada intervalo. Se indica en la escala vertical la escala densidad para ese intervalo, esto define los pares (x, y) y en el gráfico se unen con tramos de líneas rectas. Se marcan además los puntos medios del intervalo que precede al primero y del que sigue al último. Ejemplo: Observemos los polígonos de frecuencia de la distribución por edad de los casos de rubéola en el año 1999 y 2000 en Argentina. A pesar de que el número de casos notificados disminuyó casi un 50% en el 2000, la distribución de edad de los casos fue muy similar los dos años.


El histograma o el polígono de frecuencias muestran la distribución de edad de los casos de rubéola notificados durante un año, es decir, muestran la proporción del total de los casos que cae en cada categoría de edad. Pero, los distintos grupos de edad tienen distinta composición, por lo tanto, puede ser de interés presentar la tasa de casos de rubéola en cada grupo de edad. Podemos representar las tasas de rubéola cada 1000 habitantes usando un gráfico de barras o un gráfico en el que cada tasa se representa como un punto ubicado en el punto medio de la categoría de edad respetando de este modo la “distancia” entre las categorías https://www.dm.uba.ar/materias/estadistica_Q/2011/1/modulo%20descripti va.pdf

Ejemplo 2: Utilizando la tabla de datos del ejemplo 2 del histograma.


Información adicional Para información de la producción de diagrama https://www.youtube.com/watch?v=ZAJJB7gbiBs Creación de gráficos en Excel https://www.youtube.com/watch?v=uZ3Q6Nth7-E


Diagrama de Caja o Bigotes Diagrama de Caja o Bigotes Los diagramas de Caja-Bigotes (boxplots o box and whiskers), estos describen características como la dispersión y la simetría, se realizan a través de la representación de tres cuartiles, valores mínimo y máximo de los datos, sobre un rectángulo, alineado horizontal o verticalmente. Construcción de gráfico de Cajas o Bigotes El gráfico consiste en una caja rectangular, donde los lados más largos muestran el recorrido intercuartílico. El rectángulo está dividido por un segmento vertical que indica donde se posiciona la mediana (cuartil dos) y por lo tanto la relación con los cuartiles primero y tercero. La caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes. Los límites de prolongación de los bigotes, por lo que cualquier dato o caso que no se encuentra dentro de este rango se marca e identifica individualmente se encuentra dentro de este rango se marca e identifica individualmente. Ejemplo Se representa la edad de un colectivo de 20 personas. Para calcular los parámetros estadísticos, lo primero es ordenar la distribución: 20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45 Calculo de cuartiles Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N = 20 resulta que N/4 = 5; el primer cuartil es la media aritmética de dicho valor y el siguiente: Q1 = (24 + 25) / 2 = 24,5 Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la variable que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10; la mediana es la media aritmética de dicho valor y el siguiente: me= Q2 = (33 + 34) / 2 =33,5 Q3, el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En nuestro caso, como 3N / 4 = 15, resulta Q2= (39 + 39) / 2 = 39


DIBUJAR LA CAJA Y LOS BIGOTES

El bigote de la izquierda representa al colectivo de edades (Xmín, Q1) La primera parte de la caja a (Q1, Q2), La segunda parte de la caja a (Q2, Q3) El bigote de la derecha viene dado por (Q3, Xmáx). El diagrama representa Podemos obtener abundante información de una distribución a partir de estas representaciones. Veamos alguna: La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades comprendidas entre el 25% y el 50% de la población está más dispersa que entre el 50% y el 75%. El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello el 25% de los más jóvenes están más concentrados que el 25% de los mayores. El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está comprendido en 14,5 años http://instmat.utalca.cl/tem/sitiolmde/primero/guiasliceo/recuperacion/Diagrama_de_Caja_y_Bigotes-2.pdf Ejemplo No. 2 Un corredor entrena para una determinada carrera y se toman los tiempos que necesita para recorrer los 100m, durante 10 días consecutivos (cada día se toman varios tiempos y se calculan mediana, cuartiles, valores mínimo y máximo)


Observamos que el desplazamiento de las gráficas de caja hacia la izquierda indica que el entrenamiento ha dado resultado, ya que se tardan menos segundos en recorrer la misma distancia, siendo la diferencia entre el máximo y el mínimo menor, como así también la diferencia intercuartílica http://instmat.utalca.cl/tem/sitiolmde/primero/guiasliceo/recuperacion/Diagrama_de_Caja_y_Bigotes-2.pdf

Información adicional del diagrama Para poder realizar la gráfica de bigotes en Excel, diríjase a la siguiente dirección y siga los pasos: https://support.microsoft.com/es-es/office/crear-un-gr%C3%A1fico-de-cajas-ybigotes-62f4219f-db4b-4754-aca84743f6190f0d#:~:text=Un%20gr%C3%A1fico%20de%20cajas%20y%20bigotes%20mu estra%20la%20distribuci%C3%B3n%20de,extienden%20verticalmente%20llamadas %20%E2%80%9Cbigotes%E2%80%9D.


Análisis personal En su trabajo profesional ha tenido la oportunidad de analizar, recibir datos utilizando diferentes tipos de gráficos, percentiles. El manejo de gráficos si, bimestre a bimestre se realizan las gráficas para comparar el desenvolvimiento de los estudiantes, se realizan gráficos del desempeño de los estudiantes de una sección, además de realizar el gráfico por grado. Los percentiles, histogramas y gráficos de bigotes no los he elaborado, ni tampoco utilizado en el área de educación. Enumere qué tipo de datos tiene a su alcance dentro de su trabajo y que le gustaría utilizar para aplicar, percentiles, las gráficas de representación de datos. Zonas bimestrales comparando los datos de los bimestres anteriores Desempeño en nota de valor actitudinal Notas de final de año Comparativas de años anteriores al año en curso.

Proyecto de Aplicación https://www.canva.com/design/DAFQY_ORQ34/Hpj51 YJhqKtqPKhPFJpNXA/view? utm_content=DAFQY_ORQ34&utm_campaign=designs hare&utm_medium=link&utm_source=publishsharelink


¿Qué es la distribución normal? Modelo matemático teórico de una distribución de datos. Permite calcular probabilidades y es muy útil para estadística inferencial Muchas cosas que encontramos naturalmente en la práctica tienden a acercarse mucho a este modelo, por eso es tan útil. Estadísticas biológicas, datos antropométricos, sociales y económicos, mediciones psicológicas y educacionales, errores de observación, etc.


Características de la curva normal Las curvas normales se diferencian unas de otras por su media () y por su desviación estándar (). El punto más alto está sobre la media, que coincide con la mediana y con la moda. Es simétrica, unimodal y con forma de campana. Es asintótica. Los extremos nunca tocan el eje X, se extienden al infinito.

Características de la curva normal La desviación estándar determina qué tan plana y ancha es la curva (apuntamiento, curtosis). Una mayor desviación estándar implica mayor variabilidad y la curva se vuelve más ancha y plana. El área total bajo la curva es igual a 1.


Características de la curva normal

El 68.2% de los datos están entre la media y una desviación estándar (arriba o abajo). El 95.4% de los datos están entre la media y dos desviaciones estándar (arriba o abajo).  El 99.7% de los datos están entre la media y tres desviaciones estándar (arriba o abajo). Distribución normal estándar Como la media y la desviación estándar hacen que cada curva normal sea única, se buscó una forma de estandarizar todas las distribuciones normales para facilitar cálculos de probabilidad y comparaciones. Por esta razón, nace la distribución normal estándar que se caracteriza por tener u=0 y o=1. Los valores de la abscisa se representan por la “z” en lugar de la “x”.


Distribución normal estándar La puntuación típica (z) de un valor (x) indica a cuántas desviaciones estándar () de distancia está dicho valor de la media (). Transporta un valor de una distribución normal cualquiera a la estándar.

¿Qué significa?


Referencias Matus, R. (2010). Estadística.. Instituto Politécnico Nacional. https://elibro.net/es/ereader/unis/76119?page=12 Martínez, E. (2020). Estadística.. Universidad Abierta para Adultos (UAPA). https://elibro.net/es/ereader/unis/175596?page=32 Llinás Solano, H. (2017). Estadística descriptiva y distribuciones de probabilidad. Universidad del Norte. https://elibro.net/es/ereader/unis/70059?page=28 USAC, (2011), Manual de Estadística Descriptiva, Facultad de Ingeniería, Universidad de San Carlos de Guatemala, https://www.studocu.com/gt/document/universidad-de-san-carlos-deguatemala/estadistica-1/manual-estadistica-descriptiva-1-apuntes-de-launidad-1-2-y-3/23744876 Guerra Bustillo, C. W. (2003). Estadística.. Editorial Félix Varela. https://elibro.net/es/ereader/unis/71785?page=2 García Pedraza, R. (2012, December 8). La puntuación directa o frecuencia. Probabilidad Imposible. Retrieved September 5, 2022, from http://probabilidadimposible.blogspot.com/2012/12/la-puntuaciondirecta-o-frecuencia.html Gorgas García, J., & Cardiel López, N. (2009). Estadística básica para estudiantes de ciencias. Departamento de Astrofísica y Ciencias de la Atmósfera, Universidad Complutense de Madrid.


Referencias Roldán Martínez, A. (n.d.). Temas de estadística práctica. Resumen teórico de los principales conceptos estadísticos. http://hojamat.es/estadistica/tema3/teoria/teoria3.pdf Proporción de respuestas correctas 3. Puntuaciones diferenciales 4. Las puntuaciones típicas 4.1. Qué son las puntuaciones. (n.d.). WordPress.com. https://estadisticasocialf.files.wordpress.com/2013/10/puntuaciones.pdf


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.