Distribuciones muéstrales y estimadores











Reservados todos los derechos. Ninguna parte de esta publicación puede reproducirse, almacenarse en un sistema de recuperación o transmitirse de ninguna forma ni por ningún medio, ya sea electrónico, mecánico, fotocopiado, grabación o cualquier otro, sin el permiso previo por escrito del editor.
La portada y el patrón fueron creados por Carrero’s studio.
Cesar Carrero es escritor y editor especializadao en literatura e historia. Exprofesor de Lengua y Literatura en una escuela secundaria, posteriormente trabajó como editor en importantes proyectos educativos, incluido Inglés A: Literatura para la serie Pearson International Baccalaureate. Los principales intereses de investigación de Cesar incluyen la literatura romántica y gótica y el drama del Renacimiento.
Este libro fue escrito por el autor:
Cesar Carrero
C.I.28297464
Carrera Ing.Sistemas
Para la materia de Teoría y Técnicas de Decision.
1. Introduccion
2. Muestreo aleatorio y distribuciones de probabilidad
3. Distribuciones muestrales
4. Estimadores puntuales
5. Intervalos de confianza
6. Pruebas de hipótesis
7. Creditos
La estadística es una rama de las matemáticas que se encarga de recolectar, analizar e interpretar datos. Los datos pueden provenir de diversas fuentes, como encuestas, experimentos, estudios observacionales, entre otros.
Tenemos que:
Población: es el conjunto completo de todos los individuos, objetos, eventos o medidas que se quieren estudiar. Por ejemplo, la población de un estudio sobre la estatura de los estudiantes de una escuela sería el conjunto de todos los estudiantes de esa escuela.
Muestra: es un subconjunto de la población que se selecciona para ser estudiado. La muestra debe ser representativa de la población para que los resultados obtenidos puedan ser generalizados a la población completa.
Variable: es una característica que se mide en cada individuo de la población o muestra. Por ejemplo, la estatura, el peso, la edad, el género, entre otros.
Datos: son los valores obtenidos al medir o observar las variables en cada individuo de la población o muestra. Los datos pueden ser numéricos o categóricos.
Estadístico: es una medida calculada a partir de los datos de una muestra y que se utiliza para hacer inferencias sobre la población. Por ejemplo, la media, la desviación estándar, la proporción, entre otros.
La estadística se divide en dos ramas principales: la estadística descriptiva y la estadística inferencial. La estadística descriptiva se encarga de resumir y describir los datos, utilizando medidas como la media, la mediana, la moda, la desviación estándar, entre otras. La estadística inferencial se encarga de hacer inferencias sobre la población a partir de la información obtenida en la muestra, utilizando técnicas como la distribución muestral, la estimación por intervalos y las pruebas de hipótesis.
El muestreo aleatorio es una técnica utilizada para seleccionar una muestra representativa de una población. El objetivo del muestreo aleatorio es obtener una muestra que sea lo más similar posible a la población en términos de sus características y propiedades.
Existen varios métodos para realizar el muestreo aleatorio, pero todos comparten el mismo principio básico: cada individuo de la población tiene una probabilidad conocida y no nula de ser seleccionado para formar parte de la muestra. De esta manera, se garantiza que la muestra sea representativa de la población.
Una vez que se ha seleccionado la muestra, se pueden analizar las variables de interés y obtener información sobre la población. Sin embargo, debido a que la muestra es solo una fracción de la población, es posible que la información obtenida de la muestra no sea completamente precisa. Es aquí donde entran en juego las distribuciones de probabilidad.
Las distribuciones de probabilidad son modelos matemáticos que describen la variabilidad de una variable aleatoria. En el caso de las muestras, se utilizan las distribuciones muestrales para describir la variabilidad de los estadísticos calculados a partir de la muestra, como la media muestral, la proporción muestral, etc.
Las distribuciones muestrales son importantes porque nos permiten hacer inferencias sobre la población a partir de la información obtenida en la muestra. Por ejemplo, si queremos estimar la media de una variable en la población, podemos utilizar la media muestral como estimador y la distribución muestral de la media para calcular un intervalo de confianza o una prueba de hipótesis.
Las distribuciones muestrales son modelos matemáticos que describen la variabilidad de los estadísticos calculados a partir de muestras aleatorias de una población. Estas distribuciones son importantes en la inferencia estadística porque nos permiten hacer estimaciones precisas sobre los parámetros de la población, como la media, la proporción, la desviación estándar, entre otros.
Para construir una distribución muestral, se deben seguir los siguientes pasos:
1. Seleccionar una muestra aleatoria de tamaño n de una población.
2. Calcular el estadístico de interés, como la media o la proporción, a partir de la muestra.
3. Repetir los pasos 1 y 2 varias veces para obtener una muestra de estadísticos.
4. Construir un histograma o una función de densidad que describa la distribución de los estadísticos.
La distribución muestral resultante dependerá del tamaño de la muestra y de las propiedades de la población de la que se extrae. Por ejemplo, si la población sigue una distribución normal, la distribución muestral de la media también será normal, independientemente del tamaño de la muestra.
Las distribuciones muestrales son importantes en inferencia estadística porque nos permiten calcular la probabilidad de obtener un estadístico determinado si se seleccionan muestras aleatorias repetidas veces. Esto a su vez nos permite hacer inferencias sobre la población a partir de la información obtenida en la muestra.
Por ejemplo, si queremos estimar la media de una variable en la población, podemos utilizar la media muestral como estimador y la distribución muestral de la media para calcular un intervalo de confianza o una prueba de hipótesis. Si queremos comparar dos poblaciones, podemos utilizar la distribución muestral de la diferencia entre dos medias o dos proporciones para calcular un intervalo de confianza o una prueba de hipótesis.
Las distribuciones muestrales son importantes en inferencia estadística porque nos permiten hacer estimaciones precisas sobre los parámetros de la población y calcular la probabilidad de obtener un estadístico determinado a partir de la información obtenida en la muestra.
Los estimadores puntuales son estadísticos utilizados para estimar un parámetro poblacional desconocido a partir de una muestra. Estos estimadores proporcionan una única estimación del valor del parámetro, a diferencia de los estimadores por intervalos de confianza que proporcionan un rango de posibles valores.
El estimador puntual más común es la media muestral, que se utiliza para estimar la media poblacional. Otros ejemplos de estimadores puntuales incluyen la proporción muestral, la desviación estándar muestral, el coeficiente de correlación muestral, entre otros.
Para calcular un estimador puntual, se debe seleccionar una muestra aleatoria de la población y calcular el estadístico de interés. Por ejemplo, para estimar la media poblacional, se calcula la media de la muestra. El valor obtenido se utiliza como la estimación puntual de la media poblacional.
Es importante destacar que los estimadores puntuales no son exactos, ya que la muestra seleccionada es solo una fracción de la población y por lo tanto no puede capturar toda la variabilidad de la población. La precisión del estimador dependerá del tamaño de la muestra y de las propiedades de la población de la que se extrae.
Además, diferentes estimadores pueden tener diferentes propiedades en términos de sesgo y varianza. El sesgo se refiere a la diferencia entre el valor esperado del estimador y el valor verdadero del parámetro, mientras que la varianza mide la dispersión de los valores del estimador alrededor de su valor esperado. Los estimadores ideales tienen un sesgo cero y una varianza mínima.
En estadística, un intervalo de confianza es un rango de valores que se construye a partir de una muestra de datos y que se espera que contenga el verdadero valor del parámetro poblacional con cierto nivel de confianza. Los intervalos de confianza se utilizan para estimar el valor desconocido de un parámetro poblacional, como la media, la proporción o la desviación estándar.
La construcción de un intervalo de confianza depende del nivel de confianza deseado y del tamaño de la muestra. El nivel de confianza se refiere a la probabilidad de que el intervalo de confianza contenga el verdadero valor del parámetro poblacional. Un nivel de confianza típico es del 95%, lo que significa que si se repite el proceso de muestreo muchas veces, se espera que el intervalo de confianza contenga el verdadero valor del parámetro en el 95% de las veces.
La fórmula general para un intervalo de confianza es:
Intervalo de confianza = estimador ± margen de error
Donde el estimador es el valor calculado a partir de la muestra y el margen de error es una medida de la variabilidad de los valores muestrales. El margen de error se calcula a partir del error estándar, que se basa en la desviación estándar de la población y el tamaño de la muestra.
La interpretación de un intervalo de confianza implica reconocer que el valor del parámetro poblacional es incierto, pero se estima con cierto grado de precisión. Si el intervalo de confianza es estrecho, significa que el valor estimado del parámetro es más preciso y se tiene mayor confianza en que el valor verdadero esté dentro del rango especificado. Por el contrario, si el intervalo de confianza es amplio, significa que el valor estimado del parámetro es menos preciso y se tiene menos confianza en que el valor verdadero esté dentro del rango especificado.
Las pruebas de hipótesis son una herramienta estadística utilizada para evaluar la evidencia en contra o a favor de una afirmación acerca de un parámetro poblacional. En general, una prueba de hipótesis implica la formulación de dos hipótesis: la hipótesis nula (H0) y la hipótesis alternativa (H1). La hipótesis nula es la afirmación que se desea probar y la hipótesis alternativa es la afirmación que se acepta si se rechaza la hipótesis nula. El proceso de prueba de hipótesis implica la selección de un estadístico de prueba adecuado y la determinación del valor p. El valor p es la probabilidad de obtener el valor del estadístico de prueba observado o uno más extremo, asumiendo que la hipótesis nula es verdadera. Si el valor p es menor que el nivel de significancia especificado, se rechaza la hipótesis nula y se acepta la hipótesis alternativa.
La interpretación de los resultados de una prueba de hipótesis depende del contexto y de la pregunta de investigación. Si la hipótesis nula se rechaza, se puede concluir que existe evidencia suficiente para afirmar que la hipótesis alternativa es verdadera. Si la hipótesis nula no se rechaza, no se puede concluir que la hipótesis nula es verdadera, sino simplemente que no hay suficiente evidencia para rechazarla. En algunos casos, puede ser necesario realizar pruebas adicionales o recopilar más datos para llegar a una conclusión definitiva.
Es importante tener en cuenta que las pruebas de hipótesis no permiten probar que la hipótesis nula es verdadera, sino simplemente que no se dispone de evidencia suficiente para rechazarla. Además, los resultados de una prueba de hipótesis dependen del tamaño de la muestra y de las suposiciones realizadas acerca de la distribución de los datos.
A mi computadora que por mas que se dañe cada vez que tengo que entregar tareas sigue luchando para terminar la Universidad juntos.