Issuu on Google+

TEORÍA DE ESTADÍSTICA UNIDIMENSIONAL Y BIDIMENSIONAL


ESTADÍSTICA UNIDIMENSIONAL


• La estadística es una ciencia que trata la información con la finalidad de describir un fenómeno que se está estudiando y obtener conclusiones. • La población es el conjunto de elementos que son objeto de estudio. Pueden personas, animales, plantas o cosas. Cada elemento de la población se llama individuo. • Una muestra es una parte de la población cuyo estudio sirve para sacar conclusiones de toda la población. • Un carácter estadístico es una propiedad que se estudia en los individuos de la población y puede ser cualitativo o cuantitativo. • Carácter estadístico cualitativo es aquel que indica una cualidad que no se puede contar ni medir (como por ejemplo el color de ojos).


• Carácter estadístico cuantitativo es aquel que indica una cantidad, se puede contar o medir (como por ejemplo la densidad de población). El conjunto de todos los valores que puede tomar un carácter estadístico cuantitativo se llama variable estadística y se clasifica en: - Variable estadística cuantitativa discreta: Sus valores son el resultado de un recuento y puede tmar ciertos valores aislados. - Variable estadística cuantitativa continua: sus valores son el resultado de una medida y puede tomar cualquier valor dentro de un intervalo. • Los datos estadísticos se organizan en tablas donde aparece el valor de la variable y las frecuencias de dichos valores. • Frecuencia absoluta (fi): Número de individuos de la población para los que la variable toma ese valor. • Frecuencia relativa (h): Es el cociente entre la frecuencia absoluta y el número total de individuos.


GRÁFICOS ESTADISTICOS • De barras: Es un gráfico que está formado por barras separadas (si la variable es discreta) o por barras adosadas (si es continua) de altura proporcional a la frecuencia absoluta de cada valor. • Linea poligonal o linea de frecuencias: Se representan los pares de puntos formados por el valor de la variable y la frecuencia absoluta, y se unen. • De sectores: Es un gráfico que consiste en un círculo dividido en sectores de amplitud proporcional a la frecuencia de cada valor. Amplitud → ángulo de cada sector.


PARÁMETROS DE CENTRALIZACIÓN Son medidas que sintetizan los valores e indican la tendencia de estos a agruparse sobre uno. Los más frecuentes son: media, moda y mediana. • Moda: Valor de la variable que mas frecuencia absoluta tiene. Cuando hay dos valores con máxima frecuencia absoluta se llama distribución bimodal, si son tres se llama distribución trimodal y si son mas de tres se llama distribución multimodal. • Mediana: Es el valor que divide a la población en dos partes igual y además es una medida de posición. • Media: Es el valor en el que se centran los datos.


PARÁMETROS DE DISPERSIÓN Son valores que indican si los datos de la distribución están mas o menos cercanos a los parámetros de centralización. Las mas frecuentes son: recorrido, varianza, desviación típica y coeficiente de variación. • Recorrido: Diferencia entre el mayor y el menor valor de la variable estadística. • Coeficiente de variación: Nos indica (x100) el tanto por ciento de los datos de la distribución que se alejan de la media.


MEDIDAS DE POSICIÓN • • • •

Mediana Cuartiles: Dividen a la distribución en 4 partes iguales. Deciles: Dividen a la distribución en 10 partes iguales. Percentiles: Divieden a la distribución en 100 partes iguales.


MUESTREOS Para estudiar una característica de una población se escoge una muestra sobre lo que se hace el estudio estadístico y a partir de él se sacan conclusiones de toda la población. La manra de seleccionar a los individuos de la muestra afecta a la información que proporciona, por lo que es necesario decidir la forma en la que se va a elegir a la muestra. Los procedimientos más frecuentes son: muestreo aleatorio simple, muestreo sistemático, muestreo estratificado y muestreo por conglomerado. • Muestreo aleatorio simple: Consiste en elegir al azar los elementos de la población que van a formar parte de la muestra, de manera que todos tengan la misma probabilidad de ser seleccionados. Este muestreo es adecuado cuando la población es homogénea respecto a la característica que se va a estudiar.


• Muestreo sistemático: En los casos en los que se dispone de un listado de los elementos de una población se puede realizar un muestreo sistemático. Consiste en elegir al azar el primer elemento de la muestra y continuar tomando elementos igualmente espaciados a partir de este. • Muestreo estratificado: En ocasiones la variable a estudiar no es homogénea en toda la población, sino que varia según diferentes grupos o estratos. En este caso la muestra debe elegirse de manera que la proporción en cada uno de los estratos entran en la muestra sean igual proporción que en la realidad. • Muestreo por conglomerados: Para realizar un muestreo estratificado es necesario conocer con gran precisión la población de la que se quiere extraer la información y eso a veces no es posible. En cambio en muchos estudios la población de agrupan física o temporalmente por conglomerados que son parecidos a la población total.


ESTADÍSTICA BIDIMENSIONAL


• Variable estadística bidimensional (x,y) es el resultado de dos características cuantitativas en los individuos de una población, ''x'' e ''y'' son variables unidimensionales. Para estudiar una variable bidimensional es necesario estudiar también las variables unidimensionales que la forman, caracterizandose por su media y su desviación típica, este proceso se llama estudio de las distribuciones marginales asociadas a la variable bidimensional. Los datos de este estudio se ordenan en distintos tipos de tablas: • Tabla simple: La frecuencia absoluta de las variables es 1. • Tabla simple con frecuencias: Algunos de los pares de datos son repetidos. • Tabla de doble entrada: En las columnas se colocan los datos de la variable ''x'', en las filas los datos de la variable ''y'' y en el interior de la tabla sus frecuencias absolutas.


• Diagrama de dispersión: Dada una variable estadística bidimensional ''x'' e ''y'' se puede representar los datos de la variable en un eje de coordenadas cartesianas representando cada par de datos. El conjunto de puntos que se obtiene se denomina diagrama de dispersión o nube de puntos. • Covarianza: Se llama covarianza de una variable bidimensional ''x'' e ''y'' a la varianza conjunta de dichas variables. Me indica el comportamiento de una variable respecto a otra. Puede ser positiva, negativa o nula. - Si es positiva → nos indica que los valores de xi e yi se alejan en el mismo sentido respecto de sus medias. - Si es negativa → los valores de las variables se alejan en sentido opuesto respecto de sus medias. - Si es nula → No hay relación entre las 2 variables.


• Correlación: Relación o dependencia que existe entre las dos variables que intervienen en una distribución bidimensional. - Lineal o curvilínea: Según la nube de puntos se condensan en torno a una linea recta o a una curva. - Positiva o directa: Cuando a medida que crece una variable la otra también crece. - Negativa o inversa: Cuando al crecer una variable la otra disminuye. - Nula: Cuando no existe ninguna relación entre las variables; en este caso los puntos del diagrama de dispersión están separados al azar sin tender a formar ninguna línea o curva. En este caso se llaman variables incorreladas. - Funcional: Si existe una función que satisface todos los valores de la distribución (la nube de puntos pasa por una recta o curva, en caso contrario sera la relación mas fuerte o débil dependiendo de la mayor o menor tendencia de los datos a ajustarse a una función dada).


• Para poder cuantificar la correlación lineal que hay entre dos variables estadísticas de una distribución bidimensional debemos de definir el coeficiente de correlación lineal de Pearson → es un parámetro de la variable bidimensional (x,y) que sirve para medir el grado de relación lineal que hay entre las dos variables unidimensionales. • Recta de regresión lineal: Si entre 2 variables existe una correlación fuerte el diagrama de dispersión se condensa entorno a una recta y tiene sentido determinar aquella que mejor se aproxima a la nube de puntos y utilizarla para predecir valores desconocidos. La recta que mejor se aproxima a estos datos se llama recta de regresión lineal. La variable dependiente es aquella que se quiere estimar y la variable que se utiliza para estimar este valor se denomina variable independiente.


ESTADÍSTICA UNIDIMENSIONAL Y BIDIMENSIONAL