Page 1

Licenciatura en ADMINISTRACIÓN Materia:

Análisis Estadístico

UNIDAD I. Introducción a la Estadística

Introducción Los métodos de la estadística clásica se desarrollaron para el análisis de datos obtenidos de una muestra con la finalidad de hacer inferencias acerca de la población de la cual se tomó la muestra.

Objetivo general •

Identificar los elementos básicos de la estadística

Objetivo especifico •

Obtener la información necesaria para generar una de tabla de frecuencia.

Contenido temático 1.1 Objeto de estudio 1.2 Estadística descriptiva e inferencial 1.3 Variables 1.4 Distribución de frecuencia 1.5 Intervalo de clase 1.6 Construcción de tabla de frecuencia

1.1 Objeto de Estudio Existen cuando menos cuatro buenas razones para estudiar estadística, al hacerlo seremos capaces de: 1. Aprender reglas y métodos para tratar información estadística. 2. Evaluar y calificar la importancia de los resultados estadísticos que veamos publicados. 3. Conocer los aspectos del pensamiento estadístico como un componente esencial de una educación humanística. 4. Entender mejor el mundo real de nuestro entorno La estadística es un área de estudio consistente en reglas y métodos para tratar información; para otros, la estadística es una forma de actuar y de pensar con respecto a los sucesos mundanos que ocurren irregularmente y que están gobernados por ciertas leyes de incertidumbre. Pág. 1 de 8 Esta obra es exclusivamente de uso académico para los estudiantes de la BUAP. Esta obra se distribuye con una licencia Creative Commons Atribución-NoComercial, CompartirIgual 2.5 México


Licenciatura en ADMINISTRACIÓN Materia:

Análisis Estadístico

Como ciencia, la estadística se encarga de describir los resultados

de una investigación científica, de

tomar decisiones basadas en dicha investigación y de estimar cantidades desconocidas. Ejemplo: ¿Es buena la nueva Coca Cola? A principios de 1985, la compañía anuncio que estaba cambiando en secreto la fórmula para fabricar esa bebida, una fórmula que había usado desde 1886; luego de que la nueva Coca Cola fue lanzada al mercado, los miembros de Consumer Reports intentaron responder preguntas como estas: ¿A que sabe realmente la nueva Coca Cola?, ¿Es mejor que la antigua? Y ¿Cómo se compara con la Pepsi Cola? El equipo de investigación realizo tres pruebas de sabor a ciegas con 95 de sus miembros y 532 copas de plástico. Los resultados del estudio no mostraron diferencia entre los gustos entre Pepsi Cola y la nueva Coca Cola; ambos productos fueron preferidos sobre la vieja Coca Cola por un margen de 2 a1. S e encontró que las tres formulas consistían en cerca de 99% de agua carbonatada y azúcar, azúcar de maíz. La tradición y otros factores humanos diversos pueden afectar las preferencias de los consumidores; aunque el experimento parece indicar que la nueva Coca Cola es superior en sabor a la antigua, la Coca Cola clásica está desplazando a la nueva en muchas regiones de Estados Unidos.

1.2 Estadística Descriptiva e Inferencial Los procedimientos y análisis que aparecen en estadística caen en dos categorías generales, descriptiva e inferencial, dependiendo del propósito del estudio. La estadística descriptiva comprende aquellos métodos usados para organizar y describir la información recabada. Estos métodos se usan para analizar la información y desplegarla en forma grafica tal, que permita interpretaciones con significado. Los métodos de la estadística descriptiva nos ayudan a describir el mundo en torno nuestro. Ejemplo: Las situaciones siguientes utilizan estadística descriptiva. 1. Un jugador de boliche quiere conocer su promedio de anotaciones en los pasados 12 partidos. 2. Una mujer dedicada a la política desea saber el porcentaje exacto de votos que obtuvo en la última elección. 3. María quiere describir la variación que hay en las cinco calificaciones de exámenes que comprenden en la primera cuarta parte de su curso de cálculo.

Pág. 2 de 8 Esta obra es exclusivamente de uso académico para los estudiantes de la BUAP. Esta obra se distribuye con una licencia Creative Commons Atribución-NoComercial, CompartirIgual 2.5 México


Licenciatura en ADMINISTRACIÓN Materia:

Análisis Estadístico

La estadística inferencial comprende aquellos métodos y técnicas usados para hacer generalizaciones, predicciones o estimaciones sobre poblaciones a partir de una muestra. La habilidad para hacer generalizaciones sobre la población a partir de una muestra es un aspecto importante en estadística. Rara vez tenemos la información completa que necesitamos para llegar a la verdad absoluta sobre algún evento total. Ejemplo: Las situaciones siguientes, que son paralelas a las situaciones descriptivas 1. Un jugador de boliche quiere estimar la oportunidad que tiene de ganar un torneo próximo con base en su promedio de la temporada actual y en los promedios de sus futuros contrincantes 2. Con base en una encuesta de opinión, a un político le gustaría calcu8lar la oportunidad de reelegirse en las próximas elecciones. 3. Con apoyo en la variación de sus calificaciones de exámenes en la primera cuarta parte del curso de cálculo, María desea predecir la que tendrá en las calificaciones de exámenes de la segunda cuarta parte del curso de cálculo.

1.3 Variables. Una variable es una característica observable que varía entre los diferentes individuos de una población. La información que disponemos de cada individuo es resumida en variables En los individuos de la población española, de uno a otro es variable: •

El grupo sanguíneo

{A, B, AB, O}  Var. Cualitativa •

Su nivel de felicidad “declarado”

{Deprimido, Ni fu ni fa, Muy Feliz}  Var. Ordinal •

El número de hijos

{0,1,2,3,...}  Var. Numérica discreta •

La altura

{1’62 ; 1’74; ...}  Var. Numérica continua Variable es una característica (magnitud, vector o número) que puede ser medida, adoptando diferentes valores en cada uno de los casos de un estudio.

Pág. 3 de 8 Esta obra es exclusivamente de uso académico para los estudiantes de la BUAP. Esta obra se distribuye con una licencia Creative Commons Atribución-NoComercial, CompartirIgual 2.5 México


Licenciatura en ADMINISTRACIÓN Materia:

Análisis Estadístico

Según la medición: •

Variables cualitativas: Son las variables que expresan distintas cualidades, características o

modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser ordinales y nominales. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles como sí y no, hombre y mujer o son politómicas cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir: •

Variable cualitativa ordinal: La variable puede tomar distintos valores ordenados siguiendo una

escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo, leve, moderado, grave. •

Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio

de orden como por ejemplo los colores o el lugar de residencia. •

Variables cuantitativas: Son las variables que se expresan mediante cantidades numéricas. Las

variables cuantitativas además pueden ser: •

Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de

valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5). •

Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo

especificado de valores. Por ejemplo el peso (2,3 kg, 2,4 kg, 2,5 kg, ...) o la altura (1,64 m, 1,65 m, 1,66 m, ...), que solamente está limitado por la precisión del aparato medidor, en teoría permiten que siempre exista un valor entre dos cualesquiera. Según la influencia que asignemos a unas variables sobre otras, podrán ser: •

Variables independientes: Son las que el investigador escoge para establecer agrupaciones en

el estudio, clasificando intrínsecamente a los casos del mismo. Un tipo especial son las variables de control, que modifican al resto de las variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de un sesgo. •

Variables dependientes: Son las variables de respuesta que se observan en el estudio y que

podrían estar influenciadas por los valores de las variables independientes.

1.4 Distribución de frecuencia Se conoce como distribución de frecuencia ó tablas de frecuencia a toda ordenación de datos obtenida en un fenómeno de un experimento estadístico en clases. Una tabla de distribución de frecuencia puede expresarse: a) En cifras absolutas (frecuencias absolutas) Pág. 4 de 8 Esta obra es exclusivamente de uso académico para los estudiantes de la BUAP. Esta obra se distribuye con una licencia Creative Commons Atribución-NoComercial, CompartirIgual 2.5 México


Licenciatura en ADMINISTRACIÓN Materia:

Análisis Estadístico

b) En cifras relativas (frecuencias relativas) La frecuencia relativa expresa la proporción en que un determinado valor de la variable participa en el conjunto; la frecuencia relativa la podemos expresar en forma de proporción f / n, o bien en forma de porcentaje (f / n) x 100. f = frecuencia. n = número total de observaciones. A continuación se señalaran las principales características que son parte de las tablas de frecuencia o de los datos agrupados: •

Clase o categoría: Es el par de valores ordenados separados por un guión y que también se

conoce como intervalo de clase. •

Límites de clase: Los números extremos de una clase o categoría se les conoce como límites

de clase y son el límite inferior y el límite superior. •

Límites reales de la clase: Los límites reales de la clase se obtienen sumando al límite superior

de la clase, el límite inferior de la clase contigua superior y dividiendo entre 2. •

Tamaño o amplitud de clase: Es la diferencia entre los límites de las clases que lo conforman.

Marca de clase: Es el punto medio de una clase o categoría y se obtiene sumando los límites

superior e inferior de la clase y dividiendo entre 2. Reglas generales para la formación de una tabla de distribución de frecuencia a) Obtener el rango: (diferencia entre el mayor y el menor de los datos de la ordenación) b) Determinar el número de clases deseado. (Una opción es obtener la raíz cuadrada del número total de observaciones) c) Determinar la anchura o amplitud de clase. Rango ÷ número de clases Determinar el número de observaciones que caen dentro de cada clase. Lo mejor para esto es utilizar una hoja de conteo. Frecuencia absoluta de la observación xi y que representaremos por ni es el número de veces que dicho valor aparece en la muestra. Frecuencia acumulada absoluta de la observación xi y que representaremos por Ni es el número de observaciones en la muestra menores o iguales que xi

N i =  n j = N i1 + n i ji

Pág. 5 de 8 Esta obra es exclusivamente de uso académico para los estudiantes de la BUAP. Esta obra se distribuye con una licencia Creative Commons Atribución-NoComercial, CompartirIgual 2.5 México


Licenciatura en ADMINISTRACIÓN Materia:

Análisis Estadístico

Frecuencia relativa de la observación xi y que representaremos por fi es la proporción sobre el total de la muestra que representa la frecuencia absoluta de xi. Si denotamos por n el número total de observaciones (tamaño muestral) obtendremos que:

fi =

ni n y puesto que

n i

i

=n 

f i

i

=1

Frecuencia acumulada relativa de la observación xi y que representaremos por Fi es la proporción de observaciones en la muestra menores o iguales que xi

Fi =

Ni =  f j = Fi1 + f i n ji

Ejemplos para entender mejor la distribución de frecuencia. •

http://www.youtube.com/watch?v=IDaGEHZjHJE

http://www.youtube.com/watch?v=oZLZr6URYYE&feature=related

1.5 Intervalo de clase Grupo de valores que describen una característica. Deben incluir todas las observaciones y ser excluyentes. Los intervalos contienen los límites de clase que son los puntos extremos del intervalo. Se denominan intervalos cerrados, cuando contienen ambos límites e intervalos abiertos si incluyen solo un límite.

1.6 Construcción de tabla de frecuencia La frecuencia de una medida

o de una categoría, es el número de veces que aparecen en una

colección de datos. El uso de frecuencias es más conveniente para datos cualitativos o discretos; el símbolo ƒ se usan para detonar la frecuencia de una medida. Existen dos tipos generales de tablas para reportar datos usando frecuencias, estas son; tablas de frecuencias no agrupadas y tablas de frecuencias agrupadas. Las tablas de frecuencias no agrupadas se denominan así porque cada medida tiene una frecuencia correspondiente. Una tabla de frecuencias agrupadas, presenta las frecuencias de acuerdo con grupos o clases de medida se usan comúnmente para resumir grandes cantidades de datos continuos que contienen relativamente pocas repeticiones.

Pág. 6 de 8 Esta obra es exclusivamente de uso académico para los estudiantes de la BUAP. Esta obra se distribuye con una licencia Creative Commons Atribución-NoComercial, CompartirIgual 2.5 México


Licenciatura en ADMINISTRACIÓN Materia:

Análisis Estadístico

La frecuencia relativa de una medida o clase se encuentra dividiendo la frecuencia ƒ de dicha medida entre el total n de medidas. Una tabla de frecuencia relativa

tiene varias ventajas sobre otra tabla de

frecuencias cualquiera ya que podemos hacer comparaciones llenas de significado entre conjuntos similares de datos que tengan las mismas clases pero frecuencias totales distintas. Ejemplo: La siguiente tabla de frecuencias relativas para datos de la aplicación 2.6. Note que la suma de la columna de frecuencias relativas es 1.00: Clase

Frecuencia Relativa

17.89-30.88 30.89-43.88 43.89-56.88 56.89-69.88 69.89-82.88

0.32 0.32 0.28 0.04 0.04 1.00

La frecuencia acumulada de cualquier medida, o clase, es la suma de las frecuencias de esa misma medida o clase y de las frecuencias de todas las demás de menor valor.

Ejemplo. Tabla de Frecuencia

Tabla de frecuencia

Acumulada

Clase

ƒ

Clase

Frecuencia Acumulada

2-21 22-24 42-61 62-81 82-101

18 8 6 10 8

2-21 22-24 42-61 62-81 82-101

18 26=(18+8) 32=(26-6) 42=(32+10) 50=(42+8)

50 También pueden construirse tablas de frecuencia acumulada para tablas que contienen frecuencias relativas o porcentajes, cuando se hace esto se denomina como tabla de frecuencia relativa acumulada. Una tabla de frecuencia bivariada es un arreglo de datos clasificados en dos categorías; la información usada para construir las tablas de frecuencia bivariada se obtienen generalmente de contar frecuencias. Cada categoría se identifica con un símbolo llamado variable, cada variable representa datos de una categoría; las categorías pueden ser números discretos, intervalos numéricos o valores cualitativos como género, color de cabello o religión.

Pág. 7 de 8 Esta obra es exclusivamente de uso académico para los estudiantes de la BUAP. Esta obra se distribuye con una licencia Creative Commons Atribución-NoComercial, CompartirIgual 2.5 México


Licenciatura en ADMINISTRACIÓN Materia:

Análisis Estadístico

Ejemplo: Vamos a suponer que la información se obtuvo de una muestra de votantes a los que se les pregunto su filosofía política y su filiación partidista; a cada uno se le pidió identificar su filosofía política como: liberal, conservadora u otra, su filiación partidista demócrata, republicana u otra; las dos variables de clasificación son filosofía política y filiación partidista. La variable filosofía política tienen tres categorías o niveles de clasificación: liberal, conservadora u otra; la segunda variable tiene también tres categorías o niveles: demócrata, republicana, otra; los datos están tabulados en la tabla siguiente: Filosofía

Política

Liberal

Conservadora

Otra

Total

Demócrata Republicana Otra

78 84 38

65 79 46

37 7 16

180 170 100

Total

200

190

60

450

Filiación Partidista

La información que sigue, entre otras, puede leerse fácilmente de la tabla: 1. Hubo 78 votantes que dijeron ser liberales demócratas 2. 79 personas manifestaron ser conservadores republicanos 3. Se entrevisto a 450 individuos.

Ejemplos para entender mejor las tablas de frecuencia. •

http://www.youtube.com/watch?v=BetmKeqtsSk

http://www.youtube.com/watch?v=rgGZzHqY9DU

Pág. 8 de 8 Esta obra es exclusivamente de uso académico para los estudiantes de la BUAP. Esta obra se distribuye con una licencia Creative Commons Atribución-NoComercial, CompartirIgual 2.5 México

Unidad01estadisticas  

Notas de Estadística