Page 1

ESTADÍSTICA I

Claudio Álvaro Cerrón Landeo


Cada autor es responsable del contenido de su propio texto. De esta edición: © Universidad Continental S.A.C 2013 Jr. Junin 355, Miraflores, Lima-18 Teléfono: 213 2760 Derechos reservados Primera Edición: Setiembre 2013 Tiraje: 1000 ejemplares Autor: Claudio Alvaro Cerrón Landeo Impreso en el Perú - Printed in Perú Fondo Editorial de la Universidad Continental Impreso en los Talleres Gráficos: Xprinted Solución Gráfica S.R.L. Todos los derechos reservados. Esta publicación no puede ser reproducida, en todo ni en parte, ni registrada en o trasmitida por un sistema de recuperación de información, en ninguna forma ni por ningún medio sea mecánico, fotoquímico, electrónico, magnético, electroóptico, por fotocopia, o cualquier otro sin el permiso previo por escrito de la Universidad.


ÍNDICE IINTRODUCCIÓN PRESENTACIÓN DE LA ASIGNATURA

9

COMPETENCIA DE LA ASIGNATURA 9 UNIDADES DIDÁCTICAS 9 TIEMPO MÍNIMO DE ESTUDIO 9 UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

11

DIAGRAMA DE PRESENTACIÓN DE LA UNIDAD I

11

ORGANIZACIÓN DE LOS APRENDIZAJES

11

Tema N°1: INTRODUCCIÓN

12

1 Ramas y objetivos de la Estadística

12

2 Fuentes de recolección de datos

14

3 Definiciones básicas

19

Tema N° 02: RESUMEN Y GRÁFICA DE DATOS

21

1 Construcción de tableros de frecuencias cualitativos y cuantitativos

21

2 Tipos de gráficos estadísticos. Lectura y análisis

24

LECTURA SELECCIONADA Nº 1

31

Seis grados de Kevin Bacon: ¿el estudio original utilizó buenos datos?

ACTIVIDAD N° 1

31

Glosario

32

BIBLIOGRAFÍA DE LA UNIDAD I

32

AUTOEVALUACIÓN DE LA UNIDAD I

33

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS. INDICADORES ESTADÍSTICOS

35

DIAGRAMA DE PRESENTACIÓN DE LA UNIDAD ii

35

ORGANIZACIÓN DE LOS APRENDIZAJES

35

Tema N°1: MEDIDAS DE TENDENCIA CENTRAL

36

1 Media 2 Mediana 3 Moda

Tema N° 2: MEDIDAS DE DISPERSIÓN 1 Rango o recorrido

36

39

43

46 46


2 Recorrido semi intercuartil

46

3 Desviación media

47

4 Varianza

47

5 Desviación típica o estándar

51

6 Coeficiente de variabilidad

53

Tema N° 3: MEDIDAS DE POSICIÓN, ASIMETRÍA Y CURTOSIS

54

1 Cuantiles

54

2 Medidas de Curtosis

57

3 Medidas de Asimetría

58

LECTURA SELECCIONADA Nº 2

60

ACTIVIDAD N° 2

61

Glosario

62

BIBLIOGRAFÍA DE LA UNIDAD II

62

AUTOEVALUACIÓN DE LA UNIDAD II

62

UNIDAD III: PROBABILIDAD

65

DIAGRAMA DE PRESENTACIÓN DE LA UNIDAD iiI

65

ORGANIZACIÓN DE LOS APRENDIZAJES

65

Tema N°1: FUNDAMENTOS DE PROBABILIDAD Y REGLAS BÁSICAS

66

1 Definiciones básicas, sucesos y probabilidades

66

2 Regla de la suma y multiplicación

69

¿Los premios de la Academia discriminan por la edad?

Tema N°2: PROBABILIDAD TOTAL Y TEOREMA DE BAYES

72

1 Teorema de la probabilidad total 2 Teorema de Bayes

Tema N°3: TÉCNICAS DE CONTEO 1 Técnicas de conteo

73

76

2 Combinaciones y permutaciones

LECTURA SELECCIONADA Nº 2

73

76 77

77

¿Debe preocuparse de que le realicen una prueba de detección de drogas cuando solicite un trabajo? Estadística. Mario Triola. Pág. 137

ACTIVIDAD N° 3

77

Glosario

78


BIBLIOGRAFÍA DE LA UNIDAD III

79

AUTOEVALUACIÓN DE LA UNIDAD III

79

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

82

DIAGRAMA DE PRESENTACIÓN DE LA UNIDAD iV

82

ORGANIZACIÓN DE LOS APRENDIZAJES

82

tema Nº 1: DISTRIBUCIONES DE PROBABILIDAD DISCRETA

83

1 Variables aleatorias

83

2 Distribución de probabilidad binomial

86

3 Distribución de probabilidad hipergeométrica

87

4 Distribución de probabilidad de Poisson

tema Nº 2: DISTRIBUCIONES DE PROBABILIDAD NORMAL

87

88

89

2 Aplicaciones de la distribución normal estándar

92

1 Distribución normal estándar. Valor crítico z

Tablas de Distribución Normal

95

LECTURA SELECCIONADA Nº 4

96

¿Los métodos estadísticos pueden demostrar que el proceso de selección de un jurado es discriminatorio?

ACTIVIDAD N° 4

96

Glosario

97

BIBLIOGRAFÍA DE LA UNIDAD IV

98

AUTOEVALUACIÓN DE LA UNIDAD IV

98

ANEXO

99


INTRODUCCIÓN

C

uando escuchamos el término ESTADÍSTICA lo re-

una buena metodología y manejo de procesos que nos per-

lacionamos frecuentemente con el término datos

mitan alcanzar el conocimiento deseado acerca de la realidad

o datos individuales y porcentajes o cualquier infor-

para realizar una buena toma de decisiones. No hay que dejar

mación relacionada con ellos. Sin embargo la ESTADÍSTICA

de ver que la ESTADÍSTICA al brindar apoyo a otras ciencias

es más que eso, no es sólo una serie de datos o un gráfico

requiere del buen manejo de procesos dirigidos a la toma y

estadístico, involucra varias etapas que son materia de estudio

análisis de datos asociándolos con el buen manejo del cálculo

del presente manual autoformativo.

de las probabilidades y con ciertos niveles de confiabilidad en

Podemos decir que la función principal de la estadística es jus-

la toma de decisiones.

tamente la recolección y agrupamiento de datos de diverso

El presente Manual Autoformativo de ESTADÍSTICA I está

tipo para construir con ellos informes estadísticos que nos den

diseñado para que el lector pueda adquirir los conocimientos

idea sobre diferentes y muy variados temas, siempre desde un

necesarios para poder ejecutar los procesos relacionados con

punto de vista cuantitativo y no cualitativo. Esto es muy im-

la descripción y análisis de datos (ESTADÍSTICA DESCRIP-

portante remarcarlo ya que la estadística se convierte enton-

TIVA) y el cálculo de probabilidades, utilizando con total

ces en una ciencia que nos habla de cantidades (por ejemplo,

autonomía los conceptos, características y ejemplos sobre el

cuántas personas viven en un país por metro cuadrado) pero

RESUMEN y Gráfica de datos descritos en la Primera Unidad;

no nos da información directa sobre la calidad de vida de esas

Análisis Exploratorio de datos e Indicadores Estadísticos des-

personas.

critos en la Segunda Unidad; Probabilidad descrita en la ter-

Este análisis numérico que se realiza con los datos es muy importante puesto que con ello fundamentaremos nuestra toma de decisiones, desde una simple actividad diaria de alguna persona hasta una complicada gestión en alguna empresa, en cualquier campo de acción. Es por ello que se requiere del conocimiento para poder disponer de datos apropiados, suficientes, oportunos y de buena calidad así como manejar

cera Unidad y Distribuciones de Probabilidad descritas en la Cuarta Unidad; complementadas en cada unidad con lecturas seleccionadas, actividades y autoevaluaciones del aprendizaje. Agradecemos a quienes de antemano tuvieron paciencia y comprensión en la elaboración del presente manual y a aquellos alumnos con quienes pudimos optimizar el uso de la información presente en esta PRIMERA EDICIÓN.


Desarrollo de contenidos

PRESENTACIÓN DE LA ASIGNATURA Diagrama

Objetivos

Lecturas seleccionadas

Glosario

Recordatorio

Anotaciones

Inicio

COMPETENCIA DE LA ASIGNATURA

Desarrollo Actividades Autoevaluación deConoce, contenidosaplica, analiza e interpreta eficientemente métodos y técnicas de estadística

descriptiva y teoría de probabilidades para la toma de decisiones, valorando reflexivamente su importancia como herramienta en los diversos campos de la ciencia, demostrando ética en el manejo de la información. Lecturas seleccionadas

Glosario

Bibliografía

UNIDADES DIDÁCTICAS UNIDAD IAnotaciones Recordatorio Introducción, RESUMEN y Gráfica de Datos.

UNIDAD II

UNIDAD III

Análisis Explorato- Probabilidad. rio de Datos. Indicadores Estadísticos.

UNIDAD IV Distribuciones De Probabilidad.

TIEMPO MÍNIMO DE ESTUDIO UNIDAD I

UNIDAD II

UNIDAD III

UNIDAD IV

1a y 2a Semana

3a y 4a Semana

5a y 6a Semana

7a y 8a Semana

16 horas

16 horas

16 horas

16 horas

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Bibliografía

9


Desarrollo de contenidos

Diagrama

Objetivos

Desarrollo de contenidos

Diagrama Lecturas seleccionadas

Inicio

Lecturas seleccionadas

Diagrama Recordatorio

Actividades

Glosario

Recordatorio

Anotaciones

Autoevaluación

DIAGRAMA DE PRESENTACIÓN DE LA UNIDAD I Objetivos Glosario

Inicio Bibliografía

Actividades

EJEMPLOS

Autoevaluación

ACTIVIDADES

Anotaciones

Glosario

AUTOEVALUACIÓN Bibliografía

BIBLIOGRAFÍA

ORGANIZACIÓN DE LOS APRENDIZAJES Objetivos

Inicio

Anotaciones

CONOCIMIENTOS

Tema Nº 1: Introducción 1 RamasActividades y Objetivos de la Desarrollo Autoevaluación de contenidos Estadística. 2 Fuentes de recolección de datos. 3 Definiciones básicas. Lecturas seleccionadas

Lecturas seleccionadas

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

CONTENIDOS

Desarrollo de contenidos Recordatorio

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Glosario

Bibliografía

Lectura Seleccionada N° 01: Kresalja J. Baldo. El principio de subsidiariedad en materia económica. Análisis de las Recordatorio Anotaciones Constituciones de 1979 y 1993. Palestra. Lima. 2010. pp. 185-199.. Tema Nº 2: RESUMEN y Gráfica de Datos 1 Construcción de tableros de frecuencias cualitativos y cuantitativos. 2 Tipos de gráficos estadísticos. Lectura y análisis.

Autoevaluación Nº 1

PROCEDIMIENTOS

ACTITUDES

1. Define los conceptos bási- 1. Valora de manera reflexiva la importancia de la Estadística cos de Estadística. Descriptiva en todo campo 2. Identifica y utiliza los métode la ciencia. dos y las fuentes de recolección de datos. 3. Identifica tipos de datos. Actividad N° 1: Construye un organizador de conocimiento sobre el tema. 4. Construye tableros de frecuencia, 5. Describe, explora y compara diferentes características de un conjunto de datos. Actividad N° 2: Construye y analiza gráficos y tableros de frecuencia. Control de Lectura N° 1:

Bibliografía

11


o os

as

io

12

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS TEMA 1: INTRODUCCIÓN Anotaciones

Estimado alumno, en este tema conoceremos los conceptos básicos de la Estadística que nos permitirán diferenciar las fuentes de recolección de datos así como definir el tipo de estadística que estamos aplicando, sobre todo definir la variable y el tipo de variable que estás estudiando; del mismo modo es importante que diferencies lo que es parámetro y estadígrafo sobre todo cuáles son y para qué tipo de variables se aplican. Detalles que son sumamente importantes al momento de plantear un estudio de investigación estadística 1 RAMAS Y OBJETIVOS DE LA ESTADÍSTICA 1.1 DEFINICIÓN Definir la estadística es una tarea difícil porque tendríamos que definir cada una de las técnicas que se emplean en los diferentes campos en los que interviene. Sin embargo, diremos, en forma general, que: “La ESTADÍSTICA es la ciencia que le facilita al hombre el estudio de datos masivos, proporcionando un conjunto de métodos científicos para recolectar, resumir, clasificar, analizar e interpretar el comportamiento de los datos con respecto a una característica, materia de estudio o investigación, pasa de esa manera a sacar conclusiones valederas y efectuar predicciones razonables de ellos y así mostrar una visión de conjunto clara y de más fácil apreciación con respecto a la fuente de información que nos permiten tomar decisiones óptimas en casos de incertidumbre” Estadística: Etimológicamente El origen etimológico de la palabra “estadística” no está bien determinado, puesto que existen distintas opiniones y referencias. Para algunos viene de la voz griega STATERA que significa “balanza”, otros sostienen que deriva del latín STATUS que significa “situación” mientras que algunos autores afirman que procede del alemán STAAT que significa “estado” pues era función principal de los gobiernos de los estados establecer registros de población , nacimientos, defunciones, etc. 1.2 RAMAS DE LA ESTADÍSTICA La estadística se divide en dos ramas que no son independientes; por el contrario, son complementarias y entre ambas dan la suficiente ilustración sobre una posible realidad futura, con el fin de que quien tenga poder de decisión, tome las medidas necesarias para transformar ese futuro o para mantener las condiciones existentes. En atención a su metodología, por sus procedimientos y alcances bien definidos, la ciencia estadística se clasifica en: 1.2 .1 ESTADÍSTICA DESCRIPTIVA O DEDUCTIVA: Se encarga de la recolección, clasificación y descripción de datos muestrales o poblacionales, para su interpretación y análisis. Su finalidad es obtener información, analizarla, elaborarla y simplificarla y presentándolos en forma clara; eliminando la confusión característica de los datos preliminares lo necesario para que pueda ser interpretada cómoda y rápidamente y, por tanto, pueda utilizarse eficazmente para el fin que se desee. Permite la elaboración de cuadros, gráficos e indicadores bien calculados; suficientemente claros, como para disipar las dudas y la oscuridad de los datos masivos.


UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS Desarrollo

de contenidos

Lecturas seleccionadas

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Glosario

1.2.2. ESTADÍSTICA INFERENCIAL O INDUCTIVA La estadística inferencial sobre la base de la muestra estudiada saca conclusiones, o sea, hace inferencia o inducción, en cuanto al universo Recordatorio o población, de donde se obtuvo dicha muestra, basándose en los datos simplificados y analizados; detectando las interrelaciones que pueden unirlos, las leyes que los rigen y eliminando las influencias del azar; llegando más allá de las verificaciones físicas posibles. ¿Cómo se selecciona la muestra?, ¿cómo se realiza la inferencia?, y ¿qué grado de confianza se puede tener en ella? son aspectos fundamentales de la estadística inferencial, para cuyo estudio se requiere un alto nivel de conocimientos de estadística, probabilidad y matemáticas. Comprende la teoría de estimación y prueba de hipótesis. 1.3 OBJETIVOS Los objetivos de la estadística pueden ser clasificados en tres grandes capítulos: descripción, análisis y predicción. 1.3.1. Descripción de grandes colecciones de datos empíricos reduciéndolos a un pequeño número de características que concentra la parte más importante y significativa de la información proporcionada por los datos. La descripción supone que los datos que vienen expresados en su forma natural deben ser clasificados y presentados sistemáticamente en cuadros o tablas como una pequeña reducción de datos, esto se obtiene cuando el comportamiento y características de los datos se expresan por un conjunto de indicadores, medidas de resumen o estadígrafos. La estadística se inicia estudiando el problema, puesto que es un trabajo preliminar de casi todas las investigaciones estadísticas; de este modo tanto como la reducción como la descripción de la información se estudia en la Estadística Descriptiva. Es importante anotar que la descripción estadística de los fenómenos o hechos es el primer aspecto al cual se redujo la ciencia estadística durante mucho tiempo, aplicándose especialmente a los datos demográficos, sociales económicos, etc. 1.3.2. Análisis estadístico de datos experimentales y de los fenómenos observados, toda la investigación estadística incluye un problema de análisis, con el objeto de formarse un concepto de la población o universo y adoptar decisiones; en este caso no es necesario observar toda a una población sino que será suficiente elegir una muestra representativa. La preocupación del análisis estadístico es inferir propiedades para una población sobre la base de resultados muestrales conocidos. Aquí se presenta varios problemas que presentan la Estadística, la estimación estadística, el cálculo de probabilidades, las pruebas estadísticas, etc. Éstos son aspectos que corresponde esencialmente a la Inferencia Estadística.

Todo análisis debe suponer la elección adecuada de una muestra representativa, la que será estudiada en detalle para obtener conclusiones o resultados, que dentro de ciertos márgenes de aceptación sean válidas a toda la población de la cual fue elegida la muestra.

Anotaciones

Bibliografía

13


o os

as

io

14

Actividades

Autoevaluación

Glosario

Bibliografía

Anotaciones

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

1.3.3 Predicción o comportamiento de los fenómenos en el futuro, lo cual constituye la máxima aspiración práctica de toda ciencia. Este objetivo de predicción y previsión está implícito tanto en la descripción como en el análisis estadístico, puesto que en general interesa orientar la toma de decisiones con vigencia y afecto en el futuro.

Naturalmente que las estimaciones y proyecciones dependen del grado de conocimiento del comportamiento del pasado y presente de las variables en estudio.

Para concretar estos objetivos, la Estadística se vale por una parte del censo, que recopila datos del todo, analiza la distribución y variación de las características de los elementos que componen una población claramente definida; por otra parte del muestreo, que permite estimar o inferir características de un todo considerando una parte representativa. Basándose en el análisis de experiencias y evaluaciones pasadas y actuales, hace estimaciones de fenómenos y características para un futuro, propone valores esperados. La estadística también se vale de una serie de artificios matemáticos y del cálculo de probabilidades, para definir sobre la validez de supuestos, construir modelos y métodos estadísticos.

2 FUENTES DE RECOLECCIÓN DE DATOS Finalmente, el Derecho Empresarial es considerado como el conjunto de normas que regulan la actividad empresarial, esto es, la de los actos de comercio y los sujetos de comercio. Así, existen varias disciplinas que alimentan el Derecho Empresarial en los distintos rubros de dicha la actividad empresarial. Así tenemos que, los actos de comercio y los sujetos de comercio son regulados por derecho civil y el derecho comercial; la organización laboral de la empresa está regulada por el derecho del trabajo; la actuación de la empresa con agentes extranjeros está regulada por el derecho internacional; las implicancias contables y tributarias de la empresa está regulada por el derecho tributaria; etc. 1.2 FUENTES DE DATOS Las fuentes de información están constituidas por cada uno de los lugares de donde se toman los datos. De acuerdo al tipo del lugar del cual procede esta información podemos clasificarlo de la siguiente manera: 1.2.1. Fuente Primaria Los datos de la fuente primaria son obtenidos directamente de las unidades de observación mediante cualquier técnica o instrumento de recolección de datos originales. 1.2.2. Fuente Secundaria Los datos de la fuente secundaria son aquellos datos que ya han sido publicados con anterioridad, recolectados con fines diferentes de los que la investigación específica necesita. Estos datos se encuentra como archivos registros administrativos boletines, informes estadísticos requeridos en el ámbito nacional o sectorial elaborados por organismos especializados los que pueden ser públicos o privados.


UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS Desarrollo

de contenidos

2.1.3 Fuentes Internas

Lecturas seleccionadas

Los datos procedentes de Fuentes Internas son aquellos que se generan dentro de la propia organización por ejemplo, los recursos de la cantidad de géneros o servicios producidos, el número de horas de trabajo Recordatorio consumidas en cada unidad de producción, la cantidad de materiales utilizados o desperdiciados y el número de ausencias al trabajo. 2.1.4 Fuente Externas Son los datos que se generan fuera de los negocios u organizaciones. Entre las fuentes más importantes de esta clase de información, están las agencias gubernamentales, las asociaciones profesionales y comerciales y las publicaciones especializadas, empresas privadas. 2.2 MÉTODOS DE RECOLECCIÓN DE DATOS Elegir el método de recolección de datos depende de las posibilidades de acceso o contacto con los elementos investigados, del tamaño de la población o muestra, de la oportunidad de obtener datos y del presupuesto y exigencias del tiempo. Los objetivos principales para la recolección son: - Obtener los datos o respuestas a las variables analizadas. - Proporcionar información adecuada y oportuna con fines de una óptima planificación. Para seleccionar el método de recolección de datos se debe tener en cuenta lo siguiente: a. Establecer Objetivos Claros Antes de recoger la información se debe decidir qué se va a hacer con ella. Cualquier recolección de información ha de tener un objetivo específico y ser seguida por acciones. La información es una guía para nuestras acciones. A partir de la información conocemos los hechos pertinentes y adoptamos acciones apropiadas basadas en esos hechos. b. Definir su propósito Una vez que se define el objetivo de la recolección de la información, también se determina los tipos de comparación que se necesitan, y esto a su vez identifica el tipo de datos que se deben de recoger. c. Confiabilidad de las Mediciones Está directamente relacionada a la adecuada selección de la muestra. 2.2.1 CENSO Es un método de recolección de datos mediante el cual la información se obtiene analizando a la totalidad de los elementos que componen la población o universo bajo estudio. Un censo debe cumplir las condiciones de universalidad (censar a todos los elementos de la población) y simultaneidad (realizarse en un momento determinado). Un censo es equivalente a una fotografía de la población bajo estudio. 2.2.2 OBSERVACIÓN Es un proceso permanente de investigación realizado con instrumentos y técnicas específicas según el ámbito de estudio. Es necesario que el investigador cuente con un marco teórico y referencial sobre las variables y sus indicadores. Para lograr una observación científicamente válida se debe:

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Glosario

Anotaciones

Bibliografía

15


o os

as

io

16

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

-

Preparar estrategia de obtención de información verídica

-

Determinar controles de las variables.

-

Planificación y determinación de método y tipo de observación.

Anotaciones

Se pueden considerar los siguientes tipos de observación: a. Natural: Es aquel tipo de observación que no maneja mayores reglas o procedimientos que las consideradas por el investigador quien se apoya en la creatividad, imaginación y capacidad organizativa. b. Diferencial o selectiva: Es aquel tipo en el cual se determina un sistema de clasificaciones de los datos, destacando la diferencia entre los objetos o elementos de estudio (tamaño, color, categorías, etc.). c. Experimental: Se caracteriza por existir un proceso pre establecido, y en el cual el investigador interviene para estimular, alterar algún componente del ente a estudiar con el fin de obtener un resultado esperado o reproducir un fenómeno. d. Ordinaria o No participante: Es aquel tipo de observaciones en la cual el investigador se encuentra fuera de los sucesos. e. Participante: Tipo de observación en la que el investigador está dentro de la población. De las características de cada uno de los tipos de observaciones, se puede concluir que es necesario contar con personal especializado, lo que significará un costo adicional y por otro lado es un método no conveniente cuando la población a estudiar es numerosa. 2.2.3 ENTREVISTA Consiste en una interacción entre dos personas, el entrevistador (quien investiga) que formula una serie de preguntas relativas al tema de investigación, y el entrevistado (quien tiene la información) que responde verbalmente o por escrito las información que le es solicitada. Esta técnica se aplica a informantes claves, es decir, personas representativas que manejan una gran cantidad de información referente a un tema de interés. La ventaja de realizar una entrevista es que la información que se obtiene puede ser enriquecida con repreguntas, la observación directa permite constatar la veracidad de las respuestas. Al ser una interacción entre dos personas existen muchos factores que pueden distorsionar las respuestas del entrevistado por lo que el entrevistador debe ser una persona con mucho dominio de esta técnica. Según la estructura de la entrevista, estas se clasifican en: a. Entrevista No Estructurada:

La entrevista no estructurada es flexible y abierta, aunque los objetivos de la investigación rigen a las preguntas, su contenido, orden profundidad y formulación se encuentra por entero en manos del entrevistador. Si bien el investigador, sobre las bases del problema, los objetivos y las variables, elabora las preguntas antes de realizar la entrevista, modifica el orden, la forma de encauzar las preguntas o su formulación para adaptarlas a las diversas situaciones y características particulares de los sujetos de estudio.


UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS Desarrollo

de contenidos

Lecturas

Glosario

Recordatorio

Anotaciones

seleccionadas Este tipo de entrevista es muy útil en los estudios descriptivos y en las fases de exploración para el diseño del instrumento de recolección de datos.

Las ventajas de este método son:

• Es adaptable y susceptible de aplicarse a toda clase de sujetos en situaciones diversas. • Permite profundizar en los temas de interés. • Orienta a posibles hipótesis y variables cuando se exploran áreas nuevas.

Entre las desventajas se cita: • Se requiere más tiempo. • Es más costosa por la inversión de tiempo con los entrevistadores. • Se dificulta la tabulación de datos. • Se requiere de mucha habilidad técnica para obtener la información y mayor conocimiento del tema. Aún con esas desventajas y dada la utilidad de la entrevista, en sus dos formas, todo investigador debe familiarizarse con su uso, ya que es probable que la aplique en cualquier tipo de investigación.

Aún con esas desventajas y dada la utilidad de la entrevista, en sus dos formas, todo investigador debe familiarizarse con su uso, ya que es probable que la aplique en cualquier tipo de investigación.

La entrevista no estructurada pueden clasificarse en: • Entrevista formal: Es la modalidad menos estructurada posible de entrevista, ya que se reduce a una simple conversación sobre el tema en estudio. Lo importante no es definir los límites de lo tratado ni ceñirse a algún esquema previo, sino “hacer hablar” al entrevistado, de modo de obtener un panorama de los problemas más sobresalientes, de los mecanismos lógicos y mentales del entrevistado, y de los temas que para él resultan de importancia. Lo más importante es dar al entrevistado la sensación clara y definida de que puede hablar libremente, alentándolo y estimulándolo para que lo haga y cuidando de no influirlo demasiado con nuestras actitudes o las palabras que decimos. • Entrevista focalizada: Es prácticamente tan libre y espontánea como la anterior, pero tiene la particularidad de concentrarse en un único tema. El entrevistador deja hablar sin restricciones al entrevistado, proponiéndole apenas algunas orientaciones básicas pero, cuando éste se desvía del tema original, el entrevistador vuelve a centrar la conversación sobre el primer asunto.

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Se emplea normalmente con el objeto de explorar a fondo alguna experiencia vivida por el entrevistado o cuando nuestros informantes son testigos presenciales de hechos de interés o de acontecimientos históricos. Requiere de gran habilidad en su desarrollo, para evitar tanto la dispersión temática como caer en formas más estructuradas de interrogación.

• Entrevista por pautas o guías: Se guían por una lista de puntos que se van explorando en el curso de la entrevista. Los temas deben guardar una cierta relación entre sí. El entrevistador hace muy pocas preguntas directas, y deja hablar al entrevistado siempre que vaya tocando alguno de los temas señalados en la pauta o guía.

Bibliografía

17


o os

as

io

18

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

b. Entrevista Estructurada Anotaciones

Se caracteriza por estar rígidamente estandarizada, replantean idénticas preguntas y en el mismo orden a cada uno de los participantes, quienes deben escoger la respuesta en 2, 3 ó más alternativas que se les ofrecen. Inclusive los comentarios introductorios y finales se formulan de la misma manera en todas las situaciones. Para orientar mejor la entrevista se elabora un formulario que contenga todas las preguntas. Sin embrago, al utilizar este tipo de entrevista el investigador tiene limitada libertad de formular preguntas independientes generadas por la interacción personal.

Algunas ventajas que presenta este tipo de entrevista son: • La información es más fácil de procesar, simplificando el análisis comparativo • El entrevistador no necesita ser entrenado arduamente en la técnica. • Hay uniformidad en el tipo de información obtenida. Pero también tiene desventajas, tales como: • Es difícil obtener información confidencial. • Se limita la posibilidad de profundizar en un tema que emerja durante la entrevista. 2.2.4 ENCUESTA Es una técnica que permite obtener información de una muestra representativa de una determinada población. Es un proceso a través del cual conseguimos datos de primera mano y todos ellos que permitan especificar mejor el problema. 2.2.5 CUESTIONARIO Es un plan formalizado para recolectar datos de los encuestados. La función del cuestionario es la medición del comportamiento pasado, de las actitudes y de las características del encuestado. Es el método que utiliza un instrumento o formulario impreso, destinado a obtener repuestas sobre el problema en estudio y que el investido o consultado llena por si mismo. El cuestionario puede aplicarse a grupos o individuos estando presente el investigador o el responsable del recoger la información, o puede enviarse por correo a los destinatarios seleccionados en la muestra. Algunas ventajas del cuestionario son: su costo relativamente bajo, su capacidad para proporcionar información sobre un mayor número de personas en un periodo bastante breve y la facilidad de obtener, cuantificar, analizar e interpretar los datos. Dentro de las limitaciones de este método figuran las siguientes: es poso flexible, la información no puede variar ni profundizarse. Respecto al diseño del cuestionario, este varía según la experiencia del investigador, los objetivos a alcanzar, los tiempos de aplicación, el presupuesto con que se cuenta, el tiempo para el estudio, entre otros. Generalmente un cuestionario tiene cinco secciones: a. Solicitud de cooperación: es un pequeño enunciado, diseñado para obtener la cooperación del encuestado con relación a la entrevista, Contiene la identificación de la organización que realiza la encuesta, se ex-


UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS Desarrollo

de contenidos

Lecturas

seleccionadas plica el objeto del estudio y se indica el tiempo que se requiere para completar la entrevista.

b. Datos de identificación: generalmente ocupan la primera sección del Recordatorio cuestionario y se relacionan con el nombre, dirección y número telefónico del encuestado. Los datos adicionales incluirían elementos tales como la hora y la fecha de la entrevista, además del nombre o código del entrevistador. c. Datos de clasificación: Tratan sobre las características del encuestado. Estos datos los suministra directamente el encuestado en el caso de una encuesta por correo. En las personales y telefónicas el entrevistador recolecta los datos o, en algunos casos, puede estimar tipos más sensibles de datos basado en la observación. d. Instrucciones: Se refieren a comentarios realizados al entrevistador o encuestado con relación a la forma de utilizar el cuestionario. Estos comentarios aparecen directamente en el cuestionario cuando se emplea una encuesta por correo. e. Información solicitada: Constituye la parte más grande del cuestionario. 3 DEFINICIONES BÁSICAS 3.1 POBLACIÓN Es el conjunto mayor o colección completa de todos los elementos (puntajes. personas, mediciones, etc.) que posee al menos una característica común observable, cuyo estudio nos interesa o acerca de los cuales se desea información. La población debe estar perfectamente definida en el tiempo y en el espacio, de modo que ante la presencia de un potencial integrante de la misma, se pueda decidir si forma parte o no de la población bajo estudio. Por lo tanto, al definir una población, se debe cuidar que el conjunto de elementos que la integran quede perfectamente delimitado. La población puede ser según su tamaño de dos tipos: a. Población finita: cuando se tiene un número determinado de elementos. b. Población infinita: cuando el número de elementos es indeterminado, o tan grande que pudiesen considerarse infinitos. Tamaño de la Población: Es el número total de elementos que tiene la población estudiada y se denota con la letra “N”

3.2 MUESTRA Es un subconjunto de la población a la cual se le efectúa la medición con el fin de estudiar las propiedades de la población de la cual es obtenida. Una muestra debe ser representativa, esto es, guarda las mismas características de la población de donde fue seleccionada y debe ser adecuada en cuanto a la cantidad de elementos que debe tener con respecto a la población. Existen diversos métodos para calcular el tamaño de la muestra y también para seleccionar los elementos que la conforman, pero es importante que sea re-

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Glosario

Anotaciones

Bibliografía

19


o os

as

io

20

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

presentativa de la población y sus elementos escogidos al azar para asegurar la objetividad de la investigación. Anotaciones

Tamaño de muestra: Es el número de elementos de la muestra y se denota con letra “n”. 3.3 PARÁMETROS ESTADÍSTICOS Es un número que describe alguna característica de la población o medida de resumen de una población. Se considera como un valor verdadero de la característica estudiada y para determinar su valor es necesario utilizar la información poblacional completa, y por lo tanto la decisión se toman con certidumbre total. 3.4 ESTADÍGRAFO O ESTADÍSTICO Es un número que describe alguna característica de la muestra o medida de resumen de una muestra y la toma de decisión contiene un grado de incertidumbre. 3.5 DATO Es el valor, respuesta o registro que adquiere una característica o variable asociado a un elemento de la población o muestra, como resultado de la observación, entrevista o recopilación en general. Puede ser un número, una palabra o un símbolo. 3.6 VARIABLE Es una característica estudiada de las unidades estadísticas. Podemos mencionar los siguientes tipos: a. Según la Naturaleza de la Variable a.1 Variables Cualitativas o Estadísticas de Atributos Cuando expresan una cualidad, característica o atributo, tiene carácter cualitativo, sus datos se expresan mediante una palabra, no es numérico. Por ejemplo: estado civil, los colores, lugar de nacimiento, profesiones, actividad económica, causas de accidentes, etc. a.2 Variables Cuantitativas Cuando el valor de la variable se expresa por una cantidad, es de carácter numérico. El dato o valor puede resultar de la operación de contar o medir; por ejemplo: edad, número de hijos por familia, ingresos, viviendas por centro poblado, niveles de desempleo, producción, utilidades de empresas, etc. Las variables cuantitativas pueden ser: Discreta y Continua. a.1.1 Variable Discreta Cuando el valor de la variable resulta de la operación de contar, su valor está representado sólo por números naturales (enteros positivos); Ejemplos: hijos por familia, número de accidentes por día, trabajadores por empresa, población por distritos, habitaciones por vivienda, etc. a.1.2 Variable Continua Cuando la variable es susceptible de medirse, es toda variable cuyo valor se obtiene por medición o comparación con una unidad o patrón de medida. Las variables continuas pueden tener cualquier valor dentro de su rango o recorrido, por tanto se expresa por cualquier número real; Ejemplos: área de parcelas, ingresos monetarios, producción de maíz, peso, estatura, tiempo de servicios, horas trabajadas, niveles de empleo, etc.


UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS Desarrollo

de contenidos

b. Según la Escala de Medición

Lecturas seleccionadas

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Glosario

b.1 Variables Nominales Son aquellas variables que establecen la distinción de los elementos en diversas categorías, sin implicar algún orden entre ellas, distribuye a la Recordatorio unidad de análisis en dos o más categorías. Ejemplos: sexo, estado civil, deportes de práctica, profesiones, lugar de nacimiento, etc. b.2 Variables Ordinales Aquellas variables que implican orden entre sus categorías, pero no grados de distancia igual entre ellas, están referidas a un orden de jerarquía, donde las categorías expresan una posición de orden. Ejemplo: grado de instrucción, clases sociales, grado de simpatía, rango de agresividad, orden de merito, etc. b.3 Variable de Intervalo Son aquellas que suponen a la vez orden y grados de distancia iguales entre las diversas categorías, pero no tienen origen natural, sino convencional, tiene un cero relativo. Por ejemplo: coeficiente de inteligencia, temperatura, puntuación obtenida en una escala, etc. b.4 Variables de Razón Estas variables comprenden a la vez todos los casos anteriores, distinción, orden, distancia y origen único natural; el valor se expresa con un número real tiene un cero absoluto. Por ejemplo: edad, peso, ingresos, número de hijos, producción, accidentes de tránsito, etc.

TEMA 2: RESUMEN Y GRÁFICA DE DATOS Ahora es momento de aplicar todos los conceptos, definiciones y características aprendidas en el tema anterior para poder realizar la representación de los datos estadísticos de manera gráfica o a través de un tablero estadístico. Debes tener en cuenta que antes de construir un tablero de frecuencias debes verificar quién es la variable, que tipo de variable es y qué valores asume.

1 CONSTRUCCIÓN DE TABLEROS DE FRECUENCIA CUALITATIVOS Y

CUANTITATIVOS La siguiente fase de la Estadística después de haber recolectado la información a través de un trabajo de campo, es la Organización y Clasificación de los Datos que debe ser consistente y veraz que nos permitirá posteriormente realizar una buena toma de decisiones. 1.1 CONCEPTOS BÁSICOS Para iniciar la organización de datos definiremos algunos conceptos: 1.1.1 Clase Es una división de la variable. Se denota como subíndice con la letra “i” y el número total de clases con “m”. 1.1.2 Frecuencia Es las veces que se repite una clase de la variable. Estas son: Simples y Acumuladas

Anotaciones

Bibliografía

21


o os

as

io

22

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

a. Frecuencia Simple: Es aquella frecuencia que sólo correspondes a una clase de la variable entre ellas tenemos: Anotaciones

a.1 Frecuencia Absoluta Simple La frecuencia absoluta simple de la clase ci es el número fi, de observaciones que presentan una modalidad perteneciente a esa clase. m

Además se cumple que:

∑f i =1

i

=n

a.2 Frecuencia Relativa Simple Frecuencia Relativa Simple de la clase ci es el cociente hi, entre las frecuencias absolutas de dicha clase y el número total de observaciones, es decir:

hi =

fi n

Obsérvese que fi es el tanto por uno de observaciones que están en la clase m

ci. También cumple:

∑h i =1

=1

i

a.3 Frecuencia Porcentual Simple Frecuencia Porcentual Simple de la clase ci es el producto de pi, entre las frecuencias relativas de dicha clase por 100, es decir

pi = hi *100 m

Cumple lo siguiente:

∑p i =1

i

= 100

b. Frecuencias Acumuladas: Aquellas frecuencias que se obtienen por la suma de dos o más clases de la variable b.1 Frecuencia Absoluta Acumulada Fi, se calcula sobre variables cuantitativas, y es el número de elementos de la población cuya modalidad es inferior o equivalente a la modalidad ci: i

Fi = f 1 + f 2 + .... + f i = ∑ f k k =1

b.2 Frecuencia Relativa Acumulada Hi, se calcula sobre variables cuantitativas, siendo el tanto por uno de los elementos de la población que están en alguna de las clases y que presentan una modalidad inferior o igual a la ci, es decir:

Hi =

i Fi = h1 + h2 + ... + hi = ∑ hk n k =1

b.3 Frecuencia Porcentual Acumulada

Pi, se calcula sobre variables cuantitativas, siendo el tanto por ciento de los elementos de la población que están en alguna de las clases y que presentan una modalidad inferior o igual a la ci, es decir :


UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS Desarrollo

de contenidos

Lecturas seleccionadas

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Glosario

1.2 Distribución de Frecuencias Llamaremos distribución de frecuencias o tabla de frecuencias al arreglo de filas y columnas que contiene al conjunto de clases junto a las frecuencias coRecordatorio rrespondientes a cada una de ellas. Una tabla estadística sirve para clasificar y ordenar los datos estadísticos. 1.2.1 Tablas Univariantes o unidimensionales Se denomina así a las tablas de frecuencias que presentan información de una sola variable. Sus formas generales son las siguientes: a. Variable cualitativa

b. Variable cuantitativa b.1 Cuantitativa Discreta

b.2 Cuantitativa Continua Si las clases van a estar conformadas por intervalos se debe seguir los siguientes pasos: • Determinar el mínimo (Mín) y el máximo (Máx) del conjunto de datos. • Calcular el Rango (R) de datos mediante: R = Máx – Mín • Elegir el número de clases (m): se puede utilizar la siguiente fórmula m = 2.54 n siempre es un valor entero, redondear según criterios de redondeo. El valor de m se puede elegir también a criterio y necesidades del investigador en un intervalo de 5<m<20. • Se calcula la amplitud del intervalo (a) mediante:

a=

R m

siempre se redondea por exceso (esto es siempre aumentar una unidad en la cifra de redondeo. Ejemplo si a=1.23 y se desea redondear a 1 decimal el valor de a = 1.3). • Debido al redondeo por exceso que se realiza en el paso anterior, se debe realizar el ajuste al rango (si el cociente de la amplitud es exacto no seguir este paso) mediante los siguiente pasos:

Anotaciones

Bibliografía

23


o os

as

io

24

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

- Calcular el nuevo rango (R’) mediante R’ = a*m. - Calcular el exceso del nuevo rango que estará dado por d=R’-R. Anotaciones

- A la diferencia se divide en dos partes (d/2) y se le disminuye al Mín (Mín – d/2) y se le agrega al Máx (Máx + d/2) obteniendo nuevos límites. • Construir los intervalos de clase de la siguiente manera:

1.2.2 Tablas bivariantes o bidimensionales Se denominan así a las tablas que presentan información de dos variables en forma conjunta. Sus formas generales son las siguientes: Tablas bivariantes de frecuencias absolutas

De igual manera se puede construir tablas bivariantes para frecuencias relativas o porcentuales de acuerdo a las necesidades de presentación de información. Se pueden elaborar tablas de frecuencias de más variables, como por ejemplo de tres variables denominadas trivariantes o tridimensionales. 2 TIPOS DE GRÁFICOS ESTADÍSTICOS. LECTURA Y ANÁLISIS 2.1 Cuadro Estadístico: Se utiliza para presentar la información estadística en forma ordenada y de fácil lectura para cualquier usuario, se presenta en informes finales y tiene las siguientes partes: 2.1.1 Componentes de un cuadro Una gráfica, cuadro o una tabla, debe constar de: Título adecuado: Claro y conciso, que responda a las preguntas: ¿Qué relaciona?, ¿cómo?, ¿cuándo?, y ¿dónde se hicieron las observaciones?. El cuerpo: o cuadro en sí, donde debe considerar el o los tipos de variables a relacionar, el público a quien va dirigido y presentarse las frecuencias que sean más necesarias.


UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS Desarrollo

de contenidos

Lecturas

seleccionadas Notas Explicativas: En ella se presentan aclaraciones respecto a la información que se está presentando. Este componente es opcional.

Fuente: Corresponde al área de la empresa o institución responsable de la elaboración de la información. Recordatorio

2.2 Gráfico Estadístico Una gráfica o diagrama estadístico es un dibujo complementario a una tabla o cuadro, que permite observar las tendencias de un fenómeno en estudio y facilita el análisis estadístico de las variables ahí relacionadas. 2.2.1 Componentes de una gráfica: Una gráfica, cuadro o una tabla, debe constar de: Título adecuado: Claro y conciso, que responda a las preguntas: ¿Qué relaciona?, ¿cómo?, ¿cuándo?, y ¿dónde se hicieron las observaciones? El cuerpo: Es el gráfico en sí, cuya elección debe considerar el o los tipos de variables a relacionar, el público a quien va dirigido y el diseño artístico del gráfico. Fuente: Corresponde al área de la empresa o institución responsable de la elaboración de la información. 2.2.2 Principales tipos de gráficos Existe una gran cantidad de gráficos para la representación de datos estadísticos, entre los principales tenemos: a. Gráfico de Barras: El gráfico de barras, como su nombre lo indica, está constituido por barras rectangulares de igual ancho, conservando la misma distancia de separación entre sí. Se utiliza básicamente para mostrar y comparar frecuencias de variables cualitativas o comportamientos en el tiempo, cuando el número de ítems es reducido. Se construye de la siguiente manera la base de las barra la conforman las categorías de la variable y su altura se presenta con la frecuencias simples (absoluta, relativa o porcentual) Se clasifican por: Barras Simples: Compara valores entre categorías de una variable Barras Dobles: Compara valores entre categorías de dos variables Barras Múltiples Compara valores entre categorías de dos variables Barras Verticales: Las categorías de la variable deben ubicarse en el eje X Barras Horizontales: Las categorías de la variable deben ubicarse en el eje Y Barras Apiladas: Compara entre categorías el aporte de cada valor en el total.

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Glosario

Anotaciones

Bibliografía

25


o os

as

io

26

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Anotaciones

b. Gráfico de Sectores Circulares (Pie):

Usualmente llamado gráfico de pastel, debido a su forma característica de una circunferencia dividida en sectores, por medio de radios que dan la sensación de un pastel tajado en porciones. Se usa para representar variables cualitativas en porcentajes o cifras absolutas cuando el número de ítems no es superior a 5 y se quiere resaltar uno de ellos.


UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS Desarrollo

de contenidos

Lecturas seleccionadas

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Glosario

c. Gráfico de Líneas o Tendencia: Usado básicamente para mostrar el comportamiento de una variable cuantitativa a través del tiempo. El gráfico de líneas consiste en segmenRecordatorio tos rectilíneos unidos entre sí, los cuales resaltan las variaciones de la variable por unidad de tiempo. Cuando se tienen varias variables a representar, con el fin de establecer comparaciones entre ellas (siempre que su unidad de medida sea la misma); se utiliza plasmarlos en un sólo gráfico, el cual es el resultado de representar varias variables en un mismo plano. A este tipo de gráfico se le conoce como gráfico de líneas compuesto.

d. Histograma de Frecuencias: Es un gráfico de barra pero unidas. Se utiliza básicamente para mostrar la distribución de frecuencias de variables cuantitativas. El histograma se construye dibujando barras contiguas que tienen como base la amplitud de cada intervalo y como alturas las frecuencias respectivas. Distribuidora Chespi S.A.: Medición de la resistencia de conductores.

Fuente: Área de Ingeniería. e. Polígono de Frecuencias: Es un gráfico poligonal cerrado. Se utiliza básicamente para mostrar la distribución de frecuencias de variables cuantitativas. Para la construcción de un polígono de frecuencias, se marcan los puntos medios (marcas de clase) de cada uno los intervalos en la parte superior de cada barra del histograma de frecuencias, los cuales se unen con segmentos de recta.

Anotaciones

Bibliografía

27


o os

as

io

28

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Distribuidora Chespi S.A.: Medición de la resistencia de conductores.

Anotaciones

Fuente: Área de Ingeniería. f. Histograma de Frecuencias Acumuladas: Se utiliza básicamente para mostrar la distribución de frecuencias acumulada de variables cuantitativas. El histograma de frecuencias acumuladas también es obtenido a partir de una distribución de frecuencias, tomando en el eje horizontal las clases de la variable, y en el eje vertical las frecuencias acumuladas correspondientes a cada intervalo. Se construye de la misma manera que un histograma, pero utilizando frecuencias acumuladas. Se puede mostrar mediante las barras o bien mediante un polígono abierto. Para la construcción de un histograma de frecuencias acumulado, se marcan los límites superiores de cada uno los intervalos en la parte superior de cada barra del histograma de frecuencias acumulado, los cuales se unen con segmentos de recta. Este gráfico se le conoce también con el nombre de Ojiva de frecuencias. Distribuidora Chespi S.A.: Medición de la resistencia de conductores.

Distribuidora Chespi S.A.: Medición de la resistencia de conductores.

g. Diagramas de dispersión o nubes de puntos: Este tipo de gráfico es útil para representar la relación existente entre dos variables de tipo cuantitativo La representación gráfica de este tipo de variables es en realidad semejante a la representación de puntos en el plano, usando unos ejes de coordenadas. Cada pareja de valores da lugar a un punto en el plano y el conjunto de puntos que se obtiene se denomina “diagrama de dispersión o nube de puntos”.


UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS Desarrollo

de contenidos

Televisores: Relación entre Unidades Vendidas y Precio

V

Lecturas seleccionadas

Glosario

Recordatorio

Anotaciones

e n t a

Precio (Dólares)

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

h. Pictograma: Tiene la característica de que las unidades de la variable se debe representar con símbolos que lo identifique y su tamaño va en relación a la frecuencia de la categoría de la variable

i. Pirámide: Se utiliza principalmente para presentar la distribución de la población por grupos etéreos y género

j. Diagrama de Pareto El diagrama de Pareto permite ver que en muchos casos pocos factores pueden producir la mayoría de las consecuencias y se podría resumir en “pocos vitales y muchos triviales”. Por ejemplo, en Control de Calidad se puede mostrar que la mayoría de los defectos y el costo de los mismos surge de un número relativamente pequeño de causas.

Bibliografía

29


o os

as

io

30

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Anotaciones

k. Tablas de contingencias También llamadas tablas cruzadas o de doble entrada. Se utilizan cuando a las observaciones se les asocian con dos variables cualitativas simultáneamente.


Diagrama

Objetivos

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS Desarrollo

Inicio

de contenidos

Desarrollo de contenidos

Actividades

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Autoevaluación Lecturas seleccionadas

Glosario

Recordatorio

Anotaciones

LECTURA SELECCIONADA N° 1 Lecturas seleccionadas

Recordatorio

Glosario

Anotaciones

Bibliografía

Seis grados de Kevin Bacon: ¿el estudio original utilizó buenos datos? Estadística. Mario Triola. Pág. 3

“Seis grados de Kevin Bacon” es un juego popular reciente, que consiste en identificar a un actor o a una actriz de cine, y luego vincularlo con el actor Kevin Bacon. (En el momento en que se escribió esto, el juego podía jugarse en el sitio Web www.cs.virginia. edu/oracle). Consideremos a Richard Gere como ejemplo. Gere actuó en la película Cotton Club con Laurence Fishburne, que trabajó en la película Mystic River con Kevin Bacon. El vínculo Gere-Fishburne-Bacon tiene dos grados de separación porque no se cuenta la persona meta. Este juego, creado por tres estudiantes (Craig Fass, Brian Turtle y Mike Ginelli) de Albright College, es una versión más especializada de “Small World Problem”, que plantea la siguiente pregunta: ¿Cuántos intermediarios (amigos, parientes y otros conocidos) se necesitan para conectar a cualesquiera dos personas elegidas al azar en la Tierra? Es decir, para cualesquiera dos personas en nuestro planeta, ¿cuál es el número de grados de separación? Este problema de conexión tiene aplicaciones prácticas en muchos campos, como las redes eléctricas, el uso de Internet, las neuronas del cerebro y la propagación de enfermedades. El concepto de “seis grados de separación” surgió de un estudio realizado en 1967 por el psicólogo Stanley Milgram, quien originalmente describió que en Estados Unidos dos residentes al azar están conectados por un promedio de seis intermediarios. En su primer experimento, Milgram envió 60 cartas a personas de Wichita, Kansas, a quienes les pidió que renviaran esas cartas a una mujer específica en Cambridge, Massachusetts. A esas personas se les dio la instrucción de entregar en mano las cartas a conocidos que, según ellos, podrían contactar a la persona indicada, ya fuera directamente o a través de otros conocidos. Participaron 50 de las 60 personas, y tres cartas llegaron a su destino. Dos experimentos posteriores tuvieron tasas de terminación más bajas; pero finalmente Milgram alcanzó una tasa del 35 por ciento, y describió que cada cadena completa tenía un promedio de alrededor de seis intermediarios. Como consecuencia, los datos originales de Milgram produjeron el concepto “seis grados de separación”. Veamos dos preguntas clave: ¿Eran adecuados los datos originales de Milgram? ¿Los datos originales de Milgram justifican el concepto de “seis grados de separación?” Un principio extremadamente importante en este capítulo, en este libro, y en la estadística en general, es que el método que se utiliza para reunir datos de muestras puede construir o destruir la validez de las conclusiones basadas en los datos. En la actualidad, a todos nosotros se nos bombardea con encuestas y resultados de encuestas. Algunas reúnen datos de muestras que son útiles porque describen de manera exacta características importantes de poblaciones. Otras encuestas usan datos muestrales recolectados de tal forma que condenan los resultados a la creciente pila de basura de la mala información. Diagrama

Objetivos

Desarrollo de contenidos

Actividades

Inicio

ACTIVIDAD N° 1 Autoevaluación

Esta actividad puede consultarla en su aula virtual.

Lecturas seleccionadas

Glosario

Recordatorio

Anotaciones

Bibliografía

Bibliografía

31


o os

as

io

32

Inicio UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Actividades

Autoevaluación

Diagrama

Objetivos

Glosario

Bibliografía

Desarrollo de contenidos

Actividades

Lecturas seleccionadas

Glosario

Autoevaluación

GLOSARIO Anotaciones

Bibliografía

• Arreglo u ordenamiento de datos: Organización de los datos sin procesar en orden ascendente o descendente. Recordatorio

• Anotaciones Conjunto de datos: Una colección de datos. • Distribución de frecuencias: Presentación de un conjunto de datos en el que se muestra la frecuencia absoluta y/o relativa de los datos pertenecientes a cada intervalo. • Estadígrafo: Característica de la muestra. • Frecuencia absoluta: Número de datos que pertenecen a determinado intervalo. • Frecuencia Relativa: Proporción representativa de cada intervalo respecto al tamaño total. • Histograma: Gráfica de un conjunto de datos compuesta por una serie de rectángulos cada uno con un ancho proporcional al rango de los valores de cada clase o intervalo y altura proporcional a la frecuencia. • Intervalo: Conjunto de datos núméricos establecidos entre dos límites, inferior e inferior. • Marca de clase: Punto medio de cada intervalo, valor representativo de todos los datos que pertenecen a dicho intervalo. • Muestra: Colección de algunos elementos, subconjunto de la población con las mismas características que la población bajo estudio, utilizada para describir a la población de la cual proviene. • Ojiva: Gráfica de una distribución de frecuencias acumuladas. • Parámetro: Característica de la población. • Población: Colección de todos los lementos que se están estudiando y sobre los cuales intentamos llegar a conclusiones. • Variable Cualitativa Nominal: Aquella que asume valores cualitativos que no poseen jerarquías entre si. • Variable Cualitativa Ordinal: Aquella que asume valores cualitativos los cuáles si poseen jerarquías entre si. • Variable Cuantitativa Continua: Aquella que asume valores cuantitativos que provienen de una medición.

Diagrama

Objetivos

Inicio

Desarrollo de contenidos

Actividades

Autoevaluación

Lecturas seleccionadas

Glosario

Bibliografía

• Variable Cuantitativa Discreta: Aquella que asume valores cuantitativos que provienen de un conteo.

BIBLIOGRAFÍA DE LA UNIDAD I

1. Triola Mario F. ESTADÍSTICA. Pearson Educación. México 2012

Recordatorio

Anotaciones

2. Berenson, Mark y Levine, David. Estadística Básica en Administración, Conceptos y aplicaciones. Prentice Hall, México 2010  


s

s

o

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS Desarrollo

de contenidos

Objetivos

Inicio

Actividades

Autoevaluación

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Lecturas seleccionadas

Glosario

Recordatorio

Anotaciones

AUTOEVALUACIÓN DE LA UNIDAD I 1. A los clientes de un banco se les pide rellenen un cuestionario en el que se hicieron las siguientes preguntas, Glosario

Bibliografía

Anotaciones

Cuáles proporcionan datos cuantitativos o cualitativos? Asigne el código correspondiente:

A= Cualitativos Nominales B= Cualitativos Ordinales

C=Cuantitativos Discretos D=Cuantitativos Continuos A. DADCB

B. DBCAB

D. ADBCB

E. BCBAC

C. CADCA

2. En la siguiente tabla, se muestra el grado de instrucción de 1000 trabajadores de la liquidada empresa DOE RUN. Identifica cual de las afirmaciones es incorrecta.

A. El total de trabajadores con estudios superior técnico son 388. B. El diagrama de sectores representa mejor este tipo de variable. C. El 24.5% de los trabajadores son universitarios D. Más del 50% tienen estudios básicos. (Primaria y secundaria). E. Más del 60% de los trabajadores tienen estudios superiores o universitarios. 3. En la distribución de frecuencias

Los valores de A, B, C, D y E en ese orden son:

Bibliografía

33


o os

as

io

34

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

A. 13, 72, 16, 135, 96.5% B. 23, 62, 16, 137, 96.5% C. 13, 72, 16, 138, 96% Anotaciones

D. 23, 62, 16, 135, 96%

4. El siguiente gráfico representa las preferencias de bebidas de los estudiantes de la Universidad “Continental”. Señale el enunciado incorrecto entre los presentados luego del gráfico.

A. Es un diagrama de barras agrupadas que representa la preferencia de bebidas por género. B. La mayoría de los estudiantes de ambos géneros prefieren gaseosas. C. De todos los estudiantes encuestados 22 prefieren otras bebidas. D. Más del 50% de los estudiantes prefieren Frugos. E. Sólo 33 de los estudiantes encuestados prefieren agua.

5. Se tiene la siguiente tabla de distribución de frecuencia:

Determine el tamaño de la muestra. A. 120 B. 130 C. 140 D. 150 E. 160


Desarrollo de contenidos

Diagrama

Objetivos

Desarrollo de contenidos

Lecturas seleccionadas Diagrama

Inicio

UNIDAD II: “ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS” Actividades

Diagrama Recordatorio

Glosario

Recordatorio

Anotaciones

DIAGRAMA DE PRESENTACIÓN DE LA UNIDAD II Glosario

Bibliografía

Objetivos

Inicio

Anotaciones Actividades

EJEMPLOS

Glosario

ACTIVIDADES

Autoevaluación

AUTOEVALUACIÓN Lecturas seleccionadas

Lecturas seleccionadas

Autoevaluación

CONTENIDOS Recordatorio Desarrollo de contenidos

BIBLIOGRAFÍA

Bibliografía

ORGANIZACIÓN DE LOS APRENDIZAJES Objetivos

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Inicio

Anotaciones

CONOCIMIENTOS

Tema N°Actividades 1:Medidas de Autoevaluación Tendencia Central 1. Media 2. Mediana 3. Moda Lecturas Glosario Bibliografía

Desarrollo de contenidos

seleccionadas

Tema N° 2: Medidas de Dispersión 1. Rango o recorrido Recordatorio Anotaciones 2. Recorrido semi intercuartil 3. Desviación media 4. Varianza 5. Desviación típica o estándar 6. Coeficiente de variabilidad Tema N° 3: Medidas de Posición, Asimetría y Curtosis 1. Cuantiles 2. Medidas de Asimetría 3. Medidas de Curtosis Lectura Seleccionada N° 2 ¿Los premios de la Academia discriminan por la edad? Autoevaluación N° 2

PROCEDIMIENTOS

ACTITUDES

1. Calcula las medidas de tendencia central y las interpreta. 2. Calcula las medidas de dispersión y las interpreta.

Demuestra proactividad y ética en el desarrollo de la asignatura y en el manejo de la información.

Actividad N° 1: Calcula indicadores estadísticos en distintas situaciones. 3. Calcula las medidas de posición y utiliza otros indicadores estadísticos para analizar conjuntos de datos. Actividad N° 2: Resuelve ejercicios y problemas aplicando las medidas de dispersión. Tarea Académica N° 1

Bibliografía

35


o os

as

io

36

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS Anotaciones

TEMA Nº 1: MEDIDAS DE TENDENCIA CENTRAL Estimado alumno es momento de conocer las medidas descriptivas que son conocidas a menudo como indicadores estadísticos que nos van ayudar a tener una idea del comportamiento general de los datos sin tener la necesidad de analizarlos uno por uno, por ello es importante que tengamos en cuenta que lo que vamos a calcular son medidas representativas de los datos sobre los cuales ya podremos tomar algún tipo de decisión. Las medidas de tendencia central, llamadas así porque tienden a localizarse en el centro de la información. De tendencia porque no necesariamente son valores que la distribución presenta, sino valores hacia los cuales tiende o aproxima. Centrales porque, normalmente, en el gráfico de frecuencias serán siempre valores medios centrales. Las medidas de tendencia central responden a la necesidad de describir una colectividad en función de una sola medida que la caracterice y distinga, ya sea porque son los más frecuentes (moda) o porque alrededor de ellos se agrupa la mayor parte de la población o muestra (media o mediana). Las medidas de tendencia central, son también medidas de posición ya que, de todas maneras ocupan un lugar dentro de la información, los parámetros posicionales son muy útiles en la interpretación porcentual de la información. Este tipo de medidas son de gran importancia en el manejo de las técnicas estadísticas, sin embargo, su interpretación no debe hacerse aisladamente de las medidas de dispersión, ya que la representatividad de ellas está asociada con el grado de concentración de la información. Las principales medidas de tendencia central son: 1. Media aritmética. 2. Mediana 3. Moda. 1 MEDIA ARITMÉTICA Definida matemáticamente como el cociente entre la suma de todos los valores de la variable y el número de observaciones. a. Simbología: Si la media es calculada de una población se simboliza mediante µ Si la media muestral es calculada de una muestra de una población se simboliza mediante x .


UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS Desarrollo

de contenidos

b. Cálculo de la Media

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Lecturas seleccionadas

Glosario

Recordatorio

Anotaciones

b.1. Para datos no agrupados

Ejemplo 1: La inversión anual (en miles de nuevos soles) de un grupo de pequeñas empresas de la ciudad fueron: 10 12 40 10 30 14 16 20 25 28 30 26 30 10 18 17 13 17 21 14 15 19 27 22 14 11 13 15 18 20 30 39 Calcule e interprete la media. Solución: Obtenemos

Interpretación: En promedio las pequeñas empresas invierten 20 125 nuevos soles al año b.2. Para datos agrupados

Ejemplo 2: Variable Discreta Se selecciona al azar 280 vendedores de una gran compañía constructora de casas. A continuación se muestra el número de casas vendidas durante el último bimestre. Calcule e interprete la media

Solución: Completando la siguiente tabla para el cálculo de la media aritmética

Bibliografía

37


o os

as

io

38

Actividades

Autoevaluación

Glosario

Bibliografía

Anotaciones

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

El promedio es: Ejemplo 3: Variable Continua La siguiente tabla de distribución de frecuencias corresponde al rendimiento de gasolina en kilómetros por litro de una muestra de 50 automóviles producidos por Nissan México.

Solución: Completando la siguiente tabla para el cálculo de la media aritmética

El promedio es:

Interpretación: _____________________________________________________ __________________________________________________________________ c. Propiedades de la media aritmética 1. La suma total de los n valores cuya media es

Datos no agrupados :

x

es igual a n. x .


UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS Desarrollo

de contenidos

Lecturas seleccionadas

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Glosario

2. Si cada uno de los n valores xi es transformado en: yi = a . xi + b, siendo a y b constantes, entonces, la media de los n valores yi es: Recordatorio

Como casos particulares se tiene: . Si los n datos son una constante b, entonces la • Si yi = b, entonces media es igual a esa constante b. . Si a cada dato se le suma una constante • Si yi = xi + b, entonces b, la media queda sumada por esa constante b. . Si a cada dato multiplica por una constan• Si yi = a . xi , entonces te a, la media queda multiplicada por esa constante a. 3.La suma algebraica de las desviaciones de n datos xi con respecto a su media, es igual a cero.

4.La suma de los cuadrados de las desviaciones de n datos con respecto a su media es el valor mínimo.

d. Ventajas de la media aritmética - Es fácil de entender y usar. - Hace uso de todos los datos de la distribución, por lo cual es una medida de tendencia central eficiente. - Es el más conocido y popular de los promedios, el primero en el que piensan las personas, aunque no sepan estadística. - El hecho de que su definición no sea lógica sino matemática hace que sea la medida de tendencia central usada con preferencia en Inferencia Estadística y en la mayoría de tests estadísticos. e. Desventajas de la media aritmética - Puede ser influenciada por valores extremos, que la hagan perder su valor como medida de tendencia central - En ciertos casos puede no representar un valor observable, lo cual en el caso de variables discretas resulta artificioso. - No puede calcularse para series cualitativas. - Resulta tedioso calcular la media debido a que utilizamos cada uno de los puntos de dato de nuestro cálculo. - Somos incapaces de calcular la media para un conjunto de datos que tiene clases de extremo abierto, ya sea en el inferior o en el superior de la escala. 2 MEDIANA Su definición no es matemática sino lógica, entendemos por mediana aquel valor de la variable que divide en dos partes iguales a un conjunto ordenado de datos. a. Simbología Se simboliza con Me

Anotaciones

Bibliografía

39


o os

as

io

40

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

b. Cálculo de la Mediana b.1 Para datos no agrupados Anotaciones

Para el cálculo de la mediana los datos deben estar ordenados de menor a mayor, y deja a su izquierda y derecha el mismo número de elementos, es decir, el valor que ocupa el lugar central es la mediana. Lo anterior tiene sentido en caso de que la serie tenga un número impar de elementos, si por el contrario tuviera un número par habría dos valores centrales, y en este caso se toma como mediana la media aritmética de los dos valores centrales. Ejemplo 1-a: Si el número de datos es par La inversión anual (en miles de soles) de un grupo de pequeñas empresas de la ciudad fueron:

Calcule e interprete la mediana. Solución: Primero debemos ordenar los datos en forma ascendente (de menor a mayor)

Luego el número de datos se divide en dos partes iguales Se elige los valores centrales de la variable que tiene la posición i=16 y i=17 que para el ejercicio son 18 y 18

La mediana será:

Me =18

Interpretación: El 50% de las pequeñas empresas han invertido como máximo 18 mil nuevos soles al año. Ejemplo 1-b: Si el número de datos es impar La inversión anual (en miles de nuevos soles) de un grupo de pequeñas empresas de la ciudad fueron:

Calcule e interprete la mediana. Solución: Primero debemos ordenar los datos en forma ascendente (de menor a mayor)

Luego el número de datos se divide en dos partes iguales


UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS Desarrollo

de contenidos

Lecturas

Glosario

Recordatorio

Anotaciones

seleccionadas Se elige el valor centrales de la variable que tiene la posición i=17 que para el ejercicio es 18

La mediana será:

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Me = 18

Interpretación: El 50% de las pequeñas empresas han invertido como máximo 18 mil nuevos soles al año. b.2 Para datos agrupados Se aplica el siguiente estadígrafo:

Ejemplo 2: Variable Discreta Se selecciona al azar 280 vendedores de una gran compañía constructora de casas. A continuación se muestra el número de casas vendidas durante el último bimestre. Calcule e interprete la media

Calcule e interprete la mediana. Solución: Como los datos tabulados ya están ordenados, debemos encontrar el valor de la variable que ocupa la posición central, entonces dividimos al conjunto de datos “n” en dos partes: Entonces ubicamos en la tabla el valor que tenga la posición ___, para eso calculamos la frecuencia acumulada

Bibliografía

41


o os

as

io

42

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Entonces la mediana es: Anotaciones

Me =

Ejemplo 3: Variable Continua La siguiente tabla de distribución de frecuencias corresponde al rendimiento de gasolina en kilómetros por litro de una muestra de 50 automóviles producidos por Nissan México.

Calcule e interprete la mediana. Solución:

Para aplicar los valores en la fórmula debemos encontrar la clase “j” denominada “clase mediana”. La clase mediana es aquella que contiene a la mitad de del conjunto de datos, esto es el que contenga la posición la frecuencia acumulada:

, para eso calculamos

Entonces aplicando en la fórmula:

Me =

Características de la mediana: • Todo conjunto de datos medidos en escala de ordinal, intervalo o razón tiene una mediana. • El valor de la mediana depende del número de datos observados. • La mediana es un estadístico robusto, es decir, no se ve afectada por el valor de los extremos (mínimo y máximo). Por eso se le utiliza cuando hay datos inusuales o el polígono de frecuencias no es simétrico. • La mediana no tiene propiedades matemáticas valiosas para poder usarlas en otros cálculos.


UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS Desarrollo

de contenidos

3 MODA

Lecturas seleccionadas

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Glosario

Entendemos por moda el valor de la variable que más veces se repite, y en una distribución de frecuencias el valor con mayor frecuencia absoluta simple Recordatorio Puede darse el caso de que no haya moda (amodal), sólo una (unimodal), dos modas (bimodal) o varias modas (multimodal).

a. Simbología Se simboliza con Mo b. Cálculo de la Moda b.1 Para Datos no agrupados En este caso la determinación de la moda es inmediata por simple observación. Aquel valor de la variable con mayor frecuencia es la moda. Ejemplo 1: La inversión anual (en miles de nuevos soles) de un grupo de pequeñas empresas de la ciudad fueron:

Calcule e interprete la moda. Solución: Buscamos el valor que más se repita, en este caso es: Mo = 30 Interpretación: Las pequeñas empresas con mayor frecuencia han invertido 30 mil nuevos soles al año. b.2 Para Datos Agrupados Se aplica el siguiente estadígrafo:

Ejemplo 2: Variable Discreta Se selecciona al azar 280 vendedores de una gran compañía constructora de casas. A continuación se muestra el número de casas vendidas durante el último bimestre. Calcule e interprete la media

Anotaciones

Bibliografía

43


o os

as

io

44

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Anotaciones

Calcular e interpretar la Moda. Solución: El cálculo es bastante sencillo, sólo ubicamos el valor que tenga la mayor frecuencia, que para el ejercicio es: Mo = Ejemplo 3: Variable Continua La siguiente tabla de distribución de frecuencias corresponde al rendimiento de gasolina en kilómetros por litro de una muestra de 50 automóviles producidos por Nissan México.

Solución: Para aplicar los valores en: debemos encontrar la clase “j” denominada “clase modal” La clase modal es aquella que tenga la mayor frecuencia, entonces para nosotros es la clase que tiene la frecuencia ____


UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS Desarrollo

de contenidos

Entonces aplicando en la fórmula:

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Lecturas seleccionadas

Glosario

Recordatorio

Anotaciones

Características de la moda: • La moda se puede calcular para cualquier escala de medición. • El valor de la moda no se ve afectada por valores extremos. • La moda se puede calcular aun cuando uno o más intervalos sean de extremo abierto. • La moda no siempre es un valor único. Una serie de datos puede tener dos modas (bimodal) o más modas (multimodal). • Algunas series de datos no tienen moda. • La moda es una medida menos importante que la mediana o la media debido a su ambigüedad. • La moda no tiene propiedades matemáticas valiosas para poder usarlas en otros cálculos. IMPORTANTE: Medidas de tendencia central y el sesgo de la distribución de frecuencias

Bibliografía

45


o os

as

io

46

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

TEMA Nº 2: MEDIDAS DE DISPERSIÓN Anotaciones

Estimado alumno, es muy usual que las decisiones que se tomen se basen exclusivamente en los indicadores estadísticos que estamos estudiando, por lo que no solo basta con obtener las medidas de tendencia central, es necesario saber también cuál es el nivel de homogeneidad que tienen las series de datos que estamos analizando, que tan alejados del promedio están cada uno de los datos y cual es justamente el promedio de ese alejamiento que le llamaremos desviación. El tema que a continuación te presento trata justamente de lo expuesto. MEDIDAS DE DISPERSIÓN El análisis estadístico o el estudio de una serie estadística no puede quedarse sólo en el cálculo de las medidas de tendencia central o de posición tales como la media, mediana, moda, percentiles, ya que no estaríamos siendo absolutamente fieles a la realidad, suele existir datos extremos inferiores y superiores a la media aritmética, los cuales no están siendo bien representados por este parámetro, hay veces que la media, por sí sola, no es muy significativa. Además puede ocurrir que series absolutamente distintas pueden tener medias iguales y este hecho no significa que las distribuciones sean exactamente iguales. Por lo tanto es necesario profundizar en su estudio, para lo cual se requiere ver si los valores de la variable están muy o poco separados de la media aritmética. La media aritmética es más representativa cuanto más agrupados estén los valores de la serie respecto a ella y al revés y a la mayor o menor separación de los valores respecto a la media se le llama dispersión o variabilidad. Para medir el grado de dispersión de una variable, se utilizan principalmente los siguientes indicadores o medidas de dispersión: 7. Rango o recorrido 8. Recorrido semi intercuartil 9. Desviación media 10. Varianza 11. Desviación típica o estándar 12. Coeficiente de variabilidad 1 RANGO O RECORRIDO Es la medida de dispersión más sencilla ya que sólo considera los dos valores extremos de una colección de datos, sin embargo, su mayor utilización está en el campo de la estadística no paramétrica. Cálculo del Rango R = Xmax – Xmin

2 RECORRIDO SEMI INTERCUANTIL La desviación cuartil de un conjunto de datos está definida por: Q = (Q3 - Q1)/2 Donde Q3 y Q2 son el primer y tercer cuartil de los datos. A veces se usa el “Recorrido intercuartil Q3 – Q1 “ El recorrido semi-intercuartil o desviación cuartil, da una idea de la dispersión del 50% de los datos centrales. Suele utilizarse cuando la mediana es el índice más representativo.


UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS Desarrollo

de contenidos

Lecturas seleccionadas

3 DESVIACIÓN MEDIA

La desviación media, mide la distancia absoluta promedio entre cada uno de los Recordatorio datos, y el parámetro que caracteriza la información. Usualmente se considera la desviación media con respecto a la media aritmética: Cuanto más alta es la desviación absoluta media mayor es la dispersión y menos representativa la media aritmética. Cálculo de la Desviación Media Para datos no agrupados

Para datos agrupados

4 VARIANZA La varianza es uno de los parámetros más importantes en estadística paramétrica, se puede decir que, teniendo conocimiento de la varianza de una población, se ha avanzado mucho en el conocimiento de la población misma. Numéricamente definimos la varianza, como desviación cuadrática media de los datos con respecto a la media aritmética. La varianza nos mide la mayor o menor representatividad de la media aritmética: - Si la varianza es grande nos indica gran dispersión, la media aritmética no es representativa. - Si casi todos los valores están muy cercanos a la media aritmética entonces la varianza se acercará a cero, con lo que se dice que la serie es concentrada. - La varianza nunca puede ser negativa. De su forma de cálculo se desprenden dos problemas: - Se expresa en unidades cuadradas (nuevos soles cuadrados, minutos cuadrados, etc.) - Si la media aritmética no es una buena medida de tendencia central, la varianza que se basa en ella tampoco será una buena medida de dispersión. a. Simbología S2 : Varianza de la muestra σ2 : Varianza de la Población b. Cálculo de la Varianza b.1 Para Datos no Agrupados Varianza de la Muestra

Varianza de la Población

La inversión anual (en miles de nuevos soles) de un grupo de pequeñas empresas de la ciudad fueron:

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Glosario

Anotaciones

Bibliografía

47


o os

as

io

48

Actividades

Autoevaluación

Glosario

Bibliografía

Anotaciones

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Calcule la varianza Solución:

Para aplicar:

debemos calcular

(calculado en la página 33 )

Entonces aplicando a la fórmula de la varianza:

b.2 Para datos agrupados

Ejemplo 2: Variable Discreta Se selecciona al azar 280 vendedores de una gran compañía constructora de casas. A continuación se muestra el número de casas vendidas durante el último bimestre. Calcule e interprete la media


UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS Desarrollo

de contenidos

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Lecturas seleccionadas

Glosario

Recordatorio

Anotaciones

Solución:

Para aplicar:

debemos calcular

(calculado en página 33 ) Completando la siguiente tabla para el cálculo de la varianza

La varianza es: = Otra solución:

Se puede aplicar: Completando la siguiente tabla para el cálculo de la varianza

Reemplazando en:

Bibliografía

49


o os

as

io

50

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Ejemplo 3: Variable Continua Anotaciones

La siguiente tabla de distribución de frecuencias corresponde al rendimiento de gasolina en kilómetros por litro de una muestra de 50 automóviles producidos por Nissan México.

Solución:

Para aplicar:

debemos calcular

(calculado en pág 34) Completando la siguiente tabla para el cálculo de la varianza:

La varianza es: Otra solución:

Se puede aplicar: |

Propiedades de la varianza 1. La varianza es un número real no negativo y viene expresado en unidades cuadráticas, mientras que la desviación estándar viene expresada en


UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS Desarrollo

de contenidos

las mismas unidades en las que vienen expresados los datos.

Lecturas seleccionadas

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Glosario

2. Si cada uno de los n valores xi es transformado en: yi = a . xi + b, siendo a y b constantes, entonces, la varianza de los n valores yi es: Recordatorio

Como casos particulares se tiene: • Si yi = b, entonces . Si los n datos son iguales a una constante b, entonces la varianza (y la desviación estándar) es igual a cero. . Si a cada dato se le suma una constan• Si yi = xi + b, entonces te b, la varianza (y la desviación estándar) no cambian. . Si a cada dato se le multiplica por • Si yi = a . xi , entonces una constante a, la varianza de los nuevos valores es igual a la varianza de los valores iniciales multiplicada por a2. 3. La varianza depende del valor de todos los datos y es sensible a la variación de cada uno de ellos. 4. La varianza puede ser calculada también con datos agrupados en intervalos, inclusive de amplitud diferente, siempre que se puedan determinar las marcas de clase. 5. Desigualdad de Tchebysheff: Independientemente de la forma de la , distribución de frecuencias de los datos, el intervalo donde k > 1, contiene por lo menos el: de los datos.

5 DESVIACIÓN ESTÁNDAR O TÍPICA Para eliminar el problema de la elevación al cuadrado de la varianza, se realiza una transformación consistente en calcular la raíz cuadrada de la varianza con lo que obtendríamos la desviación estándar o típica

Con lo que la desviación estándar o típica vendrá dada en las mismas unidades que los valores de la variable. - La desviación estándar o típica siempre es positiva porque la varianza también lo es. - La desviación estándar o típica es la medida de dispersión óptima, más exacta, más estable y más utilizada, sirviendo de base para las medidas de asimetría, estadísticos típicas y correlación. - Cuanto más se acerca a cero la desviación más concentrada es la serie. - Suele decirse que cuando la desviación estándar o típica es menor que la media aritmética la serie es concentrada y sí la desviación estándar o típica es mayor que la media aritmética la serie es dispersa. Ejemplo 1: La inversión anual (en miles de nuevos soles) de un grupo de pequeñas empresas de la ciudad fueron:

Anotaciones

Bibliografía

51


o os

as

io

52

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Calcule e interprete la desviación estándar Solución: Anotaciones

Interpretación: La inversión promedio anual de las pequeñas empresas varían ± 8 069 nuevos soles. Ejemplo 2: Variable Discreta Se selecciona al azar 280 vendedores de una gran compañía constructora de casas. A continuación se muestra el número de casas vendidas durante el último bimestre. Calcule e interprete la media

Solución: entonces s = Ejemplo 3: Variable Continua La siguiente tabla de distribución de frecuencias corresponde al rendimiento de gasolina en kilómetros por litro de una muestra de 50 automóviles producidos por Nissan México.

Solución:

entonces s =


UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS Desarrollo

de contenidos

6 COEFICIENTE DE VARIABILIDAD

Lecturas seleccionadas

Con frecuencia nos interesa establecer comparaciones de la dispersión, entre diferentes muestras que posean distintas unidades de medida (por ejemplo, nuevos soRecordatorio les con dólares), las medidas de dispersión antes mencionadas no permiten realizar este tipo de comparaciones, pero es el coeficiente de variabilidad quien nos ayuda a realizar estas comparaciones. El coeficiente de variabilidad es una medida de dispersión relativa (sin unidades de medida) tiene en cuenta el valor de la media aritmética, para establecer un número relativo, que hace comparable el grado de dispersión entre dos o más variables, y se define como:

Para determinar la homogeneidad (tiene menor variabilidad) de dos o más muestras que tienen diferente unidad de medida, se elige aquella que tenga el menor CV. Ejemplo 1: La inversión anual (en miles de nuevos soles) de un grupo de pequeñas empresas de la ciudad fueron:

Calcule e interprete el coeficiente de variación Solución: Para calcular el coeficiente de variación, debemos calcular la media y la desviación y s = 8.069038047 estándar, por los ejercicios anteriores tenemos: Entonces

Interpretación: La inversión de las pequeñas empresas en altamente dispersas (heterogénea) Ejemplo 2: Variable Discreta Se selecciona al azar 280 vendedores de una gran compañía constructora de casas. A continuación se muestra el número de casas vendidas durante el último bimestre. Calcule e interprete la media

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Glosario

Anotaciones

Bibliografía

53


o os

as

io

54

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Solución: Para calcular el coeficiente de variación, debemos calcular la media y la desviación y s = estándar, por los ejercicios anteriores tenemos: Anotaciones

Entonces CV = __________________*100 CV= Ejemplo 3: Variable Continua La siguiente tabla de distribución de frecuencias corresponde al rendimiento de gasolina en kilómetros por litro de una muestra de 50 automóviles producidos por Nissan México.

Solución: Para calcular el coeficiente de variación, debemos calcular la media y la desviación estándar, por los ejercicios anteriores tenemos: y s = Entonces CV = __________________*100 CV=

TEMA Nº 3: MEDIDAS DE POSICÍON, ASIMETRÍA Y CURTOSIS 1 CUANTILES Sucede también con frecuencia que al investigador o al analista le interesa reducir la distribución de frecuencias de una variable a ciertas estructuras porcentuales que le sirvan como patrón para efectuar comparaciones entre segmentos equivalentes de otras distribuciones similares. Los cuantiles son los valores de la variable debajo de los cuales caen determinados porcentajes de frecuencia. a. Cuantiles más frecuentes Centil: También conocido como percententil o porcentil. El centil k, Pk. es el valor numérico tal que el k por ciento de los datos ordenados está por debajo de ese valor y el (100 – k) por ciento de los datos está por encima de ese valor. Decil: Se denomina así a cada uno de los nueve centiles: P10, P20, P30… P90 y se les denota como D1, D2, D3, …, D9 respectivamente.


UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS Desarrollo

de contenidos

Lecturas seleccionadas

Cuartil:

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Glosario

Se denomina así a cada uno de los tres centiles: P25, P50, P75 y se les denota como Q1, Q2 y Q3 respectivamente. Además, se define el rango intercuartil (llamado también propagación media) Recordatorio como la diferencia entre el tercer cuartil y el primer cuartil en una serie de datos, es decir: Rango intercuartil = Q3 – Q1 b. Cálculo de los Percentiles Si para calcular la mediana buscábamos el ordinal correspondiente a n/2, o lo que es lo mismo 50*n/100, para calcular cualquier percentil haremos lo mismo pero partiendo de que el ordinal que queremos buscar será el correspondiente a i*n/100. Hecho lo anterior el cálculo de cualquier percentil sigue los mismos pasos que los seguidos en el cálculo del percentil 50 (mediana). Para Datos Agrupados

Ejemplo 2: Variable Discreta Se selecciona al azar 280 vendedores de una gran compañía constructora de casas. A continuación se muestra el número de casas vendidas durante el último bimestre. Calcule e interprete:

1. Cuartil 1

5. Decil 9

2. Cuartil 2

6. Percentil 5

3. Cuartil 3

7. Percentil 78

4. Decil 3

8. Percentil 99

Cálculo de Cuartil 1: Solución: Como los datos tabulados ya están ordenados, debemos encontrar el valor de la variable que contiene el i=25% de los datos, entonces calculamos el 25% de “n”:

Anotaciones

Bibliografía

55


o os

as

io

56

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Entonces ubicamos en la tabla el valor que tenga la posición ___, para eso calculamos la frecuencia acumulada Anotaciones

Entonces el cuartil 1 es: Q1 = P25 = 1. Q1=

5. D9=

2. Q2=

6. P5=

3. Q3=

7. P78=

4. D3=

8. P99=

Ejemplo 3: Variable Continua La siguiente tabla de distribución de frecuencias corresponde al rendimiento de gasolina en kilómetros por litro de una muestra de 50 automóviles producidos por Nissan México. Calcule:

1. Cuartil 1

5. Decil 9

2. Cuartil 2

6. Percentil 5

3. Cuartil 3

7. Percentil 78

4. Decil 3

8. Percentil 99


UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS Desarrollo

de contenidos

Lecturas seleccionadas

Cálculo de Cuartil 1

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Glosario

Solución: debemos encontrar la clase “j”

Para aplicar los valores en:

Recordatorio

denominada “clase del i-ésimo percentil”. La clase del i-ésimo percentil es aquella que contiene el i%=25% del conjunto de datos, esto es el que contenga la posición frecuencia acumulada:

, para eso calculamos la

Entonces aplicando en la fórmula: Q1 = P25 = 1. Q1=

5. D9=

2. Q2=

6. P5=

3. Q3=

7. P78=

4. D3=

8. P99=

2 MEDIDAS DE CURTOSIS La curtosis es la característica de una distribución de frecuencias en la cual se compara la dispersión de los datos observados cercanos al valor central con la dispersión de los datos cercanos a ambos extremos de la distribución, Se aplica cuando la distribución es simétrica. Se calcula mediante:

Interpretación: Si K tiende a 0 la distribución es normal o mesocúrtica Si K tiende a 0.5 es leptocúrtica Si K tiende a -0.5 es platicúrtica Ejemplo 2: Variable Discreta Se selecciona al azar 280 vendedores de una gran compañía constructora de casas. A continuación se muestra el número de casas vendidas durante el último bimestre. Calcule e interprete el coeficiente de curtosis.

Anotaciones

Bibliografía

57


o os

as

io

58

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Solución: Para calcular el coeficiente de curtosis, debemos calcular: P10 =

P75=

P25 =

P90 =

Anotaciones

Entonces :

K= ____________ -

K=

Ejemplo 3: Variable Continua La siguiente tabla de distribución de frecuencias corresponde al rendimiento de gasolina en kilómetros por litro de una muestra de 50 automóviles producidos por Nissan México. Calcule el coeficiente de curtosis:

Solución: Para calcular el coeficiente de curtosis, debemos calcular:

P10 =

P75=

P25 =

P90 =

Entonces :

K= ____________ -

K=

3 MEDIDAS DE ASIMETRÍA En la Parte I de Medidas de descriptivas, se mencionó la relación empírica de las tres medidas de tendencia central: Media, Mediana y Moda, la cual nos mostraba el tipo de distribución de una serie de datos. Ahora determinaremos esta relación pero mediante un indicador más representativo que se le conoce como el índice de Asimetría. El índice de asimetría de Pearson se define como

En distribuciones asimétricas se verifica que : de asimetría es:

, entonces el índice


UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS Desarrollo

de contenidos

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Lecturas seleccionadas

Glosario

Recordatorio

Anotaciones

Interpretación: Si As = 0, La distribución es simétrica, esto es Si As > 0, La distribución es asimétrica positiva, esto es Si As < 0, La distribución es asimétrica negativa, esto es Ejemplo 1: Datos no clasificados La inversión anual (en miles de nuevos soles) de un grupo de pequeñas empresas de la ciudad fueron:

Calcule e interprete el coeficiente de asimetría. Solución: Para calcular el coeficiente de asimetría, debemos calcular la media, la mediana y la desviación estándar, por los ejercicios anteriores tenemos:

Entonces:

Interpretación: La distribución de la inversión anual de las pequeñas empresas muestra una ligera distribución asimétrica positiva, esto es que más del 50% de las pequeñas empresas invierten menos de 20 125 nuevos soles al año. Ejemplo 2: Variable Discreta Se selecciona al azar 280 vendedores de una gran compañía constructora de casas. A continuación se muestra el número de casas vendidas durante el último bimestre. Calcule e interprete el coeficiente de asimetría.

Solución: Para calcular el coeficiente de asimetría, debemos calcular la media, mediana y la desviación estándar, por los resultados de los ejercicios anteriores tenemos: x= ; Me = y s= Entonces:

As = _______________

As =

Bibliografía

59


o os

as

io

60

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Ejemplo 3: Variable Continua

Anotaciones

La siguiente tabla de distribución de frecuencias corresponde al rendimiento de gasolina en kilómetros por litro de una muestra de 50 automóviles producidos por Nissan México. Calcule e interprete el coeficiente de variación.

Solución: Para calcular el coeficiente de asimetría, debemos calcular la media, mediana y la desviación estándar, por los resultados de los ejercicios anteriores tenemos: x= ; Me = y s= Diagrama

Objetivos

Inicio

Entonces: Desarrollo de contenidos

Actividades

As = _______________

Autoevaluación

As = LECTURA SELECCIONADA N° 2

Lecturas seleccionadas

Glosario

Bibliografía

¿Los Premios de la Academia discriminan por la edad? Estadística. Mario Triola. Pág. 75 Recordatorio

Anotaciones

Cada año se otorgan Óscares a la mejor actriz y al mejor actor. En la tabla se presenta una lista con las edades de los galardonados en el momento de la ceremonia de entrega de los premios. Las edades aparecen en orden, empezando con la primera ceremonia de los Premios de la Academia en 1928. [Notas: En 1968 hubo un empate en la categoría de mejor actriz, y se utilizó el promedio (la media) de las dos edades; en 1932 hubo un empate en la categoría de mejor actor, y se utilizó el promedio (la media) de las dos edades. Tales datos se basan en el artículo "Ages of Oscar-winning Best Actors and Actresses", de Richard Brown y Gretchen Davis, en la revista Mathematics Teacher. En ese artículo, el año de nacimiento del ganador del premio se restó del año de la ceremonia; no obstante, las edades de la tabla se basan en la fecha de nacimiento del ganador y en la fecha de la ceremonia de premiación]. La pregunta básica que consideraremos es: ¿Hay diferencias importantes entre las edades de las mejores actrices y las edades de los mejores actores? ¿Al parecer los actores y las actrices son juzgados estrictamente por sus habilidades artísticas? O hien, ¿existe discriminación por la edad y las mejores actrices suelen ser más jóvenes que los mejores actores? ¿Hay algunas otras diferencias evidentes? Además de ser interesante, esto es importante porque nos brinda información sobre la forma en que nuestra sociedad percibe a los hombres y a las mujeres en general. Una comparación visual entre las edades de la tabla sería reveladora para las personas que tienen una habilidad especial para observar un orden en este tipo de listas de números; sin embargo, para nosotros los simples mortales, es probable que la lista no revele mucha información. Afortunadamente, se dispone de métodos para investigar este tipo de conjuntos de datos, y pronto veremos que tales procedimientos revelan características importantes que nos permiten entender los datos. Seremos capaces de hacer comparaciones inteligentes y reveladoras; aprenderemos técnicas para resumir, graficar, describir, explorar y comparar conjuntos de datos como los de la tabla.


UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS Desarrollo

de contenidos

Tabla: Premios de la Academia: Edades de las mejores actrices y los mejores actores

Lecturas seleccionadas

Las edades (en años) aparecen en orden, empezando con la primera ceremonia de premiación. Recordatorio

El problema incluye las edades de los ganadores del Óscar a la mejor actriz y al mejor actor. Con lo aprendido utilizamos distribuciones de frecuencias y gráficas para investigar si las edades de las actrices eran significativamente diferentes de las edades de los actores. Con base en los resultados obtenidos, parece que las actrices ganadoras del Óscar son más jóvenes que los actores ganadores de este premio. En el presente capítulo continuamos investigando si existe una discrepancia en las edades, pero incluirnos nuevas herramientas que servirán para comparar los dos conjuntos de datos. Las distribuciones de frecuencias y las gráficas del capítulo anterior no resultan afectadas si los datos corresponden a una muestra o a una población completa. Sin embargo, esta diferencia sí afecta a algunas de las herramientas que se presentan en este capítulo. Se podría decir que los datos constituyen una población, ya que incluyen la edad de cada ganador del Óscar como mejor actor y mejor actriz desde la primera ceremonia de Premios de la Academia, celebrada en 1928, hasta los últimos resultados disponibles en el momento en que se escribe este libro. En vez de considerar que las edades son datos poblacionales, los manejaremos como datos muestrales que se obtuvieron de una población más grande. Algunos puristas podrían manifestarse en contra de esto, pero es un enfoque común que nos permite enfrentar preguntas importantes como ésta: ¿Existe una diferencia significativa entre la edad promedio (media) de las mejores actrices y la edad promedio (media) de los mejores actores? Los métodos que se estudiaron en el capítulo anterior nos permitieron construir distribuciones de frecuencias y gráficas que resumen y presentan visualmente la distribución de los datos. Los métodos que se presentan en este capítulo nos permitirán calcular valores numéricos de estadísticos importantes. (En el capítulo anterior aprendimos que un estadístico es una medición numérica que describe alguna característica de una muestra, en tanto que un parámetro es una medición numérica que describe alguna característica de una población). En vez de basarnos únicamente en distribuciones de frecuencias y gráficas, ahora empezaremos a incluir estadísticos importantes al comparar las edades de las mejores actrices y los mejores actores. Después de calcular los valores de estadísticos importantes, estaremos más preparados para comparar los dos conjuntos de datos y para responder la siguiente pregunta fundamental: ¿Existen diferencias sustanciales e importantes entre las edades de las mejores actrices y las edades de los mejores actores? Diagrama

Objetivos

Desarrollo de contenidos

Actividades

Inicio

ACTIVIDAD N° 2 Autoevaluación

Esta actividad puede consultarla en su aula virtual.

Lecturas seleccionadas

Glosario

Recordatorio

Anotaciones

Bibliografía

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Glosario

Anotaciones

Bibliografía

61


o os

as

io

62

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD II:Inicio ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Diagrama

Objetivos

Desarrollo de contenidos

Actividades

Lecturas seleccionadas

Glosario

Autoevaluación

GLOSARIO Anotaciones

- Recordatorio

Objetivos

Asimetría: Coeficiente que mide la nivel de dispersión de una serie de datos respecto a la media.

- Anotaciones Cuartil medio: La mitad de la suma de los cuartiles primero y tercero. -

Cuartiles: Los tres valores que dividen datos ordenados en cuatro grupos, con aproximadamente el 25% de los valores en cada grupo.

-

Desviación Estandar: Medida de variación igual a la raíz cuadrada de la varianza.

-

Media: La suma de un conjunto de valores, dividida entre el número de valores.

-

Mediana: Valor que está a la mitad de un conjunto de valores acomodados en orden por magnitud.

-

Medida correctiva: Acción que se realiza a un punto crítico para que pueda estar dentro de los límites de control.

-

Medida de tendencia central: Valor que pretende indicar el centro de los valores de una colección de datos.

-

Medida de variación: Cualquiera de varias medidas diseñadas para reflejar la magnitud de la variación o dispersión de un conjunto de valores.

-

Moda: Valor que se presenta con mayor frecuencia.

-

Multimodal: Se dice que un conjunto de datos es multimodal cuando tiene más de dos modas.

-

Punto Crítico: Observación que está fuera de los límites de control.

-

Rango de percentiles 10-90: Diferencia entre los percentiles décimo y nonagésimo.

- Diagrama

Bibliografía

-

Sesgado: No simétrico y que se extiende más hacia un lado que hacia el otro. Inicio

Sesgo negativo: Sesgado hacia la izquierda.

-

Sesgo positivo: Sesgado hacia la derecha.

-

Varianza: Promedio de las desviaciones cuadráticas de cada dato respecto a la media

Desarrollo de contenidos

Actividades

Autoevaluación

Lecturas seleccionadas

Glosario

Bibliografía

BIBLIOGRAFÍA DE LA UNIDAD II

1. Triola Mario F. ESTADÍSTICA. Pearson Educación. México 2012

Recordatorio

Anotaciones

2. Berenson, Mark y Levine, David. Estadística Básica en Administración, Conceptos y aplicaciones. Prentice Hall, México 2010  

Diagrama

Objetivos

Inicio

Desarrollo de contenidos

Actividades

Autoevaluación

AUTOEVALUACIÓN DE LA UNIDAD II 1. Indique: “Estadígrafo que en valor es igual a la mediana” a) Q1 Lecturas seleccionadas

Recordatorio

Glosario

Anotaciones

b) P3

c) Q2

d) Q3

e) P5

Bibliografía

2. Determine la proposición correcta respecto a la siguiente distribución de frecuencias


UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS Desarrollo

de contenidos

a)

No se puede calcular la media aritmética pero sí la mediana.

b)

La media, mediana y moda sí se pueden calcular.

c)

La media aritmética es el estado civil “casado”.

d)

La mediana es el estado civil “casado”.

e)

La medida de tendencia central más confiable en estos datos es la moda

Lecturas seleccionadas

Glosario

Recordatorio

Anotaciones

3. En el cuadro adjunto, ¿cuál es el sueldo del 57% de la población mostrada?.

a) 62,48

b) 61,43

d) 65,97

e) 63,88

c) 67,23

4. Los siguientes datos muestran las calificaciones de una muestra de 10 personas sometidas a una prueba de aptitud: 16; 19; 13; 20; 14; 16; 19; 18; 17; 15. Calcular la desviación estándar de dichas calificaciones. a) 2,31

b) 16,34

d) 18,23

e) 19,1

c) 18,02

5. El histograma de la distribución correspondiente al peso de 100 alumnos de Bachillerato es el siguiente:

Calcule la desviación estándar de los pesos de los alumnos. a) 2,9 Kg

b) 4,3 Kg

d) 4,6 Kg

e) 6,8 Kg

c) 1,8 Kg

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Bibliografía

63


Desarrollo de contenidos

Diagrama

Objetivos

Desarrollo de contenidos

Lecturas seleccionadas Diagrama

Inicio

Lecturas seleccionadas

Glosario

Recordatorio

Anotaciones

UNIDAD III: PROBABILIDAD Actividades

Autoevaluación

DIAGRAMA DE PRESENTACIÓN DE LA UNIDAD III Glosario

Bibliografía

Objetivos

Inicio

CONTENIDOS

Recordatorio Desarrollo de contenidos

Anotaciones Actividades

Lecturas seleccionadas

Glosario

EJEMPLOS

Autoevaluación

AUTOEVALUACIÓN

Recordatorio Diagrama

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

ACTIVIDADES BIBLIOGRAFÍA

Bibliografía

ORGANIZACIÓN DE LOS APRENDIZAJES Anotaciones Objetivos

Inicio

CONOCIMIENTOS 2° Clase Presencial/ Virtual (Video conferencia) Desarrollo Actividades Autoevaluación

de contenidos

Tema N° 1: Fundamentos de Probabilidad y Reglas Básicas. 1. Definiciones básicas, suceLecturas Glosario Bibliografía sos y probabilidades. seleccionadas 2. Regla de la suma y multiplicación Tema N° 2: Probabilidad Total y Teorema de Bayes Recordatorio Anotaciones 1. Teorema de la probabilidad total. 2. Teorema de Bayes. Tema N° 3: Técnicas de Conteo 1. Técnicas de conteo 2. Combinaciones y permutaciones Lectura seleccionada 1: ¿Debe preocuparse de que le realicen una prueba de detección de drogas cuando solicite un trabajo?. Autoevaluación N° 03

PROCEDIMIENTOS

ACTITUDES

1. Identifica elementos de experimentos aleatorios. 2. Calcula la probabilidad de eventos aleatorios.

Valora de manera reflexiva la importancia de las Probabilidades en todo campo de la ciencia.

Actividad N°1: Aplica las propiedades fundamentales de la probabilidad en distintas situaciones. 3. Calcula la probabilidad de eventos aleatorios. 4. Calcula la probabilidad utilizando técnicas de conteo. Actividad N°2: Resuelve ejercicios y problemas aplicando técnicas de conteo y el teorema de Bayes. Control de Lectura Nº 2

Bibliografía

65


o os

as

io

66

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD III: PROBABILIDAD

UNIDAD III: PROBABILIDAD TEMA Nº 1: FUNDAMENTOS DE PROBABILIDAD Y REGLAS BÁSICAS Anotaciones

En alguna ocasión te has preguntado cuál es la probabilidad de que suceda algún suceso, como por ejemplo, la probabilidad de que mañana llueva, la probabilidad de que algún equipo de fútbol gane un partido, o la probabilidad de ganar un premio y hasta la probabilidad de acertar una pregunta con alternativas al marcarla al azar. Nos damos cuenta que vivimos en un mundo que es incapaz de predecir el futuro con total certeza lo cual genera el estudio y uso de la teoría de la probabilidad, la cual nos permitirá reconocer y ordenar nuestras suposiciones para poder tomar alguna decisión de manera más concreta y con fundamento. Te invito entonces a conocer el mundo de las probabilidades teniendo una probabilidad alta de que te va a gustar. 1 DEFINICIONES BÁSICAS, SUCESOS Y PROBABILIDADES 1.1 PROBABILIDAD. La probabilidad es una medida de la posibilidad que tiene un evento de ocurrir. Los valores de probabilidad siempre se asignan en una escala de cero a uno. Una probabilidad cercana a cero indica que el evento tiene muy pocas posibilidades de ocurrir, mientras que una probabilidad cercana a uno indica que es casi seguro que ocurra dicho evento. La probabilidad proporciona la posibilidad de medir, expresar y analizar la incertidumbre asociada a eventos futuros. 1.2 EXPERIMENTO. Dentro del punto de vista de la probabilidad se define un experimento como cualquier proceso que genera un conjunto de resultados bien definidos. En cualquier ejecución del experimento ocurrirá solamente uno de los posibles resultados experimentales. A continuación se presentan algunos ejemplos de experimentos y sus resultados asociados.

Para analizar un experimento en particular es necesario definir cuidadosamente los resultados experimentales posibles. 1.3 ESPACIO MUESTRAL. El espacio muestral es el conjunto de todos los resultados posibles generados por un experimento. Cada resultado experimental se conoce también como punto muestral y corresponde a un elemento del espacio muestral. Si suponemos que S denota el espacio muestral entonces:


UNIDAD III: PROBABILIDAD Desarrollo

de contenidos

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Lecturas seleccionadas

Glosario

Recordatorio

Anotaciones

1.4 DETERMINACIÓN DE PROBABILIDADES. A partir de la comprensión de los conceptos de experimento y espacio muestral, veamos cómo pueden determinarse las probabilidades para los resultados experimentales. Al asignarse estas probabilidades se deben satisfacer dos requerimientos básicos de probabilidad. 1. Los valores de probabilidad asignados deben estar entre cero y uno. Si denoindica su probabilidad asociada, ta el -ésimo resultado experimental y entonces: 2. La suma de todas las probabilidades asociadas a los resultados experimentales debe ser igual a uno. Si el espacio muestral tiene resultados experimentales, entonces:

Cualquier método para asignar valores de probabilidad a los resultados experimentales que satisfaga estos dos requerimientos y produzca medidas numéricas razonables es aceptable. En la práctica, se emplean con frecuencia el método clásico, el método de frecuencia relativa y el método subjetivo. 1.4.1 Método clásico El método clásico de asignación de probabilidades supone que cada resultado experimental tiene la misma posibilidad de ocurrir. Si un experimento tiene resultados posibles el método clásico asignaría una probabilidad de a cada resultado experimental. EJEMPLO 1: Si se considera el experimento de lanzar una moneda, en cualquiera de estos lanzamientos se observará Cara o Sello. Una suposición razonable, en caso la moneda no esté trucada, es que cualquiera de estos resultados experimentales es igualmente probable, es decir . EJEMPLO 2: Considere el experimento de lanzar un dado. Si el dado fue diseñado de modo que los seis resultados experimentales sean igualmente . probables entonces se cumple que Este método fue elaborado originalmente para analizar probabilidades en los juegos de azar, donde la suposición de resultados igualmente probables frecuentemente es razonable. Sin embargo en muchas otras situaciones esta suposición no es válida por lo que se requieren métodos alternativos para asignar las probabilidades.

Bibliografía

67


o os

as

io

68

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD III: PROBABILIDAD

1.4.2 Método de frecuencia relativa

Anotaciones

El método de frecuencia relativa está basado en los datos observados sobre el proceso o fenómeno bajo estudio. Para su determinación se necesita obtener datos mediante pruebas, entrevistas, etc. los cuales se resumen en una tabla de resultados (la tabla de distribución de frecuencias). La frecuencia relativa de un resultado (cantidad de resultados favorables entre total de resultados) se considera como la probabilidad de ocurrencia, siempre y cuando las condiciones bajo las cuales se obtuvieron los resultados se mantengan a futuro. 1.4.3 Método subjetivo Este método es apropiado cuando no se puede suponer de manera realista que todos los resultados experimentales son igualmente probables y cuando se dispone de pocos datos relevantes. Cuando se emplea este método podemos usar cualquier información disponible como nuestra experiencia o intuición. Después de considerar toda esa información se especifica un valor de probabilidad que exprese nuestro grado de creencia, en una escala de cero a uno, sobre las posibilidades de ocurrir que tiene el resultado experimental de interés. Usando el método subjetivo puede esperarse que diferentes personas asignen probabilidades diferentes al mismo resultado experimental. EJEMPLO 1: ¿Cuál es la probabilidad de que mañana por la tarde llueva? EJEMPLO 2: ¿Cuál es la probabilidad de salir al parque y encontrar a tres personas que hayan probado la gaseosa de marca Inka Kola, la bebida de sabor nacional? 1.5 PROBABILIDAD DE UN EVENTO Un evento es una colección específica de puntos muestrales. Considere el experimento de lanzar un dado, cuyo espacio muestral es S = { 1 , 2 , 3 , 4 , 5 , 6 }. Si se define el evento A como obtener un número impar, entonces A = { 1 , 3 , 5 }. Por tanto, si el resultado experimental fuese 1, 3 o 5 se diría que ha ocurrido el evento A. Si se conocen las probabilidades de los puntos muestrales, la probabilidad de un evento es igual a la suma de las probabilidades de los puntos muestrales que la componen. Es decir que

Siempre que podamos identificar todos los puntos muestrales de un experimento y asignarles las correspondientes probabilidades podemos usar el enfoque anterior para calcular la probabilidad de un evento cualquiera. Sin embargo, en muchos experimentos la cantidad de puntos muestrales es grande y su identificación, al igual que la determinación de sus probabilidades, se vuelve demasiado compleja o, incluso, imposible. Mas adelante estudiaremos algunas relaciones básicas de probabilidad para calcular la probabilidad de un evento sin conocer todas las probabilidades individuales de los puntos muestrales que la componen. Complemento de un evento Para un evento A cualquiera, se define su complemento como el evento consistente en todos los puntos muestrales que no están en A. El complemento del evento A se denota con AC. La Figura muestra una representación conocida como Diagrama de Venn, que ilustra el concepto del complemento. El área rectangular representa el espacio muestral para el experimento y como tal contiene todos los puntos muestrales posibles. El círculo representa el evento A y solo contiene los puntos muestrales que le pertenecen. El resto del rectángulo sombreado contienen todos los puntos muestrales que no están en el evento A, el cual por definición es el complemento de A.


UNIDAD III: PROBABILIDAD Desarrollo

de contenidos

Lecturas seleccionadas

Glosario

Recordatorio

Anotaciones

En cualquier aplicación de probabilidad, el evento A y su complemento AC deben satisfacer la condición: Despejando se tiene

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

.

2 REGLA DE LA SUMA Y MULTIPLICACIÓN 2.1 REGLA DE LA SUMA (ADICIÓN) La regla de la adición es una relación útil cuando tenemos dos eventos y estamos interesados en conocer la probabilidad que ocurra al menos uno de ellos. Es decir, si tenemos los eventos A y B, estamos interesados en conocer la probabilidad que ocurra el evento A, el evento B o ambos simultáneamente. Antes de presentar la ley de la adición se necesita exponer dos conceptos relacionados a la combinación de eventos: la unión y la intersección de eventos. Para dos eventos A y B, la unión del evento A con el evento B es el evento que contienen todos los puntos muestrales que pertenecen a A o a B o a ambos. La . El diagrama de Venn que se muestra en la Figura unión se denota por describe la unión de los eventos A y B.

Para dos eventos A y B, la intersección de los eventos A y B es el evento que contienen todos los puntos muestrales que pertenecen tanto a A como a B, es decir, que son comunes a ambos conjuntos. La intersección se denota por . El diagrama de Venn que se muestra en la Figura describe la intersección de los eventos A y B.

Bibliografía

69


o os

as

io

70

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD III: PROBABILIDAD

La ley de la adición permite encontrar la probabilidad de la unión de dos eventos usando la siguiente relación: Anotaciones

Ejemplo: La probabilidad que un sistema de comunicación de datos tenga una selectividad elevada es 0.72, la probabilidad que tenga alta fidelidad es 0.59 y la probabilidad que tenga ambas características es 0.37. ¿Cuál es la probabilidad que el sistema de comunicación de datos tenga al menos una de las características mencionadas? Si se definen los eventos: A = Sistema de comunicación de datos tiene una selectividad elevada B = Sistema de comunicación de datos tiene alta fidelidad

Entonces, la probabilidad pedida es:

.

2.1.1 EVENTOS MUTUAMENTE EXCLUYENTES. Se dice que dos o más eventos son mutuamente excluyentes si los eventos no tienen ningún punto muestral en común, es decir, no hay puntos muestrales en la intersección de los eventos. Para que dos eventos A y B sean mutuamente excluyentes se debe cumplir que . La Figura proporciona un diagrama de Venn que muestra dos eventos mutuamente excluyentes.

Si los eventos A y B son mutuamente excluyentes, entonces

2.1.2 PROBABILIDAD CONDICIONAL. En muchas situaciones es importante poder determinar la probabilidad de un evento cuando se sabe que ha ocurrido otro. Suponga que tenemos y que obtenemos información nueva un evento A con probabilidad o nos enteramos que ha ocurrido otro, denotado B. Si el evento A se relaciona con B, desearemos sacar ventaja de esta información al calcular una probabilidad nueva o revisada para el evento A. Esta nueva probabilidad del evento A se escribe . El símbolo “/“ denota el hecho que estamos considerando la probabilidad del evento A dada la condición que ha ocurrido el evento B. Por lo tanto, la notación se lee “la probabilidad de A dado B”. Con dos eventos A y B, la probabilidad condicional para A dado B, y la probabilidad condicional para B dado A son como siguen:

y en cada caso. Para obtener una comprensión intuitiva del uso de las relaciones anteriores consideremos el diagrama de Venn de la figura siguiente. La región


UNIDAD III: PROBABILIDAD Desarrollo

de contenidos

Lecturas

seleccionadas sombreada (tanto en gris claro como en gris oscuro) denota que el evento B ocurrió; la región sombreada en gris oscuro denota el evento . Sabemos que una vez que ha ocurrido B, la única forma en que podemos observar también el evento A es que ocurra el evento . Por lo tanto Recordatorio la razón entre y proporciona la probabilidad que observemos el evento A cuando ya ocurrió el evento B.

Ejemplo: Se estima que la probabilidad que la empresa A tenga éxito al comercializar su nuevo producto en el mercado es 0.75, la probabilidad que la empresa B tenga éxito al comercializar su nuevo producto en el mercado es 0.62 y la probabilidad que ambas empresas tengan éxito con sus respectivos productos es 0.45. ¿Cuál es la probabilidad que la empresa A tenga éxito al comercializar su nuevo producto, si se sabe que la empresa B también lo tuvo? Si se definen los eventos: A = La empresa A tiene éxito al comercializar su producto B = La empresa B tiene éxito al comercializar su producto

Entonces

2.1.3 EVENTOS INDEPENDIENTES. Dos eventos A y B son independientes si: o , de otro modo, los eventos son dependientes. Por lo tanto, dados dos eventos A y B, la ocurrencia del evento A no influye en la ocurrencia del evento B. Ejemplo: Se tienen los eventos A: Extraer un naipe de la baraja y que este resulte de color rojo. B: Extraer un naipe de la baraja y que este resulte una espada. Luego deducimos que los eventos A y B son independientes. 2.2 REGLA DE LA MULTIPLICACIÓN. La regla de la multiplicación se usa para encontrar la probabilidad de la intersección de dos eventos. Se obtiene a partir de la definición de probabilidad condicional. Ejemplo: El departamento de circulación de un periódico sabe que el 84% de sus clientes se suscribe a la edición diaria (lunes a sábado). Además la probabilidad que un cliente, que ya tiene suscripción diaria, se suscriba también a la edición dominical es 0.75. ¿Cuál es la probabilidad que un cliente se suscriba tanto a la edición diaria como a la dominical del periódico?

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Glosario

Anotaciones

Bibliografía

71


o os

as

io

72

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD III: PROBABILIDAD

Si se definen los eventos: A = Un cliente se suscribe la edición diaria Anotaciones

B = Un cliente se suscribe la edición dominical ,

entonces

.

Luego:

Notar que para el caso especial de eventos independientes, la ley de la multiplicación se convierte en: Por lo tanto, para calcular la probabilidad de la intersección de dos eventos independientes solo multiplicamos las probabilidades correspondientes. Ejemplo: El éxito de un proyecto de inversión depende del trabajo de un ingeniero, un administrador y un abogado. Se sabe que la probabilidad de que el ingeniero falle en su labor es de 4%, la probabilidad de que el administrador falle es de 6% y la probabilidad de que el abogado falle es de 8%. Para que el proyecto sea exitoso, ninguno de los 3 debe fallar. Asumiendo que las labores de los tres integrantes son independientes entre sí, ¿cuál es la probabilidad de que al final el proyecto falle? Sean los eventos A = El ingeniero falle en su labor B = El administrador falle en su labor C = El abogado falle en su labor D = El proyecto falle

Luego

.

TEMA Nº 2: PROBABILIDAD TOTAL Y TEOREMA DE BAYES Como has podido observar, la teoría de la probabilidad maneja ciertas leyes o reglas que debemos respetar, del mismo modo cuando tenemos un evento que pertenece a un sistema y que se puede realizar de manera conjunta con varios eventos disjuntos entre sì indistintamente dentro del mismo sistema es posible que nosotros calculemos cuál es la probabilidad total de la ocurrencia de dicho evento como lo veremos a continuación. Por ejemplo si en un aula hay varones y mujeres, podremos calcular la probabilidad total de elegir a algún alumno y que este alumno (sin considerar el género) no sea de Huancayo. 1 TEOREMA DE LA PROBABILIDAD TOTAL Si conocemos la probabilidad de B en cada uno de los componentes de un sistema exhaustivo y excluyente de sucesos donde participan los sucesos A1, A2, A3 y A4, entonces podemos calcular la probabilidad de B como la suma: P(B) = P(B ∩ A1) + P(B ∩A2) + P( B ∩ A3) + P( B ∩ A4) P(B) = P(B|A1)P(A1) + P(B|A2)P(A2) + P(B|A3)P(A3) + P(B|A4)P(A4)


UNIDAD III: PROBABILIDAD Desarrollo

de contenidos

Lecturas seleccionadas

Por lo tanto si generalizamos, para la Ley de la Probabilidad Total:

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Glosario

Supongamos que A1, A2, ... ,An son una partición de E, es decir que los sucesos son mútuamente excluyentes entre sí (Ai∩Aj=φ para todo par) y su unión es E entonces se cumple Recordatorio

2 TEOREMA DE BAYES Una etapa importante del análisis de las probabilidades condicionales consiste en revisar dichos valores cuando se obtiene nueva información. Con esta nueva información actualizamos los valores iniciales de probabilidad encontrando probabilidades revisadas, conocidas como probabilidades posteriores. El teorema de Bayes proporciona un medio para hacer estos cálculos de probabilidad. Los pasos en este proceso de revisión de probabilidades se muestran en la Figura siguiente.

Ejemplo: Suponga una empresa que compra componentes de dos proveedores. Sean los eventos: A1 = Componente comprado al proveedor 1

A2 = Componente comprado al proveedor 2

Actualmente, el 65% de los componentes comprados provienen del proveedor 1 y el resto del proveedor 2. Por lo tanto, si se elige al azar un componente, asignaríay . mos las probabilidades previas La calidad de los componentes comprados depende del proveedor. Sean los eventos: B1 = Componente comprado se encuentra en buenas condiciones B2 = Componente comprado se encuentra en malas condiciones Las probabilidades condicionales de recibir un componente en buenas o malas condiciones (con base en datos históricos), según el proveedor, son:

El diagrama de árbol que se muestra en la Figura siguiente describe el proceso en que esta empresa recibe un componente de unos de los proveedores mencionados y luego descubre que se encuentra en buenas o malas condiciones como un experimento de dos etapas. De los cuatro resultados experimentales posibles, dos corresponden al caso en que el componente se encuentra en buenas condiciones y dos corresponden al caso contrario.

Anotaciones

Bibliografía

73


o os

as

io

74

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD III: PROBABILIDAD

Anotaciones

Cada uno de los resultados experimentales es la intersección de dos eventos, de modo que podemos usar la regla de la multiplicación para calcular las probabilidades. Es decir,

El proceso de calcular estas probabilidades conjuntas puede describirse con lo que en ocasiones se llama árbol de probabilidad. También se le denomina árbol de decisiones, como se muestra en la Figura siguiente. De izquierda a derecha en el árbol, las probabilidades para cada una de las ramas en la primera etapa corresponden a las probabilidades iniciales, mientras que las probabilidades para cada rama en la segunda etapa son probabilidades condicionales. Para encontrar las probabilidades de cada resultado solo multiplicamos las probabilidades en las ramas que conducen al resultado. Observe que las probabilidades de los cuatro resultados experimentales suman uno.


UNIDAD III: PROBABILIDAD Desarrollo

de contenidos

Lecturas seleccionadas

Glosario

Recordatorio

Anotaciones

El teorema de Bayes es aplicable cuando los eventos para los que deseamos calcular probabilidades posteriores son mutuamente excluyentes y su unión es el espacio muestral completo. El teorema de Bayes puede extenderse al caso de n eventos mutuamente excluyentes A1, A2 , .... , An cuya unión cubre todo el espacio muestral. En tal caso, el teorema de Bayes para el cálculo de cualquier probabilidad posterior se vuelve , i = 1,2......,n donde con el nombre de probabilidad total.

se le conoce

EJEMPLO: Suponga que los componentes del ejemplo anterior se usan en un proceso de manufactura y que un componente en malas condiciones causa que una máquina se descomponga, ¿cuál es la probabilidad que el componente en malas condiciones provenga del proveedor 1? y ¿cuál es la probabilidad que provenga del proveedor 2? Con la información del árbol de probabilidad podemos usar el teorema de Bayes para responder a estas preguntas.

Proveedor 1: Proveedor 2: donde Luego:

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Bibliografía

75


o os

as

io

76

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD III: PROBABILIDAD

TEMA Nº 3: TÉCNICAS DE CONTEO Anotaciones

En el tema anterior nos hemos encontrado con un detalle muy importante que genera un gran error en las probabilidades si no se calcula bien: el tamaño del espacio muestral, el cual debe ser analizado con mucho cuidado sobre todo al determinar la estructura que tiene para luego contabilizar el total de posibilidades que se tiene. Por esa razón cuando las posibilidades son inmensas y ya no se puede realizar un conteo de manera individual debemos aplicar alguna técnica que nos facilite el conteo, esa es la razón por la cual debemos optimizar las técnicas presentadas a continuación y que requiere en varios casos del manejo del desarrollo de un factorial. 1 TÉCNICAS DE CONTEO A menudo el espacio muestral con el que tenemos que calcular las probabilidades es grande, de tal manera que construyendo un diagrama de árbol o un tablero de contingencia no va a ser posible, es por esta razón que recurrimos a modelos matemáticos para poder calcular el tamaño de nuestro espacio muestra, pero es necesario antes conocer el principio de la adición y de la multiplicación en quienes se fundamentan los métodos de conteo. 1.1 REGLA DE LA ADICIÓN Si un primer experimento tiene n1 resultados posibles y un segundo experimento tiene n2 resultados posibles. Entonces, la cantidad total de resultados experimentales luego de realizar el primer o segundo experimento, es decir solo uno de ellos, es n1 +n2. Ejemplo: Una persona puede viajar de Lima a Cuzco por vía aérea o terrestre y tiene a su disposición 6 líneas aéreas y 5 líneas terrestres. ¿De cuantas formas puede realizar el viaje desde Lima hasta Cuzco? El primer experimento consiste en elegir una línea aérea y tiene n1 = 6 formas posibles de hacerlo, el segundo experimento consiste en elegir una línea terrestre y tiene n1 = 5 formas posibles de hacerlo. Luego, se tienen n1 +n2 =11 formas posibles de realizar el viaje. 1.2 REGLA DE LA MULTIPLICACIÓN Si un experimento se puede describir como una sucesión de k etapas, en las que hay n1 resultados posibles en la primera etapa, n2 en la segunda, etc. Entonces, la cantidad total de resultados experimentales es n1 × n2 .... ×nk . Ejemplo: ¿Cuántas parejas de bailes de diferente sexo se puede formar con 3 varones y 5 damas? El experimento consiste en formar parejas de baile. La primera etapa consiste en elegir al varón y se puede hacer de n1 = 3 formas. La segunda etapa consiste en escoger a la dama y se puede realizar de n2 = 5 formas. Luego, se pueden formar n1 × n2 = 15 parejas de baile. 2 COMBINACIONES Y PERMUTACIONES

2.1 COMBINACIONES Las combinaciones permiten contar la cantidad de resultados experimentales cuando se deben seleccionar objetos entre un total de N , por lo general más grande, donde el orden de selección no se considera importante. La cantidad de combinaciones de N objetos tomando n a la vez es


UNIDAD III: PROBABILIDAD Desarrollo

de contenidos

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Lecturas seleccionadas

Glosario

Recordatorio

Anotaciones

donde Ejemplo: Se tiene un grupo de 30 estudiantes del curso Estadistica , ¿de cuantas maneras diferentes se podría elegir a 3 delegados para que representen a la sección? El orden de selección de los tres delegados no es importante. Luego, existen formas diferentes de elegirlos. Diagrama

Desarrollo de contenidos

Lecturas seleccionadas

Objetivos

Diagrama Actividades

Inicio

ACTIVIDAD Objetivos Inicio N° 3 Autoevaluación

Esta actividad puede consultarla en su aula virtual. Desarrollo de contenidos Glosario

Actividades

Autoevaluación

Bibliografía

LECTURA SELECCIONADA N° 2 Lecturas seleccionadas Recordatorio

Glosario

Bibliografía

Anotaciones

¿Debe preocuparse de que le realicen una prueba de detección de drogas cuando solicite un trabajo? Estadística. Mario Triola. Pág. 137 Recordatorio

Anotaciones

¿Debe preocuparse de que le realicen una prueba de detección de drogas cuando solicite un trabajo? Según la American Management Association, alrededor del 70% de las empresas estadounidenses realizan pruebas de detección de drogas al menos a algunos empleados y aspirantes. El U.S. National Institute on Drug Abuse afirma que aproximadamente el 15% de los jóvenes entre 18 y 25 años consumen drogas ilegales. Quest Diagnostic estima que el 3% de la fuerza laboral general de Estados Unidos consume marihuana. Supongamos que usted solicitó un empleo, tiene excelentes aptitudes (las cuales incluyen la aprobación exitosa de un curso de estadística), le hicieron una prueba de consumo de marihuana y no le dieron el empleo. Usted podría sospechar que no pasó el examen de marihuana, aun cuando no consume esta droga. Análisis de los resultados La tabla muestra los resultados de la prueba "1-Panel- THC" para identificar el consumo de marihuana. Este dispositivo de prueba cuesta $5.95 y la empresa Drug Test Success lo distribuye. Los resultados de la prueba fueron confirmados con cromatografía de gases y espectrometría de masas, que la empresa describe como "el método de confirmación preferido". (Esos resultados se basan en el uso de 50 ng/mL como nivel de corte para determinar la presencia de marihuana). Con base en los resultados de la tabla 4-1, ¿qué probabilidades hay de que la prueba indique que usted consumió marihuana, aunque no sea así? Cuando una prueba muestra la presencia de alguna condición, como una enfermedad o los residuos de alguna droga, se dice que el resultado de la prueba es positivo. Cuando la prueba indica un resultado positivo, pero la condición en realidad no está presente, el resultado es un falso positivo. Es decir, un falso positivo es un error en el que la prueba indica la presencia de una condición, cuando en realidad esta última no se presenta. En este caso, el aspirante al empleo podría sentirse angustiado por la probabilidad de un resultado falso positivo, ya que sería un error que provocaría de manera injusta la negación del empleo. (El contratante podría sentirse preocupado por otro tipo de error, un falso negativo, que se presenta cuando una prueba indica que el aspirante no consume marihuana, cuando en realidad sí lo hace. Este falso negativo podría causar la contratación de un individuo que consume marihuana, y este error puede ser grave para algunos trabajos, como los que realizan los pilotos, los cirujanos o los ingenieros de trenes).

Bibliografía

77


o os

as

io

78

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD III: PROBABILIDAD

En este capítulo analizaremos preguntas relevantes como éstas: Dados los resultados muestrales de la tabla, ¿cuál es la probabilidad de un resultado falso positivo? ¿Cuál es la probabilidad de un resultado falso negativo? ¿Esas probabilidades son lo suficientemente bajas como para que los aspirantes y los contratantes no se preocupen por tomar decisiones incorrectas motivadas

Anotaciones

por resultados erróneos de las pruebas? Tabla: Resultados de exámenes sobre el consumo de marihuana

Diagrama

Objetivos

Inicio

Desarrollo de contenidos

Actividades

Autoevaluación

Lecturas seleccionadas

Glosario

GLOSARIO - Recordatorio

Bibliografía

Experimento: La aplicación de un tratamiento y la posterior observación de sus efectos sobre los sujetos.

- Anotaciones Probabilidad Condicionada: Probabilidad de que ocurra un evento después de que haya ocurrido otro. -

Probabilidad Condicional: La probabilidad de un suceso, dado que algún otro suceso ya ocurrió.

-

Probabilidad Conjunta: Probabilidad de que ocurran dos eventos de manera simultanea.

-

Probabilidad Subjetiva: Conjetura o estimado de una probabilidad con base en un conocimiento de las circunstancias relevantes.

-

Probabilidad: Medida de la posibilidad de que ocurra un suceso dado; se expresa como un número entre 0 y 1 .

-

Regla de Combinación: Regla para determinar el número de combinaciones diferentes de elementos seleccionados.

-

Regla de la adición: Regla para determinar la probabilidad de que, en un solo ensayo, ocurra el suceso A o el suceso B, o bien, de que ocurran ambos.

-

Regla de la multiplicación: Regla para determinar la probabilidad de que ocurra el suceso A en un ensayo y de que ocurra el suceso B en un segundo ensayo.

-

Regla de Permutación: Regla para determinar el número de arreglos diferentes de elementos seleccionados.

-

Regla del conteo fundamental: Regla que dice que, para una secuencia de dos sucesos en la que el primer suceso puede ocurrir de m maneras y el segundo de n maneras, los sucesos juntos pueden ocurrir en un total de m • n maneras.

-

Regla del Factorial: Regla que afirma que n objetos distintos se pueden acomodar de n! maneras distintas.

-

Regla del suceso infrecuente: Si, bajo un supuesto dado, la probabilidad de un resultado específico observado es muy pequeña, se concluye que posiblemente el supuesto no sea correcto.

-

Suceso Compuesto: Combinación de sucesos simples.

-

Suceso Simple: Resultado experimental que no puede descomponerse más.

-

Suceso: Resultado de un experimento.

-

Sucesos Dependientes: Sucesos para los cuales la ocurrencia de cualquier suceso individual afecta las probabilidades de ocurrencia de los demás sucesos.

-

Sucesos Disjuntos o mutuamente excluyentes: Sucesos que no pueden ocurrir de manera simultánea.


os

s

o

s

s

o

UNIDAD III: PROBABILIDAD Desarrollo

de contenidos

Objetivos

Inicio

Glosario

Lecturas

Glosario

Recordatorio

Anotaciones

seleccionadas Sucesos Independientes: Sucesos para los cuales la ocurrencia de cualquiera de ellos no afecta las probabilidades de ocurrencia de los demás.

- Actividades

Autoevaluación

BIBLIOGRAFÍA DE LA UNIDAD III

Bibliografía

1. Triola Mario F. ESTADÍSTICA. Pearson Educación. México 2012

Anotaciones

2. Introducción a la Probabilidad.Décimo Segunda Edición. William Mendenhall, Robert Beaver. Cengage Learning. 2008 3. Estadística y Muestreo. Ciro Martinez Bencardino. Colombia 2012. ECOE Ediciones.

Objetivos

Inicio

Actividades

Autoevaluación

AUTOEVALUACIÓN DE LA UNIDAD III 1. Glosario

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

La probabilidad de que la próxima semana llueva en Huancayo es un típico caso de probabilidad:

Bibliografía

a) Clásica

b) Subjetiva

d) Total

c) Binomial e) Empírica o de frecuencia relativa

Anotaciones

2.

La siguiente definición: “Conforme un procedimiento se repite una y otra vez, la probabilidad de frecuencias relativas (o empíricas) de un suceso, tiende a aproximarse a la probabilidad real”, corresponde a: a) Teorema de Bayes b) Probabilidad total c) Regla del suceso infrecuente d) Probabilidad condicional e) Ley de los números grandes

3.

Determine el valor de la probabilidad del complemento de A, si P(A) = 0.274 a) 0.672

4.

b) 0

c) 0.726 d) 1

e) 0.762

Considere el caso de una pequeña empresa de ensamble en la que hay 50 empleados. Se espera que todos los trabajadores terminen su trabajo a tiempo y que pase la inspección final. A veces, alguno de los empleados no satisface el estándar de desempeño, ya sea porque no termina a tiempo su trabajo o porque no ensambla bien una pieza. Al final del período de evaluación del desempeño, el jefe de producción encuentra que 5 de los 50 trabajadores no terminaron su trabajo a tiempo, 6 de los 50 trabajadores ensamblaron mal una pieza y 2 de los 50 trabajadores no terminaron su trabajo a tiempo y armaron mal una pieza. Después de analizar los datos del desempeño, el jefe de producción decide despedir a los trabajadores que no terminaron a tiempo su trabajo o que armaron mal alguna pieza. ¿Cuál es la probabilidad de que el jefe de producción despida a un trabajador? a) 0,14

b) 0,16

c) 0,18

d) 0,2

e) 0,24

Bibliografía

79


o os

as

io

80

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD III: PROBABILIDAD

5.

De una baraja de 52 cartas extraemos sin reposición y en forma sucesiva dos cartas. Si en la primera extracción se obtuvo espada. ¿Cuál es la probabilidad de que en la segunda extracción salga espada nuevamente?

Anotaciones

a) 0,059

b) 0,24

c) 0,67

d) 0,0022

e) 0,834

6. Una compañía dedicada al transporte público explota tres líneas de una ciudad de forma que el 50% de los autobuses cubre el servicio de la primera línea, el 20% cubre la segunda y el 30% cubre el servicio de la tercera línea. Se sabe que la probabilidad de que diariamente un autobús se averíe es del 3%, 2% y 5%, respectivamente, para cada línea. Determine la probabilidad de que, en un día, un autobús sufra una avería.: a) 0,34

b) 0,00034

c) 3,4

d) 0,034

e) 0,0304

7. Mariela desea adquirir el libro de Estadística de Mario Triola, el cual es vendido en 8 librerías diferentes de la calle Calixto, en 7 galerías del Tambo y en 6 librerías cercanas al campus de la UCCI. ¿De cuántas maneras podrá adquirir dicho libro? a) 15 8.

c) 14

d) 20

e) 21

Viviana tiene 3 blusas de diferente color, 3 pantalones diferentes, 4 minifaldas y 2 pares de zapatos diferentes. ¿De cuántas formas distintas puede vestirse con estas prendas para ir a sus clases, considerando que el profesor de Estadística ha prohibido a las mujeres ir a clase con minifalda?: a) 5/9

9.

b) 13

b)2/18

c)5/18

d) 9/12

e)9/17

Una caja contiene 4 bolas blancas y 5 bolas rojas. Se extraen consecutivamente 2 bolas sin reemplazo. Calcular la probabilidad de que se extraigan una bola blanca y una roja, en ese orden.

10. Identifica el enunciado falso con respecto a las COMBINACIONES: a) Se tiene un total de “n” diferentes elementos disponibles. b) Los reordenamientos de los mismos elementos son considerados iguales. c) Se selecciona “r” de los “n” elementos, donde r<n. d) Se expresa como: e) La agrupación ABC ≠ CBA


Desarrollo de contenidos

Diagrama

Objetivos

Desarrollo de contenidos

Lecturas seleccionadas Diagrama

Inicio

Lecturas seleccionadas

Glosario

Recordatorio

Anotaciones

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD Actividades

Autoevaluación

DIAGRAMA DE PRESENTACIÓN DE LA UNIDAD IV Glosario

Bibliografía

Objetivos

Inicio

CONTENIDOS

Recordatorio Desarrollo de contenidos

Anotaciones Actividades

Lecturas seleccionadas

Glosario

EJEMPLOS

ACTIVIDADES

Autoevaluación

AUTOEVALUACIÓN

Recordatorio Diagrama

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

BIBLIOGRAFÍA

Bibliografía

ORGANIZACIÓN DE LOS APRENDIZAJES Anotaciones Objetivos

Inicio

CONOCIMIENTOS Tema N° 01:Distribuciones de Actividades Autoevaluación Probabilidad Discreta 1. Variables aleatorias 2. Distribución de probabilidad binomial. Lecturas Glosariode probabiliBibliografía 3. Distribución seleccionadas dad hipergeométrica. 4. Distribución de probabilidad de Poisson.

Desarrollo de contenidos

Anotaciones Tema N° 2: Distribuciones De Probabilidad Normal 1. Distribución normal estándar. Valor crítico z. 2. Aplicaciones de la distribución normal estándar.

Recordatorio

Lectura Seleccionada N°4 ¿Los métodos estadísticos pueden demostrar que el proceso de selección de un jurado es discriminatorio? Autoevaluación N° 04

PROCEDIMIENTOS

ACTITUDES

Procedimientos: 1. Identifica la distribución de probabilidad discreta de un experimento aleatorio 2. Calcula e interpreta la probabilidad del evento de interés. Actividad N°1: Calculan la probabilidad en distintas distribuciones

Demuestra proactividad y ética en el desarrollo de la asignatura y en el manejo de la información.

Procedimientos: 3. Identifica la distribución de probabilidad continua de un experimento aleatorio 4. calcula e interpreta la probabilidad de distribuciones normales. Actividad N°2: Resuelve ejercicios y problemas aplicando la distribución normal. Tarea Académica Nº 2

Bibliografía

81


o os

as

io

82

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD Anotaciones

Debes tener en cuenta que las distribuciones de probabilidad están relacionadas con la distribución de frecuencias. De hecho, podemos pensar en la distribución de probabilidad como una distribución de frecuencias teórica. Una distribución de frecuencias teórica es una distribución de probabilidades que describe la forma en que se espera que varíen los resultados. Debido a que estas distribuciones tratan sobre expectativas de que algo suceda, resultan ser modelos útiles para hacer inferencias y tomar decisiones de incertidumbre.

TEMA 01: DISTRIBUCIONES DE PROBABILIDAD DISCRETA 1 VARIABLES ALEATORIAS:

1.1 DEFINICION BÁSICA DE VARIABLES ALEATORIAS En la Unidad anterior se define un experimento como cualquier proceso que genera resultados bien definidos. Se considera de interés el proceso de asignar valores numéricos a los resultados experimentales. Para hacerlo, se introduce la noción de variable aleatoria. Para cualquier experimento en particular, una variable aleatoria puede definirse de modo que cada resultado experimental posible genere exactamente un valor numérico para la variable aleatoria, es decir que una variable aleatoria es la descripción numérica del resultado de un experimento. Ejemplo

Una variable aleatoria puede clasificarse como discreta o continua dependiendo de los valores numéricos que pueda asumir. Una variable aleatoria que solo puede tomar una secuencia finita o infinita numerable de valores es una variable aleatoria discreta. El número de ventas logradas, número de artículos defectuosos y número de clientes atendidos por día son ejemplos de variables aleatorias discretas. Una variable aleatoria que toma una secuencia infinita no numerable de valores es una variable aleatoria continua, por ejemplo: tiempo requerido (en minutos) para trasladarse de la UCCI al hogar. 1.2 DISTRIBUCIÓN DE PROBABILIDAD DE UNA VARIABLE ALEATORIA DISCRETA La función de distribución de probabilidad, denotada por , proporciona la probabilidad que la variable aleatoria discreta tome el valor especifico . En la construcción de una distribución de probabilidad discreta siempre deben satisfacerse dos condiciones: • •


UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD Desarrollo

de contenidos

Lecturas

seleccionadas Ejemplo: Una empresa compra juguetes y su proveedor los entrega en cajas de 50 unidades. Luego de la comercialización de los juguetes y de acuerdo a las devoluciones realizadas por sus propios clientes ha determinado el número de juguetes defectuosos en las últimas 500 cajas compradas. La información se Recordatorio muestra a continuación:

Sea la variable aleatoria X = Número de juguetes defectuosos por caja de 50 unidades. La función de distribución de probabilidad se puede obtener calculando la frecuencia relativa para cada valor de X.

1.3 VALOR ESPERADO DE UNA VARIABLE ALEATORIA DISCRETA El valor esperado de una variable aleatoria discreta es un promedio ponderado de todos los valores posibles de la misma, donde los pesos son las probabilidades asociadas con los valores. El valor esperado de una variable aleatoria discreta se calcula con la siguiente expresión:

El valor esperado de una variable aleatoria es el valor medio, o promedio. Para experimentos que pueden repetirse muchas veces, el valor esperado puede interpretarse como el valor promedio a largo plazo para la variable aleatoria. Sin embargo, el valor esperado no necesariamente es el número que pensamos asumirá la variable aleatoria la próxima vez que se realice el experimento. Ejemplo: Si se desea calcular el valor esperado de la variable aleatoria definida en el ejemplo anterior.

Luego, el valor esperado de X es 0.95 juguetes defectuosos. 1.4 VARIANZA DE UNA VARIABLE ALEATORIA DISCRETA El valor esperado nos da una idea acerca del valor promedio o central para la variable aleatoria, pero es importante tener además una medida de la dispersión o variabilidad de los valores posibles de la variable aleatoria. La varianza es una medida usada para representar la dispersión o variabilidad en los valores de una variable aleatoria. La varianza de una variable aleatoria discreta se calcula con la siguiente expresión:

Una medida de dispersión relacionada es la desviación estándar, , la cual se define como la raíz cuadrada positiva de la varianza.

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Glosario

Anotaciones

Bibliografía

83


o os

as

io

84

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Ejemplo: Si se desea calcular la varianza y desviación estándar de la variable aleatoria definida en el ejemplo anterior. Anotaciones

Aplicaciones La siguiente tabla muestra la distribución del número de errores que un publicista comete al elaborar una pieza publicitaria.

a. Encuentre el valor de “a” para que dicha distribución sea de probabilidad.

b. Si se elige una pieza publicitaria. ¿cuál es la probabilidad que el publicista cometa a lo más 3 errores?

c. Calcule e interprete el valor esperado.


UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD Desarrollo

de contenidos

2 DISTRIBUCIÓN DE PROBABILIDAD BINOMIA

Lecturas seleccionadas

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Glosario

La distribución de probabilidad binomial es una distribución discreta de probabiRecordatorio lidad que se relaciona con un experimento binomial, el cual tiene cuatro propiedades: • El experimento consiste de una sucesión de n intentos o ensayos idénticos. • En cada intento o ensayo son posibles dos resultados. A uno lo llamaremos éxito y al otro fracaso. • La probabilidad de obtener un éxito, p , no cambia de un intento o ensayo a otro. • Los intentos o ensayos son independientes. En un experimento binomial la variable aleatoria de interés se define como X = Número de éxitos obtenidos en los intentos o ensayos. Esta variable aleatoria puede tomar los valores 0,1,2,...,n . La función de distribución de probabilidad asociada con esta variable aleatoria es:

Lo anterior puede escribirse como . El valor esperado y variancia de una variable aleatoria con distribución binomial son respectivamente. Ejemplo 1: La probabilidad de que cualquier símbolo particular de código se transmita erróneamente a través de un sistema de comunicaciones es 0.10. En la transmisión de los símbolos los errores ocurren de manera independiente unos de otros. Suponga que se envía un mensaje formado por 10 símbolos. ¿Cuál es la probabilidad que se transmitan erróneamente solo 2 símbolos? Sea X = Número de símbolos transmitidos erróneamente del total de 10, entonces . La función de distribución de probabilidad es

Luego,

.

Ejemplo 2: Con respecto al Ejemplo anterior, ¿cuál es la probabilidad de transmitir como máximo tres símbolos erróneamente?

Propiedades de la distribución binomial a) la media: μ = np b) la varianza: σ2 = npq c) cuando p es menor que 0.5, la distribución binomial está sesgada hacia la derecha. d) conforme p aumenta, el sesgo es menos notable. e) cuando p = 0.5, la distribución binomial es simétrica. f) cuando p es mayor que 0.5, la distribución esta sesgada hacia la izquierda.

Anotaciones

Bibliografía

85


o os

as

io

86

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

3 DISTRIBUCIÓN DE PROBABILIDAD HIPERGEOMÉTRICA

Anotaciones

La distribución de probabilidad hipergeométrica está estrechamente relacionada con la distribución binomial, pero difieren en dos puntos: en la distribución hipergeométrica los ensayos no son independientes y la probabilidad de éxito varía de ensayo a ensayo. En la notación usual, r denota el número de elementos considerados como éxitos que hay en una población de tamaño N, y N – r denota el número de elementos considerados como fracasos que hay en dicha población. La función de probabilidad hipergeométrica se usa para calcular la probabilidad de que en una muestra aleatoria de n elementos, seleccionados sin reemplazo, se tengan x éxitos y n – x fracasos. La función de distribución de probabilidad asociada con esta variable aleatoria es:

Lo anterior puede escribirse como

. El valor esperado y variancia

de una variable aleatoria con distribución hipergeométrica son

y

respectivamente. Ejemplo: Una empresa fabrica fusibles que empaca en cajas de 12 unidades cada una. Suponga que un inspector selecciona al azar tres de los 12 fusibles de una caja para inspeccionarlos. Si la caja contiene 5 fusibles defectuosos, ¿cuál es la probabilidad que el inspector encuentre más de un fusible defectuoso? Sea X = Número de fusibles defectuosos encontrados por el inspector en la muestra . La función de distribución de de tamaño 3, entonces probabilidad es

4 DISTRIBUCIÓN DE PROBABILIDAD DE POISSON En esta sección se describe una variable aleatoria discreta que se usa con frecuencia para estimar la cantidad de sucesos u ocurrencias en determinado intervalo de tiempo o espacio. Por ejemplo, la variable aleatoria de interés podría ser X = Número de clientes de los clientes al banco por hora, X = Número de reparaciones necesarias por cada 10 kilómetros e carretera o X = Número de fugas en 100 millas de un oleoducto. Si se satisfacen las dos propiedades siguientes, la variable aleatoria X = Número de ocurrencias en determinado intervalo de tiempo o espacio es una variable aleatoria discreta que se describe con la distribución de probabilidad de Poisson: • La probabilidad de una ocurrencia es igual en dos intervalos cualesquiera de igual longitud. • La ocurrencia o no ocurrencia en cualquier intervalo es independiente de la ocurrencia o no ocurrencia en cualquier otro intervalo. La función de probabilidad de Poisson es:


UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD Desarrollo

de contenidos

Lecturas seleccionadas

Lo anterior puede escribirse como , donde λ es la tasa o número promedio de ocurrencias en determinado intervalo de tiempo o espacio y . El valor esperado y variancia de una variable aleatoria con distribución de Poisson son numéricamente iguales al parámetro de la distribución, es decir . Recordatorio Ejemplo 1: La división de mantenimiento de telefonía está tratando de decidir cuántos reparadores necesita para proporcionar un nivel aceptable de servicio a sus clientes. El número de quejas que llegan al centro de servicio sigue una distribución de Poisson, con una tasa promedio de 30 llamadas al día. ¿Cual es la probabilidad de recibir en el centro de servicio más de 20 quejas en medio día? Sea X = Número de quejas que llegan al centro de servicio en medio día, entonces . La función de distribución de probabilidad es:

Ejemplo 2: Con respecto al Ejemplo anterior, ¿cuál es la probabilidad que llegue al centro de servicio menos de 25 quejas al día? Sea X = Número de quejas que llegan al centro de servicio por día, entonces . La función de distribución de probabilidad es:

Luego,

.

TEMA Nº 2: DISTRIBUCION DE PROBABILIDAD NORMAL 1 DISTRIBUCIÓN NORMAL ESTÁNDAR. VALOR CRÍTICO Z. 1.1 DISTRIBUCIÓN NORMAL ESTÁNDAR La distribución normal es una de las distribuciones más usadas e importantes. Se ha desenvuelto como una herramienta indispensable en cualquier rama de la ciencia , la industria y el comercio. Muchos eventos reales y naturales tienen una distribución de frecuencias cuya forma es muy parecida a la distribución normal. La distribución normal es llamada también campana de Gauss por su forma acampanada

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Glosario

Anotaciones

Bibliografía

87


o os

as

io

88

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Propiedades de la distribución normal • La distribución normal tiene forma de campana. Anotaciones

• La distribución normal es una distribución de probabilidad que tiene media µ= 0 y desviación estándar σ = 1. • El área bajo la curva o la probabilidad desde menos infinito a más infinito vale 1. • La distribución normal es simétrica, es decir cada mitad de curva tiene un área de 0.5. • La escala horizontal de la curva se mide en desviaciones estándar. • La forma y la posición de una distribución normal dependen de los parámetros µ y σ , en consecuencia hay un número infinito de distribuciones normales.

Existe una relación del porcentaje de población a la desviación estándar. En la figura observamos por ejemplo que el área bajo la curva para tiene un porcentaje de 68.26%, ±2 σ = 95.46% y ±3 σ = 99.73%

La población incluye todos los datos, la muestra es una porción de la población.

Tomando como referencia una distribución normal estándar con parámetros: µ = 0 y σ2 = 1. Se trabaja con la distancia entre x y µ en función de la desviación estándar. Tal como se muestra a continuación:


UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD Desarrollo

de contenidos

Notación:

Lecturas seleccionadas

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Glosario

Z ~ Normal (0,1) y se lee: “Z tiene distribución normal estándar con medio 0 y varianza igual a 1” Recordatorio

1.2 VALOR CRÍTICO Z Determina el número de desviaciones estándar σ entre algún valor X y la media de la población µ. Para calcular el valor de Z usamos la siguiente fórmula.

La distribución de probabilidad f (Z) es una distribución normal con media 0 y desviación estándar 1; esto es Z se distribuye normalmente con media cero y desviación estándar = 1 Z~N(0,1): La gráfica de densidad de probabilidad se muestra en la figura.

La distribución f (Z) se encuentra tabulada en la tabla de distribución normal estándar. En esta tabla podemos determinar los valores de Z o la probabilidad de determinado valor Z.

Anotaciones

Bibliografía

89


o os

as

io

90

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Anotaciones

Ejemplo 1: El gerente de personal de una gran compañía requiere que los solicitantes a un puesto efectúen cierta prueba y alcancen una calificación de 500. Si las calificaciones de la prueba se distribuyen normalmente con media 485 y desviación estándar 30 ¿Qué porcentaje de los solicitantes pasará la prueba? Calculando el valor de Z obtenemos:

Buscamos el valor correspondiente Z en las tabla de distribución normal. Z0.5 = .69146 = 69.146%. siendo esta la probabilidad de que la calificación sea menor a 500 P (X<500). Dado que el porcentaje pedido es la solución es 1-.69146 =.3085 , 30.85% de los participantes pasarán la prueba.


UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD Desarrollo

de contenidos

Ejemplo 2:

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Lecturas seleccionadas

Glosario

Recordatorio

Anotaciones

Encuentre la probabilidad siguiente usando la tabla Z. P(-1.23 < Z < 0)

Solución: Buscamos el valor Z1..23 en las tablas siendo este = .89065. restando .89065-.05 = .3905, este valor es la probabilidad de 0 a 1.23 que es exactamente la misma de –1.23 a 0 por simetría. Por lo tanto la probabilidad es .3905

2 APLICACIONES DE LA DISTRIBUCIÓN NORMAL ESTÁNDAR. APROXIMACIÓN NORMAL A LA BINOMIAL Cuando las muestras son pequeñas, en una distribución binomial se obtienen fácilmente probabilidades asociadas a un evento mediante la fórmula de la binomial. Cuando las muestras son grandes, el cálculo nos llevaría bastante tiempo. La distribución normal es a menudo una buena aproximación a una distribución binomial cuando np y nq son mas grandes que 5.

con n = 20 y p = .5

con n = 60 y p = .5

Para utilizar la distribución normal como una aproximación de la binomial debemos estar seguros de que la distribución de interés es en efecto una distribución biniomial, para lo cual debe reunir los siguientes criterios: 1. Hay solo dos posibles resultados éxito o fracaso 2. Resulta de un conteo 3. Cada prueba es independiente 4. La probabilidad del éxito es constante en cada prueba 5. Hay un número fijo de pruebas.

Bibliografía

91


o os

as

io

92

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Ejemplo 1 La probabilidad de que un paciente se recupere de una rara enfermedad de la sangre es 0.4. Si se sabe que 100 personas contrajeron esa enfermedad, Anotaciones

a) ¿Cuál es la probabilidad de que menos de 30 sobrevivan? b) ¿Cuál es la probabilidad de que exactamente 5 sobrevivan? c) ¿Cuál es la probabilidad de que a lo más 30 sobrevivan? El primer paso es verificar si el experimento cumple con los requisitos de una distribución binomial, y si es el caso calcular la media y la desviación estándar de la distribución.

a) P(x < 30 ) Para resolver el problema con la fórmula de la distribución binomial se tendría que calcular 30 binomiales, desde la binomial de cero hasta la binomial de 29. Mediante el uso de la aproximación normal a la binomial el procedimiento es mucho más corto. El primer paso es aplicar al valor de x el factor de corrección de continuidad, que es simplemente sumar o restar 0.5 al valor de x, dependiendo del problema. En este caso queremos la probabilidad de que x valga menos de 30, no incluye al 30, entonces se le resta 0.5. En seguida se aplica la fórmula de Z, utilizando el valor de x = 29.5, y en seguida buscar el área en la tabla:

b) P(x = 35 ) En una distribución continua la probabilidad de que la variable aleatoria sea exactamente determinado valor no se puede calcular y se estima que es cero, mientras que en una distribución discreta la probabilidad se calcula sumando y restando el factor de corrección de continuidad para estimar el área entre ambos puntos. Sin embargo, cuando tenemos un caso como este, lo correcto y lo más fácil es calcular la probabilidad con la fórmula de la binomial, y obtenemos el resultado exacto.


UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD Desarrollo

de contenidos

Lecturas seleccionadas

c) P( x ≤ 30 )

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Glosario

Aquí se pide la probabilidad de que x tome valores desde 0 hasta 30 inclusive, como el 30 está incluido el factor de corrección de continuidad se suma. Recordatorio

Ejemplo 2 Calcular la probabilidad de que al lanzar una moneda 100 veces, el número de caras obtenido esté comprendido entre 45 y 55.

Se tiene:

Y la probabilidad pedida es, con la aproximación realizada:

Ejemplo 3: La presión sanguínea de ciertos enfermos sigue una ley normal de media 90 mm. Hg y de desviación típica 12 mm. Hg. Hallar la probabilidad de que elegido un paciente al azar: a) Su presión sea mayor de 115 mm. Hg. b) Su presión esté comprendida entre 80 y 100 mm. Hg.

Anotaciones

Bibliografía

93


o os

as

io

94

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Tipificando los valores 90, 80 y 100 tenemos:

Anotaciones

La probabilidad de que la presión sea mayor de 115 mm. Hg. es:

Y la probabilidad de que la presión esté comprendida entre 80 y 100 mm. Hg:

Ejemplo 4: Diferencias y relaciones entre la distribución binomial y la normal. El porcentaje de españoles con estudios medios es del 35 %. Elegidos ocho al azar, calcular la probabilidad de que entre 3 y 5 (ambos incluidos) tengan estudios medios, aplicando: a) La distribución binomial. b) La aproximación normal de la binomial. Aplicando la distribución binomial con n=8, p=0,35 y q=0,65, se tiene:

Aplicando la aproximación normal a la binomial con:

Y, tipificando para aplicar la aproximación normal a la binomial:

Con lo cual la probabilidad será: Y se ve que la aproximación no es aquí buena porque n es muy inferior a 30 y p es muy distinto de 0,5. TABLAS DE DISTRIBUCIÓN NORMAL

Área bajo la curva normal


UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD Desarrollo

de contenidos

TABLAS DE DISTRIBUCIÓN NORMAL

Área bajo la curva normal

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Lecturas seleccionadas

Glosario

Recordatorio

Anotaciones

Bibliografía

95


o os

as

io

96

Actividades

Autoevaluación

Glosario

Bibliografía

Anotaciones

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Diagrama

Desarrollo de contenidos

Lecturas seleccionadas

Objetivos

Diagrama Actividades

Inicio

ACTIVIDAD Objetivos Inicio N° 4 Autoevaluación

Esta actividad puede consultarla en su aula virtual. Desarrollo de contenidos Glosario

Actividades

Autoevaluación

Bibliografía

LECTURA SELECCIONADA N° 4 Lecturas seleccionadas Recordatorio

Glosario

Bibliografía

Anotaciones

¿Los métodos estadísticos pueden demostrar que el proceso de selección de un jurado es discriminatorio?

Recordatorio

Anotaciones

Estadística. Mario Triola. Pág.199

Después de que un acusado ha sido condenado por algún crimen, en ocasiones se interpone una apelación con el argumento de que el acusado fue condenado por un jurado de personas diferentes a él. Uno de los criterios es que el proceso de selección del jurado debe garantizar que los miembros representen a la población de la región. En un caso célebre, el doctor Benjamin Spock, escritor del libro Baby and Child Cure, fue condenado por conspiración al fomentar la resistencia al reclutamiento durante la guerra de Vietnam. Su defensor argumentó que el doctor Spock estaba en desventaja, pues los 12 miembros del jurado eran hombres. Las mujeres se habrían mostrado más comprensivas, ya que, en general, se oponían más a la guerra; además, el doctor Spock era muy reconocido entre el público femenino como médico infantil. Un especialista en estadística testificó que el jurado tenía una proporción consistentemente menor de mujeres que los otros seis jurados del mismo distrito. La condena del doctor Spock fue anulada por otras razones. En la actualidad los integrantes de los jurados de las cortes federales se deben elegir de manera aleatoria. En 1972, Rodrigo Partida, méxico-estadounidense, fue condenado por robo con i ntento de violación. Su condena fue dictada en el condado de Hidalgo, que se localiza en Texas, en la frontera con México. En el condado de Hidalgo había 181,535 personas que podían formar parte del jurado, y el 80% de ellas eran méxico-estadounidenses. De las 870 personas llamadas a servir como jueces, el 39% (339) eran méxico-estadounidenses. Tiempo después, se apeló la condena de Partida (Castaneda contra Partida) con base en la gran discrepancia entre el 80% de méxico-estadounidenses disponibles para fungir como jueces y el hecho de que sòlo fuera seleccionado el 39% de este grupo. En este capítulo estudiaremos el problema de Castaneda contra Partida en especial a partir de las siguientes preguntas fundamentales: 1. Puesto que los méxico-estadounidenses constituyen el 80% de la población y dado que Partida fue sentenciado por un jurado de 12 personas de las que sólo el 58% de los jueces (7) eran méxico-estadounidenses, ¿podemos concluir que este jurado fue elegido en un proceso que discrimina a los méxico-estadounidenses? 2. Dado que los méxico-estadounidenses constituyen el 80% de la población total de 181535 habitantes y que durante un período de más de 11 años sólo el 39% de los individuos llamados a servir como jueces eran méxico-estadounidenses, ¿podemos concluir que el proceso de selección del jurado discriminó a este grupo? (Sabemos que, debido al azar, las muestras varían naturalmente hasta cierto punto de lo que se esperaría a nivel teórico. Sin embargo la discrepancia entre la tasa del 80% de méxico-estadounidenses de la población y el 39% de los méxico-estadounidenses llamados a servir como jueces es lo suficientemente grande para explicarse por el azar?) Este ejemplo explica la importancia de una comprensión básica de los métodos estadísticos en el terreno legal. Es probable que los abogados que carecen de conocimientos estadísticos no puedan ofrecer un buen servicio a sus clientes. En una ocasión el autor testificó en la suprema Corte del estado de Nueva York y al analizar la situación, se dio cuenta de que la falta de comprensión de conceptos estadísticos básicos podría ser muy perjudicial para el cliente de un abogado.


os

s

o

s

s

o

Diagrama

Objetivos

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD Desarrollo

Inicio

de contenidos

Desarrollo de contenidos

Actividades

Lecturas seleccionadas

Glosario

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Autoevaluación Lecturas seleccionadas

Glosario

Recordatorio

Anotaciones

GLOSARIO Distribución binomial: Distribución donde los sucesos tienen la misma probabilidad, con la presencia de éxito y fracaso y en un número fijo de ensayos.

- Recordatorio

Objetivos

Bibliografía

- Anotaciones Distribución de Poisson: Distribución de probabilidad discreta que se aplica a ocurrencias de algún suceso durante un intervalo de tiempo, distancia, área, volumen u otra unidad similar que se especifique. -

Distribución de probabilidad: Conjunto de valores de una variable aleatoria junto con sus probabilidades correspondientes.

-

Distribución hipergeométrica: Se diferencia de la binomial en que la probabilidad de los sucesos no se mantiene constante.

-

Distribución muestral de proporciones: Distribución de probabilidad de las proporciones muestrales, donde todas las muestras tienen el mismo tamaño muestral n.

-

Distribución normal: Distribución de probabilidad con forma de campana, simétrica y asintótica por ambos extremos.

-

Distribución normal estándar: Distribución normal con una media igual a cero y una desviación estándar igual a 1

-

Valor crítico z: Número de veces que la diferencia entre la observación dada y la media contiene a la desviación estándar.

- -

Valor esperado: Promedio ponderado de los resultados de un experimento.

Inicio

Variable Aleatoria: Variable que toma diferentes valores como resultado de un experimento aleatorio.

Actividades

Autoevaluación

Glosario

Bibliografía

BIBLIOGRAFÍA DE LA UNIDAD IV

1.

Triola Mario F. ESTADÍSTICA. Pearson Educación. México 2012

2.

Toma Inafuko-Rubio Donet. Estadística Aplicada. Centro de Investigación Universidad del Pacífico. 2012

Anotaciones

Objetivos

Inicio

Actividades

Autoevaluación

AUTOEVALUACIÓN DE LA UNIDAD IV 1. Glosario

La encargada de los préstamos en un banco estima, con base en sus años de experiencia, que la probabilidad de que un solicitante no sea capaz de pagar su préstamo es 0.025. El mes pasado realizó 40 préstamos. ¿Cuál es la probabilidad de que 3 Bibliografía préstamos no sean pagados oportunamente? A) 0,6

B) 61%

C) 6%

D) 0,625 E) 0,94

Anotaciones

2.

El arribo de buses de pasajeros al terminal de la Empresa de Transportes “Cruz del Sur” es un proceso de Poisson, con un promedio de 2 arribos por hora. Calcular la probabilidad de que ningún bus arribe en una hora. A) 0,1527

B) 0,0165

C) 0,1353

D) 0,1254 E) 0,1758

Bibliografía

97


o os

as

io

98

Actividades

Autoevaluación

Glosario

Bibliografía

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

3.

Sea Z ~ N(0,1). Halle P[-2 ≤ Z ≤ -1.57] A) 0.0678

Anotaciones

B) 0.0542

C) 0.0354

D) 0.0478 E) 0.5147 4.

Una población normal tiene una media de 20,00 y una desviación estándar de 4,00. Halle el valor “z” correspondiente a 25,00 A) 1,25

B) 1,26

C) 1,27

D) 1,28 E) 1,29 5.

Un estudio reciente de los sueldos por hora del personal de una empresa mostró que el salario medio por hora es de 16,50 Nuevos Soles, con una desviación estándar de 3,50 nuevos soles. Si se selecciona al azar a un trabajador de la empresa ¿cuál es la probabilidad de que gane más de 20 nuevos soles la hora? A) 0,1680

B) 0,1580

C) 0,1587

D) 0,1682 E)0,8415

l


ANEXO Desarrollo

de contenidos

ESTADÍSTICA I Actividades Autoevaluación MANUAL AUTOFORMATIVO

Lecturas seleccionadas

Glosario

Recordatorio

Anotaciones

CLAVE DE RESPUESTAS AUTOEVALUACIONES.

Bibliografía

99


Estadistica i  
Estadistica i  
Advertisement