Issuu on Google+

ESTADÍSTICA PRÁCTICA

Arbey Fernando Grisales Guerrero Jhon Faber Arredondo Edwin Mamián

ARMENIA 2009

1


INTRODUCCIÓN La necesidad de tener un conocimiento más riguroso en los diferentes aspectos del proceso de aprendizaje, obliga al docente y a los alumnos a emplear los mejores recursos para recolectar, ordenar, clasificar y analizar la información requerida para dar solución a problemas de índole pedagógico. La estadística aplicada a la educación es una excelente herramienta para tal fin.

2


TABLA DE CONTENIDO PÁGINA INTRODUCCIÓN CAPÍTULO I NOCIONES PRELIMINARES DE ESTADÍSTICA (OBJETIVOS)

1

1.1

Breve Reseña Histórica de la Estadística

3

1.2

Definición de Estadística

5

1.3

División de la Estadística

6

1.4

Aplicación de la Estadística

6

1.5

Términos de Uso Común en Estadística

7

EJERCICIOS CAPÍTULO I

9

CAPÍTULO II LA INVESTIGACIÓN (OBJETIVOS)

15

2.1

Qué es la Investigación

17

2.2

Características de la Investigación

17

2.3

Clases de Investigación

18

2.4

Investigación Estadística

19

• • • • •

Formulación del Problema Objetivos de la Investigación Determinar si se trata de un censo o de una muestra Técnica de Muestreo Tipos de Muestra

19 20 20 21 21

3


• • • • • • • • •

Tabla de Números Aleatorios Unidad a Investigar Variables Elaboración de la Encuesta Elaboración del Presupuesto Selección y Preparación del Personal Cronograma de Trabajo Recolección Procesamiento y Análisis

EJERCICIOS CAPÍTULO II

24 26 26 27 30 31 31 32 32 34

CAPÍTULO III TABLAS ESTADÍSTICAS (OBJETIVOS)

37

3.1

Elaboración de Tablas o Cuadros

39

3.2

Técnica Empleada en la Elaboración de un Cuadro

39

3.3

Cuadros Estadísticos

40

• • •

Generalidades o de Referencia De Resumen Cuadro de Frecuencia

EJERCICIOS CAPÍTULO III

40 41 42 46

CAPÍTULO IV GRÁFICAS ESTADÍSTICAS (OBJETIVOS)

49

4.1

Principios Básicos en las Construcción de Gráficos

51

4.2

Tipos de Gráficas

51

4.3

Ventajas de las Gráficas

51

4


4.4

Gráficos de Visualización

4.5

Gráficos de Evolución • • • • • •

Gráficos lineales Histograma Polígono de Frecuencia Ojiva Pirámides Gráfico de Gant

EJERCICIOS CAPÍTULO IV

52 53 54 54 55 55 57 59 59

CAPÍTULO V ALGUNOS SÍMBOLOS Y CONCEPTOS MATEMÁTICOS (OBJETIVOS)

63

5.1

Notación Sumatoria

65

5.2

Fórmulas de las Sumatorias

68

5.3

Notación Productoria

68

5.4

Errores en las Mediciones

70

5.5

Clases de Errores

71

5.6

Aproximaciones Numéricas

73

5.7

Notación Científica

73

5.8

Operaciones en Notación Científica

74

5.9

Gráfica de Funciones

76

• • 5.10

Función Lineal Función Cuadrática

76 78

Porcentajes y Tasas

EJERCICIOS CAPÍTULO V

81 87

5


CAPÍTULO VI PROMEDIOS (OBJETIVOS)

91

6.1

Promedios: Medidas de tendencia central y medidas de posición

93

6.2

Media Aritmética Simple

93

6.3

Media Aritmética Ponderada

95

6.4

Otro Método para calcular la Media Aritmética Simple

96

6.5

La Mediana

6.6

La Moda

6.7

Media Geométrica

6.8

Media Armónica

6.9

Características Comparativas de la Media, Mediana, Moda, Media Geométrica y Media Armónica

6.10

Medidas de Posición: Cuartiles, Deciles y Percentiles

6.11

Cuartiles

111

6.12

Deciles

113

6.13

Percentiles

114

6.14

Características de los Cuartiles, Deciles y Percentiles

EJERCICIOS CAPÍTULO VI

100 104 106 109 111 111

116 116

CAPÍTULO VII DISPERSIÓN (OBJETIVOS) 7.1

Medidas de Dispersión

119 121

6


7.2

Rango o Recorrido

121

7.3

Desviación Media

122

7.4

La Varianza

124

7.5

Desviación Típica

7.6

Curva Normal

7.7

Coeficiente de Variación

7.8

Recorrido Intercuartil

131

7.9

Cuando deben ser utilizadas las medidas de Dispersión

134

EJERCICIOS DEL CAPÍTULO VII

127 128 130

135

CAPÍTULO VIII CORRELACIÓN Y REGRESIÓN (OBJETIVOS)

139

8.1

Correlación y Regresión

141

8.2

Correlación

8.3

Diagrama de Dispersión

8.4

Coeficiente de Correlación de Pearson

142

8.5

Regresión

145

EJERCICIOS CAPÍTULO VIII

141 141

148

ANEXO 1 RESPUESTAS A LOS EJERCICIOS

151 153

GLOSARIO

159

BIBLIOGRAFÍA

163

7


CAPÍTULO I NOCIONES PRELIMINARES DE ESTADÍSTICA

OBJETIVOS −

Narrar por escrito y con sus propias palabras, la historia de la Estadística.

Dar por escrito una definición correcta de Estadística.

Identificar términos básicos de la Estadística que permitan el análisis de problemas de grupo.

8


1.1

BREVE RESEÑA HISTÓRICA DE LA ESTADÍSTICA

Desde las épocas primitivas el hombre ha recogido datos sobre el mundo que le rodea: datos sobre las reses que tiene, sobre el número de árboles que ha sembrado, etc. Por lo anterior, una historia completa de la estadística sería demasiado larga. Trataremos, sin embargo, de hacer un recuento de las estadísticas más importantes de que se tiene historia, y veremos qué personajes se han destacado en este campo. Comencemos en la China, unos 3.000 años A.C… Allí un rey llamado YAO, ordenó recoger información sobre dos aspectos de su país: -

El número de comercios y comerciantes. La cantidad de tierra cultivada.

Si viajamos hacia el occidente de la China, legamos a ASIRIA, donde se recogió información sobre: -

Las jerarquías administrativas. Los diversos estados del Imperio. La producción de estos estados (cultivos, cerámicas, etc.)

En Egipto, por ejemplo, se recolectaban datos sobre el número de habitantes, que se actualizaban cada año. Los Egipcios fueron quienes realizaros el primer censo de población de que se tenga noticia.

Y hablando de Egipto, es fácil recordar a Moisés. Pues bien, él escribió durante la travesía del desierto un libro que se llamó “NÚMEROS” porque es, ni más ni menos, un censo de os israelitas que iban con él. En este censo se registró el número de personas que salieron de Egipto y que según la historia no podían entrar a la TIERRA PROMETIDA.

9


Pasemos ahora a Roma. Sus gobernantes efectuaban un censo de población anual, el que denominaron Census, Allí recolectaban datos sobre el número de habitantes y los bienes que éstos poseían. La iglesia católica en el Concilio Trento introduce en forma obligatoria la inscripción de los nacimientos, los matrimonios y las muertes. En Inglaterra, Guillermo El Conquistador ordenó realizar un censo de las oficinas administrativas del estado a fin de organizar mejor el funcionamiento de éste.

Después de Guillermo El Conquistador, muchos gobernantes tanto de Inglaterra como del mundo entero han utilizado los datos estadísticos para tomar decisiones de gobierno. Aproximadamente en el año 1650 surge en Inglaterra el grupo de los aritméticos políticos, que estudiaba fenómenos sociales basados en los datos recogidos. Mencionemos a Graunt, quien desarrolló extensos estudios sobre la población. De estos aritméticos políticos se derivaron varias tendencias. Una de ellas estudió el Cálculo de Probabilidades. Parece ser que esta tendencia tomó fuerza cuando algunos matemáticos quisieron estudiar las probabilidades de acertar en los juegos de cartas y dados, muy comunes en la época. Blas Pascal, enunció en 1660 los principios fundamentales del Cálculo de Probabilidades. En1750 el profesor Godofredo Achenwald, empleó la palabra ESTADÍSTICA, para referirse a una nueva ciencia que sería “el aliado más eficaz de un gobernante consciente”, ya que en su país se recopilaban y analizaban datos de todos los estados.

El suizo Bernoulli y el belga Quetelet la dotaron de bases matemáticas muy sólidas

10


1.2. DEFICIÓN DE ESTADÍSTICA Lee con atención: Un gobernante de un pequeño estado buscando fomentar la agricultura en su país, pide al ministro de este ramo un informe sobre el clima de las tierras cultivadas, para poder distribuirles semillas apropiadas. Veamos los pasos que siguió el ministro para cumplir su misión: -

Recolectó la información recorriendo las parcelas del estado y preguntando a los cultivadores sobre el clima de las tierras.

-

Organizó los datos de acuerdo a los diversos climas encontrados.

-

Resumió la información de tal manera que fuera más entendible para el gobernante.

-

Tabuló los aspectos observados de una forma concreta.

FRIO

TEMPLADO

CÁLIDO

Departamento A

1.500 Ha.

2.300 Ha.

4.300 Ha.

Departamento B

6.000 Ha.

7.300 Ha.

5.700 Ha.

Departamento C

4.800 Ha.

2.800 Ha.

6.500 Ha.

11


Con el cuadro anterior el gobernante Analizó la distribución de las tierras cultivadas y pudo sacar conclusiones con base en las cuales determinó qué tipo de semillas se requiere para cada Departamento. ESTADÍSTICA es, entonces, el conjunto de métodos de permiten recolectar, organizar, resumir, tabular y analizar datos para sacar conclusiones y tomar decisiones lógicas.

1.3. DIVISIÓN DE LA ESTADÍSTICA Para su estudio, la Estadística se divide en: •

Estadística Descriptiva:

Ciencia dedicada a describir las regularidades o características existentes en un conjunto de datos (la muestra). En este sentido las tareas de las Estadística Descriptiva son: i) La organización de los datos numéricos de la muestra a través de las tablas y representaciones gráficas. ii) El análisis de los datos obtenidos mediante la obtención de índices estadísticos representativos de la muestra: medidas de tendencia central y de dispersión. Por medio de la estadística descriptiva podemos estudiar sólo una muestra y si ésta es representativa de la población podemos INFERIR sus características. •

Estadística Inferencial:

Obtener conclusiones de las características de la población a partir del conocimiento de las características de la muestra.

12


Si se pudiese trabajar siempre con poblaciones bastaría la estadística descriptiva pero de la imposibilidad de trabajo con poblaciones nace la necesidad de utilizar muestras para posteriormente estimar o inferir las conclusiones. 1.4. APLICACIONES DE LA ESTADÍSTICA La Estadística tiene un panorama muy amplio de aplicación en las demás ciencias. Así, por ejemplo, la Estadística Sociológica se ocupa del manejo de datos y suministro de información acerca de experimentos u observaciones realizados para averiguar aspectos tales como: Condiciones sociales de vida en una comunidad, problemas humanos, delincuencia, divorcios, etc. Por otra parte, en Biología se aplica en el estudio de datos numéricos sobre experimentos realizados en seres vivos tales como reacciones humanas a un determinado compuesto químico, experiencias con una nueva droga, porcentaje de grasa de ciertos alimentos, etc. Económicamente hablando, la Estadística se puede aplicar en las siguientes áreas dentro de la organización de la empresa: -

Producción.

-

Finanzas.

-

Contabilidad (Auditoría). Índice de inventarios.

-

Personal.

-

Mercados (Publicidad)

En cuanto a producción se refiere la Estadística se puede aplicar en los siguientes aspectos: Estudio de nuevos métodos o nuevos productos, estudio de tiempo, planeación del control estadístico de calidad.

13


En finanzas se hace uso de la Estadística para comparar razones y hacer proyecciones a corto, mediano y largo plazo. En contabilidad se emplea principalmente en auditoría para seleccionar facturas y cuentas con base en las cuales se sacan conclusiones sobre la situación actual de la cartera, ampliación del crédito, etc. En la sección de personal se puede emplear la Estadística en encuestas sobre actitud de los empleados hacia la empresa, test de inteligencia para ascensos, etc. Finalmente en el departamento de mercados se puede usar la estadística sacar conclusiones respecto a la opinión que el público consumidor pueda tomar sobre un producto, impacto de la publicidad, relación de un producto con sus competitivos, etc. En lenguaje técnico el estudio de la Biología por medio de la Estadística se denomina BIOMETRÍA; cuando se trata de aplicaciones a la Sicología lo llamamos SICOMETRÍA; además de estos campos científicos, se le ha dado mucha importancia recientemente al estudio de las relaciones entre variables económicas desde el punto de vista de ciertas funciones básicas en Economía, tales como la demanda y el ingreso marginal, la función de producción, la función de costos, etc., en cuyo caso se le conoce como ECONOMETRÍA. 1.5. TÉRMINOS DE USO COMÚN EN ESTADÍSTICA Explicaremos a continuación algunos términos que se presentan frecuentemente al estudiar estadística: -

Población: Conjunto de todos los individuos que tienen en común alguna característica observable. Ejemplo 1: Los estudiantes de un colegio X, las notas de un grupo de estudiantes, la estatura de los estudiantes de una universidad, etc.

-

Muestra: Es una parte de la población en la que se observa el fenómeno objeto de estudio. Los elementos deben seleccionarse aleatoriamente, es decir, todos los elementos que componen la población tienen la misma posibilidad de ser seleccionados. Ejemplo 2: Si tomamos la población como los estudiantes de un colegio X, la muestra puede ser un porcentaje de ellos, seleccionados en forma aleatoria.

14


-

Variable: Son ciertos rasgos, cualidades o propiedades que poseen los elementos de una población. Ejemplo 3: Peso, estatura, estado civil, sexo, profesión, etc.

-

Modalidad: Se llama modalidad de la variable X a toda manifestación posible de X Ejemplo 4: La variable sexo puede dividirse en dos modalidades: masculino o femenino.

-

Parámetro: Son todas aquellas medidas que describen numéricamente la característica de una población. Ejemplo 5: La media, varianza, desviación típica.

-

Estadístico: Es la persona que trabaja en la elaboración y análisis de estadísticas.

-

Estadísticas: Se refiere a un ordenamiento sistemático de datos presentados en forma de cuadros y gráficos.

Ejemplo 6: Las estadísticas presentadas por el DANE.

-

Estadísticas Primarias: Son aquellos datos obtenidos ya sea por encuestas directas, mediante la utilización de cuestionarios, o como resultado de la observación directa.

-

Estadísticas Secundarias: Los datos se obtienen de publicaciones, los cuales pueden ser reproducciones totales o parciales.

-

Estadísticas Temporales: Denominadas series de tiempo o series cronológicas. Son las obtenidas y ordenadas en forma cronológica, siendo el resultado de investigaciones periódicas (días, meses, años).

15


Estadígrafos: Descripción numérica de una característica correspondiente a una muestra, es decir, medida que caracteriza a una muestra con fines descriptivos. EJERCICIOS -

1.

He aquí una serie de círculos, dentro de los cuales se han escrito los pasos del proceso estadístico. Ahora, trace una línea que los vaya uniendo según su orden lógico.

Recolección Resumen

Conclusión

Análisis

Organización Decisión

2.

En la siguiente lista hay varios pueblos antiguos. ¿Recuerda cuál de ellos llevó a cabo el primero ceso? a. b. c. d. e.

3.

Chino Asirio Egipcio Romano Griego

En el Concilio de Trento, la iglesia hizo obligatoria la inscripción de: a. b. c. d. e.

Nacimientos, matrimonios y número de hijos Nacimientos, bautizos y matrimonios Nacimientos, matrimonios y muertes Bautizos, matrimonios y número de hijos Bautizos, matrimonios y muertes

16


4.

Los aritméticos políticos investigan fenómenos sociales basados en datos estadísticos. Utilizando algunas de estas letras usted puede formar el nombre del más importante de ellos. Luego escríbalo a la derecha: W R L

H C

G

T

N

____________________

U A

5.

Subraye la palabra de la cual se deriva el término estadística. Establecer Estado Estudio Estadio Estándar

6.

A un estudiante de estadística se le ha pedido aparear los nombres de algunos personajes con sus aportes en Estadística, pero parece que no le ha ido muy bien. ¿Podría usted ayudarle haciendo los apareamientos correctos en las papeletas en blanco? PASCAL

GAUSS

ACHENWALD

Demostró el valor práctico de la curva normal

Estudió el Cálculo de Probabilidades

Fue el primero en utilizar el término Estadística

PASCAL

GAUSS

ACHENWALD

17


7.

Indicar si es verdadero o falso, corrigiendo el error. a.

La población ha de ser representativa de la muestra.

V

F

b.

Las medidas que describen una muestra se llaman parámetros.

V

F

c.

Muestra es un subconjunto de la población.

V

F

d.

La Estadística Descriptiva se ocupa de la recolección, ordenación y análisis de datos poblacionales.

V

F

La Estadística Inferencial obtiene inferencias acerca de poblaciones a partir de muestras.

V

F

e.

8.

La fábrica de bombones “BUEN SABOR”, proyecta lanzar al mercado un nuevo producto. Para ello realiza un test de aceptación entre niños de ambos sexos, de 6 a 12 años, pertenecientes a la concentración escolar “Divino Niño” del barrio “Las Orquídeas”. Para aplicar el test se tomó una muestra de 30 alumnos y para medir la aceptación del producto una escala de 1 a 10. Los puntajes obtenidos fueron los siguientes: 2, 1, 5, a. b. c. d.

9.

3, 4, 3,

8, 3, 2,

6, 1, 1,

4, 4, 3,

5, 6, 1.

8, 5,

10, 3,

10, 2,

6, 1,

3, 7,

2, 6,

¿Cuál es la población? ¿Cuál es la muestra? ¿Cuál es la variable? ¿Cuáles son las modalidades de la variable?

¿Qué utilidad tiene la estadística en Finanzas, Contabilidad, Educación, Biología, Sociología?

18


10. En la columna A aparece un listado de términos estadísticos. Colocar en los paréntesis de la columna B los números que correspondan a las definiciones:

A 1.

Variable

2.

Estadísticas

3.

Parámetros

4.

Estadístico

5.

Estadígrafos

6.

Estadísticas Secundarias

7.

Estadísticas Primarias

8.

Estadísticas Temporales

B (

)

Los datos se obtienen de publicaciones, las cuales pueden ser reproducciones parciales o totales.

(

)

Es la persona que trabaja en la elaboración o análisis de estadísticas.

(

)

Se refiere a un ordenamien to sistemático de datos pre sentados en forma de cuadros y gráficos.

(

)

Descripción numérica de una característica correspondiente a una muestra, es decir, medida que caracteriza a una muestra con fines descriptivos.

(

)

Son todas aquellas medidas que describen numéricamen te la característica de una población.

11. Ubicar en Estadística Descriptiva o Estadística Inferencial cada uno de los siguientes aspectos motivo de estudio estadístico. a.

Describir los grupos en términos de promedios de estatura.

19


_______________________________________ b.

Determinar la probabilidad de que muestras de observaciones sean sólo el resultado de variaciones de azar. _______________________________________

c.

Encontrar una diferencia entre dos métodos específicos de enseñanza. _______________________________________

d.

Determinar la vida media de lámparas producidas por determinada fábrica. _______________________________________

e.

Analizar la conducta de un grupo escolar frente a una prueba de lectura. _______________________________________

12. Completar las siguientes expresiones: a.

_________________ son ciertos rasgos, cualidades o propiedades que poseen los elementos de una población.

b.

_________________ son todas aquellas medidas numéricamente las características de una población.

c.

El estudio de la Biología por medio de la estadística se llama _______________________________________

d.

El estudio de la Sicología por medio de la estadística se llama _______________________________________

e.

_________________ los datos se obtienen de publicaciones, los cuales pueden ser reproducciones totales o parciales.

que

describen

20


f.

_________________ conjunto de todos los individuos que tienen en común alguna característica observable.

g.

_________________ se refiere a un ordenamiento sistemático de datos presentado en forma de cuadros y gráficos.

21


CAPÍTULO II LA INVESTIGACIÓN

OBJETIVOS −

Identificar las diferentes etapas que se siguen en un proceso de investigación estadística.

Distinguir las diferentes clases de investigación estadística.

Conocer las clases de muestras que se utilizan en el estudio de la estadística.

22


Investigar significa pagar la entrada por adelantado y entrar sin saber lo que se va a ver. J. Robert Oppenheimer 2.1. ¿QUÉ ES LA INVESTIGACIÓN? Lo que hoy denominamos investigación, se inicio en el momento en que el hombre se enfrento a problemas y, frente a ellos, comenzó a interrogarse sobre el por qué, cómo y para qué; es decir, cuando empezó a indagar sobre las cosas. Etimológicamente la palabra investigar proviene del latín in (en) y vestigari (hallar, inquirir, indagar, seguir vestigios). De ahí el uso más elemental del término en el sentido de “Averiguar o descubrir alguna cosa”. Aplicada al campo de la ciencia, la investigación es un procedimiento reflexivo, sistemático, controlado y critico que tiene por finalidad descubrir o interpretar los hechos y fenómenos, relaciones y leyes de un determinado ámbito de la realidad. Podemos decir que la investigación constituye una búsqueda de hechos, un camino para Conocer la realidad, un procedimiento para descubrir verdades parciales, o mejor, para descubrir no falsedades parciales. Como proceso comprende un conjunto de faces: la formulación y definición de problemas. La formulación de hipótesis, la recopilación, sistematización y elaboración de datos, la formulación de deducciones y proposiciones generales y, por último, el análisis de los resultados o conclusiones para determinar si se confirman o no la hipótesis formuladas y encajan dentro del marco teórico del que se partió. 2.2. CARACTERISTICAS DE LA INVESTIGACION Apoyándose en las consideraciones anteriores, enunciaremos algunas características principales de la investigación: - Ante todo, es una forma de plantear problemas y buscar soluciones mediante una indagación o búsqueda que tiene un interés teórico o una preocupación practica. - De una manera muy general, se llama también investigación a la adquisición de conocimientos acerca de un aspecto de la realidad (situación-problemas) con el fin de actuar sobre ella.

23


-

-

-

Es una exploración sistemática a partir de un marco teórico, en el encajan los problemas o las hipótesis como encuadre referencial. Requiere de una formulación precisa del problema que se quiere investigar y de un diseño metodológico en que se expresan los procedimientos para buscar la o las respuestas implicadas en la formulación del problema. Exige comprobación y verificación del hecho o fenómeno que se estudia mediante la confrontación empírica. Trascienden las situaciones o casos particulares para hacer inferencias de validez general. Utiliza una serie de instrumentos metodológicos que son relevantes para obtener y comprobar los datos considerados pertinentes a los objetivos de la investigación. La investigación se registra y expresa en un informe, documento o estudio. La tarea del investigador es: Tomar conocimientos del problema que otros pueden haber pasado por alto; insertarlos en un cuerpo de conocimiento e intentar resolverlos con el máximo de rigor y primariamente, para enriquecer nuestro conocimiento. Según eso, el investigador es un problematizador por excelencia. Mario Bunge.

Toda investigación debe reunir las siguientes características: claridad, sencillez y utilidad. 2.3. CLASES DE INVESTIGACION - Interna: investigar fenómenos originados dentro de la misma empresa o entidad. Requiere organizar la investigación de tal manera que permita la aplicación de métodos estadísticos, a fin de lograr las conclusiones validas deseadas. Ejemplo 1: investigar la mortalidad académica en un colegio x. -

Externa: se realiza con el fin de obtener la información necesaria, que no se da en la investigación interna que permita comparar fenómenos o entidades, establecer su posición relativa, estudiar su comportamiento actual o futuro.

24


Ejemplo2: realizar una investigación sobre la mortalidad académica en otros colegios y comparar los resultados con los del colegio x. - Exhaustiva: se denomina así a aquella investigación donde se observan todos los elementos que constituyen la población objetivo. Ejemplo3: un censo sobre la población de determinada región. -

Parcial: se realiza cuando no se desea o no es posible una investigación exhaustiva y sólo se observa una parte de los elementos o unidades que constituyen la población objetivo.

Ejemplo4: en una fábrica de gaseosas se pueden producir miles de unidades diarias, para investigar la calidad del producto, se seleccionan al azar unas cuantas unidades y del estudio que se les haga, se pueden obtener conclusiones sobre toda la producción. 2.4. INVESTIGACION ESTADISTICA Al iniciar una investigación estadística se debe tener en cuenta los siguientes pasos: A. Planteamiento. En esta fase debemos considerar: 1.

Formulación del problema.

A continuación indicaremos algunos aspectos y criterios que facilitan la tarea de encontrar una formulación adecuada. ¿Cuál es el problema? Este es un punto de partida: consiste en identificar el problema, planteándolo y delimitándolo. ¿Cuáles son los aspectos o elementos principales del problema? Se trata de expresarlo con claridad y precisión, mediante la descomposición dimensional del problema estableciendo sus constituyentes. ¿Qué se ha dicho sobre el problema? Estudiar la literatura sobre el tema o cuestiones conexas.

¿Cuáles son las relaciones entre los diferentes aspectos del problema?

25


Traducir la pregunta o preguntas con que se formula el problema, expresándolas en variables manipulables y susceptibles de investigación empírica. ¿Está suficientemente definido? Se trata de evitar el equívoco en el uso de los conceptos; hay que definir claramente el alcance que se da a los términos que definan el problema. 2. OBJETIVOS DE LA INVESTIGACIÓN Después de formulado el problema, deben determinarse los objetivos generales y específicos y, de ser posible una jerarquización de los mismos, teniendo en cuenta una serie de propósitos bien definidos como: -

3.

Informar acerca de lo que se ha dicho y de lo que se dice sobre el problema en cuestión. Proporcionar una orientación inicial que permita una mejor formulación y delimitación del problema. Evitar la búsqueda de datos e información ya obtenidos y no investigar lo que ya esta investigado.

DETRMINAR SI SE TRATA DE UN CENSO O DE UNA MUESTRA.

Se ha dicho que la población es el conjunto de todos los elementos observables, es decir, que poseen todos los atributos privativos según las restricciones del problema de investigación. Las poblaciones se pueden clasificar como finitas e infinitas según se finito e infinito el número de elementos que las integran. Cuando se hace un estudio de todos y cada uno de los elementos de una población finita, se dice que se está haciendo un CENSO. Pero si solo se observa parcialmente una población (finita o infinita) a esa parte de ella, es decir ese subconjunto de elementos observables se les da el nombre de muestra. El problema principal consiste en asegurar que el subconjunto sea representativo de la población, de manera que permita generalizar al universo los resultados obtenidos sobre la muestra. DEFINICION

26


TECNICA DE MUESTREO. Conjunto de operaciones que se realizan para elegir una muestra. a. Cualidades de una buena muestra Para que la muestra tenga validez técnico estadística, debe cumplir con los siguientes requisitos. - Ser representativa o reflejo general del conjunto o universo estudiado, reproduciendo lo más exactamente las características del mismo. - Que su tamaño sea estadísticamente proporcionado a la magnitud de la población. - Que el error muestral se mantenga dentro d los límites adoptados como permitidos. b. Leyes en que se basa el método de muestreo Salvo en el caso de muestras empíricas o no aleatorias, el método de muestreo se basa en ciertas leyes que le otorgan fundamentación científica. - Ley de la regularidad estadística. Según la cual un conjunto de n unidades, tomadas al azar de un conjunto N, es casi seguro que tiene las características del grupo más grande. - Ley de la inercia de los grandes números. Se refiere al hacho de que en la mayoría de los fenómenos cuando una parte varia en una dirección, es probable que una parte igual del mismo grupo varíe en dirección opuesta. - Ley de la permanencia de los números pequeños. Si una muestra suficientemente numerosa es representativa de la población, una segunda muestra de igual magnitud deberá ser semejante a la primera; y si en la primera muestra se encuentran pocos individuos con características raras, es de esperar encontrar igual proporción en la segunda muestra. c. Tipos de muestra Tomando en cuenta la estructura y los procedimientos de selección, se pueden distinguir dos tipos de muestras y dentro de cada uno de ellos diferentes clases. El primer tipo ¨ muestreo aleatorio o probabilístico¨ se basa en las leyes anteriores y es rigurosamente científico. El segundo procedimiento ¨ no aleatorio¨, a diferencia del anterior no tiene una Base estadístico-matemática y pude revestir dos formas: la de muestro intencional u opinatico y la de muestreo errático, circunstancial o sin norma. d. Muestra aleatorias, probabilísticas o al azar

27


Al decirse que la muestra se determina al ¨azar¨ se quiere expresar que cualquiera de los elementos que componen el conjunto tiene las mismas posibilidades de quedar incluidos en la muestra. Resulta evidente que en este procedimiento tiene mayores posibilidades de validez cuanto más homogéneo es el conjunto. Existen diversos procedimientos para el muestreo aleatorio o probabilístico, que da lugar a diferentes clases de muestras, las cuales vamos a describir a continuación.

-

Muestreo aleatorio simple. Constituye la base de todo maestreo probabilístico; consiste en que todos los elementos tienen una misma probabilidad de ser escogidos como parte de la muestra. Cada elemento que constituye la muestra puede haber sido seleccionado una sola vez, lo que generalmente ocurre, denominándose extracciones sin reposición; en otras ocasiones, cada elemento no se destruye; en estos casos se dice que en las extracciones son realizadas con reposición.

Este método es de gran importancia cuando la población no es grande o, siendo grande, se concentra en un área pequeña. También cuando la característica que se investiga presenta poca variabilidad o cuando la población facilita su enumeración para su selección. La elección de las unidades se puede hacer por sorteo o por tablas de números aleatorios ya establecidos. -

Método por sorteo. Consiste en colocar en un recipiente fichas con los nombres de todos los integrantes de la población que se van a estudiar y después y después de revolverlas bien, se extraerán tantas fichas como individuos se quieran obtener

Lo anterior lo podemos explicar de la siguiente forma: Supongamos que en un colegio x hay matriculados 500 estudiantes distribuidos en 10 cursos se quiere seleccionar una muestra aleatoria del 10% del total de la población, o sea 50 estudiantes, de cada grupo se escogen 5 alumnos al azar para ello introducimos en un recipiente 50 fichas que corresponden a los números de lista de cada alumno y se procede a extraer 5 fichas por curso. Mediante la siguiente ilustración grafica mostramos la forma como se selecciona la muestra

28


Sean: A1, A2, A3,…grupos del colegio x en cada uno de los grupos se hace los siguiente

Repitiendo este proceso en los 10 cursos obtenemos los 50 estudiantes que conforman la muestra Se comprende que si la población es muy numerosa este procedimiento resulta poco práctico y por consiguiente, debe darse preferencia a las tablas de números aleatorios

-

tablas de números aleatorios

Son tablas de números obtenidos por un procedimiento como el de la lotería, es decir por un procedimiento al azar. Para utilizar estas tablas se empieza por enumerar los individuos de la población de 1 en adelante y luego se extraerán tantos números como elementos vayan a incluirse en la muestra. La tabla puede empezarse a leer en cualquier parte, pero debe escogerse al azar la columna y fila del comienzo. Considérese que tenemos 500 estudiantes y se desea seleccionar una muesaleatoria de 50 estudiantes.

29


Para este problema se puede emplear la tabla de números aleatorios que aparecen en la página siguiente. Se empieza de arriba hacia abajo, tomando 3 dígitos a la vez (porque 500 es un numero de 3 dígitos); el primer número que se ve es 139. Por esto se selecciona al estudiante que ocupa el lugar 139. El numero siguiente es 820 como es mayor de 500 se salta al siguiente numero (lo mismo se hace si el numero aparece 2 veces) el siguiente número es 220, se selecciona el estudiante que ocupe el lugar 220 y así sucesivamente hasta completar los 50 estudiantes. -

Muestreo aleatorio estratificado. Denominado también muestreo aleatorio restringido con el fin de mejorar la representatividad de la muestra, cuando la población es heterogénea y presenta una gran variabilidad, se procede a agrupar

¨TABLA DE NUMEROS ALEATORIOS¨ COLUMNAS FILAS 1–5

6 – 10

11 – 15

16 – 20

21 – 25

26 - 30

30


1

13913

86044

48923

33656

55247

89000

2

82061

53586

33404

16313

26743

67229

3

22080

88670

23660

81626

69735

83888

4

21556

23754

71329

12254

12727

54600

5

33653

58837

40291

77567

55718

17204

6

45750

93921

92530

60224

98710

33863

7

51799

61463

93735

42881

70206

22192

8

57848

29005

78216

81940

41702

50521

9

69945

64ยบ89

47178

90851

84694

67179

10

75993

31631

31660

90851

59190

25509

11

88091

66714

62200

56165

99181

43167

12

18800

17980

69584

21478

42173

58825

13

18334

44240

23028

69449

56661

33813

14

36480

70490

76472

17419

71149

88000

15

24071

37211

95360

50237

37140

19034

16

36169

72294

78499

15551

46706

35693

17

14801

50339

76754

90089

76153

93972

18

87384

60841

90539

81971

34103

93922

19

62879

55919

54631

49475

23677

87498

20

29414

98879

83924

58700

10132

29119

21

14095

44465

66661

15895

11075

45728

22

83540

72001

46282

74200

29152

80974

23

56124

82504

60057

92624

87103

80924

24

34756

60548

58313

67162

16550

39204

25

42020

88084

37934

52010

34627

74450

26

76785

98586

51708

43891

92578

74400

27

49369

90880

65483

35773

50529

74351

28

18814

36624

45104

20621

68607

95970

29

97447

14668

43359

95159

98053

67876

30

70030

25171

57134

87040

56004

67827

31


32


(En estratos, categorías o clases) las unidades de muestreo homogéneas entre si. Dentro de cada uno de los estratos se hará luego una selección al azar (aleatoria simple) El plan de subdivisión del conjunto, llamado ¨plan de representación¨ se efectúa conforme al objetivo de la investigación y sobre la base del conocimiento estadístico del universo. El reparto de la muestra en cada estrato, que se denomina ¨afijación¨, puede realizarse de tres maneras: - Que cada estrato tenga una muestra de igual tamaño (afijación uniforme). - Que la muestra sea proporcional al número de elementos de cada estrato (afijación proporcional). - Que el tamaño de la muestra sea óptimo, dependiendo del grado de variabilidad de cada estrato y del costo. Ejemplo 5: el estudio sobre la aceptación de un artículo en determinada ciudad. En este caso podemos dividir la población en estratos (barrios de la ciudad) y obtener una muestra de igual tamaño en cada barrio, para después seleccionar los elementos que conformen la muestra representativa de la población. - Muestro sistemático. Es utilizado por algunos contadores para revisar cuentas. Consiste en determinar un intervalo igual al valor obtenido al dividir el tamaño de la población por el de la muestra. Luego se toma aleatoriamente una observación, a la que se le suma el tamaño del intervalo para encontrar una nueva observación y así sucesivamente. Ejemplo 6: entre 01 y 15 se selecciono la observación 4 y como la longitud del intervalo es 15, la segunda observación será 19, luego la 34, y así sucesivamente. - Muestreo no probabilístico. la nota característica de estas muestras consiste en que no se basan en una teoría matemática estadística sino que dependen del juicio del investigador. En relación con las muestras aleatorias, este método posee ventajas en lo que se refiere a costos y a tiempo, pero es más difícil controlar la validez de los resultados. Se dan dos modalidades diferentes en las muestras no aleatorias: el muestreo intencional u opinatico y el muestreo errático, circunstancial y sin norma. -

Muestreo intencional u opinatico.

33


La persona selecciona la muestra procurando que sea representativa, pero haciéndolo de acuerdo a su intención u opinión. - Muestreo errático. En un muestreo de este tipo, llamado también circunstancial y sin norma, simplemente se toman los casos que se tienen a mano o que se seleccionan arbitrariamente. Ejemplo 7: en el estudio de una comunidad en el cual se quieren averiguar las necesidades sentidas por la población, una muestra de este tipo seria aquella que se obtiene recogiendo información de las personas que vienen a mano sin plan alguno. 4. UNIDAD A INVESTIGAR. La unidad es la fuente de información, es decir a quien va dirigida la investigación lo cual puede ser una persona, una familia, una vivienda, un establecimiento educativo, comercial, industrial o de servicio público, y su selección depende del objeto de la investigación. La unidad puede ser simple (constituida por un individuo) o colectiva (constituida por un grupo, una familia, un pueblo, etc.). La unidad debe ser clara, en tal forma que sea entendida por todos; además, adecuada al tipo de investigación; mensurable, que permita ser medida, y comparable con los resultados obtenidos en investigaciones similares. Ejemplo 8: si tomamos como base de una investigación un centro educativo, la unidad de investigación puede ser: cada uno de los alumnos (unidad simple) o cada grupo (unidad colectiva). 5. VARIABLES. Se trata de una característica observable o un aspecto discernible en un objeto de estudio que puede adoptar diferentes valores o expresarse en diferentes categorías. En el caso particular en que la variable solo pueda tomar un valor y solo uno, entonces se dice que es una constante. Ejemplo 9: la edad de los invitados a una fiesta, los goles anotados por un equipo de futbol, peso de los alumnos, etc. - Clasificación de variables. Según el modo como se presentan estas características o propiedades, las variables se pueden clasificar de esta forma: - Cualitativas o cuantitativas. Continuas o discretas. - Dependientes e independientes.

34


-

Variables cualitativas: reciben este nombre aquellas variables cuyos elementos de variación tienen un carácter cualitativo no susceptible de medición numérica, por ejemplo el sexo, profesión, afiliación política, etc.

-

Variables cuantitativas: son aquellas en que las características pueden presentarse en diversos grados y tienen un carácter numérico.

Ejemplo 11: tasas de natalidad, estatura de los alumnos, notas, etc. -

Variables discretas: llamadas también discontinuas, son las que no pueden tomar valores intermedios entre otros dos valores dados, o sea que siempre se representan con números enteros.

Ejemplo 12: el número de hijos de una familia, número de aulas de un colegio, número de personas de un país, etc. Un análisis más profundo de las variables cuantitativas nos lleva a clasificarlas como independientes y dependientes. Una variable es independiente cuando sus valores no dependen de ninguna otra y por lo regula r a cada uno le corresponde uno o varios valores de otra variable la cual a su vez recibe el nombre de variable dependiente por depender de otra u otras. Ejemplo 13: el número de alumnos de un colegio depende de la capacidad de la planta física, en este caso la variable independiente es la planta física ya que no depende de ninguna otra variable. Sin embargo el número de alumnos si depende de la capacidad de la planta física del colegio. 6. ELABORACION DE LA ENCUESTA. Para el desarrollo de la encuesta se debe elaborar previamente un cuestionario que tenga las siguientes características: (ver anexo). a)

Incluir únicamente las preguntas indispensables, ya que el exceso de interrogantes dificulta el proceso de tabulación.

b) Las preguntas deben ser claras, concisas y comprensibles para quien las hace y para quien las responda.

35


c)

Las preguntas deben ordenarse, comenzando con las fáciles y terminando con las difíciles.

d) No se deben emplear abreviaturas. e) Se debe suprimir las preguntas que, de antemano, se consideran no van a ser contestadas. Preguntas indiscretas que molesten al investigado. f)

Las preguntas deben ser cortas para que faciliten su retención.

g)

Deben formularse preguntas cuyas respuestas se limiten a un numero o a una afirmación (si) o una negación (no).

Por lo general un cuestionario se compone de tres partes: -

Encabezamiento. Incluye: nombre o titulo de la investigación, en tal forma, que resuelva los interrogantes: ¿Qué?, ¿Cuándo? Y ¿Dónde?; el nombre de la entidad responsable de la investigación y el código del formulario.

-

Instrucciones. Son las normas o pautas que se le plantean al encuestado para que corresponda las preguntas formuladas.

-

Cuerpo. Contiene las preguntas. En algunos formularios, cuando se quiere identificar al informante, se comienza con preguntas generales, tales como nombre, dirección, estado civil, edad, profesión, etc. Luego se sigue con las preguntas necesarias para alcanzar el objetivo propuesto, que pueden ser de diversas clases a saber:

-

Preguntas introductivas: son aquellas que tienen por finalidad atraer la atención del interrogado, disponiéndolo favorablemente hacia la entrevista personal. Es conveniente partir de lo general a lo particular.

Ejemplo 14: ¿hubo mejoría en el rendimiento académico con relación al año anterior? SI NO -

preguntas abiertas: Son aquellas denominadas de opinión o de respuesta libre. Por la variedad de respuestas obtenidas su tabulación se hace difícil.

Ejemplo 15: ¿Qué opina usted de la educación a distancia?

36


-

Pregunta cerradas: las respuestas son limitadas. Cuando la pregunta tiene dos alternativas se denomina dicotómica. Si tiene más de dos alternativas se llama de selección múltiple.

Ejemplo 16: en su concepto, el rendimiento académico del colegio X es: Excelente -

Bueno

Regular

Deficiente.

preguntas de control: se hacen con el fin de controlar la veracidad de la información. Dos preguntas que persiguen el mismo dato, pero que están redactadas en distinta forma situadas en diferentes partes del cuestionario podrán servir para comprobar la veracidad de las respuestas suministradas por los entrevistados. Son llamadas también preguntas testigo.

Ejemplo 17: ¿tiene usted documento de identificación? SI

NO

¿Podría anotar el número? -

Preguntas filtro: tiene como finalidad indicar cuándo se debe suspender la entrevista o si por el contrario se quiere pasar a otro grupo de pregunta.

Ejemplo 18: ¿es usted cristiano? -

SI

NO

Pregunta batería: constituye una serie de preguntas encadenadas, que se complementan entre sí, con el fin de profundizar en un determinado tema. Esta serie de preguntas deben ir precedidas de una pregunta filtro, que determinará o no formularlas.

Ejemplo 19: en el caso en que se responda afirmativamente la pregunta anterior, se puede formular una serie de preguntas ¨dispuestas en batería¨ para conocer más fondo la situación. De las siguientes religiones cual profesa usted? A. Católica B.

Presbiteriano

C.

Adventista

37


D. Ortodoxa E.

Otra

NOTA: antes de proceder a la adopción definitiva del modelo que se haya elaborado, se debe verificar su validez y eficacia por medio de una pequeña encuesta de carácter piloto para saber que modificaciones se hacen. -

Conviene que la encuesta no se realice:

Durante periodos habituales de vacaciones.

En proximidad anterior o posterior a las festividades de tipo religioso.

Épocas de exceso de calor o de lluvia.

Durante un mes que haya acumulación de días festivos.

Entre otros procedimientos que pueden utilizarse para recolectar información están: -

Observación directa: el investigador puede observar y recoger datos mediante su propia observación. en esta clase de observación no se requiere cuestionario ya que no hay respuestas de los entrevistados.

Ejemplo 20: el estudio que el docente hace del comportamiento de sus alumnos (nota apreciativa). -

Observación indirecta: se presenta cuando el investigador corrobora los datos que a tomado de otros, ya sea de testimonios orales o escritos de personas que han tenido contacto de primera mano con la fuente que proporciona los datos.

Ejemplo 21: la opinión de otros profesores con respecto al comportamiento de un determinado alumno, que sirve como base para emitir un juicio.

7. ELABORACION DEL PRESUPUESTO.

38


Cuando alguien va a presentar un proyecto de investigación a una institución, una de las mejores recomendaciones consistirá en presentar un modelo económico realista y bien estructurado de los costos de la investigación. En la elaboración del presupuesto deben tenerse en cuenta las diferentes etapas de la investigación. Los siguientes son los puntos básicos que hay que analizar al elaborar el presupuesto. a.

Organización.

1.

Estudios preliminares

2.

Propaganda

3.

Impresión de los formularios

4.

Papelería

5.

Capacitación del personal

6.

Servicios auxiliares

7.

Uso de maquinas, equipos, etc.

8.

Locales

9.

Varios

10. Asesorías 11. Imprevistos b. Trabajos de campo. 1.

Viáticos

2.

Recolección de datos

3.

Transporte

c.

Tabulación

d. Publicación

39


NOTA: en general en cualquier investigación los imprevistos pueden calcularse hasta un 10% del costo general. 8.

SELECCIÓN Y PREPARACION DEL PERSONAL.

En las diferentes etapas de la investigación se requerirá personal calificado y perfectamente adiestrado en la tarea que se le encomienda y su consecución dependerá de los recursos financieros disponibles. En algunas ocasiones se recurre a personal que no tiene ninguna experiencia, requiriéndose su capacitación. Para esta selección se tiene en cuenta los siguientes criterios: números de personas acorde al número de formularios o unidades a entrevistar; conocimiento que tenga del interrogatorio y del objetivo de la investigación; cualidades morales que le impidan falsear las respuestas; cualidades de sociabilidad y cortesía; presentación personal correcta y sencilla. El adiestramiento del personal se realiza mediante cursos o seminarios más o menos breves. 9.

CRONOGRAMA DE TRABAJO.

Se trata de un ordenamiento de las diferentes etapas involucradas en la investigación con las correspondientes fechas de iniciación y terminación, con el fin de contratar cada fase, procurando que se cumpla dentro del tiempo establecido. También es una forma de determinar el tiempo de la investigación. Ejemplo22: tablas expuestas a continuación nos dan una idea de la forma como se debe diseñar un cronograma de trabajo.

40


ETAPAS

FECHAS INICIAL

FINAL

16-I-89

21-I-89

23-I-89

4-II-89

3.preparacion del personal

6-II-89

11-II-89

4.pre-Encuesta

13-II-89

25-II-89

5.recoleccion

6-III-89

18-III-89

6.tabulacion

27-III-89

22-IV-89

7.publicacion

2-V-89

13-V-89

1.estudios preliminares

2.Preparacion del cuestionario

ETAPAS

MESES Ene.

Feb.

Mar.

Abr.

May.

1.estudios preliminares 2.preparacion del cuestionario 3.preparacion del personal 4.pre-Encuesta

5.recoleccion 6.tabulacion 7.publicacion

41


B. RECOLECCION Esta etapa a menudo olvidada, tiene para el investigador mucha más importancia que cualquier otra. La recolección de la información tiene que ser vigilada constantemente por el propio investigador y realizada conforme a los planes previamente trazados. Como ya se ha advertido, solo si la investigación ha sido recogida de manera correcta, podrían tener validez las conclusiones que de ella deriven. En el caso contrario, no se justifica siquiera el empleo de la estadística, ya que ninguna técnica podrá corregir los errores presentes en los datos básicos recogidos. La decisión sobre los datos que van a recogerse y sobre la precisión con que deben ser obtenidos dependen primordialmente del propósito de la investigación y del material estudiado, siendo conveniente limitarse a recoger tan solo aquella

42


investigación que va ha ser utilizada pues el deseo de investigar muchos datos, en la esperanza de que algún día será de utilidad, conspira contra la correcta obtención de aquellos que son realmente esenciales. En esta etapa, se precede a distribuir y a recoger los formularios, controlando el número de encuestas entregadas y recogidas, al mismo tiempo verificando la calidad de la información recogida. C. PROCESAMIENTO Y ANALISIS Cuando el trabajo de campo, que consiste fundamentalmente en la recopilación de los datos, se termina, hay que volver otra vez al trabajo de escritorio. El conjunto de datos disponibles es de poca utilidad si no se procede a la elaboración de los mismos de acuerdo a los objetivos de la investigación. Para realizar esta tarea debemos conocer cuestiones fundamentales como: 1. Codificación 2. Tabulación 3. Análisis e interpretación 4. Publicación 1. Codificación. Esta es una operación que se realiza previa a la tabulación, pero en función de esta. Consiste en asignar un número correlativo a cada una de las categorías que comprende el cuestionario o documento de observación. En otras palabras se trata de que cada respuesta del cuestionario sea traducida y representada por indicaciones numéricas (códigos) que facilitan la tabulación. De lo dicho resulta claro que la finalidad de la codificación es la de facilitar la agrupación de datos hechos o respuestas. Existen dos formas principales de codificación: una para la tabulación manual y otra para la tabulación mecánica o electrónica. Cuando se trata de preguntas abiertas, el plan de codificación presenta, ciertas complicaciones, puesto que las opiniones, supuestos teóricos o hipótesis del codificador, a nivel inconsciente, pueden determinar la categorización de las respuestas.

43


Ejemplo 23: los establecimientos educativos por departamentos: Antioquia

01,

Bolívar

02,

Boyacá

03,

Caldas

04.

2. Tabulación. Puede ser manual o electrónica, dependiendo de la cantidad de formularios, del número de preguntas que tenga el formulario, del tiempo y de los recursos disponibles. -

Tabulación manual. Es el procedimiento más antiguo podríamos decir que es un trabajo artesanal, laborioso y lento, consiste en trazar un signo convencional por cada caso comprendido en la serie que se recuenta. La tabulación manual se realiza mediante la elaboración de cuadros, graficas y esquemas, que faciliten el análisis de la información y la inferencia de conclusiones y recomendaciones.

Ejemplo 24: los siguientes datos correspondientes a las edades de los once alumnos de grado segundo de básica primaria de la escuela A. 6,

7,

6,

8,

7,

6,

6,

8,

7,

7,

6.

Elaboramos un cuadro utilizando la tabulación manual:

Edad (años)

Numero de datos

Total

6

5

7

4

8

2

44


-

Tabulación electrónica. Las operaciones de recuento mediante el procedimiento manual resultan demasiado lentas y de escaso rendimiento. Por eso, en todo problema estadístico de cierta magnitud, se utilizan equipos electrónicos que realizan recuentos con rapidez, eficiencia y precisión.

3. Análisis e interpretación. Esta etapa se considera como la más importante que tiene el informe, ya que el análisis de los datos tendrá que ver con la formulación del objetivo general de la investigación y de las hipótesis establecidas. A menudo el conjunto de datos clasificados constituyen un volumen considerable de la información muy difícil de comparar; la labor estadística consiste en interpretar los datos, mediante procedimientos de síntesis que resumen y simplifican los datos en una expresión única, según valores y atributos iguales, la cual permite el conocimiento eficaz t rápido de un universo estadístico. En este proceso se debe considerar la elaboración de distribuciones o tablas de frecuencia, obtenidas a través de una sistematización para poder ser presentada en forma de cuadros y graficas.

Los principales procedimientos para la interpretación de datos son los siguientes: •

Determinación de parámetros de posición media, mediana, moda.

Determinación de parámetros o medidas de dispersión

Desviación media, desviación estándar, desviación semi intercuartil.

4. Publicación. Comprende la fase final de la investigación, y con ella se propone hacer llegar a las personas interesadas el resultado total del estudio teniendo en cuenta todos los aspectos considerados en el proceso, en tal forma que los datos sean comprensibles, con la correspondiente validez que merezcan las conclusiones.

45


EJERCICIOS 1.

Decir si son verdaderas o falsas las siguientes afirmaciones. a.

La unidad de investigación es la fuente donde se recolecta la información.

b.

En el muestreo aleatorio, algunos elementos tienen la posibilidad de pertenecer a la muestra.

c.

El objeto de la investigación es el hecho o fenómeno que se desea estudiar.

d.

En el muestreo estratificado se determina un intervalo igual al valor obtenido de dividir el tamaño de la población por el de la muestra.

e.

En el muestreo no probabilístico las muestras se seleccionan en forma aleatoria.

2.

Completar las siguientes expresiones: a.

el formulario elaborado para la toma de datos, en una investigación tiene tres partes:__________________________________________________

_________________________________________________________ b.

En una investigación estadística se siguen fundamentalmente tres etapas:______________________________________________________ __________________________________

c.

En la etapa procesamiento y análisis se deben tener en cuenta cuatro pasos :_______________________________________________________

d.

Enumerar tres características que se deben tener en cuenta al elaborar una encuesta:________________________________________________

3.

Dar dos ejemplos de investigación interna, externa, exhaustiva y parcial.

4.

A la izquierda de cada una de las siguientes variables hay un espacio en blanco. Usted deberá colocar una C si la variable es continua o una D si es discreta.

a._________ numero de pares de zapatos expuestos en una vitrina.

46


b._________ litros de leche contenidos en una caneca. c._________ edad de los animales de un zoológico. d._________ valor de la carne en un supermercado. e._________ soldados participantes en una batalla.

5.

Dar dos ejemplos de preguntas:

a.

Introductivas

b.

Abiertas

c. Cerradas d.

Preguntas de control

e.

Filtro

f.

En batería

6.

Relacionar los siguientes conceptos con los de población y muestra.

a.

Profesores del departamento del Quindío. __________________________

b.

Número de alumnos que han superado las pruebas de un curso de nivelación.___________________________________________________

c.

Algunos de los integrantes del equipo de futbol de Colombia.____________

d.

Grupo de alumnos seleccionados por su buen rendimiento académico._________________________________________________

7.

Dar un ejemplo de un problema que sea objeto de la investigación estadística y siga cada uno de los siguiente pasos: a.

Objetivos

b.

Determinar si se trata de un canso o de una muestra.

47


c.

Seleccionar la clase de muestra a emplear

d.

Clase de unidad de investigación.

e.

Variable que se investiga.

f.

Elaborar la encuesta.

g.

Diseñar el presupuesto.

h.

Elaborar un cronograma.

8.

Empleando la tabla de números aleatorios, extraer la muestra del 30% del total de los alumnos de la clase.

9.

La tabla siguiente nos muestra las estaturas de los 80 estudiantes de una escuela X. utilizando la tabla de números aleatorios seleccionar una muestra de 20 estudiantes.

130

125

123

132

145

120

128

116

142

133

115

116

142

156

132

126

126

119

132

136

116

143

140

150

162

125

129

123

126

129

119

132

145

146

148

152

132

136

135

134

123

138

139

142

132

131

129

127

126

145

126

118

125

123

124

129

136

145

147

162

140

123

117

132

156

129

138

142

145

148

142

142

145

148

152

153

156

154

162

128

48


CAPITULO III TABLAS ESTADISTICAS

OBJETIVOS

49


-

Elaborar tablas de frecuencia a partir de datos observados para una variable determinada.

-

Interpretar los resultados presentados en forma tabular.

-

Desarrollar destrezas acumuladas.

para

calcular

frecuencias

relativas

frecuencias

3.1. ELABORACION DE TABLAS O CUADROS Cuando un investigador quiere presentar la información de tal forma que pueda llamar la atención sobre determinadas cifras o comparaciones entre los datos, elaborar un cuadro. En los cuadros hay muchos datos, a veces todos los de una investigación, pero se presentan de tal forma que se ven ordenados y se pueden comparar unos con otros. Para elaborar los cuadros, se debe, ante todo, identificar los caracteres o características que se investigaron, lo cual permite una mejor clasificación de lo observado.

Ejemplo 1: la identificación política de un grupo de personas es una característica cualitativa y la podemos tabular de la siguiente forma.

Partidos

Cantidad

50


Liberal

12

Conserva.

20

Comunista

15

TOTAL

47

Ejemplo 2: las edades de un grupo de personas es una característica cuantitativa y se puede tabular así:

Edad años

N° de personas

8

3

10

4

13

7

15

12

TOTAL

26

3.2. TECNICA EMPLEADA EN LA ELABORACION DE UN CUADRO A pesar de que no se tienen reglas fijas para la elaboración de cuadros, se pueden aplicar algunas de las recomendaciones que en forma muy general, se han hecho y como tales han sido aceptadas. 1. El cuadro debe ser lo más sencillo posible. 2. Cuando se elaboran dos o más cuadros, estos deben ser numerados, de la siguiente forma: cuadro N° 1, cuadro N° 2, etc.

51


3. Todo cuadro debe tener un titulo, que responda a los interrogantes: Que, como, donde, cuando. 4. El titulo debe separarse un poco del cuadro, dejando por lo menos dos espacios de intermedio. 5. El encabezamiento de un cuadro contiene los títulos y subtítulos de las columnas. Los títulos deben ser colocados en mayúscula y los subtítulos en minúsculas. En el encabezamiento del cuadro se puede colocar una columna para totales que pueden estar ubicados al principio o final. También los totales pueden ubicarse en la parte inferior del cuadro, pero dentro del mismo. 6. El cuerpo corresponde a la parte numérica, información o contenido. Se debe tener cuidado con el contenido del cuadro, ya que si no se conoce la información o cantidad, el espacio correspondiente no se debe dejar en blanco ni colocar ceros y en ese lugar colocar guiones. 7. El cuadro se cerrara por encima y por debajo con líneas más fuertes que las utilizadas en el interior del cuadro. 8. Deberán especificarse las unidades de medida utilizadas para la descripción de las características. 9. Pie o fuente. Será utilizado un espacio debajo del cuadro, para dar referencia al origen de los datos, es decir, de donde fueron tomados. Además, para dar explicaciones sobre las abreviaturas, símbolos o códigos utilizados; también servirá dicho espacio para indicar si el cuadro fue tomado de otra publicación, haciendo claridad sobre la fuente, autor, pagina, etc. Ejemplo 3: (ver cuadro en la página siguiente)

3.3. CUADROS ESTADISTICOS Los cuadros pueden ser de tres tipos: 1. Generales o de referencia. Se concentran todos o casi todos los datos de una investigación.

52


Ejemplo 3: Cuadro N° TITULO (que, como, cuando, donde)

ENCABEZAMIENTO (titulo en mayúscula)

Titulo en mayúscula Sub-titulo en minúscula Sub-total

Cuerpo (letras en mayúscula o minúscula)

TOTALES

2.

De resumen. Se obtienen de los cuadros generales. Permiten una comprensión más rápida y global de la información que se quiere presentar.

Ejemplo 4: los cuadros que se presentan a continuación, nos muestran lo que es un cuadro general y un cuadro de resumen.

53


NUMERO DE ALUMNOS POR CADA NIVEL EN CENTROS DOCENTES DE ARMENIA 1.988

CENTRO DOCENTE

PRE ESCOLAR

PRIMARIA

SECUNDARIA

TOTAL

A

15

50

320

385

B

23

30

180

233

C

30

40

150

220

D

35

32

700

767

E

40

25

600

665

NUMERO DE ALUMNOS POR CENTRO DECENTE DE ARMENIA 1988

CENTRO DOCENTE

NUMERO ALUMNOS

A

385

B

233

C

220

D

767

E

665

54


3.

Cuadro de frecuencia. Tiene como finalidad presentar en forma ordenada los valores que toman las diferentes características, en tal forma que permitan al lector tener una visión de conjunto, ya sea aclarando el texto del informe o complementándolo. Veamos cómo se elabora un cuadro de frecuencia tanto para datos agrupados en intervalos y datos no agrupados en intervalos. En lo sucesivo para simplificar un poco hablaremos de datos agrupados y de datos no agrupados. A continuación presentamos la simbología que se emplea en la elaboración de estos cuadros. N: tamaño de la población n: tamaño de la muestra f: frecuencia absoluta. Número de veces que se repite cada valor de la variable F: frecuencia absoluta acumulada. Sumas de las frecuencias absolutas anteriores a una clase determinada h: frecuencia relativa. Se obtiene dividiendo cada frecuencia absoluta por el tamaño de la muestra o de la población. H: frecuencia relativa acumulada. Suma de las frecuencias relativas anteriores a una clase determinada. m: numero de intervalos. Xi: marcas de clase o puntos medios de cada intervalo. Se obtiene promediando los dos límites de cada clase. C: amplitud de clase L.R.S. limite real superior de clase o frontera superior

55


L.R.I. limite real inferior de clase o frontera inferior Tablas de frecuencia: la elaboración de un cuadro de frecuencias lo explicaremos mediante ejemplos. -Datos no agrupados: cuando el numero de datos es menor que 25, para su tabulación se construye una tabla de varias columnas donde: . En la primera columna se ubica los valores de la variable en forma ordenada. . En las siguientes columnas se colocan la frecuencia absoluta, frecuencia relativa, frecuencia absoluta acumulada, frecuencia relativa acumulada respectivamente. Ejemplo 5: El número de hijos de doce familias del barrio M en la Ciudad X 4,5,2,3,4,3,5,4,6,4,5,4, La distribución de frecuencia para estos datos es la siguiente: NUMERO DE HIJOS DED 12 FAMILIAS BARRIO M CIUDAD X Xi Nª de hijos

Fi

hi

FI

HI

2

1

0.083

1

0.083

3

2

0.167

3

0.25

4

5

0.417

8

0.667

5

3

0.25

11

0.917

6

1

0.083

12

1.0

total

12

1.0

--

--

Obsérvese que la ultima frecuencia absoluta acumulada es igual al total de datos 12 y que la ultima frecuencia relativa acumulada es igual a uno.

56


_ Datos agrupados: cuando el número de datos es mayor que 25, se suele agrupar los datos en intervalos o clase cuyo número varía entre cinco y quince. El siguiente ejemplo nos muestra los pasos a seguir para la tabulacion de datos agrupados. Ejercicio 1: los datos expuestos a continuación corresponden a los pesos (kilos) de 40 adultos de un centro docente nocturno X de la ciudad A. 60

64

70

71

65

74

63

72

68

67

73

75

67

76

71

74

74

73

75

75

68

78

75

76

86

75

88

77

72

78

83

77

87

82

89

80

74

80

85

84

Elabora una tabla de frecuencia para los datos anteriores. Solución 1. Se ordenan los datos

2.

60

63

64

65

67

67

68

68

70

71

71

72

72

73

73

74

74

74

74

75

75

75

75

75

76

76

77

77

78

78

80

80

82

83

84

85

86

87

88

89

calculemos el rango (R)

Rango = dato mayor – dato menor R= 89- 60=29

57


3.

Determinamos el numero de intervalos de clase (m) una de las formas de obtener m es aplicando la regla de sturges, con la cual se obtiene una aproximaci贸n aceptable sobre el numero de intervalos necesarios para agruparlos. Tener en cuenta que 5< m <15.

m= 1+ 3.3 Log n (regla de sturges) m= 1+ 3.3 Log 40 m= 1+3.3 (1.60206) m=6.28 Tomamos m=6 4. c=

Hallamos la amplitud del intervalo de clase (c)

R 29 = 4.83 m 6

se puede tomar c =5 5.

Construcci贸n de la tabla de frecuencia

PESOS DE 40 ALUMNOS. CENTRO DOCENTE NOCTURNO X DE LA CIUDAD A fecha: 10-12-88

58


Clases

fi

Hi

FI

HI

Marcas de clase Xi

Fronteras o limites reales

Peso (Kilos) 60-64

3

0.075

3

0.O75

62

59.5-64.5

65-69

5

0.125

8

0.2

67

64.5-69.5

70-74

11

0.275

19

0.475

72

69.5-74.5

75-79

11

0.275

30

0.75

77

74.5-79.5

80-84

5

0.125

35

0.875

82

79.4-84.5

85-89

5

0.125

40

1.0

87

84.5-89.5

TOTAL

40

1.0

--

--

--

--

Observe que: 1. Cada clase contiene 5 datos que corresponden a la amplitud de clase. Por ejemplo, la clase 60-64 contiene los siguientes valores: 60,61.652.63.64. 2. La frecuencia absoluta (fi) corresponde al nĂşmero de datos incluidos en cada clase. Por ejemplo: La clase 65-69 contiene 5 datos: 65.67.67.68.68. 3. La frecuencia relativa (hi). Es el valor que se obtiene al dividir cada frecuencia absoluta entre el total de datos.

59


Ejemplo 6:

h= 1

3 =0.75 las frecuencias relativas se puede expresar en 40

porcentaje multiplicando la proporción por 100,

4.

h =0.75 × 100=7..5% 1

frecuencia absoluta acumulada (Fi). Se obtiene de la siguiente manera:

F f 1

f

=

F

1

2

=

f

1

f

2

F

3

+

F

3

=

f

1

+

f

2

+

3.....

F

3=3,

2

=3+5=8,

= 3+5+11=19

5. Frecuencia relativa acumulada (Hi). Aquí:

H h 1

=

1

H h h

,

2

=

1

+

2

H h h 3

=

1

+

2

+

h

3,......

0.075=0.075,

H

3

H

2

= 0.075+ 0.125=0.2,

= 0.075+0.125+0.275=0.475

Al finalizar este proceso se debe tener en cuenta que la frecuencia relativa acumulada correspondiente a la última clase sea 1.0; en caso contrario se procede a hacer aproximaciones en las frecuencias relativas (hi). 6.

Las marcas de clase o puntos medios del intervalo se calculan por la semisuma de los extremos de cada clase. Por ejemplo:

60


X 7.

1

=

60 + 64 = 62 2

X

2

=

65 + 69 = 67,... 2

Las fronteras o límites reales. El limite real superior de cada clase se obtiene mediante mediante la semisuma del limite inferior de una clase con el limite superior de la siguiente: Por ejemplo:

60 +69 =64.5, 2

L.R.S

1

=

L.R.S

2

=

65 +74 =69.5,... 2

Los límites reales inferiores se hallan restándoles el límite real superior la amplitud de clase, en nuestro caso:

L.R.I

1

= 64.5 – 5=59.5,

L.R.I

2

= 69.5 – 5 = 64.5……

Ejercicios 1.

En una prueba de matemáticas realizada a un grupo de estudiantes de 8ª de un colegio A, se registraron las siguientes notas:

10,

1,

5,

6,

8,

9,

10,

2,

5,

4,

9,

10, 2, 10, 10, 8,

6,

3,

10, 9,

Elabora una tabla de frecuencia (datos no agrupados) 2.

La siguiente información es la referente a la estatura de 50 estudiantes de la escuela A (estatura en cm)

138 164 150 132 144 125 149 157 130 127 146 158 140 147 136 148 152 144 132 138 168 126 138 170 163 119 154 165 140 160 146 173 142 146 135 153 140 135 145 129 161 145 135 142 150 156 145 128 123 155

61


a. b.

Organizar una distribución de frecuencia para datos agrupados Interpretar,

f

2,

f H 4, X 5, h3, 5,

c.

Calcular el porcentaje de alumnos con estatura superior a 150 cms.

d.

Calcular el porcentaje de alumnos que tienen estatura inferior a 142 cms

3. Los salarios de 40 empleados de una empresa Q son presentados en la siguiente tabla: Salario miles de $

Frecuencia

30-39

15

40-49

12

50-59

4

60-69

3

70-79

6

TOTAL

40

a.

¿Cuantos intervalos de clase diferentes hay?

b.

¿Cual es la amplitud de cada intervalo de clase?

c.

¿Cuales son los límites reales del cuarto intervalo de clase?

d.

¿Qué porcentaje de empleados gana más de $49.000 y menos de $70.000?

e.

¿Qué porcentaje de empleados gana menos de $ 60.000?

62


4. Contestar verdadero o falso según el caso a. La suma de las frecuencias absolutas es igual a 1

V F

b. El cuerpo de un cuadro corresponde a la parte: información o contenidos V F

numérica,

c. cuando el número de datos es mayor que 30: agrupar en intervalos o clases V F d. El punto medio de un intervalo de una distribución de debe escogerse en forma tal que termine en V F

se suelen

frecuencia 0 ó en 5.

5. Preguntar el peso (kilos) de cada uno de sus compañeros de curso y organizar los datos obtenidos en una tabla de frecuencia. 6. Recolectar información sobre un problema que pueda ser objeto de estudio estadístico y después tabular la información (Tomar un mínimo de 50 datos y un máximo de 100 datos) 7. completar las siguientes expresiones: a. La diferencia entre el mayor y el menor de los datos en una distribución de frecuencia es el ____________________________________________________________ b. La________________________________________________________ Es el número de veces que se repite un dato en una muestra dada. c. El último valor de las ______________________________________ igual al tamaño de la muestra.

es

d. La suma de las ______________________________________________ siempre es 1 ó 100% 8. Supongamos que se investiga el precio de cierto articulo en 50 almacenes diferentes y se encuentran los siguientes datos:

63


72 64 73 76 70 91 93 84 90 91 75 87 71 73 69 93 92 83 96 95 83 88 85 72 73 70 83 81 97 72 93 99 83 71 85 68 82 73 84 83 96 70 81 83 94 73 85 69 86 85 a. Elabora una tabla de frecuencias. b. Determinar el valor de:

F F f h h H L.R.S. L.R.I . 3,

5,

2,

3,

4,

2,

3,

4.

9. Los salarios (en miles de pesos) de 40 empleados de una compañía se describen a continuación. 35 39 36 96 87 89 74 80 43 48 43 83 76 91 82 83 56 53 72 56 74 93 93 45 63 55 65 63 73 95 66 59 38 62 67 85 86 88 39 62 a. Elabora una tabla de frecuencias b. ¿Qué porcentajes de empleados gana mas de $ 63.000? c. ¿Que porcentaje de empleados gana más de $43.000 y menos de $65.000? d. ¿Qué porcentaje de empleados ganan menos de $83.000? 10. Durante el mes de mayo de 1989 el número de nacimientos en los distintos hospitales de una ciudad es el siguiente:

64


HOSPITAL A= 40 B = 35 HOSPITAL D= 3 HOSPITAL E= 15 F= 26

HOSPITAL HOSPITAL C= 12 HOSPITAL

a. Organizar estos datos en una tabla de frecuencia b. Porcentaje de nacimientos del hospital C con respecto al total de nacimientos.

65


CAPITULO IV GRAFICAS ESTADISTICAS

OBJETIVOS

-

construir graficas estadísticas y a la vez saberlas interpretar.

-

Presentar problemas estadísticos de forma clara y entendible por medio de graficas.

-

Utilizar la grafica apropiada para cada problema estadístico

Después de haber elaborado las tablas o cuadros, como complemento de estos, es necesario presentar la información obtenida en graficas estadísticas

66


El grafico permite que el ojo del lector siga las variaciones que los datos han tenido. Y quizá pueda imaginar como variaran en el futuro. 4.1. PRINCIPIOS BASICOS EN LA CONSTRUCCIÓN DE GRAFICOS La forma de la grafica depende en gran parte del gusto de la persona que la elabora; sin embargo, hay ciertos principios generales que se deben tener en cuenta en el logro de una buena grafica; a saber: 1.

La grafica debe ser sencilla y contener únicamente las líneas y símbolos necesarios.

2.

La grafica debe ser explicita. El titulo ha de ser claro y se debe colocar en la parte superior o inferior de la grafica. Además, se debe escribir la fuente de información, escalas y notas o leyendas explicativas.

3.

Si la grafica presenta más de una variable debe hacerse la diferenciación mediante leyendas o signos convencionales.

4.

la grafica se presenta siempre de izquierda a derecha y de abajo hacia arriba.

4.2. TIPOS DE GRAFICAS En nuestro caso veremos dos categorías, las cuales estudiaremos a continuación: De barras Gráficos de Visualización

De repartición Porcentual o Diagrama circular

67


Gráficos estadísticos Lineales Histogramas Gráficos de evolución

Polígonos de Frecuencia Ojivas Pirámides Gráficos de Gantt

4.3. VENTAJAS DE LAS GRAFICAS

- Permiten visualizar el problema más rápidamente. - Se puede analizar los problemas de una manera más entendible. - Se representan dos o más situaciones al mismo tiempo. - Por medio de las graficas podemos predecir el comportamiento futuro de la variable

68


4.4. GRAFICOS DE VISUALIZACION Representan una situación de manera estática Puede ser: 1.

De Barras. Es una de las graficas mas utilizadas por su sencillez y por la facilidad que ofrece, para representar las características cualitativas y cuantitativas, aún en aquellos casos en que la información no se tiene en cuadros de frecuencia. Siendo sus bases iguales, las magnitudes que representan serán proporcionales a las alturas, con lo que se facilita la comparación.

Ejemplo 1. La siguiente tabla nos muestra el número de alumnos por cada grado en la escuela A. Elabora un grafico de barras.

GRADO

Nº DE ALUMNOS

50

30

20

45

60

TOTAL

205

NUMERO DE ALUMNOS DE LA ESCUELA A 1988 69


2.

De repartición porcentual o circular. Consiste en un círculo dividido en partes proporcionales a la magnitud de cada clasificación en que se han organizado los datos, los cuales son generalmente pocos. Dicho circulo representa el 100% o sea el total de los datos; cada porcentaje parcial se señala en el circulo con la ayuda de un transportador.

Ejemplo 2 Superficies Zonas continentales del Mundo CONTINENTES

AREA (Millones de km2)

GRADOS ª

70


Asia

43

103,9

Europa

10

24,1

África

30

72,,5

América del norte

23

55,6

América del sur

18

43,5

Australia

7,5

18,1

Antártica

12

29,0

Islas

5,5

13,3

total

149,0

360 Fuentes: naciones unidas

Para elaborar la columna correspondiente a grados partidos del hecho de que el área total es de 149 millones de kilómetros cuadrados, lo que corresponde a 350ª, o sea: Para África tenemos:

360º X

149 millones de Km 2. 43 millones de Km 2.

X=

360 ×43 =103,9º 149 71


Siguiendo un proceso similar se encuentran los demás sectores. Usando el transportador obtenemos la grafica en la página siguiente. 4.5. GRAFICOS DE EVOLUCION A diferencia de los anteriores, que presentan una situación estática, gráficos de evolución nos muestran movimiento. Convención 1. Asia 2. Europa 3. África 4. América del norte 5. América del sur 6. Australia 7. Antártica 8. Islas

1. GRAFICOS LINEALES Todo gráfico que consista de líneas bien sea quebradas o curvas, se conviene en llamarlo gráfico lineal. Son muy utilizados para representar series cronológicas. También se le denomina curvas de sucesión porque generalmente se refiere a variables observadas durante un periodo de tiempo. Dichas variables se denominan series de tiempo o series cronológicas. Ejemplo 3 PERSONAS INSCRITAS PARA PRESENTAR EXAMEN DE ABMISION EN EL COLEGIO X (1983-1988)

72


Aテ前

Nツコ DE PERSONAS

1983

150

1984

200

1985

180

1986

130

1987

250

1988

300

TOTAL

1210

2. HISTOGRAMA. Cuando se trata de datos agrupados en vez de diagrama de barras se construye el histograma de frecuencias absolutas. Un histograma consiste en una serie de rectテ。ngulos que tienen: - Sus bases sobre el eje horizontal con centros en las marcas de clase y longitud igual el tamaテアo de los intervalos de clase. - Superficies proporcionales a las frecuencias de clase. Ejemplo 4: Construir un histograma para la siguiente tabla: NOTAS DE ALGEBRA DE 50 ALUMNOS DEL COLEGIO A NOTAS

fi

Xi

LRI-LRS

73


6.1-7.0

5

6,55

6.05-7.05

7.1-8.0

8

7,55

7.05-8.05

8.1-9.0

25

8,55

8.05-9.05

9.1-10.0

12

9,55

9.05-10.05

Total

50

-

-

NOTA: Las columnas marcas de clase (X) y límites reales se obtienen a partir de la información dada (Notas,fi). 3.

Polígonos de frecuencia. Se pueden elaborar uniendo los puntos medios de los techos de los rectángulos en el histograma. Cuando los datos de menor frecuencia se dan al principio y al final, y los de mayor frecuencia en el centro, como en el ejemplo anterior, el polígono tiene forma de montaña.

Por regla general, el histograma debe preferirse al polígono de frecuencias. Este debe destinarse a aquellos casos en los cuales se quiere presentar más de una serie en el mismo grafico, con fines comparativos. Ejemplo 5: Construir el polígono de frecuencia para la tabla anterior. (Ver grafica en la página siguiente) 4.

Ojiva. Este grafico se obtiene uniendo los puntos correspondientes a las frecuencias acumuladas menores que cualquier Límite Real Superior y los Límites Reales Superiores de clase. También es llamado polígono de frecuencia Acumuladas.

74


Este diagrama se utiliza para presentar distribuciones de frecuencia en escala cuantitativa con fines analíticos o para resumir ciertas series cronológicas cuando se tiene interés, no tanto en las fluctuaciones de un lapso a otro, sino en el efecto acumulado a través del tiempo. Generalmente es preferible utilizar una doble escala en la cual la escala vertical izquierda muestra las frecuencias acumuladas y la escala vertical derecha los porcentajes acumulados. Ejemplo 6: Trazar la ojiva correspondiente a las notas de algebra, del ejemplo 4. Solución: Haciendo la tabla siguiente se facilita la construcción de las graficas que se encuentran en la pagina siguiente. NOTAS

FI

Hi

75


Menor que 6.05

0

0

Menor que 7.05

5

10%

Menor que 8.05

13

26%

Menor que 9.05

38

76%

Menor que10.05

50

100%

Partiendo de los valores ubicados en la escala de la izquierda obtenemos los valores correspondientes en la escala de la derecha procediendo de la siguiente manera:

X=

50

100%

10

X

10 × 100% = 20% similarmente se puede obtener los demás valores 50

El grafico de frecuencias acumuladas permite responder fácilmente preguntas como las siguientes: ¿Cuántos alumnos obtuvieron notas por debajo de 7.5? ¿Qué porcentaje del total de alumnos obtuvo notas menores que 9.0? ¿Por debajo de que nota están el 65% de los alumnos? Para averiguar el número de alumnos que obtuvieron notas menores que 7.5 se proceden así: Se levanta una vertical a esta nota hasta la curva y se proyecta a la escala vertical izquierda, lo cual nos indica que por de bajo de esta nota están aproximadamente 10 alumnos.

76


Para obtener el porcentaje de alumnos por debajo de 9.0, se levanta una vertical hasta la curva y se proyecta en la escala de los porcentajes obteniéndose aproximadamente el 75%. La tercera pregunta se deja como ejercicio. Nota: El grafico anterior corresponde a la “ojiva menor que”, de forma similar se puede construir la “ojiva mayor que”. 5.

pirámides. Dentro de los diagramas rectangulares, las pirámides constituyen una modalidad muy utilizada para representar las edades de la población de una región.

Si observamos detenidamente su grafica, no es más que un histograma, utilizado para representar dos características de una misma figura. Cuando el problema se refiere a edades, colocamos en la ordenada las edades y en las abscisas los porcentajes correspondientes a cada edad o grupo de edades, ubicando varones a la derecha y mujeres a la izquierda del eje vertical. Cuanto más “joven” sea una población, más ancha será la base de la pirámide. Una población “envejecida” dará una pirámide más ancha en los rectángulos superiores. Ejemplo 7: Con los siguientes datos sobre una población potencial de consumidores, se pide construir una pirámide de dicha población teniendo en cuenta la edad y el sexo.

EDAD AÑOS

DISTRIBUCION PORCENTUAL Hombres %

Mujeres %

77


12

-

15

10.9

9.7

16

-

19

9.1

8.9

20

-

23

7.6

7.4

24

-

27

5.8

6.3

28

-

31

4.9

5.3

32

-

35

4.2

4.5

36

-

39

3.9

3.0

40

-

43

2.5

2.8

44

-

47

2.2

1.0

51.1

48.9

Total

78


6.

GRAFICO DE GANTT. Se utiliza para representar los hechos en su relación con el tiempo; de ordinario se trata de relacionar el trabajo previsto y el trabajo efectivamente realizado; de ahí que se les denomine “graficas de avance de trabajo” y también “grafico de trabajo y de trabajo realizado” (Cronogramas).

Para elaborar este tipo de grafico, se diseña una columna donde se indica la descripción de los distintos trabajos, luego una serie de columnas representan las unidades de tiempo a utilizar (puede ser horas, días, meses, años, etc.). Ejemplo 8: La figura representa el porcentaje de trabajo ejecutando de una unidad de matemáticas en un periodo de tiempo correspondiente a una seman Días

% DE TRABAJO EJECUTADO EN FACTORIZACION 10

20

30

40

50

60

70

80

90

100

Lunes

Martes

Miércoles

Jueves

Viernes

EJERCICIOS 1. Las siguientes son cifras hipotéticas de la población de pensionados de una pequeña cuidad.

79


Edad (años)

fi

65-69

11

70-74

7

75-79

8

80-84

4

85-89

6

Total

36

Con la relación de la tabla, dibujar: un histograma, un polígono de frecuencias, la ojiva, el diagrama circular.

2. La producción anual de una fabrica de tubos electrónicos, durante cuatro años. año

1986

1987

1988

1989

Número de tubos

3.200

4.500

7.200

6.800

Trazar: un diagrama de barras, un grafico lineal y un gráfico circular. 3.

Elabora una grafica adecuada para representar la siguiente información:

Durante 5 meses se construyen 150 casas en la siguiente forma: el primer mes, 10% del total; el segundo mes 12% del total; el tercer mes 18% del total; el cuarto mes 32% del total y el ultimo mes 28% restante.

4.

Contestar verdadero o falso según el caso.

80


a. Los grafico de visualización representan una situación en movimiento V F b. La ojiva también es llamada polígono de frecuencia Acumulada

V F

c. La relación de las escalas en una grafica debe ser 1:1

V F

d. Al hacer una grafica, las frecuencias deben representarse En el eje de las ordenadas. 5.

Defunciones por accidentes en el país X año 1980 Edad en años

fi

0-9

748

10-19

457

20-29

642

30-39

466

40-49

340

50-59

241

60-69

156

70-79

76

80-89

81

Total

3207

a.

con los datos de la tabla trazar la ojiva menor que

b.

¿Cuántas defunciones hubo en personas menores de 35 años?

81


6.

c.

Del total de funciones ¿que porcentaje ocurrió por debajo de 75 años?

d.

Por debajo de que edad ocurrió el 43% de las defunciones.

la tabla siguiente presenta las importaciones y exportaciones (en limite de millones de pesos), de un país X en el periodo comprendido entre 1981- 198.

Construir una pirámide

7.

Año

Importaciones

Exportaciones

1980

10.5

6.4

1981

6.6

12.0

1982

5.4

11.5

1983

5.0

9.2

1984

4.2

7.3

1085

3.5

6.3

1986

2,4

5.7

1987

1.8

3.2

total

39.4

61.6

elabora un diagrama circular que represente las extensiones territoriales de los países Bolivarianos.

82


PAÍS

AREA (Km2)

Bolivia

1.099.000

Colombia

1.138.000

Ecuador

284.000

Perú

1.285.000

Venezuela

916.000

Total

4.722.000 Fuente: Atlas básico de Colombia

8. Composición por grupo de edades de la población colombiana 1973. Edad (Años)

porcentaje %

Menos de 10

29.63

10-19

26.23

20-54

37.01

Más de 54

7.13

Total

100

Trazar la grafica que represente mejor la información dada. 9. represente en un diagrama de barras la producción de café de los países latinoamericanos en 1984 en miles de toneladas. País

Producción (miles toneladas)

83


BRASIL

1003

COLOMBIA

840

MEXICO

234

GUATEMALA

162

EL SALVADOR

143

COSTA RICA

113

PERU

98

ECUADOR

90

TOTAL

2683

10. representar en un grafico de barras, la profundidad promedio (metros) de los Océanos del Mundo. OCEANOS

PROFUNDIDAD PROMEDIO (metros)

PACIFICO

4200

Atlántico

3870

Indico

3390

Océano Ártico

1200

total

12660

Fuente: O.E.A

84


CAPITULO V ALGUNOS SIMBOLOS Y CONCEPTOS MATEMÁTICOS

OBJETIVOS

. Utilizar símbolos matemáticos para simplificar la escritura de expresiones numéricas. . Emplear propiedades de las sumatorias para resolver problemas matemáticos. . Identificar las distintas clases de errores que se presentan al hacer mediciones.

7.1 NOTACION SUMATORIA En muchas ocasiones nos encontramos con la suma de un gran número de términos, de allí que es indispensable indicar mediante un símbolo apropiado dichas sumas.

85


El símbolo permite ganar tiempo, presición y espacio en las operaciones que se realicen. Por convención se a adoptado la letra S del alfabeto griego, es decir sigma

(∑ ) .

n

La expresión

∑a i se lee : “sumatoria cuando i va de 1 hasta n de a i , donde: i =1

I =1 es el limite inferior de la sumatoria n es el limite superior de la sumatoria

a

i

es el término que varia.

Ejemplo 1 La expresión

y +y +y 1

2

3

+ ... + y

n,

se puede escribir de una

forma más simplificada, mediante la siguiente sumatoria n

∑yi, o sea: i =1

y +y +y 1

2

3

+ ... + y

n

n,

=

∑yi, i =1

Ejemplo 2 Desarrollar las siguientes sumatorias. 5

a.

2i

i =1 6

b.

1/i

i=2

86


3

c.

3i

i =0

4

d.

(2j-3)(j+2)

i =1

Solución: 5

a.

2i=2.1+2.2+2.3+2.4+2.5=2+4+6+8+10=30

i =1 6

b.

∑ i=2 3

c.

∑ i =0

1 1 1 1 1 1 30 + 20 + 15 + 12 + 10 87 29 = + + + + = = = i 2 3 4 5 6 60 60 20 i

0

1

2

3

3 = 3 + 3 + 3 + 3 + = 1 + 3 + 9 + 27+ = 40

4

d.

(2j-3)(j+2)=(2.1-3)(1+2)+(2.2-3)(2+2)+(2.3-3)(3+2)+(2.4-3)(4+2)

i =1

= (-1)(3)+(1)(4)+(3)(5)+(5)(6) = -3 +4+5+30 =46

Ejemplo 3 Emplear notación sumatoria para las siguientes expresiones a.

1+2+3+…10

b.

3 +3 +3

2

3

4

87


c.

2+5+8+11+…20

d.

( b − 4) + ( b − 4) + ( b − 4) + ( b − 4) 5

6

7

8

Solución: a.

Observe que :

- el total de sumandos es 10 (n=10) - i varia de 1 a 10 - La diferencia común entre los términos es de una unidad Una de Las formas de escribir la suma propuesta es: 10

i = 1+2+3+…+10

i =1

b.

– En este caso tenemos tres sumandos (n=3) - cada sumando es una potencia cuya base es igual (3) y el exponente varia de 2 a 4 (i = 2, 3 ,4) Por lo tanto la expresión dada se escribe 4

i =21

c.

i

2

3

4

3 = 3 +3 +3

Notamos que los términos de esta suma están en progresión aritmética.

- Razón (r=7) - Total de sumandos (n=7) - ¡ varia de 1 a 7 puestos que tenemos 7 términos.

88


- El primer término es 2

( a = 2) 1

- El termino ¡- ésimo de una progresión aritmética ésta dado por:

a = a + ( i − 1) r (1) i

1

Reemplazando en la formula 1 tenemos:

a = 2 + (i − 1)3 i

a = 2 + 3i − 3 i

a = 3i − 1 i

De lo anterior obtenemos: 7

(3i-1)=2+5+8+…+2

i =1

d.

– Esta suma se compone de 4 sumandos (n=4) _ Solo varia el sub-índice de b (¡=5,6,7,8,) _ El numero 4 pertenece constante en cada sumando Luego, la suma se escribe así:

∑ (b − 4) = (b 8

i =5

i

5

− 4) + (b6 − 4) + (b7 − 4 ) + (b8 − 4)

5.1.1 propiedades 1. La sumatoria de una constante k, es n veces la constante:

89


n

k = nk

i =1

Ejemplo 4: 5

4 = 5(4) = 20

i =1

2.

la sumatoria de una constante k por una variable, es igual a la constante por la sumatoria de la variable.

n

n

j =1

i =1

∑ kxi = k ∑x

(propiedad homogénea)

Ejemplo 5 3

3

∑i = 3(1 + 2 + 3) = 3(6) = 18

3i

i =1

3.

n

∑ i =1

i =1

la sumatoria de una suma (o diferencia) es igual a la suma o diferencia de las sumatorias. n

n

i =1

i =1

( xi ± yi ) = ∑ xi ± ∑ yi (Propiedad lineal)

Ejemplo 6: efectuar: 4

∑ i =1

2

( 2i + i ) =

=2

4

∑ i =1

4

2i + ∑ i =1

4

4

i =1

i =1

∑i + ∑i

i

2

2

90


= 2(1+2+3+4+)+(1+4+9+16) =2(10)+30=20+30=50

5.2. FORMULAS DE LAS SUMATORIAS En el trabajo con sumatorias encontramos algunas sumas, que tienen unas características muy especiales, las cuales se pueden calcular de una forma directa empleando formulas de sencilla aplicación. Estas formulas proporcionan el valor de la suma de n – números comprendida entre 1 y n, inclusive. Las formulas expuestas a continuación pueden ser demostrados por el método de inducción matemática. n

1.∑ i =

Formulas:

i =1

n(n +1) 2

Ejemplo 7: calcular el valor de la siguiente suma: 1+2+3+…+15

n

∑ i,

Solución 1+2+3+4+…15= 1.

n=15

i =1

15

Luego: 1.∑ i = i =1

15(15 + 1) 15.16 = = 20 2 2

Otra forma de calcular esta suma es aplicando la propiedad, que al sumar dos términos equidistantes obtenemos el mismo resultado:

91


1+15 = 16 2+14= 16

S=

15.16 =120 2

3+13= 16 . . . 15+1= 16

Observa que si tiene 15 sumas, cuyo resultado es dieciséis, como los números se repiten dos veces, redivide entre dos. n

2.

∑i

2

=

i =1

n(n + 1)(2n + 1) 6

Ejemplo 8: Hallar el valor de

2

2

2

2

1 + 2 + 3 + ...50

Solución: 50

1 + 2 + 3 + ...50 ∑i 2

2

2

2

=

2

,

n=50

i =1

50

∑i

2

i =1

n

3.

=

50(50 +1)(100 +1) 50.51.101 = = 42925 6 6

i3 = (

i =1

Ejemplo 9: calcular

n(n + 1) )2 2 1

3

3

3

3 + 2 + 3 + ... + 20

92


Solución: 1

3

3

3

3 + 2 + 3 + ... + 20 (

20( 20 + 1) 20.21 )=( )= 2 2

=(

( 210)

12

Ejemplo 10. Calcular

∑(5i − 6i

2

2

= 44100

+ 7)

i =1

12

Solución:

12

12

i =1

i =1

∑ (5i − 6i + 7) = ∑5i − ∑ 2

i =1

12

12

i =1

i =1

6i

2

12

−∑ 7 i =1

12

= 5∑ i − 6∑ i + ∑ + 7 2

i =1

5[ (12)(12 + 1) ] 6[ (12 )(12 + 1)( 24 + 1) ] − + 12.7 2 6 5(12)(13) 6(12 )(13)( 25) − + 84 2 6 =300-3900+84= -3426

5.3. NOTACION PRODUCTORIA En estadística se presentan con algunas frecuencias productos en los cuales es indispensable utilizar un símbolo que simplifique los cálculos numéricos y sea de fácil manejo. Por convención se escogió la letra griega mayúscula

(phi).

Ejemplo 11:

93


n

1× 2 ×3 ×...n = ∏i i =1

Ejemplo 12 4

∏ i =1

i

2

=

2

2

2

2

1 .2 .3 .4 = 1• 4 • 9 • 16 = 576

Ejemplo 13 5

3i = (3 • 2) • (3 • 3) • (3 • 4) • (3 • 5) = 6 • 9 • 12 • 15

i =2

=9720 5.31. Propiedades 1. la productoria de una constante es igual a una potencia, en donde la base es la constante y el exponente es el límite superior del producto. n

∏ i =1

k =k

n

,

k

E

R

4

Ejemplo 14: Calcular

∏2 i =1

Solución: 4

∏2 i =1

=

4

2

= 16

2. La productoria de una constante por una variable es igual a la constante elevada al límite superior por la productoria de la variable.

94


n

∏hxi = k i =1

n

n

∏ x, k

E

i

i =1

R

n

Ejemplo 15: Calcular

4i

i =1

Solución: 3

∏ i =1

4i =

3

4∏i 3

i =1

=

3

4

(1 • 2 • 3) = 64(6) = 384

5.4. ERRORES DE LA SMEDICIONES En trabajos de investigación y experimentación es común que los datos obtenidos estén sujetos a errores de diversa índole. Nunca podemos conocer el valor preciso y exacto de una magnitud; sin embargo, es posible conocer cual es el valor del error que se comete al estimar y al expresar cierta medida o datos por una cifra numérica. El error se refiere a la diferencia de los datos obtenidos experimentalmente con la realidad de los hechos. 5.5. CLASES DE ERRORES 1.

Error absoluto. Se considera como el valor absoluto de la diferencia obtenida por cálculo y el valor real de la magnitud.

Ejemplo 16. Un investigador trata de medir el peso de (kilos) de una persona y obtiene los siguientes resultados: 65,25;

62,28;

62,19;

62,23;

62,30;

¿Cuál será el peso mas preciso? Solución: Hallemos el promedio de los pesos encontrados P=

62.25 + 62.28 + 62.19 + 62.23 + 62.30 5 95


P = 62.25 kilos El error absoluto para cada medida es el valor absoluto de: La diferencia entre dato encontrado y el promedio. 62,25 - 62,25

=

0

= 0

62,28 - 62,25

=

0.03

= 0,03

62,19 - 62,25

=

-0,06

=0,06

62,23 - 62,25

=

-0.02

= 0,02

62,30 - 62,25

=

0,05

= 0,05

Promediamos los valores obtenidos:

E

A

E

=

A

0 + 0.3 + 0.06 + 0.02 + 0.05 5

= 0,032 kilos. Este valor es el error absoluto del valor más probable.

Por lo tanto el resultado final será: Peso de la persona = Peso promedio de la persona 0.032 k

2.

± error absoluto 62,25 ±

Error Relativo. Es el cociente que se obtiene al dividir el valor absoluto entre el valor promedio de las mediciones. Frecuentemente se expresa en porcentaje

ER =

E V

A

• 100%

P

Ejemplo 17: Calcular el error relativo para el ejercicio anterior.

96


Solución:

E E

R

R

E

R

= ?,

=

E

A

= 0.032k ,

V

P

= 62,25k

0.032 • 100% 62.25

= 0,0514%

NOTAS: 1. Cuanto menor sea el error relativo, tanto más precisa será la medición. 2. El error absoluto representa el error cometido en la medición. 3. El error relativo indica el error cometido en la unidad de la magnitud medida. 5.6. APROXIMAACIONES NUMERICAS (= se lee: Aproximadamente) 1. Redondeo de datos: Al efectuar operaciones en matemáticas las cifras decimales se aproximan o redondean de acuerdo a unas reglas establecidas, que permite minimizar la acumulación de errores de redondeo cuando abarca un número grande de operaciones. 1er. Caso: La cifra posterior a la cual se desea redondear es menor que cinco. Ejemplo 18: Aproximar a la décima más cercana 832,84. Solución: 832,84 ≈832,8

2do. Caso: La cifra posterior a la cual se desea redondear es mayor que cinco. Ejemplo 19: Aproximar la centésima más cercana 49,268.

97


Solución: 49,268 ≈49,27

3er. Caso: La cifra posterior a la cual se desea redondear es cinco. Si la cifra anterior a cinco es par, no varia. Si la cifra anterior a cinco es impar, se redondea al número par más próximo. Ejemplo 20: Aproximar 834,85 y 593,35 a la décima más cercana. Solución: 834,85 ≈834,8 593,335 ≈593,4

5.7 NOTACION CIENTIFICA En algunas ciencias como Física, Química, Astronomía, etc., se emplean cantidades muy grandes o muy pequeñas. Para simplificar su manejo, dichas cantidades se expresan como producto de dos factores: uno de ellos es un número decimal con una sola cifra entera diferente a cero y el otro una potencia de diez. La notación científica es de gran utilidad, ya que es mas breve, permite fácil y rápida comparación de magnitudes y determina la precisión con que se hacen las medidas. Ejemplo 21: Expresar en notación científica los siguientes números: a.

la distancia de la tierra a la luna 3844000

b.

Radio de un átomo de hidrógeno 0,000000005 cm (aproximadamente)

Solución: a.

b.

5

384400km = 3,844 ×10 km −9

0,000000005cm = 5,0 ×10 cm 98


5.8. OPERACIONES EN NOTACIÓN CIENTIFICA 1. Multiplicación. Aquí es importante tener en cuenta la siguiente propiedad: n

n +m

m

10 ×10 =10

n, m E

,

R

Ejemplo 22: Expresar en notación científica las siguientes notaciones: a. 10000

×

b. 20000

×

5000

800000

×

1800

Solución: a.

(

10000 × 5000 = 1×10 × 5 ×10 = (1× 5) × 10 ×10 4

3

4

3

)

7

= 5×10 b.

4

5

3

20000 × 800000 × 1800 = 2 ×10 × 8 ×10 × 1,8 ×10

(

= ( 2 × 8 × 1,8) × 10 ×10 ×10 4

5

3

)

12

= 28,8 ×10

13

= 2,88 ×10

2. división. Se aplica la siguiente propiedad: n

10 =10 10

n−m

m

,

n, m E R

Ejemplo 23: Expresar en notación científica:

99


a.

1000 1000000

b.

10 0,0001

Solución: 3

1× 1000 3− 6 a. = 106 = 1×10 1000000 1×10

−3

1×10

1

b.

1+ 4 1×10 10 1− ( − 4 ) =1×10 5 = = 1×10 = 1×10 −4 0,0001 1×10

3. Potencia. Se utilizan las propiedades: a.

( )

m

n = n• m a a

b.

( a •b)

n

n

n

= a ×b

Ejemplo 24: expresar en notación científica: a.

(2,3×103)

4

b.

(3,2×10−4)

3

Solución: a.

(2,3×10−3)

( ) ( 2,3) × (1012) 4

=

=

=

( 2,3)

4

× 103

4

4

12

27,9841×10

100


=

−11

13

2,79841×10 = 3,3 ×10

4. Raíces. Se debe aplicar la propiedad siguiente: n

a ×b

=

n

E

nz

a ×n b,

+

,n ≥ 2

Ejemplo 25: 12

25×10

a. Extraer la raíz cuadrada de

b. extraer la raíz cúbica de 3

9−

27 ×10

Solución:

12

6

10

a.

25 × 10 = 25 ×

b. 3

27 × 10 = 3 27 ×

−9

3

= 5 × 10 −9

10

−3

= 3 ×10

5. Audición y sustracción. Si las potencias de 10tienen diferente exponente, deben igualarse antes de sumar. Ejemplo 26: simplificar las siguientes expresiones: 5

3

a.

3,4 ×10 + 1,8 ×10

b.

2.83 ×10 − 4.6 ×10

−5

−4

101


Solución: a.

b.

5

3

3,4 ×10 + 1,8 ×10

=

5

5

3,4 ×10 + 0.018 ×10

=

( 3,4 × 0.018) ×105

=

3,418 ×10

5

−5

−4

2,83 ×10 − 4,6 ×10

=

−4

=

( 0,283 − 4,6) ×10−4

=

− 4,317 ×10

5.9 GRAFICA DE FUNCIONES

−4

0,283 ×10 − 4,6 ×10

−4

LINEAL- CUADRATICA

A. FUNCIÓN LINEAL Es una de las funciones que se maneja con la mayor frecuencia por sus numerosas aplicaciones no solo en las matemáticas, sino en otras ciencias como la Estadística, Economía, Ingeniería, etc. Su nombre se debe al hecho deque su representación gráfica en el plano cartesiano es una línea recta. Toda función lineal está definida por una expresión de la forma: Y=f(x) =ax+b,

a, b E R

Ejemplo 27: las siguientes expresiones son funciones lineales:

102


Y=2x +3, Y=-2x,

Y=

5 ×+1, etc. 3

Sabemos que dos puntos distintos determinan una recta y como la gráfica de toda función lineal es una línea recta, basta determinar dos de sus puntos, generalmente los puntos donde la recta corta los ejes x y y, puntos éstos que se denominan interfectos y cuyas coordenadas son de la forma (o,y);(x,O). No significa esto que no se pueda determinar otros puntos. Recordemos que el conjunto solución de la función está dado por todos los pares ordenados (x ,y) cuyos puntos determinan la recta. Ejemplo 28: graficar la función lineal y=2x -3 Solución:

Hallemos los intersectos x = 0,

y = 2( 0 ) −3;

y = −3

( 0,−3)

y = 0,

0 = 2 x −3;

2 x = 3,

x=

2 =1,5, 3

(1.5,0 )

Ubicamos los intersectos es un plano cartesiano, la grafica se obtiene uniendo los puntos mediante una línea recta.

103


Ejemplo 29: La ecuación y=0.95x -95 de el peso aproximado en kilogramos para un joven de X centímetros de alto. Trazar la grafica de la ecuación y usarla para estimar los pesos de los jóvenes de 150, 170 y 200cm de alto. Solución: Tracemos la grafica de esta función utilizando los valores dados: X=150,

y =0.95 (150)-95,

y= 47.5,

(150, 47.5)

X=170,

y =0.95 (170)-95,

y= 66.5,

(170, 66.5)

X=200,

y =0.95 (200)-95,

y= 95,

(200,95)

Estatura

Peso

(cm)

(Kg.)

150

47,5

170

66,5

200

95

NOTA: cuando la grafica de una función lineal resulta ser una paralela al eje x, se llama función constante. Estas son de la forma:

B. FUNCIÓN CUADRATICA

104


2

y = ax + c, a ≠ 0a, b, cER,

Una función que pueda expresarse de la forma

Se

llama función cuadrática. La representación grafica de una función cuadrática corresponde a una parábola. Las funciones expuestas a continuación son cuadráticas: 2

y = 2x ,

2

y = 3x + 5 x,

2

y = 6 x + 4 x − 2,

2

y = x + 3,

etc. PASOS A SEGUIR PARA ELABORAR LA GRAFICA DE UNA FUNCIÓN CUADRATICA

( y = ax + bx + c) 2

1. Si a>0, la parábola abre hacia arriba (↑) parábola abre hacia abajo ( )

Si a<0, la

2. Hallamos los intersectos de x (y=0), utilizando la fórmula general como solución de la ecuación cuadrática obtenida.

x= Si

−b±

2

b

− 4ac

2a

2

b − 4ac < 0, la parábola no corta al eje x.

3. Encontramos el vértice de la parábola por medio de la formula: 2

b 4ac − b (− , ) 2a 4a Si la parábola abre hacia abajo el vértice corresponde el punto máximo de la parábola; si abre hacia arriba, corresponde a un punto mínimo. 4. Calculemos el y – intersecto (x=0) Ejemplo 30= Trazar la grafica de la siguiente ecuación:

105


2

y = 2x + 5x − 3 Solución: 1. La parábola abre hacia arriba (2>0) 2. Hallamos los x – intersectos, a=2, b=5,

x=

− 5 ± 25 −4( 2 )( − 3) 2( 2 )

x=

− 5 ± 25 + 24 − 5 ± 49 = 4 4

x

=

−5 + 7 2 = = 0.5 4 4

x

=

− 5 − 7 12 = = −3 4 4

1

1

c=-3

3. Como 2>0, el vértice corresponde al punto mínimo de la parábola y se calcula de la siguiente manera:

− b 4ac − b − 5 4( 2 )( − 3) − 5 − 5 − 24 − 25 ( , )=( , )=( , ) 2a 4a 4 4( 2) 4 8 2

2

=( −1.25,−6.125) 4. El y- intersecto se halla reemplazando x por cero en la función dada.

y =2

( 0) + 5( 0) − 3 2

y = −3 Grafica

x- intersectos:

x = 0.5 1

x

2

= −3 106


( −1.25,−6.125)

Vértice:

y = −3

y- intersecto:

NOTA: Las funciones cuadráticas de la siguientes formas 2

2

2

y = ax , y = ax + bx, y = ax + c, se pueden graficar de una manera más sencilla mediante una tabulación de valores. Ejemplo 31: Trazar la grafica de:

y =−

1 2 +2 2x

Solución: x

-2

-1

0

1

2

107


y

0

3/2

2

3/2

0

Encontramos el vértice por medio de la fórmula indicada anteriormente:

4( − 1 / 2)( 2) − 0 b 4ac − b 0 (− , ) = (− , 2a 4a 2(11 / 2) 4( − 1 / 2 ) 2

= (0,

2

−4 ) = ( 0,2 ) −2

Gráfica

5.10.

PORCENTAJES Y TASAS

Diariamente los medos de información hacen referencia a la industria, la banca, el comercio, los deportes, etc., tanto ellos como nosotros utilizamos expresiones como “el

108


10% de la población”, “el 25% del encaje bancario”, “el 20% d la nota de una materia”, “la tasa de natalidad de Colombia”, etc.

PORCENTAJES Son ampliamente utilizados en estadística; se trata de proporciones que multiplicadas por 100, se expresan en porcientos. Ejemplo 32: Una alumna de 8ª grado presentó exámenes de matemáticas, biología y español, de tal manera que, de 10 problemas de matemáticas acertó 8; de 40 preguntas de biología respondió correctamente 26 y de 20 frases de español analizo acertadamente15. Las preguntas que se pueden hacer respecto a estos problemas son: ¿En cual asignatura obtuvo mejor resultado? ¿En cual el peor? Observamos que la razón de aciertos o respuestas correctas al número de las preguntas en cada examen es: Matemáticas:

8 26 , Biología 10 40

Español

15 20

Si queremos comparar dichas razones se hace necesario llevarlas a un denominador común. Para facilitar nuestro trabajo y dar respuesta a las preguntas formuladas se elige 100 como denominador común. Matemáticas

8 80 = 10 100

109


Biología

26 65 = 40 100

Español

15 75 = 20 100

Al expresar las fracciones con el mismo denominador 100, nos permite afirmar que el mejor resultado se obtuvo en el examen de matemáticas y el peor el de biología. Las razones cuyo consecuentes es 100 se llaman porcentajes. Decimos entonces que el alumno acertó: el 80% del examen de matemáticas, el 65% del examen de biología, el 75% del examen de español. El termino por ciento se simboliza (%) y significa por cada 100. Así la razón 75/100, representa “el 75 por ciento de” y escribimos 75%. REGLAS EN EL USO DE LOS PORCENTAJES . Si no existe un motivo valedero para hacerlo, los porcentajes se expresan hasta el primer decimal. . Cuando se elimina el último decimal se aplican las reglas de redondeo enunciadas anteriormente. . Cuando todos los componentes de un total se expresan como porcentajes del total, la suma de todos los porcentajes debe dar 100. REGLA PARA HALLAR EL TANTO POR CIENTO DE UNA CANTIDAD Se establece una regla de tres simple y se despeja el valor de la incógnita. Ejemplo 33: una población tiene 150.000 habitantes, de los cuales el 52% son personas menores de 20 años. ¿Cuántos habitantes tiene dicha población que sean menores de 20 años? Los 150.000 habitantes representan el 100% por lo tanto podemos establecer la siguiente regla de tres simple: Habitantes

%

110


150.000

100

x=

52 ×150.000 100

= 78.000 habitantes menores de 20

años x

52

Ejemplo 34: la siguiente tabla muestra la nota de cada uno de los cuatro períodos de un grupo de 5 estudiantes. ¿Cuál es la nota definitiva de cada uno de ellos sabiendo que el primer periodo vale el 10%, el segundo 20%, el tercero 30% y el cuarto el 405? Estudiantes

I

II

III

IV

10%

20%

30%

40%

A

5.2

6.3

7.1

5.8

B

7.2

2.4

5.8

7.6

C

8.4

9.3

5.3

2.6

D

9.0

6.0

3.0

5.1

E

3.0

4.0

5.2

7.5

Periodo

Solución: Se halla el respectivo porcentaje para cada una de las notas así: Para el alumno A: 10% de 5.2 es

5.2 ×10 100

=0,52

20% de 6.3 es

6.3 ×20 100

=1,26

30% de 7.1 es

7.1×30 100

=2,13

111


40% de 5.8 es

5.8 × 40 100

=2,32

Por lo tanto la nota definitiva del estudiante A es: 0,52+1,26+2,13+2,32=6,23

≈ 6.2

Se deja el ejercicio del cálculo de la nota definitiva para los demás estudiantes. TASAS Una tasa es simplemente un fraccionario. El numerador, indica el numero de veces que ocurrió determinado fenómeno en un área perfectamente limitada y en un periodo de tiempo perfectamente definido. El denominador indica el número de habitantes de la población en el cual puede ocurrir el fenómeno descrito en el numerador. Numero de veces que ocurrió determinado fenómeno

n

x10 , n ≥ 2

población en la cual ocurrió el fenómeno Como el numerador de la tasa nunca podrá ser mayor que su denominador, el resultado será menor que la unidad y para evitar el uso de decimales, los resultados se multiplican por 100, 1000, 10000, etc., pues es mas fácil recordar por ejemplo que la tasa de mortalidad en Colombia en 1980 fue de 8 por 1000 que recordar que es 0.008. Teniendo en cuenta el concepto anterior, será mas fácil obtener o calcular cuantas tasas se quiera. Aquí nos limitaremos a explicar aquellas que son mas utilizadas especialmente en la estadística demográfica. 1. TASA DE NATALIDAD Denominado también coeficiente de natalidad, se define como “La relación por cocientes entre el número de nacimientos ocurridos en una población y el número total de personas que lo forman”. Expresando en estos términos, se trata de la tasa bruta anual de natalidad efectiva y se obtiene con la aplicación de la siguiente fórmula:

112


Tasa bruta anual de = efectiva

natalidad

numero de nacimientos vivos ocurridos en la poblacion de un area geografica dada y en un año dado. Estimación de mitad del año de la población

× 1000

de la misma area geográfica y durante el mismo año. Ejemplo 35: calcular la tasa de natalidad de cada uno de los años mostrados en la tabla de la página siguiente. Según estos datos la tasa bruta de natalidad para cada uno de los años considerados es: Para 1984=

284.080 •1000 = 42.81 ≈ 43 6′635.942

Lo que significa que por cada 1000 personas, la población se aumentó en 43. TASA BRUTA ANUAL DE NATALIDAD DEL PAIS X 1984-1988

PARA LOS AÑOS

Año

Población total al 30 de junio de cada año

Nacimientos vivos registrados en cada año

1984

6’635.942

284.080

1985

6’878.739

291.747

1986

7’121.534

354.739

1987

7’364.330

3387.199

1988

7’593.265

280.199

Para 1985 =

291.747 •1000 = 42.41 = 42 6′878.738 113


Para 1986 =

354.739 •1000 = 49.81 = 50 7′121.534

Para 1987 =

338.199 •1000 = 45.92 = 46 7′364.330

Para 1988 =

280.199 •1000 = 36.90 = 37 7′593.265

En este año la tasa de natalidad disminuyó. 2. TASA DE NUPCIALIDAD Se define como la tasa que emplea “para medir la frecuencia de los matrimonios en el seno de una población”. Para calcularla utiliza la siguiente formula: Tasa anual bruta de nupcialidad = Numero de matrimonio concertados en la población de un área geográfica dada y en un año dado Población estimada a mitad de año en esa misma área geográfica y durante el mismo año Ejemplo 36: Calcular la tasa de nupcialidad de la siguiente tabla:

TASA BRUTA ANUAL DE NUPCIALIDAD EFECTIVA DEL MUNICIPIOX PARA LOS AÑOS 1986-1988 Año

Población total al 30 de junio de cada año

Matrimonios registrados en cada año

114


1986

22.314

1.493

1987

24.625

1.139

1988

25.342

1.835

Para 1986 =

1.493 •1000 = 66.90 = 67 22.314

O sea que de cada 1000 personas 67 se casaron. Para 1987 =

1.139 •1000 = 46.25 = 46 24.625

Para 1988 =

1.835 •1000 = 72.40 = 72 25.342

En este año se presentaron mayor número de matrimonios.

3. TASA DE MORBILIDAD Con la utilización de esta tasa se pretenden estudiar los efectos de la enfermedad sobre la población del siguiente modo:

Tasa anual bruta de morbilidad

Número de casos de enfermedad Registrados en la población de un Área geográfica dada y un año Dado.____________________________ Población estimada a mitad de año

115


En esa misma área geográfica Y durante el mismo año.____________ Ejemplo 37: Calcular la tasa de morbilidad en la tabla de la página siguiente: Para 1986 =

650 •1000 = 2.59 = 3.0 250.325

Para 1987 =

795 •1000 = 3.02 = 3 263.126

TASA BRUTA ANUAL DE MORBILIDAD POR VARICELA EN LA CIUDAD Y PARA LOS AÑOS 1986-1988 Año

Población total al 30 de junio de cada año

Morbilidad por varicela registradas en cada año

1986

250.325

650

1987

263.126

795

1988

272.324

1.314

Para 1988 =

1.314 •1000 = 4.82 = 5 272.324

En este año se presento el mayor número de casos de varicela (5 por cada 1000). Ejercicios 1. desarrollar las siguientes sumatorias: 4

a. ∑( 2 −1) i =1

b. ∑ ( i + 2 )( i − 3) i =0

∑(3 3

5

c.

p =1

p

−2 p

) 116


4

d.

∑2

5

j

1

j =2

∑(2k +3k 6

1

∑( i − i +1)

e.

f.

i =2

k =2

2

)

2. Emplear notación sumatoria para las siguientes expresiones: a. 5 + 9 +13 + ...45 b.

( x − 1) + ( x − 2) + ... + ( x

c.

4 + 4 + 4 + ... + 4

1

1

2

2

10

3

− 10)

12

d. 2 + 4 + 8 + 16 + ... + 1.024 e.

f.

1 1 1 + + ... + 5 6 15

(2 − y ) + (2 − y ) + ... + (2 − y ) 1

2

18

3. Utilizando las formas de las sumatorias, calcular:

∑6i

b.

i =1

40

c.

∑k k =1

∑(2i + 5i ) 25

30

a.

2

i =1

3

∑(5i −8i +9i ) 20

d.

2

3

i =1

4. desarrollar las siguientes productorias

117


3

6

a.

∏4

b.

4

c.

∏( j + 2) j =1

i =1

∏3k

5

2

d.

k =1

∏1 / i i =2

5. Expresar las siguientes operaciones mediante la notación productoria. a.

b.

5 y • 5 y • 5 y • ...• 5 y 1

2

3

10

( x + y ) • ( x + y ) • ( x + y )...( x 1

2

2

1

2

2

3

2

15

3

+

y

15

)

2

c.

2 • 3 • 4 ...•12

d.

2 2 2 2 2 2 • • • • • 5 6 7 8 9 10

6. Un estudiante realizo varias mediciones del largo de una baldosa y obtuvo los siguientes resultados: 25.0;

26;

25.4;

24.6;

24.8;

25.6;

25.1

a. ¿Cuál es el valor más probable del largo de la baldosa? b. ¿Cuál es el error absoluto en la medición? c. ¿Cuál es el error relativo en la medición? d. ¿Cómo presentaría el largo de la baldosa? 7. Redondear los siguientes números a décimas y centésimas: a. 3,437

b. 0,6321

c.1,278

d. 0,083

e. 12,329

f. 235,485

8. Redondear cada uno de los siguientes números a la exactitud indicada:

118


a. 12,96 aproximando unidades b. 1,378 aproximando a décimas c. 28,93 aproximando centésimas 9. Expresar los siguientes valores en notación científica: a. Distancia de la tierra al sol 149600000 km. _____________________________ b. La unidad Ángstrom 0,0000001 mm. __________________________________ c. velocidad de la luz 300000 km/seg ___________________________________ d. El diámetro de un glóbulo rojo de 0,00001 mm. 10. Realizar las siguientes operaciones: 3

4

10 − 5,8 •10

a. 1,26 • b.

(8,5 •10 ) • (4,3 •10 ) −7

12

19

c.

5,7 •10

d.

2,63 •10

18

1,6 •10

16

12

5,4 •10 6

4

3

e.

2,1 •10 + 5,1 •10 − 8,3 •10

f.

(1,8 •10 ) + ( 2,9•10−1) −2

4

11. Expresar los siguientes números sin utilizar potencias de 10.

119


4

a.

2,8 •10

c.

0,0483 •10

e.

6,832 •10

−4

10

b. 1,32 • 6

3

−5

10

d. 1,56 • f.

7

0,00001 •10

12. De 150 carros en un parqueadero, hay 14 negros, 21 rojos, 10 azules, 26 blancos y 24 verdes. a. ¿Qué porcentaje de los carros son negros? b. ¿Qué porcentaje de los carros son azules? c. ¿Qué porcentaje de los carros son blancos? d. ¿Qué porcentaje de los carros son verdes? 13. Una biblioteca de una universidad tenía 74.450 libros en 1965. Se agregaron en 1966, 25.663 volúmenes: ¿Cuál fue el porcentaje de aumento en libros? 14: Trazar la gráfica de Las siguientes funciones lineales: a. y=2x+6 b. y=5/2x-3 c. y=-3x+1 d. y=-2x e. y=-5 15. Graficar las siguientes funciones: a.

y = − 2x + 5x + 3

b.

y = 6x

2

2

120


2

c.

y = 4x + 7

d.

y = − x + 6x − 2

e.

y = −3x + bx

2

2

16. La ecuación y=100+0.5 x dá el promedio de la presión arterial y en milímetros de mercurio, para un adulto con x años de edad. Trazar la gráfica de esta ecuación y estimar las presiones arteriales para adultos con 25,35 y 45 años de edad. 17. Consultar y calcular las tasas de natalidad, nupcialidad y morbilidad de 5 departamentos de Colombia

CAPITULO VI

121


PROMEDIOS

OBJETIVOS

- Calcular e interpretar las medidas de tendencia central en datos agrupados y no agrupados. - Calcular e interpretar las medidas de posición en datos agrupados. - Comparar las medidas de tendencia central y escoger la de mayor aplicabilidad según el problema en estudio.

6.1. PROMEDIOS: MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE POSICIÓN El estudio de las tablas y las graficas vistos en los capítulos anteriores, tenía como fin resumir los datos en su conjunto que nos proporcionan las observaciones. Ambos métodos, cuyo origen común es la clasificación, son sistemas usados para comprender mejor los datos y siempre es beneficioso utilizarlos. A partir de estos sistemas vemos claramente la variación de los datos: algunos son pequeños y otros son grandes. Sin embargo de entre todos los datos sobresalen algunos que podemos considerar como representativos de todo el conjunto; a estos valores los vamos a llamar promedios. Bajo esta consideración diremos que un promedio es un valor aislado el cual puede considerarse como el más representativo de un grupo de datos. Obviamente, un valor representativo no puede ocupar un lugar extremo, pero si es un número que debe caer

122


al rededor de la mitad del grupo, de tal manera que nos referimos a los promedios como medidas de tendencia central. Por su propia naturaleza, un promedio tiene muchos usos. Se usa frecuentemente, para resumir todo un conjunto de números; por ejemplo, la calificación promedio de Algebra el año pasado, el salario promedio de los recolectores de café durante el año anterior, el precio promedio de los bonos de desarrollo económico de la bolsa de valores, etc. 6.1.1 definiciones y cálculos de los principales promedios Los promedios más comunes son: La medida Aritmética, la mediana y la moda. La media aritmética es la más familiar y la que todos hemos calculado alguna vez; la utilizamos con mucha frecuencia en nuestro trabajo estadístico. La media geométrica y la media armónica se emplean para ciertos casos especiales que detallaremos más adelante. 6.2. MEDIA ARITMETICA SIMPLE

6.2.1 datos no agrupados La media aritmética o media de una serie de n datos

x x ..., x 1

2

n

se representa

por x y se define como lA suma de todos los valores de una variable dividida por el número total de datos. n

x=

x + x .. + x 1

2

n

n

=

∑x i =1

i

n

Ejemplo 1: Calcular la media aritmética de los siguientes números: 25, 12, 18, 36, 40 Solución:

x=

25 + 12L + 18 + 36 + 40 5

= 26,2, x = 26.2 123


6.2.2. Datos agrupados La media aritmética para datos agrupados se calcula de la siguiente forma: el punto medio (marca de clase) de cada intervalo se multiplica por su frecuencia correspondiente, de suman estos productos y el resultado se divide por n (suma de las frecuencias absolutas) n

x=

∑x f i

n

i

=

x f 1

1

+ x2

f

2

+... + xn

f

n

n

Ejemplo 2: Hallar la medida aritmética de los datos correspondientes a las notas de matemáticas de 30 alumnos del grupo 8A, según la siguiente tabla:

NOTAS DE MATEMÁTICAS DE 30 ALUMNOS GRUPO 8A NOTAS

Fi

4,8 - 55

4

5,6 - 6,3

4

6,4 - 7,1

5

7,2 - 7,9

7

8,0 - 8,7

7

8,8 - 9,5

3

TOTAL

30

Solución:

124


Calculamos xi (marca de clase) y este valor lo multiplicamos por la frecuencia respectiva. (Ver tabla en la pรกgina siguiente).

x=

216.9 = 7.23 30

Lo que significa que el promedio en matemรกticas del grupo 8A es 7.2.

Xi

Xi fi

5,15

20,6

5,95

23,8

6,75

33,75

7,55

52,85

8,35

58,45

9,15

27,45

TOTAL

216,9

6.3. MEDIA ARITMร‰TICA PONDERADA Se calcula sumando los productos de los datos, por su factor de ponderaciรณn (o pesos), dividiendo por la suma de los factores de ponderaciรณn.

125


n

x = w1 x1

+ w2 x2 + ... + wn xn 5

=

∑x w i =1 n

i

i

∑w i =1

i

Ejemplo 3: un alumno de tercer semestre de matemáticas obtuvo las siguientes notas: 3.5 cálculo II, 4.0 psicología I, 3.6 programación de computadores, 3.8 ingles I. Cada asignatura tiene una intensidad horaria de: 5h, 3h, 4h, 3h respectivamente. Calcular el puntaje promedio de dicho alumno. Solución: Los factores de ponderación están dados por la intensidad horaria de cada asignatura.

x = 3.5

x

1

w = 5,

x=

3

= 3. 6

w = 4,

2

3

xw+x w +x w +x w w+w +w +w 1

1

2

1

x=

x

= 4.0

w = 3,

1

x=

2

2

3

2

3

3

4

4

x w

4

4

= 3.8

=3

=

4

( 3.5)( 5) + ( 4.0 )( 3) + ( 3.6)( 4 ) + ( 3.8)( 3) = 5+3+4+3

17.5 +12 +14.4 +11.4 55.3 = = 3.68 ≈ 3.7 15 15

6.4. OTRO METODO PARA CALCULAR LA MEDIDA ARITMÉTICA SIMPLE Antes de explicar este método, veamos que son desviaciones. Desviaciones son las diferencias que se presentan entre los valores que toma la variable y un valor constante, el que puede ser la medida aritmética o un origen de trabajo. El origen de trabajo se simboliza por A y corresponde a un valor cualquiera, seleccionado arbitrariamente y que puede estar dentro o fuera del recorrido.

126


Se consideran tres clases de desviaciones: - Desviaciones respecto a la medida aritmética

d

- Desviaciones respecto a un origen de trabajo

d' = x

j

i

= xj − x j

−A

- Desviaciones respecto a un origen de trabajo tomadas en unidades de intervalo

A xi − = c

d"

i

(datos agrupados con amplitud constante) Ejemplo 4: dados los números 1, 2, 3, 4, 5. Calcular: a. Desviación respecto a la medida aritmética. b. Desviación respecto a un origen de trabajo. Solución: a. x =

d d

1 + 2 + 3 + 4 + 5 15 = =3 5 5

1

= 1 − 3 = − 2,

4

= 3 − 3 = 0,

d d

x =3

2

= 2 − 3 = − 1,

5

= 5− 3= 2

d

3

= 4 − 3 = 1,

b. Tomamos como origen de trabajo A=6

127


d" d ' d '

x

i

1

i

= 1 −

= 3

4

d ' = 2 − 6 = − 4, d ' = 5 − 6 = −1 2

d ' = 4 − 6 = −2 3

5

Con lo visto anteriormente podemos deducir una fórmula que nos permite calcular la medida aritmética de un conjunto de datos agrupados. n

x =A+

∑f d' i

i =1

i

n

Ejemplo 5: Calcular la medida aritmética del ejemplo correspondiente a las notas de matemáticas de los alumnos del grupo 8A (expuestos anteriormente) Solución: Es aconsejable escoger como origen del trabajo un valor central de las marcas de clase. A= 7.55 notas

f

i

x

i

d '= x − A f d ' i

i

i

48 - 5,5

4

5,15

-2,4

-9,6

56 - 6,3

4

5,95

-1,6

-6,4

64 - 7,1

5

6,75

-0,8

-4,0

72 - 7,9

7

7,55

0

0,0

80 - 8,7

7

8,35

0,8

5,6

88 - 7,5

3

9,15

1,6

4,8

i

128


total

x = A+

30

_

_

-9,6

∑ f d'

x = 7.55 +

i

i

n (−9.6) 30

x =7.55 −0.32 x =7.23

NOTA: Este método es útil cuando se manejan valores muy grandes. 6.4.1. Propiedades de la media aritmética 1. La suma de las desviaciones respecto a la medida aritmética es igual a cero. n

∑d i =1

i

d = x −x

= 0,

i

i

Ejemplo 6: Dados los siguientes números 2, 5, 4, 6, 3. Calcular la suma de las desviaciones respecto a la medida.

x=

d d

1

= 2 − 4 = − 2,

4

= 6 − 4 = 2,

Luego:

d d

2+5+4+6+3 =4 5

2

= 5 − 4 = 1,

5

= 3 − 4 = − 1,

d +d +d +d +d 1

2

3

4

5

d

3

= 4−4 =0

= −2 + 1+ 0 + 2 − 1 = 0

2. La me media aritmética del producto de una constante es igual a la constante.

129


n

M[

k]

=

∑k i =1

n

=

nk = k, n

KER

3. La media aritmética del producto de una constante por una variable, es igual a multiplicar la constante por la media de la variable. n

M

 

k

x

i 

∑k x

=

=

i

n

k ∑ xi i =1

n

=kx

4. La media aritmética de una variable más o menos una constante, es igual a la media de la variable más o menos la constante. n

M [ xi ±k ] =

∑x i =1

i

n

± k, = x ± k

5. La media aritmética de una muestra dividida en submuestras, es igual, a la media ponderada de las submuestras, tomando como ponderación los tamaños de las mismas.

x=

x=

x f 1

x f 1

1

f

1

+ x2 1

+

f

+ x2

f

2

2

f

+ ... + xn

+ ... +

2

f

f

n

f f 1

+ ... +

2

f

n

=n

n

+ ... + xn

n

f

n

Como

h

= i

f

i

n

x = x1 h1 + x2 h2 + ... + xn hn 130


Ejemplo 7: Un inversionista tiene 100 acciones cuyo valor promedio es de $2000 Y 60 acciones cuyo valor promedio es $1800. Averiguar el valor promedio de las 160 acciones.

x=

x f +x f f+f 1

2

1

1

2

=

2

2000(100 ) + 1800( 60) 200000 + 108000 = 100 + 60 160

x =$1925

Ejemplo 8: La media de los salarios pagados a los hombres y a las mujeres de una empresa fueron respectivamente de $30000 y $40000. Los porcentajes de hombres y mujeres empleados de dicha empresa fueron 40% y 60%. Calcular la media de los salarios pagados en un mes.

Solución: para resolver este problema utilizamos

x

1

= 30000,

x

2

x = x1 h1 + x2 h2

h = 0,4 h = 0,6

= 40000,

1

2

x =30000( 0.4 ) +40000( 0.6 )

x = $36.000

x =12.000 +24000,

6. La suma de los cuadrados de las desviaciones respecto a la medida es menor, si se compara con desviaciones respecto a un origen de trabajo. n

∑d i f 2

i =1

n

i

( )

< ∑ d 'i i =1

2

f

i

Ejemplo 9: Verificar la propiedad anterior con los siguientes números: 2, 3, 4

131


Solución:

x=

2 +3+ 4 =3 3

Sea A=6

d

= 2 − 3 = − 1, 1

d

d

2

= 3 − 3 = − 0,

d

d 3 = 4 − 3 = 1,

2 1 2

2 2

d3

= 1, = 0,

=

1 2

d d

1 '

2

d

Total

'

' 3

2

d'

= 2 − 6 = −4,

1

2

=9

2

=

= 3 − 6 = −3,

d'

= 1 − 6 = −5,

d '

2

3

= 16

25 50

Total

De lo anterior se tiene que 2 < 50. Calcular valor que se tome para A no altera el sentido de la desigualdad. 6.4.2. Características de la media aritmética - La media aritmética es el único promedio que se presta a tratamiento algebraico - Es muy sensible a cualquier cambio de los valores de la distribución.

132


- No es recomendable aplicarlo en distribuciones que no tienen definido sus valores extremos. - No se debe usar cuando la variable esta dada en forma de tasas o porcentajes o cuando presenta crecimiento geométrico. - Con los datos agrupados en intervalos, la medida depende de número de intervalos elegidos, de su amplitud y de los límites de los mismos. - La media aritmética se emplea en distribuciones más o menos simétricas. 6.5. LA MEDIANA (Md) Es el valor central o medida de posición de la variable que divide una distribución estadística con igual número de observaciones por devojo ny por encima. 1. Datos no agrupados. Para calcular la mediana de datos no agrupados, éstos deben ordenarse en forma creciente, o sea, de menor a mayor. Si el número de datos recolectados es impar, la mediana corresponde al valor central; cuya posición está dada por:

(i =

n +1 ) 2

Si hay un número de par de datos la mediana es el promedio de los valores centrales. Ejemplo 10: Hallar la mediana den los siguientes números: 1, 2, 3, 5, 8,4, 5. Solución: Ordenamos los datos de menor a mayor: 1, 2, 3,4 ,5, 5, 8. La mediana es 4. Ejemplo 11: Calcular la mediana de los siguientes datos: 1, 5, 2, 3, 8, 4. Solución:

133


Ordenamos los datos: 1, 2, 3, 4, 5, 8.

Md =

3+4 = 3 .5 2

Ejemplo 12: Los salarios (mensuales) de 4 obreros de una empresa son $28000, $35000, $42000, 37000 y el sueldo del gerente es de $120000. Hallar el salario promedio de los 5 empleados de la empresa. Solución: Calculamos la media aritmética.

x=

28000 + 35000 + 42000 + 37000 +120000 5

x = $52.400 En este caso la media aritmética no es el promedio más adecuado puesto que hay un solo empleado que gana más de $52.400.

Ahora organizamos los datos de menor a mayor 28000, 35000, 37000, 42000, 120000. La mediana es $37000 y este es un salario más representativo para los cinco empleados. 2. Datos agrupados. La mediana se obtiene mediante la siguiente formula:

n fd Md = L + ( 2 − )(c ) fm Donde: L = Limite real inferior donde se encuentra la mediana

134


n = Ubicación de la clase mediana 2 fm = Frecuencia absoluta de la clase mediana, fd= suma de las frecuencias absolutas anteriores de la clase mediana c= Amplitud de clase Ejemplo 13: Calcular la mediana para los datos de la tabla en la página siguiente: Solución:

n 31 = =15.5 2 2

EDAD

Este valor esta ubicado en la tercera clase

FI

2 - 4

5

5 - 7

8

8 - 10

12

11 - 13

4

14 - 19

2

TOTAL

31

← Md

135


L=

10 + 5 = 7.5, 2

fd = 5 +8 =13,

fm =12,

c =3

Aplicando la formula indicada anteriormente tenemos:

15.5 −13, Md = 7.5 + ( )(3) 12

Md = 8.12 Años. Esto indica que el 50% de los datos esta por encima de 8.12 años y el otro 50% por debajo de 8.12 años. 6.5.1. Método grafico Para hallar la mediana a. Utilizando el histograma, podemos calcular la mediana. Ejemplo 14: Calcular la mediana del ejemplo anterior por medio del histograma.

EDAD (Años)

fi

Fronteras

2 - 4

5

1.5 - 4.5

5 - 7

8

4.5 - 7.5

8 - 10

12

11 - 13

4

10.5 - 13.5

14 - 16

2

13.5 - 16.5

TOTAL

31

_________

7.5 - 10.5

La mediana es la abscisa correspondiente a la línea PQ que divide el histograma en 2 partes de igual área como lo muestra la grafica de la página siguiente:

136


En la figura el área total del histograma es de 31 unidades, con base en las frecuencias absolutas; contando las áreas encontramos que el rectángulo correspondiente a la clase mediana es el que tiene como área 12; a la izquierda de él hay 5+8= 13 unidades, o sea que es necesario separar 2.5 unidades del rectángulo de la mediana para completar 15.5 que es la mitad del área total. Del histograma tenemos:

2 .5 (3) 12 RQ = 0.625 RQ =

Mediana=7.5+0.625 Mediana= 8.12 b. La Mediana también puede ser calculada mediante el polígono de frecuencias relativas acumuladas u ojiva porcentual, determinado la abscisa correspondiente al punto de la ojiva cuya ordenada es el 50%.

137


Ejemplo 15: Encontrar la mediana de la tabla anterior por medio de la ojiva porcentual: Edad (Años)

Hi (%)

Menores que

1.5

0

Menores que

4.5

16.1

Menores que

7.5

42

Menores que 10.5

80.6

Menores que 13.5

93.5

Menores que 16.5

100

M= 8.1 6.5.2. Características de la mediana - La mediana es el punto que divide a la distribución en dos partes de igual área.

138


- Para calcular la mediana no se tiene en cuenta los valores extremos; por lo tanto un cambio sustancial es el valor de ellos no afectan para nada el valor de la mediana. - Con los datos agrupados en intervalos, la mediana depende del número intervalos elegidos, de su amplitud y de los límites de los mismos. - Puede ser calculada aunque algunos de sus intervalos carezcan de límites, siempre y cuando la mediana no se encuentre en ese intervalo, en cuyo caso tampoco podrá ser calculada. - La mediana debe ser utilizada cuando entre los valores que se estudian hay alguno muy diferente de los otros. - Es más representativa que la media cuando la distribución de frecuencias tiene puntuaciones muy extremas. 6.6 LA MODA (Mo) Llamada también modulo, modo, valor prevalerte, valor dominante, etc., es la medida de posición que nos da la magnitud del valor que se presenta con más frecuencia en una serie. Dicho en otras palabras. Se trata del valor de la variable que tiene mayor frecuencia absoluta. En un polígono de frecuencias corresponde al punto medio del rectángulo más alto. La moda es de gran utilidad cuando se desea obtener pronta información sobre un problema determinado. Ejemplo 16: La edad más frecuente de un grupo de egresados de un colegio, la estatura más común de un grupo de alumnos. 1. Datos no agrupados. La moda corresponde al valor de la variable que se presenta con mayor frecuencia. Ejemplo17: La moda de los números 2, 3, 4, 5, 2, 3, 2, es 2. NOTA: Si se tiene una variable con, máxima frecuencia, la distribución es unimodal. Si hay dos valores de la variable con la misma frecuencia máxima, la distribución es bimodal. Si hay más de dos, la distribución es multimodal.

139


En datos no agrupados puede suceder que no haya moda, cuando ninguno de los valores se repite. Algunos consideran la moda como un “promedio industrial” ya que la fabricación o la venta de un artículo puede estar determinado por la moda. 2. Datos agrupados. Para datos agrupados la moda se calcula mediante la siguiente fórmula:

Mo = L(

1

∆1+ ∆ 2

)(c)

Donde: L= Límite real inferior de la clase modal:

∆= 1

2

=

Diferencia de la frecuencia modal y la frecuencia de la clase contigua superior.

Diferencia de la frecuencia modal y la frecuencia de la clase contigua inferior.

C= Amplitud de la clase. Ejemplo 18: Hallar la moda de los datos presentados en la siguiente tabla.

140


PESO ( Kilos)

f

40 - 44

3

45 - 49

8

50 - 54

10

55 - 59

12

60 - 64

5

TOTAL

38

1

← Mo __________________________ . La clase modal es la clase que tiene la mayor frecuencia. Solución: La clase modal esta en 55 ya que aquí se encuentra la mayor frecuencia.

L=

50 + 59 = 54.5 2

141


∆ = 12 −10 = 12 ∆ = 12 − 5 = 7 1

2

c =5

Mo = 54.5 + ( Mo = 55.6

2 )(5) 2 +7

kilos

6.61. Características de la moda (Mg) La media geométrica es un promedio definido por una formula matemática. Se utiliza cuando se quiere dar importancia a valores pequeños de la variable cuando s desea obtener el promedio de una serie de valores que están dados en progresión geométrica o aproximadamente geométrica. Se define como la raíz-enésima de la productoria de los n valores de la variable. 1. Datos no agrupados. El promedio geométrico se calcula hallando el producto de todos los elementos de la serie, y luego extrayendo una raíz del orden del número de observaciones consideradas.

Mg = n

x1 • x2 • ... xn ,

Mg = n

n

∏x i =1

i

Ejemplo19: La media geométrica de los siguientes números: 2, 3, 5, 4, es: Mg = 4 2 • 3 • 4 • 5 Mg = 4 120 Mg = 3.30

NOTA: La formula de la media geométrica, tal como se ha visto, el inconveniente de que tanto el producto de los valores de las observaciones, así como de su raíz, puede ser de

142


un valor demasiado alto que dificulte las operaciones, así como por otra parte, si un valor de xi es cero, el producto también será cero. Para obviar las dificultades anteriores se usan los logaritmos:

x x ... x Mg = ( x1• x 2 •... x n ) Mg = n

1

2

n

1/ n

LogMg = Log

( x1• x2•...• xn)

1/ n

=

1 Log ( x1 • x2 • ... • xn ) n

=

1 ( Log x1 + Log x2 + ... + Log xn) n

Log Mg =

1 n ∑ Log xi n i =1 n

Mg = Anti Log

(∑ Log xi ) i =1

n

Ejemplo 20: Un capital de %1.000 se coloca a un interés del 30% anual, el primero de enero de 1985. Si el interés se capitaliza anualmente los días 31 de Diciembre, calcular el promedio de dinero invertido entre el primero de Enero de 1985 y el 31 de Diciembre de 1988. Solución: 1000(1.30)=1300 1300(1.30)=1690

143


1690(1.30)=2197 (Ver tabla en la página siguiente)

Mg = Anti log

12,683653 4

Mg = anti log(3.1709132),

Mg =$1.482,22

X

AÑOS

1

Log x1

1985

1000

3

1986

1300

3,1139943

1987

1690

3,22788

1988

2197

3,34183

TOTAL

-

12,683653

2. Datos agrupados. La media geométrica se define como la raíz enésima de la productoria de los valores de la variable, elevadas cada una de ellas a una potencia, la cual esta dada por la frecuencia absoluta.

Mg = Mg =

f1

f2

f3

x1 • x 2 • x3 • ... • x n n

∑f i =1

i

fn

Log xi

144


n

∑Logx

Mg = antiLog ( i =1

n

i

)

Ejemplo 21: Hallar la media geométrica de los datos presentados en la siguiente tabla.

f

PESO (Kilos) 40 - 44

5

45 - 49

10

50 - 54

7

55 - 59

6

TOTAL

28

i

Solución: Organizamos una tabla que nos facilite el cálculo numérico:

f

x

i

Log xi

42

1,623249

8,11624

47

1,76209

16,7209

52

1,7160

12,0120

57

1,75587

10,5352

i

Log xi

145


TOTAL

-

47,38434

47,38434 ) 28 Mg = AntiLog (1,6922978) Mg = AntiLog (

Mg = 49.23 Kilos Mg = 49.2 Kilos

6.7.1. Características de la media geométrica - Solo basta que haya un dato igual a cero para que la media geométrica sea igual a cero. - Si algún valor es menor que cero, la media geométrica no tiene sentido lógico. -Se puede comprobar que la media geométrica es menor o igual a la media aritmética. - Mientras mas dispersos estén los datos entre si, mayor será la diferencia entre la media aritmética y la geométrica. -Se utiliza cuando se desea saber la tasa promedio de crecimiento de una serie de datos, como una serie cronológica. 6.8. MEDIA ARMONICA (Ma) Está definida por una fórmula matemática. Se aplica cuando se desea promediar los datos de una variable dada en forma de tasas, esto es tantas unidades de un tipo por cada unidad de otra especie; también se utiliza para promediar datos inversamente proporcionales. 1. Datos no agrupados. Se utiliza la siguiente fórmula:

146


n

Ma =

1

1

+

x x 1

Ma =

+ ... +

2

1

x

n

n n

1

i =1

x

1

2. Datos agrupados.

n

Ma =

f x

1

f x

+

1

Ma =

2 2

+ ... +

f x

n n

n

f ∑ x n

i =1

i

i

Ejemplo 22: supongamos que la distancia entre dos ciudades A y B es 100 Km. y entre B y C 150 Km. Un automovilista recorre el primer trayecto a una velocidad de 100 km./h y el segundo trayecto a una velocidad de 120 km./h. Hallar la velocidad promedio del viaje completo.

Solución: Una forma incorrecta de solucionar este problema es utilizando la media aritmética, ya que la velocidad en los dos tramos es diferente.

X =

120 +100 = 110 Km. / h 2

(Incorrecto)

Debemos utilizar la media armónica que sería el promedio apropiado en este caso:

147


Vm =

S

s +s v v 1

1

s

2

S = 250,

v

2

1

= 100,

2

s = 100, v = 120 1

2

= 150,

Vm =

250 100 150 + 100 120

Vm = 111.11Km / h 6.8.1. Características de la media armónica. -En una distribución cualquiera la media armónica es menor que la media geométrica. - Está influenciada por los datos extremos, especialmente por los más pequeños. - No puede ser calculada si alguno de los datos de la distribución es cero. - Se utiliza en física para calcular velocidades promedio. 6.9. CARACTERÍSTICAS COMPARATIVAS DE LA MEDIA, MEDIANA MODA, MEDIA GEOMETRICA Y MEDIA ARMONICA. (Ver cuadro en la página siguiente). 6.10. MEDIAS DE POSICION: CUARTILES, DECILES Y PERCENTILES. Decimos que los cuartiles, deciles y percentiles no son medidas de tendencia central, si no medidas de posición que nos informan del orden o de la posición que ocupa un dato dentro del total de datos observados. Están definidos por fórmulas matemáticas y se utilizan cuando se trabaja con datos agrupados. 6.11. Cuartiles

(Q ), K = 1,2,3 K

148


Los cuartiles son los valores de la variable que dejan por debajo de si:el 25%, 50%, y 75% del total de las puntuaciones. i. El primer cuartil

(Q ) 1

es el valor de la variable que supera al 25% de las

observaciones y a la vez, es superado por el restante 75%. ii. El segundo cuartil

(Q ) 2

es el valor de la variable que supera al 50% y a la vez es

superado por el otro 50% de las observaciones. iii. El tercer cuartil es el valor de la variable que supera al 75% y es superado por el restante 25%. Para calcular los cuartiles, utilizamos la siguiente fórmula.

Q

K

nk − fd = L( + 4 )(c), donde : f Qk

L = Limite real inferior de la clase cuartil. n= Total de datos K= Número de datos por debajo de la clase cuartil

f Qk = Frecuencia absoluta del cuartil buscado c= Amplitud de clase

∗nk = indica la clase donde esta ubicado el cuartil que se desea encontrar 4 149


6.12. DECILES

(D )

K = 1,2,…,9

K

La distribución se divide en diez partes iguales. - El primer decil

(D ) 1

es igual al valor que supera al 10% de las observaciones y a la

vez es superado por el restante 90%. - El segundo decil

(D ) 2

es igual al valor que supera al 20% de las observaciones y a

la vez es superado por el restante 80%, y así sucesivamente hasta el noveno decil. Para calcular los deciles empleamos la siguiente formula:

D

k

nk − fd = L + ( 10 )(c ), f Dk

k=1,2,…,9

Donde: L= limite real inferior de la clase decil n= Total de datos K= Número de datos por debajo de la clase decil.

f Qk = Frecuencia absoluta del decil buscado. c= Amplitud de clase

∗nk = indica la clase donde esta ubicado el decil buscado. 4 150


6.13 PERCENTILES

( P ),

K= 1,2,…,99

K

La distribución se divide en 100 partes iguales - El primer percentil

(P ) 1

es igual al valor que supera al 1% de las observaciones y a

la vez es superado por el restante 99%. - El segundo percentil

(P ) 2

es igual al valor que supera al 2% de las observaciones y

a la vez es superado por el restante 98%, y así sucesivamente hasta el centésimo percentil. Se utiliza la siguiente formula:

p

k

 nk  − fd (c ),  100  =L+ f Dk

k=1,2,…,99

Ejemplo 20: La siguiente tabla nos muestra los pesos de 50 estudiantes del colegio X.

PESO (libras)

f

118 - 126

3

127 - 135

5

136 - 144

18

145 - 153

6

154 - 162

10

163 - 171

8

TOTAL

50

i

151


Con relación a la tabla anterior calcular e interpretar: a.

Q

3

b.

Solución: n=50,

D

4

c.

P

46

k=3

nk 50 × 3 = 37.5 4 4 145 +162 a. L= = 153.5 2 fd = 3 + 5 +18 + 6 = 32

este valor esta ubicado en la quinta clase

f Q3 =10 c =9

Por lo tanto:

Q

Q

3

3

=153.5 + (

37.5 −32 )(9) 10

= 158.45 libras.

Esto significa que el 75% de los Estudiantes pesan 158.4 libras o menos.

b.

nk 50 × 4 = = 20 10 10

Esta ubicado en la tercera clase

152


127 +144 =135.5 2 fd = 3 + 5 = 8

L=

f D4 =18 c =9 Luego:

D D

20 − 8 )(9) 18 = 141.5 libras 4 = 135.5 + ( 4

Esto quiere decir que el 40% de los estudiantes pesan 141.5 libras o menos.

c.

nk 50 × 46 = 23 100 100 127 +144 L= = 135.5 2 fd = 3 + 5 = 8

f

P46

= 18

c =9 Con lo anterior tenemos:

P

46

=135.5 + (

23 −8 )(9) 18 153


P

46

= 143 libras

Podemos concluir que el 46% de los alumnos pesan 143 libras o menos. 6.14. CARACTERÍSTICAS DE LOS CUARTILES, DECILES Y PERCENTILES - generalmente, se aplican en variables continuas, cuando tienen un número grande tanto de intervalos como de observaciones, y se examina tan solo una parte de la distribución que presenta una característica especial de ser estudiada. _ El segundo cuartil, el quinto decil y el percentil – 50 son iguales a la mediana. Ejercicios 1. las calificaciones de un estudiante en 5 asignaturas fueron: 3.8, 6.5, 7.4, 8.3 y 9.3. Hallar la media aritmética de dichas calificaciones. 2. Hallar la mediana y la moda para los siguientes conjuntos de datos:

a. 7, 4, 8, 6, 5, 1, 7, 9, 2 b.15, 18, 13, 10, 6, 2, 3, 10, 3, 2 3. Hallar la media geométrica y la media armónica para los siguientes conjuntos de datos: a. 3.8,

4, 6

b. 4,

8.5,

10,

7

4. Para la siguiente distribución de datos agrupados DISTRIBUCION DE FRECUENCIAS ESTATURA DE ALUMNOS ESCUELA X ESTATURA (cm)

f

i

154


120 - 129

7

130 - 139

10

140 - 149

12

150 - 159

15

160 - 169

3

170 - 179

6

TOTAL

53

Con relación a la tabla anterior calcular e interpretar: Media, Mediana y Moda.

5. Las calificaciones de un estudiante en 3 asignaturas fueron 7.1, 6.8 y 8.3 a. si los pesos asignados a cada asignatura son 2, 4 y 6, respectivamente. ¿Cuál es el promedio adecuado para sus calificaciones? b. ¿Cuál seria si todos los pesos fueran iguales? 6. Tres profesores de matemáticas registraron una calificación media en sus exámenes de 7.5, 8.1 y 6.7; sus clases estaban formadas por 32, 25, y 40 estudiantes, respectivamente. Determinar la calificación media para todas las clases. 7. Las ciudades A, B y C son equidistantes entre si. Un automóvil viaja de A a B a 30 km/h y de C a A a 50 km/h. Determinar el promedio de velocidad para el viaje completo. 8. Un automovilista viaja de A a B a una velocidad media de 40 km/h y vuelve de la ciudad B a A a una velocidad de 60 km/h. Hallar la velocidad media del viaje completo.

155


9. Un capital de $5000 se invierte al 28% anual. ¿Cuál será el capital total después de 5 años si el capital inicial no se ha retirado? 10. Se sabe que la media aritmética de dos números es 5 y la media geométrica de los mismos es igual a 4. ¿Cuál es la media armónica? 11. El precio promedio de un centenar de artículos es $185.70, los artículos se dividen en dos grupos, con medias de $175.80 y $197.80 ¿Cuántos artículos hay en cada grupo? 12. La media aritmética de 3 números es 4, la mediana es 4 y su media geométrica es 3

60. calcular los valores de estos tres números.

13. La siguiente tabla nos muestra los salarios de 49 empleados de una empresa X

SALARIOS (MILES DE PESOS)

P

92

D

8

I

30-38

3

39-47

12

48-56

7

57-65

19

66-74

8

TOTAL

49

Con relación a la tabla anterior calcular e interpretar (tercer cuartil),

f

(octavo decil),

D

3

Q

1

(tercer decil),

(primer cuartil),

P

15

Q

3

(percentil quince),

(percentil noventa y dos)

156


14. a. Demostrar que la media aritmética de geométrica de

xyx 1

2

x,x 1

2

es mayor o igual que la media

.

b. ¿Cuándo serán la media aritmética y geométrica iguales? 15. Contestar verdadero (V) o falso (F), según el caso: a. La media aritmética se utiliza en física para calcular velocidades promedio V F b. La mediana es mas representativa que la media cuando la tiene puntuaciones muy extremas.

V F distribución

c. Mientras mas dispersos estén los datos entre si, menor será la entre la media aritmética y la geométrica.

V F diferencia

d. La moda en el polígono de frecuencias corresponde al punto rectángulo más bajo.

V F medio del

e. El cuarto decil es igual al percentil cuarenta.

V F

16. completar las siguientes expresiones: a. La _________________________________ se presta a tratamientos algebraicos. b. La _________________________________ es el valor que se presenta con mayor frecuencia en una serie de datos. c. La mediana es aquel valor que divide el grupo de datos en ________________________________________________________________________ d. El percentil _____________________________ y el cuartil __________________ _____________________________ coinciden con el valor de la mediana e. Una distribución que tiene 2 modas se llama __________________________ y si tiene 3 modas se llama______________________________________________

157


CAPITULO VII

DISPERSION

OBJETIVOS

158


- Definir e identificar las medidas de dispersión. - Calcular e interpretar las medidas de dispersión en datos agrupados y no agrupados. - interpretar problemas estadísticos con la ayuda de la curva normal.

7.1 MEDIDAS DE DISPERSION En el capítulo anterior sintetizamos toda una muestra de datos representándolos por estadígrafos calculados a partir de la misma, como el caso de la media aritmética. En este capítulo se hace un análisis de otra importante característica de las distribuciones de frecuencia al cual nos ayuda a entender completamente el estudio de cualquier distribución. Algunos valores son pequeños y otros son grandes. La variación de estos valores es llamada DISPERSION y puede ser medida de diferentes maneras, siendo la más importante la dispersión de los valores alrededor de la media. Esta característica siempre debe ser tenida en cuenta en el análisis de cualquier distribución. Una medida de dispersión puede ser útil en dos sentidos: i. Puede ser usada para indicar el grado de variación entre todos los valores de una serie de datos. ii. Una medida de dispersión puede ser usada para que con un promedio se describa una muestra y se aprecie la homogeneidad de un grupo de datos. Si la dispersión es grande, el valor del promedio no tiene meritos; pero cuando la dispersión es pequeña, el valor del promedio es altamente significativo. Ejemplo 1: El promedio de los números 3, 4 y 20 es 9, puesto que 9 no esta cerca de ningún valor: es de esperar que la dispersión de los datos sea grande. Sin embargo, considerando un segundo grupo de datos tales como 8,9 y 10 el promedio es 9 el cual es próximo a los valores dados y por lo tanto este segundo grupo proporciona una mayor confiabilidad en el promedio.

159


Es de anotar que aunque los dos conjuntos de datos tienen igual media aritmética, para el primer grupo de números el promedio no es más apropiado puesto que la dispersión es grande. Las medidas de dispersión más comunes son:

- Rango o Recorrido

- Desviación media

- La Varianza

- Desviación Típica o Estándar

- Coeficientes de variación

- Desviación Cuartita

7.2 RANGO O RECORRIDO Es la medida de dispersión más fácil de calcular, pues basta restar del mayor valor muestral el menor de ellos.

R=x

max imo

−x

min imo

Esta diferencia sólo tiene significado cuando es muy pequeña, ya que no informa nada sobre el comportamiento de los otros datos diferentes al menor y al mayor. Ejemplo 2: calcular el rango recorrido de los siguientes datos: 2, 8, 10, 3, 4. Solución: R= 10-2 R= 8 7.2.1 Características del rango - Solo se basa en los valores extremos; es fácil de calcular. - Puede ser influenciado por los mismos extremos cuando estos son supremamente raros, hasta tal punto que puede dejar de ser una medida de dispersión. - No es afectado por valores intermedios; por lo tanto no es una medida ideal de dispersión.

160


7.3 DESVIACION MEDIA

(D ) M

También denominada desviación promedio, es la media o promedio de la suma de las desviaciones por la frecuencia (El signo se toma se toma siempre positivo), de alguna medida de tendencia central que generalmente es la media, pero en algunos casos se usa la mediana o la moda. Su formula es: n

D

M

=

∑X i =1

I

−X

f

I

n

Es similar el uso de la formula para datos no-agrupados y datos agrupados. Ejemplo 3: En una prueba de tiro al blanco de cuatro anillos, dos competidores, Arango y García, obtuvieron los resultados que se indican. ¿Cuál es el mejor? (Ver tabla en la página siguiente) Solución: Ambos competidores lograron el mismo puntaje y tienen el mismo promedio; sin embargo el resultado de García es más consistente ya que su desviación media es menor.

161


COMPETIDOR ARANGO

f

x

i

f x

i

x −x

i

i

i

f x −x i

i

0

4

0

10

40

5

10

50

5

50

10

12

120

0

0

15

4

60

5

20

20

7

140

10

70

TOTAL

37

370

--

180

x=

370 = 10 37

DM =

180 = 4,86 37

COMPETIDOR GARCÍA

162


f

x

i

f x

i

i

f x −x

x −x

i

i

i

0

2

0

10

20

5

10

50

5

50

10

15

150

0

0

15

6

90

5

30

20

4

80

10

40

TOTAL

37

370

--

140

x=

370 = 10 37

DM =

i

140 = 3,78 37

Ejemplo 4: Calcular la desviación media con los datos de la siguiente tabla: PESOS (Kilos)

f

58 - 60

5

61 - 63

8

64 - 66

7

67 - 69

13

TOTAL

33

i

Solución:

163


Primero calculamos la media aritmética y luego hallamos la desviación media.

x

i

x=

D

x f i

i

x −x

x −x f

i

i

59

295

5.54

27.7

62

496

2.54

20.32

65

455

0.46

3.22

68

884

3.46

44.98

TOTAL

2130

-

96.22

i

2130 = 64.54 kilos 33

M

=

96.22 = 2.91 kilos 33

Podemos decir que la dispersión de los datos con respeto a la media es de 2.9 kilos. 7.3.1. Características de la desviación - La desviación media está basada en todos y cada uno de los valores muéstrales. - Por ser calculada con base en un promedio, la desviación media mide el grado de dispersión respecto a esos valores. - Debido a que la desviación media se calcula como un promedio absoluto de desviaciones, se considera una medida débil de dispersión. - Es una medida de dispersión bastante objetiva: - Cuanto mayor sea su valor mayor es la dispersión de los datos. -Su mayor uso corresponde a aquellas distribuciones cuyos valores extremos no están definidos, o cuando el promedio esta afectado por valores grandes de la

164


Variable, que obligan a calcular la mediana. 7.4 LA VARIANZA

(s ) 2

Se define como la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución. La formula es: n

s

2

=

∑ x f 2

i =1

i

n

i

= −x

2

(La demostración se deja como ejercicio). Ejemplo 5: Calcular la varianza de los datos presentados en la tabla adjunta.

EDAD (Años)

f

i

165


5 - 9

3

10 - 14

2

15 - 19

12

20 - 24

8

25 - 29

7

TOTAL

32

Solución: Calculemos x y luego la varianza

x

i

x=

x f i

(x −x) (x −x) f 2

i

i

2

i

7

21

148.84

446.52

12

24

51.84

103.68

17

204

4.84

58.08

22

176

7.84

62.72

27

189

60.84

425.88

TOTAL

614

-

1096.88

614 = 19.18 años, 32

i

x =19.2 años

166


s

2

=

1096.88 = 34.27 años 32

s

2

= 34.3 años

La dispersión de los datos respecto a la media en unidades cuadradas es de 34.3 años. 7.4.1 Propiedades - La varianza debe ser simple un valor positivo.

s

2

=> 0

- La varianza de una constante es igual a cero.

∑ f ( k −k ) n

v[

= k]

i =1

2

1

n

=0

(Se vio que la media de una constante es igual a la constante). - La varianza de la suma (o resta) de una variable más o menos una constante es igual a la varianza de la variable.

v[

x+ k ]

= v[ x ] + v[ k ]

= v[ x ] + 0

= v[ x ]

- La varianza de una constante por una variable es igual al producto de la constante al cuadrado por la varianza de la variable.

167


v[

kxi ]

=k

2

v[

(Demostrar esta propiedad)

xi ]

7.4.2. Características de la varianza - La varianza es una primera aproximación sobre la cuantificación del grado d variabilidad de una distribución cualquiera. - Para comparar dos distribuciones, en cuanto a su variabilidad absoluta, se pueden utilizar sus varianzas, indicándonos el resultado cuál de ellas es más homogénea o cuál es más heterogénea. - La varianza presenta el inconveniente de expresar el grado de dispersión de una variable en unidades diferentes a las que se tenía originalmente. - No es recomendable su cálculo cuando tampoco lo sea el de la media como medida de tendencia central. - Sirve de base para calcular la desviación típica que es la más importante de todas las medidas de dispersión. 7.5 DESVIACION TIPICA (S) Esta medida, la más importante y utilizada de los parámetros de dispersión, es de fácil tratamiento algebraico. Se basa en la totalidad de las observaciones y se define como la raíz cuadrada del valor de la varianza. Para su cálculo se emplea a la siguiente formula:

∑( xi −x ) f n

s=

2

i =1

i

n

Ejemplo 6: Calcular la desviación típica del ejemplo anterior. Solución: s 34.3 años 2 = 5.85 años

168


s= 5.85 años.

La dispersión de los datos respecto a la media es de 5.8 años.

7.5.1. Características de la desviación típica - Se calcula en función de todos y cada uno de los valores de la variable. - Son índices muy sensibles a la variación de cualquier puntuación de la variable, basta que varíe una puntuación Para que cambie la desviación típica. - Es la medida de dispersión que más se utiliza y solo es aplicable en variables cuantitativas. - Es la mínima medida de dispersión en cuanto a desviaciones cuadráticas se refiere. - Su utilidad se debe a que ella junto con el promedio ayuda a determinar los límites dentro de los cuales se encuentran las observaciones que se estudian, en tal forma, que basta conocer el promedio y la desviación típica para reproducir toda la información contenida en los datos originales, salvo desde luego, pequeñas variaciones. Esta interpretación se basa en las propiedades de la curva normal.

7.6 CURVA NORMAL Cuando se tiene una distribución simétrica, la media aritmética de la población debe estar ubicada en el centro de la distribución. Si además de obtener el promedio, hacemos la representación grafica de un polígono de frecuencias, que al suavizarla, se tendrá una curva conocida con los nombres de curva normal, de error o campana de Gauss. Se ha comprobado que un gran número de fenómenos tanto biológicos, como sociales, se distribuyen de forma normal.

169


7.6.1. Características de la curva Normal - La curva normal es simétrica respecto a su media. - Al ser una curva simétrica, la media, mediana y moda coinciden, por lo que el 50% del área está a la derecha de la media y el 50% a la izquierda. - El área total comprendido entre la curva y el eje de abscisa (eje horizontal) es igual a 1. - La distancia horizontal que hay desde el punto de inflexión de la curva (donde se presenta un cambio de concavidad), hasta una perpendicular levantada sobre la media es igual a la desviación típica. 7.6.2 Propiedades de la desviación estándar - Teniendo en cuenta que la desviación estándar es el más utilizado de los parámetro de dispersión, hacemos la siguiente referencia a su significado. - Entre la media y una desviación estándar, por encima y debajo, se tendrá el 68.3% de las observaciones. x ±S

}68.3%

- Entre la mitad y do veces la desviación típica, a un lado y otro de la media, se tendrá el 95.5% de los casos. x ± 2S

}

95.5%

- Si a la media se le suma o resta tres veces la desviación típica, dicho intervalo abarcara el 99.7% de los datos. x ± 3S

}

99.7%

Gráficamente

170


Ejemplo 7: la media de las estaturas de 1500 estudiantes de una escuela x es de 145 cm y la desviación típica 8 cm. Suponiendo que las estaturas se distribuyen normalmente. Averiguar la estatura y el número de alumnos que están incluidos en los siguientes intervalos. a.

b.

x ±S ;

Solución: N= 1500

x ±2S ;

x =145cm,

c. x ±3S S= 8 cm

x = x − S = 145 − 8 = 137cm x = x + S = 145 + 8 = 153cm 1

a. sea

2

x = 137cm x = 153cm 1

2

El número de estudiantes que miden entre 137 153 cm es 1500 (0.683)=1024.5=1024 estudiantes.

b.

x = x − 2S = 145 − 2(8) = 145 − 16 = 129cm x1 = 129cm x = x + 2S = 145 + 2(8) = 145 + 16 = 161cm x2 = 161cm 1

2

171


O sea que el 95.5% de los estudiantes miden entre 129 y 161 cm, en este caso equivale a: 1500 (0.955)= 1432.5 = 1432 estudiantes.

c.

x = x − 3S = 145 − 3(8) = 145 − 24 = 121cm x1 = 121cm x = x + 3S = 145 + 3(8) = 145 + 24 = 169cm x2 = 169cm 1

2

De lo anterior, el 99.6% de los estudiantes miden entre 121 y 169 cm, es equivalente a: 1500(0.977) = 1465.5

≈ 1465 estudiantes

7.7. COEFICIENTE DE VARIACION

(C ) V

Hasta ahora solo se han estudiado los diversos métodos de analizar el comportamiento de conjuntos aislados de datos. Este estudio lo hemos hecho a través de estadígrafos de posición tales como la media aritmética, mediana, moda, etc., y de estadígrafos de dispersión tales como la desviación típica. Sin embargo, hay otro problema no menos importante. Cuando nos enfrentamos ante dos conjuntos diferentes de datos de la misma índole, nos vemos en la necesidad se saber cuál es más homogéneo. El análisis estadístico nos lleva a apreciar, por medio del coeficiente de variación, cuál de dos o más conjuntos de datos es más homogéneo. Para su cálculo se utiliza la formula siguiente:

c

v

s = • 100% x

Ejemplo 8: En dos pruebas de conocimiento A y B, la prueba A se califico sobre 100 puntos; la media aritmética de las calificaciones fue de 72 puntos con una desviación típica de 9. La prueba B se calificó sobre 80 puntos y los resultados dieron una media de

172


52 puntos con una desviación típica de 6. Halle en cuál de las dos pruebas hubo mayor dispersión. Solución: PRUEBA A

PRUEBA B

x = 72

x = 52

S =9

S =6

9 C.V . = •100% 72 C.V =12,5%

6 •100% 52 C .V =11,5% C .V . =

En la prueba A se presentó mayor dispersión Como el coeficiente de variación de la prueba A es mayor que el de la prueba B, podemos decir que la prueba A presenta mayor dispersión que la prueba B. 7.7.1. Características del coeficiente de variación - Solo puede ser aplicado para variables cuantitativas. - Este coeficiente se emplea cuando se desea comparar dos o más distribuciones, con el fin de determinar cuál de ellas tiene mayor o menor variabilidad relativa. - Su uso se hace necesario cuando dichas distribuciones están dadas en unidades de medida diferentes, y por tanto, en estos casos, no se podrá comparar las varianzas o las desviaciones típicas. 7.8 RECORRIDO INTERCUARTIL El recorrido intercuartil es aquel comprendido entre el primero y el tercer cuartiles. Su utilidad consiste en que dentro de los límites determinados por él, se encuentra el 50% de las observaciones “centrales” generalmente no afectadas por las fluctuaciones extremas de la serie. El recorrido intercuartil mide la dispersión de los valores de la serie, pues mientras más próximos sus límites, mayor concentración de las observaciones alrededor de la mediana. Ejemplo 9: Con las notas de algebra de dos grupos de alumnos se calcularon los siguientes estadígrafos

173


GRUPO A

GRUPO B

Mediana = 8

Mediana = 8

Q =7 Q =9

Q =4 Q =9

1

1

3

3

Observamos que a pesar de que la mediana es 8 para ambos grupos, en el primero 50% de los alumnos tienen valores muy próximos a ella y en cambio, en el segundo grupo, la dispersión es mayor. Sin la información adicional suministrada por el cálculo de los cuartiles el resumen de la serie quedaría incompleto. En ocasiones se calcula la desviación cuartil

(Q ) D

Q yQ 1

3,

que es simplemente la mitad del

recorrido intercuartil.

(Q ) = Q −2 Q 3

1

D

Si la serie es perfectamente simétrica, entonces: La mediana

±Q

D

encierra el 50% de las observaciones.

Si por el contrario la serie es muy asimétrica, lo anterior no es verdadero y en tales casos la desviación cuartil sugiere una interpretación errónea, razón por la cual, casi nunca se utiliza.

174


Ejemplo 10. Distribución de edades de las mujeres ingresadas a la sala de maternidad del hospital del hospital X. calcular: Recorrido intercuartil y desviación cuartil. (Ver tabla en la página siguiente). Solución: Hallamos los cuartiles n 34 = = 8.5, 4 4

Q yQ 1

3,

c =4

EDAD (Años)

f

16 - 19

5

20 - 23

8

24 - 27

12

28 - 31

3

32 - 35

6

TOTAL

34

1

16 + 23 =19.5 2 fd = 5

L=

f Q1 = 8

O sea que

8.5 − 5 )( 4) 1 8 Q = 21.25 años ≈ 21.1 años

Q

= 19.5 + (

1

175


Ahora:

3n 3 ×34 = = 25.5 4 4 24 + 31 L= = 27.5 2 fd = 5 + 8 +12 = 25 f Q3 = 3 c =4 Luego:

Q

3

Q

3

= 27.5 + (

25.5 − 25) (4) 3

= 28.16 ≈ 28.2 años

Luego:

Q − Q 28,2 − 21,2 = 7 Q −Q = 7 3

1

3

1

Por lo tanto

Q

D

Q

D

=

Q −Q 3

1

2 = 3.5 años

=

28.2 − 21.20 = 3.5 años 2

Es decir, la distribución de las edades de las mujeres ingresadas al hospital presenta una variación cuartil de 3.5 años.

176


7.8.1. Características del recorrido intercuartil - Se basa en dos valores

Q yQ 1

3,

y por lo tanto no se ve afectada por otros

valores diferentes de ellos. - Los cuartiles

Q yQ 1

3,

comprenden el 50% de todos los dato, un recorrido

intercuartil pequeño indica poca variación entre los valores centrales que representan el 50%. - Es una medida de dispersión más informativa que el rango. 7.9. ¿CUANDO DEBEN SER UTILIZADAS LAS MEDIDAS DE DISPERSION? Como ya vimos, una medida de tendencia central por si misma nos proporciona poca información de la distribución de frecuencias. Para describir una distribución de forma más completa necesitamos más información. Esta información adicional nos la proporcionan las medidas de dispersión. En la siguiente tabla se muestran las parejas de índices estadísticos descriptivos más empleados en estadística para describir una distribución de frecuencias. MEDIDAS DE TENDENCIA CENTRAL Media:

x

Mediana: Md Moda: Mo

MEDIDAS DE DISPERSION Varianza :

S

2

Desviación típica: S Desviación Cuartil

Q

D

Amplitud o Rango: R

EJERCICIOS

177


1. Hallar la desviación media de los siguientes números: 2, 4, 5, 6, 3, 1, 7 2. Calcular la varianza y la desviación típica de los siguientes conjuntos de datos: a. 2, 3, 4, 6, 9, 1

b. 5.3, 8.1, 6.5, 7.1

3. La siguiente tabla nos muestra una distribución de frecuencias de las calificaciones de un examen final de matemáticas en un colegio A. CALIFICACIONES

FRECUENCIAS

4.0 - 4.9

10

5.0 - 5.9

15

6.0 - 6.9

20

7.0 - 7.9

13

8.0 - 8.9

12

9.0 - 9.9

14

TOTAL

84

Hallar e interpretar: desviación media, varianza, desviación típica, coeficiente de variación y desviación cuartílica.

178


4. La información que se presenta a continuación nos muestra la media y la varianza de las estaturas de los alumnos de dos colegios A y B. Varianza (

(cm )

Colegio

Media (cm)

A

150,3

27,04

B

153,6

37,21

2

¿En que colegio se presenta mayor dispersión y porque? 5. La medida de dos números es 7 y la varianza es 1. Hallar los números. 6. En un examen de Español la puntuación media de un grupo de 150 estudiantes fue 8.8 y la desviación típica fue 8.0. En Sociales sin embargo, la media final del grupo fue de 8.3 y la desviación típica 7.6. ¿En que asignatura hubo mayor dispersión? 7. La medida de 10 observaciones es 3 y la suma de los cuadrados es 100. Encontrar la varianza del conjunto. 8. Contestar verdadero (V) o falso (F), según el caso: a. El rango es una medida de dispersión confiable. b. La desviación media esta basada en todos y cada uno de muéstrales.

V F V F

c. La desviación típica no es sensible a la variación de cualquier puntuación de la variable.

V F

d. El área total comprendida entre la curva normal y el eje de (eje horizontal) es igual a 1.

V F

e. La varianza presenta el inconveniente de expresar el dispersión de una variable en unidades diferentes originalmente.

los valores

abscisa

V F grado de a las que se tenía

9. Completar Las siguientes expresiones:

179


a. El _________________________________________ se emplea cuando se desea comparar dos o más distribuciones para saber cual es más homogénea. b. La ________________________________________ es el promedio de las desviaciones de las puntuaciones a partir de su media, elevadas al cuadrado. c. La desviación típica es la ________________________________ de la varianza. d. El _______________________________ de un conjunto de observaciones es la diferencia entre la menor y la mayor. e. La _________________________________ es simétrica respecto a su media. 10. La altura en centímetros de 20 alumnos de una escuela aparece en la siguiente tabla. ¿Cuál será el valor de S?

f

ALTURA 125 - 128

2

129 - 132

4

133 - 136

7

137 - 140

6

141 - 144

1

TOTAL

20

1

11. La media de 20 observaciones es 5 y la suma de los cuadrados es 634. Encontrar la varianza del conjunto. 12. los valores registrados en dos variables distintas (x: peso (kilos); y: presión sanguínea (mm de Hg) para un mismo grupo de personas han sido las que se muestran en la tabla adjunta. ¿Cuál es la variable que presenta mayor dispersión? X

Y

180


50

165

65

150

72

184

80

193

TRABAJO PRÁCTICO A. Objetivo: Formular un problema que sea objeto de la investigación estadística y aplicar la mayor parte de los conceptos estudiados en este curso. B. Metodología: A continuación le presentamos una serie de recomendaciones que usted debe en cuenta al presentar el siguiente trabajo. 1. Formular un problema que sea objeto de estudio estadístico. Le sugerimos estudiar uno de los siguientes: peso, estatura, edad, notas de un grupo de estudiantes de un centro docente. 2. determinar el objetivo general y los objetivos específicos. 3. ¿Cuál es la población? 4. ¿Cuál es la muestra? ¿y tipos de muestras empleadas? 5. ¿Cuál es la variable? 6. Elabore una pequeña encuesta en la que se pueda recolectar información para el problema en estudio. 7. Hacer una tabulación inicial con los datos obtenidos del problema estudiado. 8. Elaborar una tabla de frecuencias. 9. Realizar las siguientes graficas: Histograma, Polígonos de frecuencias, de repartición porcentual. Calcular e interpretar:

181


10. Las medidas de tendencia central, Media, y Moda. 11. Las medidas de posición

Q .D .P 1

3

15

. y P90

12. Las medidas de dispersión: desviación típica, Varianza, Desviación cuartil. 13. Conclusiones. c. Evaluaciones. Para la calificación del trabajo se tendrá en cuenta los siguientes aspectos 1. Normas INCONTEC 2. Elaboración de la encuesta 3. Cálculos matemáticos 4. Presentación de tablas y graficas estadísticas. 5. Conclusiones.

CAPITULO VIII

CORRELACION Y REGRESION

182


OBJETIVOS

- Interpretar y manejar los conceptos de regresión y correlación. - Predecir el comportamiento futuro de dos variables a partir de valores dados de ellas y determinar la contabilidad de esa predicción. - desarrollar destrezas para construir y analizar curvas de regresión.

8.1 CORRELACION Y REGRESION Uno de los propósitos más frecuentes o comunes en una investigación, es determinar si las variables involucradas tienen o no relación, por ejemplo: determinar la relación entre altura (x) y peso(y), o entre la potencia (x) y la velocidad (y) de un automóvil, o entre la cantidad de fertilizantes(x) y la producción de trigo (y), o entre propaganda (x) y ventas (y), de ser así obtener un índice numérico que nos indique la cuantía de esa relación. Después de encontrar la afinidad entre las variables, es importante llevar ésta a una ecuación matemática que nos permita predecir valores futuros o intermedios que no han sido considerados inicialmente. Como ya hemos visto, variable dependiente es aquella que varia en función de otra. Es decir, sus valores dependen de los valores de la otra.

183


Ejemplo 1: Si M metros de tela cuestan P pesos, podemos decir que P es la variable dependiente y M la independiente, pues si aumenta el número de metros de tela aumente el precio y si disminuyen los metros, disminuye el precio. 8.2 CORRELACION Los requerimientos de las ciencias van más allá del comportamiento de una variable y en muchos de sus problemas necesita investigar la relación entre dos o más variables. Así por ejemplo: ¿Existe alguna relación entre las calificaciones obtenidas por los estudiantes en sus exámenes de admisión en el colegio San José y su rendimiento académico es él? ¿Existe alguna relación entre la publicidad de un artículo determinado y sus ventas? Si existen relaciones de asociación entre las variables entonces, ¿Será posible hacer estimaciones del valor de una de ellas conociendo el valor de la otra variable? Dar respuesta a esta clase de interrogantes es el tema central de la corrección. De todo lo anterior podemos concluir que la correlación sirve para medir el grado o la fuerza de asociación entre dos variables.

8.3 DIAGRAMAS DE DISPERSION Para hacer el análisis de la correlación entre dos variables, lo primero que debe hacerse es ubicar los puntos en un diagrama Cartesiano y con ello obtenemos información sobre la relación o no de las variables. Se puede presentar los siguientes casos.

184


Para investigar la correlación entre dos variables, en estadística se han creado los coeficientes de correlación que permite expresar cuantitativamente el grado de relación que existe entre ellas. La naturaleza de las distribuciones que se correlacionan, sus escalas de medida y sus características, son los factores determinantes para la selección de la técnica y del coeficiente de correlación que se aplica. 8.4 COEFICIENTE DE CORELACIÓN DE PEARSON Utilizamos la formula siguiente par determinar si las variables tienen ó no relación.

r=

n∑ xy − ∑ x∑ y

∑ x − (∑ x) 2

2

n∑ y 2 − ( ∑ y )

2

Podemos encontrar los siguientes casos: a. r=0, indica ausencia de correlación, es decir, que las dos variables son independientes. b. Los valores del coeficiente de correlación de Pearson se encuentran entre los valores de -1 y 1.

185


-1 >r <1 c. Cuando se obtiene un valor grande de r (ya sea positivo o negativo), indica una fuerte relación entre dos variables. Un valor positivo r, indica que los valores grandes de la variable x se asocian con valores grandes de la variable y, y los valores bajos de la variable x se asocian con valores bajos de la variable y. d. Si r es exactamente -1 ó +1, quiere decir que hay perfectamente asociación entre las dos variables, en el sentido que por cada unidad que aumenta ó disminuye una variable, la otra cambia siempre igual al número de unidades. Ejemplo 2: E el cuadro siguiente, se presenta el peso y la estatura de 5 estudiantes. Hallar el coeficiente de relación de Pearson e interpretar el resultado obtenido. ESTATURA Y PESO DE ALUMNOS DEL COLEGIO X ALUMNOS

ESTATURA (X) (cms)

PESO (Y) (kilos)

1

162

58

2

158

58

3

155

56

4

162

60

5

170

68

Solución: 1. En el plano cartesiano, ubicamos los puntos de las variables x, y.

186


2. Para facilitar los cálculos del coeficiente de correlación Lineal de Pearson. Construimos la siguiente tabla. n

x

y

xy

x

1

162

58

9396

26244

3364

2

158

58

9264

24964

3364

3

155

56

8640

24025

3136

4

162

60

9720

26244

3600

5

170

68

11560

28900

4624

TOTAL

807

300

48520

130377

18088

2

y

2

De la tabla tenemos:

∑x =807

(∑ x)

∑y =300

(∑ y )

∑xy = 48520,

2

= ( 807 ) = 651249 2

2

= ( 300 ) = 90.000

∑x

2

2

=130377,

∑y

2

=18088

187


3. Calculamos el coeficiente de correlación:

r=

n∑ xy − ∑ x∑ y

∑ x − (∑ x) 2

r=

2

n∑ y 2 − ( ∑ y )

2

5 × 48520 − 807 ×300 5 ×130377 − 651249 5 ×18088 − 90000

r= 0.94

188


4. Interpretación. Este valor nos indica que hay una correlación lineal positiva alta, por lo tanto para valores grandes de la variable estatura, hay asociados valores grandes de la variable peso, y viceversa. 8.5. REGRESION Después de haber encontrado la correlación entre las dos variables, podemos relacionarlas mediante una ecuación matemática que nos permite calcular otros valores, que no se hayan considerado inicialmente. Existen varios métodos para ajustar los puntos a una línea recta, en nuestro caso emplearemos el método de los mínimos cuadrados. 8.5.1. METODO DE LOS MINIMOS CUADRADOS Para emplear este método, debemos determinar el valor promedio de x, el valor promedio de y, el valor promedio de

x

2

y el valor promedio de xy para todos los

datos en conjunto y exigiremos que estos promedios satisfagan la ecuación: y=ax+b y, además, la ecuación multiplicada por x, es decir, xy=

ax

2

+ bx. En esta forma

obtenemos dos ecuaciones que nos permiten calcular a y b, para la recta requerida. Se puede demostrar que si se emplea este método, se obtiene una recta para la cual la suma de los cuadrados de los residuos es mínima. Debido a esto el método recibe el nombre de método de mínimos cuadrados. Para encontrar los valores a y b se puede hacer lo siguiente:

189


PRECESO

RAZÓN

1. y = ax + b 2.

1. Ecuación de la línea recta

2

xy = ax + bx

2. Multiplicando ambos miembros De 1 por x

n

3.

n

∑ yi = ∑ax + ∑b i =1

i

i =1

3. Aplicando la notación sumatoria

i =1

1 (puesto que el proceso se realiza Para n puntos) n

4.

∑x y i =1

i

n

i

= ∑ ax 2i + ∑bxi i =1

n

5.

∑ yi = a∑ x i =1

i =1

n

6.

+ nb

5. Propiedades de sumatorias en 3

n

∑ yi = a∑ x i + ∑ xi i =1

7. b =

8.

i

4. Aplicando notación sumatoria en 2

i =1

2

i =1

∑y − a∑x

7. Despejando b en 5

n

∑xy = a ∑x b= ∑x

6. Propiedades de sumatorias en 4

i =1

2

8. Despejando b en 6

190


9.

10.

∑y − a ∑x = ∑xy − a ∑x n ∑x a=

2

9. Igualando 7 y 8

n∑ xy − ∑ x ∑ y

( x)

n∑ x − ∑ 2

10. Resolviendo y despejando a en 9

2

x ∑ y − ∑ xy ∑ x ∑ b = 11. n∑ x − ( ∑ x ) 2

2

11. Reemplazando el valor de a en 8

2

Ejemplo 3: Hallar la ecuación de la línea recta que mejor ajuste los datos del ejemplo 2. Solución: Utilizando los valores obtenidos en el ejemplo 2

n =5

∑x =807,

( ∑x )

∑y =300,

(∑ y )

∑xy = 48520,

2

= 651249

2

= 90000

x 2 =130377

Reemplazando:

a=

5(48520) − (807) − (300) 5(130377) − 651249

a = 0.78 191


b=

300(130377) − 807(48520) 5(130377) − 651249

b = −66.8 De acuerdo a lo anterior, la ecuación buscada es: y = ax + b y =0.78 x −66.8

Línea de ajuste de regresión

Dando valores a la variable x obtenemos valores estimados para y.

X

Y

Y (Estimado)

162

58

60

158

58

56

155

56

54

162

60

60

170

68

66

Visualizando esta información tenemos la siguiente línea recta (Recta de regresión)

192


Nota: Con la ecuación de la línea de regresión, no solo es posible conocer el peso dado la estatura si no que también puede hallarse la estatura dado el peso.

Ejemplo 4: a. Estimar el peso de un estudiante que mide 1.60 cm. b. Estimar la estatura de un estudiante que pesa 65 kilos. Solución: De la ecuación

y = 0.78 x −66.8

tenemos:

y = 0.78(160) −66.8

a. x =160cm,

y = 58 Kilos.

b. y=65 Kilos,

65 = 0.78 x − 66.8 x=

65 + 66.8 0.78

x =168.9 cms Ejercicios 1. Con los siguientes datos sobre fertilizante y producido, encontrar r. Fertilizante X (libras)

2

3

4

5

6

Producido Y (libras)

7

9

10

14

15

2. Con los siguientes datos sobre estatura de padres e hijos, encontrar r. 193


Padres X (cms)

165

168

170

172

175

Hijo Y (cms)

150

153

158

160

169

3. La siguiente tabla muestra el número de cigarrillos consumidos diariamente y la mortalidad. Nº de cigarrillos

Mortalidad por 1000 habitantes

5

0.4

10

0.7

15

1.0

20

1.8

25

2.1

30

2.4

35

2.7

a. Dibujar el diagrama de dispersión. b. Calcular el coeficiente de correlación c. Interpretar el valor obtenido de r.

4. Dados los siguientes datos sobre el peso (x) y la longitud (y) del alambre: a. Dibujar el diagrama de dispersión. b. Encontrar la línea de dispersión. 194


c. Calcular la longitud del alambre cuando el peso es 18 libras. d. Calcular el peso del alambre cuando la longitud es 25 metros. Peso x (Libras)

11

12

13

14

15

Longitud (metros)

16

17

19

20

22

5. Con los siguientes datos sobre ingresos (x) y gastos (y). a. Dibujar el diagrama de dispersión. b. Encontrar la línea de regresión. c. Calcular los gastos si los ingresos son 60. d. Calcular los ingresos si los gastos son 50. x (ingresos en miles de pesos)

50

51

52

53

54

y ((Gastos en miles de pesos)

41

46

45

55

53

6. En la tabla adjunta se relacionan las ventas en miles de pesos y los años de experiencia de los vendedores de la compañía M. Vendedor

Ventas (Miles de $)

Años de Experiencia

A

7

5

B

6

4

C

4

3 195


D

3

1

E

9

6

F

6

3

G

5

4

H

7

4

a. Dibujar el diagrama de dispersión. b. Encontrar la línea de regresión. c. ¿Cuantos miles de pesos se puede esperar que venda el vendedor P si tiene 7 años de experiencia?

ANEXO 1 UNIVERSIDAD DEL QUINDIO INSTITUTO DE EDUCACION ABIERTA Y A DISTANCIA PROGRAMA DE BASICA PRIMARIA ANÁLISIS DE RENDIMIENTO ACADEMICO AREA DE MATEMÁTICAS 196


TERCER PERIODO

COLEGIO X

ARMENIA (QUINDIO) 1989

Responda cada una de las preguntas que aparecen en esta encuesta, de acuerdo a su criterio personal. 1. En su concepto el rendimiento académico en el colegio es: Excelente_______ Bueno_______ Regular_______ Deficiente_______ 2. ¿Cuál de las siguientes asignaturas es de su preferencia?: Idiomas________ Sociales________

Matemáticas____________ Otras ____________________

3. Coloque en el espacio indicado la nota que obtuvo en el tercer periodo en matemáticas:_______________________________ 4. Señale aspectos positivos y negativos de la orientación recibida en el área de matemáticas: __________________________ _______________________________________________________________ 5. Que calificación le daría a su profesor de matemáticas: Excelente_______ Buena________ Regular_______ Deficiente______

RESPUESTAS A LOS EJERCICIOS ANTERIORES CAPITULO 1 197


2. c 3. c 4. Graunt 5. Estado 6. PASCAL Estudi贸 el c谩lculo de probabilidades

GAUSS Demostr贸 el valor practico de la curva normal

ARCHENWAL

198


Fue el primero en utilizar el término. ESTADISTICA

7.

a. F b. F c. V d. V e. V

8. a. Niños matriculados en la concentración Escolar Divino Niño del barrio las Orquídeas. b. Los 30 niños de ambos sexos de la concentración escolar. c. Puntaje de aceptación del producto d. Niños y Niñas 10. (6) (4) (2) (5) (3) 11. a. Descriptiva b. Inferencial 199


c. Inferencial d. Descriptiva e. Descriptiva 12. a. Variable b. Parámetros c. Biometría d. Sicometría e. Estadísticas Secundaria. f. Población g. Estadísticas CAPITULO II 1. a. V b. F c. V d. F e. F 2. a. Instrucciones, encabezamiento y cuerpo b. Planeamiento, recolección, Procesamiento y análisis. c. Codificación, tabulación, análisis e interpretación y publicación 4. a. D b. C 200


c. C d. C e. D 6. a. Poblaci贸n b. Muestra c. Muestra d. Muestra CAPITULO III 1. no olvide que todo cuadro debe llevar un titulo. Col贸queselo.

f

NOTAS

I

h

I

F

I

H

1

1

0.05

1

0.05

2

2

0.10

3

0.15

3

1

0.05

4

0.20

I

201


4

1

0.05

5

0.25

5

2

0.10

7

0.35

6

2

0.10

9

0.45

8

2

0.10

11

0.55

9

3

0.15

14

0.70

10

6

0.30

20

1.00

Total

20

1.0

-

-

2. a. Sugerencia tomar m=7 c.

15 × 100% = 30% 50

d.

20 × 100% = 40% 50

3. a. 5 b. 10 c. L.R.I . =

50 + 69 = 59.5, 2

d.

7 × 100% = 17.5% 40

e.

31× 100% = 77.5% 40

L.R.S = 59.5 +10 = 69.5

4. a. F b. V 202


c. V d. F 7. a. Rango b. Frecuencia Absoluta c. Frecuencias Absolutas acumuladas d. Frecuencias Relativas CAPITULO IV 4. a. F b. V c. F d. V 8. Diagrama circular.

CAPITULO V 1. a. -2 d.

28

b.

4

c.

27

e.

1/3

f.

310

11

2. a.

∑( 4i +1) i =1

10

d.

∑2 i =1

3. a. 2790

i

b. ∑( x −i ) 10

i =1

i

12

c.

1 ∑ i =5 i

b. 28.275

i

i =1

15

e.

∑4 18

f.

∑( 2 − y ) i =1

c. 672400

i

d. 374990 203


10

5. a.

∏5 y i =1

∏(x y ) 15

b.

i

i

i =1

6. a. 25,21 ±0,38

b. 1,50%

8

b. 1×

10 km

9. a. 1,496 ×

−5

10

d. 1× 10. a.

i

12

c.

∏i

10

2

d.

i =2

2

∏i i =5

c. 24,83cm ó 26,21cm −7

10

mm

5

c.

3 ×10 km / seg

e.

2,1427 ×10

mm 4

− 5,674 ×10

c.

1

3,5625 ×10

11. a. 28000

c. 48300

e. 6832

12. a. 9.33%

b. 14%

c. 6,66% d. 17.33%

6

e. 16%

13. 34,5% CAPITULO VI 1. 7.06 2. a. 6 y 7

b. 8 y 10

3. a. Mg = 4.50, 5. a. 7.6

M

A

= 4.41

Mg =6.98,

M

A

= 6.55

b. 7.4

6. 7.32 7. 38.3km/h 8. 48km/h 9. $17179,9 10. 16/5 204


11.

n = 55,

n

12.

x = 3,

x

1

2

1

15. a. V

b. V

c. F

2

d. F

= 45 =4

x

3

=5

e. V

16. a. Media aritmética b. Moda c. Dos partes de igual área d.

P

50

yQ

2

e. Bimodal y multimodal CAPITULO VII 1.

D

M

= 1.71

2. a. 2.67 y 1.63

b. 1.01 y 1.006

4. En el colegio B se presenta mayor dispersión 5. 7.

x = 8,

x

1

S

8. a. F

2

2

=6

=1 b. V

c. F

d. V

e. V

9. a. Coeficiente b. Varianza c. Raíz cuadrada 205


d. Rango e. Curva normal 11.

6.7

12. La variable x CAITULO VIII 2. r = 0,97. Este valor indica que para valores grandes de la variable x hay asociados valores grades de la variable y, y viceversa. 5. b.

y= 3.3x – 123.6

c. y=74.4

d. x= 52.6

GLOSARIO - Aleatorio: Procedimiento ó fenómeno dependiente de algún suceso eventual. - Atributo: Característica originada por las variables cuantitativas. - Cifras significativas: Cifras digitas exactas aparte de los ceros requeridos para situar el lugar decimal. - Coeficiente de correlación: estadígrafo que cuantifica el grado de afinidad existente entre las variables. Correlación: Grado de relación reciproca entre dos o más variables. 206


- Correlación línea: Todos los puntos de un diagrama de dispersión tienden a ubicarse alrededor de una línea recta. - Cuartiles: Valores que dividen los datos en cuatro partes iguales. - Deciles: Valores que dividen un conjunto de datos en diez partes iguales. - Desviación Media: Media aritmética de los valores absolutos de las desviaciones respecto a la media aritmética. - Desviación Típica: Medida de dispersión más significativa. Es la raíz cuadrada del cuadrado medio de las desviaciones de los datos respecto a la media aritmética. - Diagrama: Gráfica representativa de la variación de un fenómeno o de datos estadísticos. - Diagrama de Dispersión: Representación gráfica de todos los pares de observaciones de una variable bidimensional. - Diagrama de barras: Conjunto de barras o rectángulos sobre un eje de coordenadas. - Dispersión: Grado en que los datos numéricos tienden a extenderse alrededor de un valor medio. - Dispersión Relativa: Razón porcentual entre la dispersión absoluta y un promedio. - Distribución de Frecuencias: Ordenación tabular de los datos en intervalos de clase con sus respectivas frecuencias. - Error: Valor de la disparidad de los datos obtenidos experimentalmente respecto a la realidad de los hechos. - Error absoluto: Error total cometido en la medición. - Error Relativo: Error cometido en la unidad de la magnitud media. 207


-Escala: Sistema de producción mediante el cual determinadas magnitudes representan otras magnitudes mayores tomadas de la realidad. Esto facilita su representación en diagramas. - Estadígrafos de Dispersión: Medidas que indican en que grado los datos se alejan de un valor promedio determinado con anterioridad. -Estadígrafo: Descripción numérica de una característica correspondiente a una muestra. - Estadígrafos de Posición: Medidas determinadas para una muestra que dan información respecto a la puntuación promedio en una distribución. - Estadísticas: Colección sistemática de datos presentada en forma de cuadros y graficas. - Evento: Conjunto de posibles resultados de un experimento. - Frecuencia Absoluta: Numero de veces que dicho elemento aparece en la información. - Frecuencia Acumulada: Frecuencia total de todos los valores menores que el límite real superior de clase del intervalo considerado. - Frecuencia Porcentual Acumulada: Llamada también frecuencia relativa acumulada. Se obtiene dividiendo la frecuencia acumulada por la frecuencia total. - Histograma: Representación grafica de las distribuciones de frecuencia, constituida por rectángulos cuya base es el intervalo de clase y la altura la frecuencia respectiva. - Intervalo de clase: Símbolo que encierra un conjunto de datos comprendidos entre dos valores extremos llamados límites. - Límite de clase: Valores extremos de un intervalo de clase.

208


- Límite Real de Clase: Valores reales de los extremos de un intervalo de clase, suponiéndolos como aproximaciones. - Línea de Regresión: Curva de ajustes de los datos de una distribución bidimensional. - Marca de clase: Punto medio de un intervalo de clase. - Marco Teórico: Hace referencia a los antecedentes de la investigación, a los principios y teorías que se tendrán en cuenta como base durante el desarrollo del trabajo. - Media Aritmética: Cociente entre la suma de una serie de datos y el número total de los mismos. - Mediana: Es la media de los dos valores medios de una colección ordenada de datos. - Media Geométrica: Medida de centralización equivalente a la raíz n-ésima del grupo de los n-términos o datos de una distribución. - Media Armónica: Reciproca de la media aritmética de los recíprocos de los números dados. - Moda: Media de centralización correspondiente al dato que se presenta con la mayor frecuencia. - Muestra: Conjunto de medidas, datos o sucesos tomados de una población. - Parámetros: Medidas que describen numéricamente las características de una población. - Percentil: Cuantil que divide los datos en cien partes iguales.- Población: Grupo entero, motivo de un estudio estadístico.

209


- Polígono de Frecuencia: Representación grafica de una distribución de frecuencias, resultante de unir los puntos determinados por las marcas de clase con sus respectivas frecuencias. - Promedio: Valor típico o representativo de una serie de datos. - Productoria: Notación simplificada del producto de un gran número de términos que guardan entre si cierta relación. - Recta de Mínimos Cuadrados: Recta de regresión o ajuste de un conjunto de datos representados por observaciones pares. - Regresión: Estimación de una variable, conocida otra que está relacionada con ella. - Sumatoria: Notación simplificada y simbólica de la suma de un gran numero de términos que guardan entre si cierta relación. - Tabulación: Expresión y agrupación de datos estadísticos por medio de tablas o cuadros. - Trabajo de Campo: Es la etapa de la investigación en la cual se realiza la recolección de datos. - Unidad de investigación: Es la fuente de donde se toma la información para una investigación estadística. Puede ser un individuo, un grupo o una institución. - Valores estimados: Valores calculados para una variable, a partir de una curva de regresión. - Variable: Rasgos, características o propiedades que poseen los elementos de una población o de una muestra. - Varianza: Medida de dispersión equivalente al cuadrado de la desviación típica.

210


BIBLIOGRAFIA

ANDER-EGG, Ezequiel. Técnica de investigación social. Buenos Aires; Humanita. BLALOK, Hubert M., jr. Estadística social. México: Fondo de cultura Económica. GOVINDEN, Lincoyan Portus. Curso practico de estadística. Bogota: Mc Graw Hill. HOGG, Robert V. CRAIG Allen T. Introduction to mathematical statistics. 3ª Ed. New York: MacMillan PROBABILIDAD Y ESTADISTICA/ Tr. Luis Hernán Rodríguez. Bogotá: McGrawHill RODRIGUEZ, Pedro; CIFUENTES, Miñon. Bioestadística. Madrid: Universidad a Distancia. SANCHEZ, Javier I. Estadística Básica aplicada SPIEGEL, Murray R. Estadística. Bogotá; Mc Graw Hill. Colección Schaum. TORRES DE CASTRO, Luz Stella. Manual Practico de estadística I. Cali: Pime TARO, Yamane. Estadística. México: Harla, S.A.

211


WAYNE W., Daniel. Estadística con aplicaciones a las Ciencias Sociales y a la educación. Bogota: McGrawHill. ZUWAYLIF. Estadística General Aplicada. Bogota: Fondo educativo Interamericano.

212


Estadistica