Issuu on Google+

ESTADÍSTICA La estadística es una técnica basada en la recolección, recuento, clasificación, e interpretación de un conjunto de datos obtenidos a partir de la observación, con el propósito de poder llevar a cabo comparaciones y realizar estimaciones. EXISTEN DISTINTOS TIPOS DE ESTADÍSTICA DESCRIPTIVA O DEDUCTIVA: Esta clase de estadística se utiliza con el propósito de recolectar, describir y resumir un conjunto de datos obtenidos. Estos pueden visualizarse de manera numérica y gráfica. Sin embargo, su uso se acota sólo al uso de la información obtenida. Es decir, que a partir de loa misma no se puede realizar ningún tipo de generalización. ANÁLISIS DESCRIPTIVO DE LA INFORMACION: Ayudará a observar el comportamiento de la muestra en estudio, a través de tablas, gráficos..... Los resultados recogidos en la muestra se resumen en una matriz de datos N x M, en la cual N es el número de unidades de análisis utilizadas ( número de casos ) y M es el número de características de dichas unidades , unidades de las que tenemos información. Transformación de los datos: la transformación persigue la consecución de una distribución aproximada a la normal. Tipos de transformación: Lineales: suma, resta, división , multiplicación , cambia los valores brutos ( datos obtenidos ) de la variable sin alterar nada mas. No lineales mono tónicas: cambian los valores originales y también sus distancias pero no el orden No lineales no mono tónicas : similar a la anterior pero no altera el orden.. DATOS NO AGRUPADOS Tendencia central: la tendencia central se refiere al punto medio de una distribución. Las medidas de tendencia central se conocen como medidas de posición. Dispersión: se refiere a la extensión de los datos en una distribución, es decir, al grado en que las observaciones se distribuyen.

DATOS AGRUPADOS


Medidas de Dispersión Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variables cuantitativas. Medidas de Tendencia central La estadística busca entre otras cosas, describir las características típicas de conjuntos de datos y, como hay varias formas de hacerlo, existen y se utilizan varios tipos de promedios. Se les llama medidas de tendencia central porque general mente la acumulación más alta de datos se encuentra en los valores intermedios. Las medidas de tendencia central comúnmente empleadas son : 

Media aritmética

Mediana

Moda

Media geométrica

Media armónica

Los cuantiaos GRAFICOS DE ESTADISTICA DESCRIPTIVA Los gráficos se han de explicar enteramente por sí mismos. El contenido de un gráfico deberá ser tan completo como sea posible. Las escalas vertical y horizontal estarán rotuladas con claridad dando las unidades pertinentes. La mayorías de los gráficos presentan información numérica con escalas, que deben rotularse para describir completamente la variable presentada en la escala y para variables de medida se dirán las unidades de medición. No se debe tratar de abarcar demasiada información en un solo gráfico. Es mejor hacer varios gráficos que comprimir toda la información en uno solo. Una regla práctica segura es evitar gráficos que contengan más de 3 curvas. Los gráficos tienen que dar una visión general y no una imagen detallada de un conjunto de datos. Las presentaciones detalladas se deben reservar para las tablas. Las tablas se explicarán por sí mismas enteramente. como los gráficos, se ha de dar suficiente información en el título y en los encabezamientos de columnas y filas de la tabla para permitir que el lector identifique fácilmente su contenido. Como el título será por lo general lo primero que se lee en detalle, deberá suministrar toda la información esencial sobre el contenido de la tabla y deberá especificar el tiempo, lugar, material ó estudio experimental y relaciones que se presenten en la tabla. Para cada variable numérica se han de dar las unidades. La función del rayado es dar claridad de interpretación. Las anotaciones de numéricas del cero se han de escribir explícitamente. Una anotación numérica no debe comenzar con una punto decimal. Los números que indican valores de la misma característica se han de dar con el mismo número de decimales.


Para Los Suiguites Datos Van A Ser Vasados En La Tabla 1(Tanto Agrupados Como No Agrupados) Tabla I. Distribuci贸n de frecuencias de la edad en 100 pacientes.

Edad

N潞 de pacientes

18

1

19

3

20

4

21

7

22

5

23

8

24

10

25

8

26

9

27

6

28

6

29

4

30

3

31

4


32

5

33

3

34

2

35

3

36

1

37

2

38

3

39

1

41

1

42

1

NO AGRUPADOS Otro modo habitual, y muy útil, de resumir una variable de tipo numérico es utilizando el concepto de percentiles, mediante diagramas de cajas. La Figura muestra un gráfico de cajas correspondiente a los datos de la Tabla I. La caja central indica el rango en el que se concentra el 50% central de los datos. Sus extremos son, por lo tanto, el 1er y 3er cuartil de la distribución. La línea central en la caja es la mediana. De este modo, si la variable es simétrica, dicha línea se encontrará en el centro de la caja. Los extremos de los "bigotes" que salen de la caja son los valores que delimitan el 95% central de los datos, aunque en ocasiones coinciden con los valores extremos de la distribución. Se suelen también representar aquellas observaciones que caen fuera de este rango (outliers o valores extremos). Esto resulta especialmente útil para comprobar, gráficamente, posibles errores en nuestros datos. En general, los diagramas de cajas resultan más apropiados para representar variables que presenten una gran desviación de la distribución normal.


DATOS AGRUPADOS Histograma: Esta formado por rectángulos cuya base es la amplitud del intervalo y tiene la característica que la superficie que corresponde a las barras es representativa de la cantidad de casos o frecuencia de cada tramo de valores, puede construirse con clases que tienen el mismo tamaño o diferente ( intervalo variable). La utilización de los intervalos de amplitud variable se recomienda cuando en alguno de los intervalos , de amplitud constante, se presente la frecuencia cero o la frecuencia de alguno o algunos de los intervalos sea mucho mayor que la de los demás, logrando así que las observaciones se hallen mejor repartidas dentro del intervalo.


Ojivas: Cuando se trata de relacionar observaciones en un mismo aspecto para dos colectivos diferentes no es posible ejecutar comparaciones sobre la base de la frecuencia, es necesario tener una base estándar, la frecuencia relativa. La ojiva representa gráficamente la forma en que se acumulan los datos y permiten ver cuantas observaciones se hallan por arriba o debajo de ciertos valores. Es útil para obtener una medida de los cuartiles, deciles , percentiles. Polígono de Frecuencias Se puede obtener uniendo cada punto medio (marca de clase) de los rectángulos del histograma con líneas rectas, teniendo cuidado de agregar al inicio y al final marcas de clase adicionales, con el objeto de asegurar la igualdad del áreas.

diagramas de barras son similares a los gráficos de sectores. Se representan tantas barras como categorías tiene la variable, de modo que la altura de cada una de ellas sea proporcional a la frecuencia o porcentaje de casos en cada clase . Estos mismos gráficos pueden utilizarse también para describir variables numéricas discretas que toman pocos valores


En los gráficos de sectores, también conocidos como diagramas de "tartas", se divide un círculo en tantas porciones como clases tenga la variable, de modo que a cada clase le corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa. Un ejemplo se muestra en la . Como se puede observar, la información que se debe mostrar en cada sector hace referencia al número de casos dentro de cada categoría y al porcentaje del total que estos representan. Si el número de categorías es excesivamente grande, la imagen proporcionada por el gráfico de sectores no es lo suficientemente clara y por lo tanto la situación ideal es cuando hay alrededor de tres categorías. En este caso se pueden apreciar con claridad dichos subgrupos.


MEDIDAS DE ASIMETRIA Y APUNTAMIENTO Sesgo: las curvas que representan los puntos de datos de un conjunto de datos pueden ser simétricas o sesgadas. Las curvas simétricas, tienen una forma tal que una línea vertical que pase por el punto más alto de la curva dividirá el área de ésta en dos partes iguales. Cada parte es una imagen espejo de la otra. En las curvas sesgadas, los valores de su distribución de frecuencias están concentrados en el extremo inferior o en el superior de la escala de medición del eje horizontal. Los valores no están igualmente distribuidos. Las curvas pueden estar sesgadas hacia la derecha (positivamente sesgadas) o sesgadas hacia la izquierda (negativamente sesgadas). MEDIDAS DE CURTOSIS Al comparar cuán aguda es una distribución en relación con la Distribución Normal, se pueden presentar diferentes grados de apuntalamiento. 1. Mesocúrtica, Normal 2. PlarticúrtiCa, Menor apuntalamiento 3. Leptocúrtica, Mayor apuntalamiento

INFERENCIAL O INDUCTIVA.

Estadística descriptiva o deductiva: La estadística descriptiva o deductiva se refiere a la recolección, presentación, descripción y análisis de un GRUPO DE DATOS sin sacar conclusiones o inferencias sobre un grupo mayor. El grupo de datos puede ser una muestra o una población completa.

ESTADÍSTICA APLICADA Está conformada por las dos clases de estadísticas anteriores. Su objetivo consiste en deducir resultados sobre un universo, a partir de una muestra determinada. Este tipo de estadística puede ser aplicada en cualquier área que no pertenezca a ella, tal como historia, psicología, etc.


DENTRO DE LAS APLICACIONES DE LA ESTADÍSTICA DESTACO LAS SIGUIENTES: La Estadística en el Periodismo

Los periodistas además de dedicarse al ámbito de la noticia, realizan crónicas y estudios de investigación, que nos entregan preguntas y respuestas frente a determinados sucesos o situaciones de interés público. Algunos de los estudios más frecuentes son sobre alcoholismo, enfermedades, sexualidad, delincuencia, etc. Valiéndose de las encuestas u otros instrumentos técnicos de medición es posible conocer la opinión de la gente y con ello informar a la opinión pública, a través de los medios de comunicación, desde donde las autoridades pueden adoptar las medidas correctivas, si es el caso. Tal es así, que la estadística forma parte importante del periodismo investigativo. La Estadística en la Política Conocidas son las famosas encuestas de tipo político, que entregan una orientación de la intención de voto, de una muestra estadística representativa, sobre la opinión de las personas en un tiempo determinado, teniendo esta herramienta una gran confiabilidad. Así es que el uso de la estadística es imprescindible para determinar caminos a seguir para los candidatos de elección popular. Si no fuera por la matemática, en especial la estadística, no sería posible realizar campañas políticas bien direccionadas, donde los elevados costos de la propaganda son de vital importancia.


Este tipo de instrumento también es importante para la orientación en los logros tanto de las políticas de gobierno, como de estado, en beneficio de la ciudadanía. La Estadística en la Publicidad Cuando las grandes marcas trasnacionales y/o nacionales como Coca-cola, Pepsi, Parmalat, Omo, Falabella, etc. nos llenan de slogans, música y colores en sus comerciales, lo único que buscan es que la gente adquiera los productos y/o servicios que ofrecen. Se dedican, entonces, a realizar las llamadas “campañas publicitarias”, y, antes de lanzar una, hacen un estudio para encontrar las mejores alternativas posibles a fin de lograr el éxito de ventas deseado. Éstos estudios son de carácter estadístico. En las empresas de marketing existen profesionales que trabajan con grupos de gente pre-seleccionada, de diversos lugares, edades, intereses y actividades, entre otros, dependiendo del “Grupo Objeto”, en los llamados “Focus”, recopilándose información mediante preguntas. Finalmente, con la ayuda de la estadística, se toman decisiones y se hacen las adecuaciones pertinentes. De esta forma se pueden realizar grandes inversiones, teniendo un casi seguro éxito, sin correr mayores riesgos. La Matemática en Las Ciencias Biológicas

En el área de las ciencias biológicas, en la enseñanza media ya aparecen aplicaciones matemáticas, como son los logaritmos para calcular el pH en química, las ecuaciones químicas, el cálculo de mezclas... En biología, la forma en que los padres transmiten su información a sus hijos, o genética, es una materia que utiliza mucho la estadística y probabilidad. Es el caso de los estudios de Mendel, por ejemplo, quién se dedicó a estudiar el comportamiento de ciertas plantas a las que cruzó y determinó cómo se relacionaban genéticamente los padres con los hijos, hablando de Genotipo y Fenotipo.


En esta categoría es también donde se realizan los mayores avances de la humanidad, en descubrimientos. Cada año se descubren miles de formulas científicas que relacionan fenómenos de la naturaleza matemáticamente. Uno de los avances más sorprendentes de la actualidad matemática es el llamado “Cálculo de escala de tiempo”, una nueva herramienta, la cual utiliza la estadística y probabilidad para determinar el tiempo en que podría sanar una herida, por ejemplo. Los científicos que se dedican a esto realizan estudios estadísticos, recogiendo datos y muestras, investigando la posible regularidad que podría haber en la cicatrización de una herida, el tiempo de reproducción de un virus, el comportamiento migratorio de algunas aves, además de factores de tamaño y volumen del crecimiento de una duna de arena en el desierto, entre otros. Todo esto funciona con la idea de recopilar información, muestrear ciertas áreas para ver cómo se han comportado algunas aves, por ejemplo, luego utilizar la estadística, con lo cual se pueden dibujar curvas que se supone que son relativamente parecidas al comportamiento migratorio de aves. Con esta herramienta se podrían determinar también las épocas de mayor probabilidad de contagio de algún virus transmitido por insectos. Lo más nuevo sobre todo esto, es el estudio matemático de detectar la bulimia, utilizando estas curvas para conocer el factor de riesgo de adquirir esta enfermedad. Y todo esto se hace con muchas variables de todo tipo, como el estado de ánimo del paciente, la situación familiar, relaciones de amistad, etc. Estas nuevas herramientas parecieran estar revolucionando la matemática. Los científicos piensan que esto podría ser algo así como un paralelo a la teoría unificada, en la física. Conclusión Mucha gente piensa que la matemática es una ciencia que no tiene nada que ver con otras disciplinas que no sean las ingenierías. Otros nunca le encuentran aplicaciones útiles a ésta, y por eso tampoco les gusta. Pero, la matemática en realidad tiene infinitas aplicaciones en todo el conocimiento adquirido por la humanidad, partiendo por todo lo relacionado con las


ingenierías, economía, en las ciencias biológicas e incluso en algunas ramas del área Humanista. Éste grafico muestra la cantidad de aprehendidos, en las categorías de analfabeto, educación básica, educación media y educación superior. En los años 1986, 1990 y 1995

ESTADÍSTICA MATEMÁTICA: Se refiere al empleo de la estadística pero desde un punto de vista formal, a través del uso de distintas ramas propias de la matemática y de la teoría de la probabilidad. Su uso es necesario debido a que los datos que maneja la estadística matemática son aleatorios e inciertos. MEDIA, MEDIANA Y MODA PARA DATOS AGRUPADOS MEDIA ARITMÉTICA Cuando los datos se presentan en una distribución de frecuencias, todos los valores que caen dentro de un intervalo de clase dado se consideran iguales a la marca de clase, o punto medio, del intervalo. Las fórmulas k


X

=

f1X1

+

f2X2

+ ...+fkXk fX =

=

fjXj

=

fX

j=1 ----------------------------- ------ ------- ------f1 + f2 + ...+ fk k

fN fj

j=1 k X=A+

fjdj = A +

fd

j=1 ------------ -----------k fj N j=1 son válidas para tales datos agrupados si interpretamos Xj como la marca de clase, fj con su correspondiente frecuencia de clase, A como cualquier marca de clase conjeturada y dj = Xj - A como las desviaciones Xj con respecto de A. Los cálculos con las dos ecuaciones anteriores se llaman métodos largos y cortos,respectivamente . Si todos los intervalos de clase tienen idéntica anchura c, las desviaciones dj = Xj - A pueden expresarse como cuj, donde uj pueden ser 0, ±1, ±2, ±3,..., y la segunda fórmula se convierte en k X = A + "fjuj = A+ "fu c j=1 -------- ------------NN que es equivalente a la ecuación X = A + cu. Esto se conoce como método de compilación para calcular la media. Es un método muy breve y debe usarse siempre para datos agrupados con intervalos de clase de anchuras iguales. Se debe notar que en el método de


compilación los valores de la variable X se transforman en los valores de la variable u de acuerdo con X = A + cu. LA MEDIANA La mediana de un conjunto de números en magnitud es o el valor central o la media de los dos valores centrales. Para datos agrupados, la mediana obtenida por interpolación viene dada por Mediana = L1 + N/2 - ("f)1 c -------------fmediana donde: L1 = frontera inferior de la clase de la mediana. N = Número de datos (frecuencia total) ("f)1 = suma de frecuencias de las clases inferiores a la de la mediana. fmediana = frecuencia de la clase de la mediana. c = anchura del intervalo de clase de la mediana. Geométricamente la mediana es el valor de X (abscisa) que corresponde a la recta vertical que divide un histograma en dos partes de igual área. Ese valor de X se suele denotar por X. LA MODA La moda de un conjunto de números es el valor que ocurre con mayor frecuencia; es decir, el valor más frecuente. La moda puede no existir, e incluso no ser única en caso de existir. En el caso de datos agrupados donde se haya construido una curva de frecuencias para ajustar los datos, la moda será el valor (o los valores) de X correspondiente al máximo (o máximos) de la curva. Ese valor de X se denota por X. La moda puede deducirse de una distribución de frecuencias o de un histograma a partir de la fórmula Moda = L1 +

1c

----------1+ donde: L1 = frontera inferior de la clase modal.

2


1 = exceso de la frecuencia modal sobre la de la clase inferior inmediata. 2 = exceso de la frecuencia modal sobre la clase superior inmediata. c = anchura del intervalo de clase modal


Estadística