Clase repaso estadistica i 2014

Page 1

EstadĂ­stica y probabilidad I Clase I Definir la ciencia estadĂ­stica su historia , utilidad e importancia


Introducción a la Estadística y Probabilidad I La estadística es comúnmente considerada como una colección de hechos numéricos expresados en términos de una relación sumisa, y que han sido recopilado a partir de otros datos numéricos. Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) definen la estadística como un valor resumido, calculado, como base en una muestra de observaciones que generalmente, aunque no por necesidad, se considera como una estimación de parámetro de determinada población; es decir, una función de valores de muestra. La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos de masa o colectivo, cuya mediación requiere una masa de observaciones de otros fenómenos más simples llamados individuales o particulares". (Gini, 1953) Murria R. Spiegel, (1991) dice: "La estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis


Definición de Estadística La Estadística es la ciencia cuyo objetivo es reunir una información cuantitativa concerniente a individuos, grupos, series de hechos, etc. y deducir de ello gracias al análisis de estos datos unos significados precisos o unas previsiones para el futuro.

La estadística

Recopila

La ciencia

Organiza A fin de realizar una toma de decisión más efectiva.

Análisis e interpretación Datos numéricos


Utilidad e Importancia de la Estadística Los métodos estadísticos tradicionalmente se utilizan para propósitos descriptivos, para organizar y resumir datos numéricos. La estadística descriptiva, por ejemplo trata de la tabulación de datos, su presentación en forma gráfica o ilustrativa y el cálculo de medidas descriptivas. Ahora bien, las técnicas estadísticas se aplican de manera amplia en mercadotecnia, contabilidad, control de calidad y en otras actividades; estudios de consumidores; análisis de resultados en deportes; administradores de instituciones; en la educación; organismos políticos; médicos; y por otras personas que intervienen en la toma de decisiones.


Etapas de Desarrollo de la Estadística La historia de la estadística está resumida en tres grandes etapas o fases.

Primera Fase: Los Censos

Segunda Fase: De la Descripción de los Conjuntos a la Aritmética Política Tercera Fase: Estadística y Cálculo de Probabilidades


División o tipos de la Estadística La Estadística para su mejor estudio se ha dividido en dos grandes ramas: la Estadística Descriptiva y la Inferencial

Estadística Descriptiva: Consiste sobre todo en la presentación de datos en forma de tablas y gráficas. Esta comprende cualquier actividad relacionada con los datos y está diseñada para resumir o describir los mismos sin factores pertinentes adicionales; esto es, sin intentar inferir nada que vaya más allá de los datos, como tales.

Estadística Inferencial Se deriva de muestras, de observaciones hechas sólo acerca de una parte de un conjunto numeroso de elementos y esto implica que su análisis requiere de generalizaciones que van más allá de los datos. Como consecuencia, la característica más importante del reciente crecimiento de la estadística ha sido un cambio en el énfasis de los métodos que describen a métodos que sirven para hacer generalizaciones. La Estadística Inferencial investiga o analiza una población partiendo de una muestra tomada.


Estadística y Probabilidad I Todo análisis y estudio ponderado de una disciplina o campo del saber requiere primero de la definición de los conceptos básicos que fundamentan la misma. Esta unidad constituye la parte teórica conceptual que es necesario conocer primero. Como la estadística es una ciencia que se utiliza en los diversos campos de investigación, en nuestro caso, debemos de tener claro estos conceptos básicos dentro de las disciplinas de la educación y las ciencias sociales para poder lograr un entendimiento más claro de las técnicas y métodos estadísticos en estas ciencias del comportamiento humano


Conceptos Básicos Parámetros Estadígrafo

Datos Escala de intervalos Escala de Escala nominal razones

Estadística descriptiva

Investigación histórica Muestra sistemática

Estadística inferencial Investigación descriptiva

Investigación experimental

La Estadística y algunos conceptos básicos

Investigación clínica Variables independientes

Medición Investigación longitudinal Variables constantes Investigación etnográfica

Muestra aleatoria Variables cuantitativas

Variables continuas

Variables discretas Variables Muestra estratificada

Variables cualitativas Variables dependientes


Concepto de Estadística Sus fines son describir al conjunto de datos obtenidos y tomar decisiones o realizar generalizaciones acerca de las características de todas las observaciones bajo consideración.

Áreas que conforman a la Estadística •

Estadística Descriptiva (Deductiva): Es la encargada de la organización, condensación, presentación de los datos en tablas y gráficos y del cálculo de medidas numéricas que permitan estudiar los aspectos más importantes de los datos.

Estadística Inferencial o Inferencia Estadística: está definida por un conjunto de técnicas, mediante las cuales se hacen generalizaciones o se toman decisiones en base a información parcial obtenida mediante técnicas descriptivas

DESCRIBIR

. INFERIR


Áreas de Aplicación de la Estadística • •

El uso de la Estadística es muy amplio. Resulta difícil nombrar un área en la cual no se emplee. Los métodos estadísticos han encontrado aplicación en: – Gobierno – Negocios – Ciencias Sociales – Ingeniería – Ciencias Física y Naturales – Control de Calidad – Procesos de Manufactura – Muchos otros campos de la actividad intelectual.


Población: es la colección de todas las posibles mediciones u observaciones que pueden hacerse de una variable bajo estudio

.

Se clasifica en dos categorías: Finita: es aquella que incluye una cantidad limitada contable de observaciones, individuos o medidas. Siempre que sea posible alcanzar (contar) el número total de todas las posibles mediciones, se considera como finita la población.

Infinita: es aquella que incluye un gran conjunto de observaciones o mediciones que no pueden alcanzarse por conteo. Al menos, hipotéticamente, no existe límite en cuanto al número de observaciones que el experimento puede generar.


UNIVERSO El Universo estadístico, consiste en fijar cuales son los casos individuales que van a ser observados así como el alcance en el espacio y en el tiempo de la investigación El conjunto de unidades físicas ( personas u objetos) a las cuales se les mide una o mas características, constituye el UNIVERSO, pudiendo obtenerse diferentes poblaciones de características, distintas; a saber: las poblaciones de pesos, tallas, calificaciones, etc. Algunos autores suelen considerar universo y población como sinónimos.


Muestra: – Es un conjunto de mediciones u observaciones tomadas a partir de una población. – Es un subconjunto de la población.

Muestra aleatoria: se considera aleatoria siempre y cuando cada observación, medición o individuo de la población tenga la misma probabilidad de ser seleccionado.


Muestra y Poblaci贸n

Muestra Poblaci贸n


Datos Estadístico Es información cuantitativa o numérica que puede encontrarse casi donde quiera: en negocios, en economía y muchas otras áreas Por ejemplo: • El precio de un sombrero es mostrado en un cierto número de bolívares, • La situación de empleo en una nación es expresada mediante un número de personas, • La inscripción en una universidad es registrada mediante un número de estudiantes, • La distancia recorrida por un agente de ventas es reportada en número de millas. • La edad de una persona es representada por un número de años


Tipos de datos y escalas de medida • Variables: – son las características o lo que se estudia de cada individuo de la muestra. Ej: sexo, edad, peso, estatura, color de ojos, estado civil, temperatura, cantidad de nacimientos, presión, grosor, diámetro, ... • Datos: – son los valores que toma la variable en cada caso.


Tipos de datos •

Cualitativos: son datos que solo toman valores asociados a las cualidades o atributos, clasificándolos en una de varias categorías, es decir, no son valores numéricos. Ej: – Sexo: f/m. – Hábito de fumar: Fumador/No fumador – Color de ojos: negro, azul, marrón, … – Religión: católica, evangélica, … – Estado civil: soltero, casado, divorciado,…

Cuantitativos: provienen de variables que pueden medirse, cuantificarse o expresarse numéricamente. Ejemplos: – Peso – Edad – Estatura – Presión – Humedad – Intensidad de un sismo – Cantidad de hermanos


Escalas de medida •

Tipos de variables cuantitativas: – Discretas: es aquella que solo puede tomar un número finito o infinito numerable de valores. Ejemplo: cantidad de hermanos. – Continuas: es la variable que puede tomar cualquier valor en una escala continua. Ejemplo: cantidad de líquido contenido en un recipiente.

• • • • •

Escala Nominal. Escala Ordinal. Escala de Intervalos. Escala de Razón o Proporción. Escala Absoluta.

Variables Cualitativas

Variables Cuantitativas


Escalas de medida •

• •

Escala nominal: los datos se pueden • agrupar en categorías que no mantienen una relación de orden entre si, por lo tanto no • están definidas las operaciones lógicas (>, <, ≤, ≥) sino solo las de igualdad o diferencia. Ejemplos: color de ojos, sexo, profesión, estado civil, religión. Escala de razón o proporción: es la más completa y general de todas las escalas. Se caracteriza porque los valores de la variable son números entre los cuales, además de las relaciones de orden (>, <, ≤, ≥) y distancia (+,-), se pueden establecer múltiplos y proporciones. Ejemplos: peso, altura, volumen…

Escala ordinal: existe un cierto orden o jerarquía entre las categorías (>, <, ≤, ≥). Ejemplos: grados militares, organigrama de una empresa, escalafón de los profesores universitarios, grados de disnea, estadiaje de un tumor. •

Escala Absoluta: se caracteriza porque los valores que toma la variable son el resultado de contar y por lo tanto, está constituida por los enteros positivos y el cero. Ejemplos: número de hermanos, cantidad de autos vendidos, cantidad de accidentes en una intersección, cantidad de hijos,…


Datos Univariantes y Multivariantes •

Univariantes o unidimensionales: sólo recogen información sobre una característica (Ej: edad de los alumnos de una clase). Bivariantes o bidimensionales: recogen información sobre dos características de la población. (Ej: edad y estatura de los alumnos de una clase).

Multivariantes o pluridimensionales: recogen información sobre tres ó más características. (Ej: edad, estatura y peso de los alumnos de una clase).


Abusos que se pueden cometer con la Estadística • • •

Conclusiones erróneas debido a que los datos son numéricamente insuficientes. Representaciones gráficas engañosas (escalas). Datos muéstrales no representativos: – Muestra que no incluye a elementos de toda la población. – Ciertas categorías de personas no responden correctamente. – Respuestas voluntarias (sesgadas).


En general hay tres formas para presentar los datos organizados:

Tablas Estadísticas Presentación con Palabras Cuando una serie de datos incluye solamente unos pocos ítems, la palabra escrita puede ser usada para presentar apropiadamente los hechos

PRESENTACION DE DATOS ESTADISTICOS

Graficas Estadísticas


Tipos de Tablas Estadísticas La tablas estadísticas pueden ser agrupadas en dos tipos de acuerdo con los propósitos para los cuales sirven las tablas Tablas para propósitos generales ( también llamadas tablas de referencia o tablas repositorias)

Tablas para propósitos especiales ( también llamadas resumen, tablas de texto o tablas analíticas)


TITULO

INSCRIPCIÓN EN INSTITUCIONES DE EDUCACIÓN SUPERIOR POR TIPO DE INSTITUCION Y POR SEXO 1999 Y 2000

( En miles )

NOTA DE ENCABEZADO ENCABEZADOS

Partes Principales de una Tabla

2000

1999

Tipo de Institución

Total

H

M

Total

H

M

Todas las instituciones

CONCEPTOS

Nota de Pie Fuente

Universidades Colegio de artes Escuela de profesionales Independientes normal Escuela tecnológicas Escuelas teológicas Otras Preparatorias

Inscripción del semestre otoño

Fuente: BCV e instituto de estadísticas

CUERPO


Métodos Estadísticos •

Amiel (1993) manifiesta que el método es una serie de pasos sucesivos, conducen a una meta.

En la ciencia se entiende por método el conjunto de procesos que el hombre debe emprender en la investigación y demostración de la verdad.


El Método estadístico •

Como la estadística trabaja con números, el procedimiento que utiliza es: a partir de unos datos numéricos, para obtener resultados mediante determinadas reglas y operaciones. Este procedimiento se denomina método estadístico y comprende los siguientes pasos que veremos a continuación:


4. Inferencia estadística. Después de la medición de datos, la Teoría de la Probabilidad acude en ayuda de la Estadística. Se deducen las leyes de inferencia que permiten predecir el comportamiento futuro de la población investigada.

Inferencia estadística (Predicción)

3.

Medición de datos. En esta etapa, comienza la elaboración matemática y medición de los datos.

Tabulación y agrupamiento de datos.

Medición de datos.

2. Tabulación y agrupamiento de datos. Los datos son convenientemente ordenados, clasificados y tabulados, es decir, dispuestos en tablas que facilitan la lectura.

1.

La etapa inicial, consiste en la recolección de datos referidos a la situación que se desea investigar.

Recuento o recopilación de datos


Críticas al método estadístico

Hay una percepción general de que el conocimiento estadístico es intencionada y demasiada frecuentemente mal usada, encontrando formas de interpretar los datos que sean favorables al presentador.

Al escoger (o rechazar o modificar) una cierta muestra, los resultados pueden ser manipulados. El Decano de Harvard Lawrence Lowell escribió en 1909 que las estadísticas, "como algunos pasteles, son buenas si se sabe quién las hizo y se está seguro de los ingredientes."


DEFINICIÓN Y USO •

Necesidad de resumir la información. Para que los datos sean útiles deben organizarse para distinguir patrones y tendencias y llegar así a conclusiones lógicas

Una forma de organizar un conjunto de datos es clasificarlos en categorías o clases y luego contar cuántas observaciones quedan dentro de cada categoría.

Para el análisis e interpretación de datos es valioso conocer:

La forma o patrón de distribución de los datos La posición de la distribución: alrededor de qué valor se tienden a concentrar los datos Variabilidad: la dispersión de los datos alrededor de los valores centrales •

Ordenamiento o arreglo de los datos en clases o categorías indicando para cada una de ellas, el número de elementos que contiene o frecuencia


VISITAS DIARIAS HECHAS AL SITIO WEB DE ESTUDIOS SOBRE DIVERSIDAD CULTURAL EN EL PRIMER CUATRIMESTRE DEL 2007

22 30 33 35 38 40 45 49 22 30 33 35 38 41 45 50 23 30 33 35 38 41 45 50 24 30 34 35 38 42 46 52 25 30 34 36 38 42 46 52 26 30 34 36 38 42 47 52 26 30 34 36 39 42 47 52 26 31 35 37 39 43 47 53 27 31 35 37 39 43 47 53 27 31 35 37 40 43 47 54 27 31 35 37 40 44 48 55 28 31 35 38 40 44 48 61 28 32 35 38 40 45 48 62 28 32 35 38 40 45 49 64 29 33 35 38 40 45 49 72


MANIPULACIÓN DE LOS DATOS Conclusiones obtenidas de estos datos: Edad máxima: 72 Edad mínima: 22 Amplitud general: 50 diferencia entre ( 72-22) Mayoría de valores está entre 30 y 50

Una visión más clara se puede obtener construyendo una distribución de frecuencias. Requiere definir: 1- Valor de inicio de la primer clase 2 - Amplitud o intervalo a usar 3- Conociendo ambas queda definida la de clases a construir

cantidad


EL NÚMERO DE CLASES•

Depende de la cantidad de datos u observaciones y de la amplitud general

Muchas observaciones permiten un mayor número de clases

Pocos datos no conviene hacer muchas clases

Buscar un balance entre necesidad de resumir la información y mantener suficientes detalles para apreciar las características de los datos.

Partir de la amplitud general y probar con diferente número de clases hasta alcanzar un número de clases y un intervalo adecuado (rango / # clases)

Decidir si usar clases iguales o desiguales

El número de clases recomendable está asociado con la cantidad de datos.


Clases abiertas: Ubicadas al principio o al final de la distribución de frecuencias, Necesarias cuando unos pocos datos se alejan mucho de la mayoría (hacia arriba o hacia abajo), • Evitar construir clases intermedias vacías (para clases de igual amplitud) • •

Recomendaciones: Las clases deben ser exhaustivas y mutuamente excluyentes Procurar que el número de clases oscile entre 5 y 10 Evitar, hasta donde sea posible, clases de diferente amplitud


COMPONENTES DE LA DISTRIBUCIÓN DE FRECUENCIAS FRECUENCIAS ABSOLUTAS: Número de elementos u observaciones pertenecientes a una misma clase. FRECUENCIA RELATIVA: Se obtiene dividiendo la frecuencia absoluta por el número de observaciones Denota la importancia de la clase, al expresarse en términos porcentuales Facilitan el análisis de los datos, en especial para comparar distribuciones de frecuencias basadas en diferentes número de observaciones FRECUENCIA ACUMULADA Número de observaciones que son menores que el límite superior de la clase. Se obtiene sumando las frecuencias (absolutas o relativas) en sentido descendente PUNTO MEDIO: Valor central de la clase, Promedio entre el límite inferior de entre dos clases sucesivas, Es el valor representativo de la clase


1.- Organización de los datos •

Formas de organizar los datos: – Un arreglo: es la forma más sencilla de organizar los datos en bruto, consiste en colocar las observaciones en orden según su magnitud: ascendente o descendente. – Poco práctica cuando se tiene una gran cantidad de datos.


1.1 Organizaciรณn de los datos Una distribuciรณn de frecuencias: es un arreglo de los datos que permite expresar la frecuencia de ocurrencias de las observaciones en cada una de las clases, mostrando el patrรณn de la distribuciรณn de manera mรกs significativa.

Frecuencia con la que se repiten los datos

Numero de Clase

Intervalos

Punto Medio

fi


BIBLIOGRAFIA CONSULTADA BERENSON, M.L. y D.M. LEVINE. 1984. Estadística para Administración y Economía. Conceptos y Aplicaciones. Edit. Interamericana. México, D.F. CABALLERO, W. 1981. Introducción a la Estadística. Instituto Interamericano de Cooperación para la Agricultura (IICA). San José, Costa Rica. CHAO, L.L. 1993. Estadística para las Ciencias Administrativas. 3ra. Edic. Edit. McGraw-Hill. Bogota, Colombia. HERNANDEZ, S.R.; C. FERNANDEZ COLLADO y P. BAPTISTA LUCIO. 1991. Metodología de la Investigación. Edit. McGraw-Hill Interamericana de México, S.A. de C.V. México. INFANTE, GS y G.P. ZARATE de LARA. 1990. Métodos Estadístico. Un enfoque interdisciplinario. 2da. Edi. Edit. Trillas. México, D.F. .


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.