Issuu on Google+

PERCENTIL MEDIANA

MEDIDAS DE POSICIĂ“N

CUANTILES: PERCENTILES,CUARTILES, DECILES Centiles: Percentiles: P1, P2‌P99 Q1: P25. Cuartil primero. Deja el 25% de los valores por debajo Q2: P50: Md (mediana). Cuartil segundo. Deja la mitad de los valores por encima y por debajo Q3: P75. Cuartil tercero Deciles: P10, P20‌P90 Cuantiles pertenecen a nĂşmeros reales ďƒ  es posible P19,3

+ Ă­ndice de posiciĂłn + Ă­ndice de distribuciĂłn

Para caracterizar un grupo de datos son necesarios:

MEDIDAS DE DISPERSIĂ“N O VARIABILIDAD ABSOLUTAS Distancia de cada valor respecto a la medida de tendencia central DISPERSIĂ“N DE LA DISTRIBUCIĂ“N ďƒ  VARIABILIDAD ďƒ  Se mide con la varianza 

Recorrido/rango: R = xn - x1



Recorrido/rango intercuartĂ­lico: RI = Q3 - Q 1



Medida de dispersiĂłn en valor absoluto ďƒ  Mediana Median absolute deviation: masa total de desviaciĂłn respecto a la mediana DesviaciĂłn absoluta respecto a la mediana: ∑│Xi -Md│ DesviaciĂłn media con respecto a la mediana: ∑

Escalas nominales y ordinales

│Xi −Md│ n

Medida de dispersiĂłn en valor absoluto ďƒ  Media DesviaciĂłn absoluta respecto a la media: ∑│Xi-X│ DesviaciĂłn media con respecto a la media: ∑



│Xi−X │ n

Medida al cuadrado ďƒ  Media Variabilidad cuadrĂĄtica: ∑(Xi- X)2 Varianza: đ?‘† 2 = ∑

(Xi− X )2 n

ďƒ  alterando el sentido de la medida 2

DesviaciĂłn tĂ­pica o estĂĄndar: S= đ?‘† = ∑ Cuasi-varianza: đ?‘†n2−1 = ∑

(Yi− Y )2 n−1

2

(Xi− X) n

mejor indicador de la variabilidad global de la distribuciĂłn

ďƒ  mejor indicador para muestras/grupos

RelaciĂłn entre varianza y cuasi-varianza:

2 đ?‘› − 1 đ?‘†đ?‘›âˆ’1 = đ?‘› đ?‘†đ?‘›2


MEDIDAS DE DISPERSIÓN RELATIVAS para que no afecten las unidades de medida de la variable y para que puedan hacerse comparaciones entre las dispersiones de conjuntos de datos dispares 

Recorrido semi-intercuartĂ­lico: Rs = Q3-Q1/(Q3+Q1)



Ă?ndice de dispersiĂłn respecto a la mediana: VMe = D/Me



Coeficiente de variación de Pearson: � = �0 =

Escalas nominales y ordinales

� �

MOMENTOS DE UNA DISTRIBUCIÓN 



Indicadores genĂŠricos de una distribuciĂłn Dos distribuciones son iguales, si tienen todos sus momentos iguales, y son tanto mĂĄs parecidas cuanto mayor sea el nĂşmero de momentos iguales que tengan RelaciĂłn entre momentos ordinarios y centrales ďƒ  đ?‘šđ?‘&#x; = (a − đ?‘Ľ )(đ?‘&#x;)



Momentos ordinarios respecto al origen ďƒ  đ?‘Žđ?‘&#x; =



∑đ?‘˜đ?‘–=1 đ?‘‹đ?‘–đ?‘&#x; .đ?‘› đ?‘– đ?‘

Se ven afectados por los cambios de origen y de escala (unidad) en los valores de la variable đ?‘Ž0 =1 para cualquier distribuciĂłn đ?‘Ž1 =đ?‘‹ ; media aritmĂŠtica



∑đ?‘˜đ?‘–=1 đ?‘‹ đ?‘– −đ?‘‹ đ?‘&#x; .đ?‘› đ?‘–

Momentos centrales de orden p respecto a la media aritmĂŠtica ďƒ  đ?‘šđ?‘&#x; =

đ?‘

Sólo se ven afectados por los cambios de escala �0 = 1 �1 = 0 �2 = � 2

TRANSFORMACIONES LINEALES DE UNA VARIABLE ESTAD�STICA 

Dada una variable estadĂ­stica x una nueva variable estadĂ­stica y, serĂĄ una transformaciĂłn lineal de x cuando cada valor de y (đ?‘Śđ?‘– ) dependa de cada observaciĂłn de x (đ?‘Ľđ?‘– ) segĂşn una funciĂłn lineal, manteniĂŠndose la asignaciĂłn de frecuencias. r

mr(y) = b .mr(x) ďƒ  comportamiento de los momentos centrales de orden r yi = a + b xi 

TipificaciĂłn canĂłnica ďƒ  para comparar conjuntos de diferentes caracterĂ­sticas đ?‘Śâˆ’đ?‘‹ đ?‘?= đ?‘†đ?‘Ś Z=0 ďƒ  50% de la distribuciĂłn đ?‘?= 0 ďƒ  media de la nueva variable DistribuciĂłn normal đ?‘†đ?‘§ = 1 ďƒ  desviaciĂłn tĂ­pica de la nueva variable


MEDIDAS DE FORMA 

Medidas de asimetrĂ­a respecto a la media Momento central de orden imparâ&#x2030;Ľ3 (p=1 ď&#x192;  se anula) ď&#x192;  Depende de la unidades p impar ď&#x192;  đ?&#x2018;&#x161;đ?&#x2018;? > 0 ď&#x192;  la distribuciĂłn es asimĂŠtrica positiva p impar ď&#x192;  đ?&#x2018;&#x161;đ?&#x2018;? = 0 ď&#x192;  la distribuciĂłn es simĂŠtrica p impar ď&#x192;  đ?&#x2018;&#x161;đ?&#x2018;? < 0 ď&#x192;  la distribuciĂłn es asimĂŠtrica negativa Permite hacer comparaciones de carĂĄcter universal Momento central de tercer orden de la variable tifipicada: đ?&#x2018;&#x201D;1 = đ?&#x2018;&#x161;3 (t) =

ď&#x201A;§

đ?&#x2018;&#x161; 3 (đ?&#x2018;Ľ) đ?&#x2018;&#x2020;đ?&#x2018;Ľ3

Medidas de curtosis o apuntamiento Mayor o menor apuntamiento con independencia de la varianza Considerar momento central de orden 4 ď&#x192;  đ?&#x2018;&#x161;4 =

â&#x2C6;&#x2018;đ?&#x2018;&#x203A;đ?&#x2018;&#x2013;=1 (đ?&#x2018;&#x2039; đ?&#x2018;&#x2013; â&#x2C6;&#x2019;đ?&#x2018;&#x2039; )4 .đ?&#x2018;&#x203A; đ?&#x2018;&#x2013; đ?&#x2018;

ď&#x192;  depende de la unidades

Para la comparaciĂłn universal ď&#x192;  momento de cuarto orden tipificado Comparar el apuntamiento de la distribuciĂłn con el de la distribuciĂłn normal (đ?&#x2018;&#x161;4 đ?&#x2018;Ą = 3) Coeficiente de curtosis ď&#x192;  đ?&#x2018;&#x201D;2 = đ?&#x2018;&#x161;4 đ?&#x2018;Ą â&#x2C6;&#x2019; 3 =

đ?&#x2018;&#x161; 4 (đ?&#x2018;&#x2039;) đ?&#x2018;&#x2020;đ?&#x2018;Ľ4

-3

đ?&#x2018;&#x201D;2 > 0 ď&#x192;  LeptocĂşrtica ď&#x192;  MĂĄs apuntalada que la normal đ?&#x2018;&#x201D;2 = 0 ď&#x192;  MesocĂşrtica ď&#x192;  Igual de apuntalada que la normal đ?&#x2018;&#x201D;2 < 0 ď&#x192;  PlaticĂşrtica ď&#x192;  MĂĄs aplanada que la normal

MEDIDAS DE CONCENTRACIĂ&#x201C;N Miden el mayor o menor grado de igualdad en el reparto de la totalidad de los valores de la variable Dos situaciones extremas: A. Igualdad en el reparto - Suponemos la distribuciĂłn agrupada por intervalos -La proporciĂłn del monto total que se haya acumulado en el n intervalo es igual a la proporciĂłn sobre el total de los individuos que se lo reparten B. MĂĄxima concentraciĂłn - SĂłlo un individuo acumula el total del monto y el resto de los individuos no tienen nada ď&#x201A;§

Curva de Lorenz Suponemos la distribuciĂłn agrupada por intervalos đ?&#x2018;˘1 = đ?&#x2018;Ľ1 . đ?&#x2018;&#x203A;1 ď&#x192; Monto acumulado en el primer intervaloď&#x192;  đ?&#x2018;Ľ1 : marca de clase de cada intervalo o punto medio đ?&#x2018;˘2 = đ?&#x2018;Ľ1 . đ?&#x2018;&#x203A;1 +đ?&#x2018;Ľ2 . đ?&#x2018;&#x203A;2 ď&#x192;  Monto acumulado hasta el segundo intervalo đ?&#x2018;˘3 = đ?&#x2018;Ľ1 . đ?&#x2018;&#x203A;1 +đ?&#x2018;Ľ2 . đ?&#x2018;&#x203A;2 + đ?&#x2018;Ľ3 . đ?&#x2018;&#x203A;3 ď&#x192;  Monto acumulado hasta el tercer intervalo đ?&#x2018;˘đ?&#x2018;&#x203A; = â&#x2C6;&#x2018; đ?&#x2018;Ľđ?&#x2018;&#x2013; . đ?&#x2018;&#x203A;đ?&#x2018;&#x2013; ď&#x192;  Monto acumulado hasta el Ăşltimo intervalo đ?&#x2018;&#x17E;đ?&#x2018;&#x2013; = đ?&#x2018;?đ?&#x2018;&#x2013; =

đ?&#x2018;˘đ?&#x2018;&#x2013; đ?&#x2018;˘đ?&#x2018;&#x203A; đ?&#x2018; đ?&#x2018;&#x2013; đ?&#x2018;

.100 ď&#x192;  Porcentajes del monto total acumulados hasta cada intervalo .100 ď&#x192;  Porcentaje de individuos que integran el intervalo sobre el total de individuos

Curva de Lorenz ď&#x192; GrĂĄfico de ejes coordenados en el que se representen los pares de puntos (qi , pi)

ď&#x192;  MĂĄx igualdad en el reparto= MĂĄx homogeneidad ď&#x192;  Curva de Lorenz = Coincide con la diagonal


−1 ∑𝑛𝑖=1 (𝑝 𝑖 −𝑞 𝑖 )

Índice de Gini 𝐼𝑔 =

−1 ∑𝑛𝑖=1 𝑝𝑖

Indicador numérico de la concentración Equivale al doble del área encerrada entre la curva de Lorenz y la diagonal 𝐼𝑔 =1; Máxima concentración 𝐼𝑔 =0; Máxima uniformidad

REPRESENTACIONES GRÁFICAS NOMINAL

DIAGRAMA DE BARRAS DIAGRAMA EN ESCALERA PICTOGRAMA DE SECTORES

ORDINAL DE INTERVALO DE RAZÓN

HISTOGRAMA POLÍGONO DIAGRAMA DE CAJAS Y BIGOTES DIAGRAMA ACUMULATIVO

ANÁLISIS ESTADÍSTICO DESCRIPTIVO Análisis de datos unidimensionales MEDIDAS DE POSICIÓN MEDIDAS DE NO CENTRAL TENDENCIA CENTRAL  MODA  MÍNIMO  MEDIANA  MÁXIMO  MEDIA  CUANTILES

MEDIDAS DE DISPERSIÓN          

RANGO RANGO INTERCUALTÍLICO DESVIACIÓN MEDIA CON RESPECTO DE LA MEDIANA DESVIACIÓN MEDIA CON RESPECTO DE LA MEDIA CUASI-VARIANZA VARIANZA DESVIACIÓN TÍPICA RECORRIDO SEMIINTERCUARTÍLICO ÍNDICE DE DISPERSIÓN RESPECTO DE LA MEDIANA COEFICIENTE DE VARIACIÓN DE PEARSON

http://www.uv.es/ceaces/base/descriptiva/Descrip1.htm http://www.uv.es/ceaces/

MEDIDAS DE FORMA 

COEFICIENTE DE ASIMETRÍA: MOMENTO DENTRAL DE TERCER ORDEN LA VARIABLE TIPIFICADA COEFICIENTE DE CURTOSIS: MOMENTO CENTRAL DE CUARTO ORDEN DE LA VARIABLE TIPIFICADA

MEDIDAS DE CONCENTRACIÓN ÍNDICE DE GINI


ď&#x192;¨ DistribuciĂłn normal/Gaussiana ď&#x192;&#x2DC; ď&#x192;&#x2DC;

DistribuciĂłn de variable continua Queda especificada por dos parĂĄmetros de los que depende su funciĂłn de densidad La media: Âľ La desviaciĂłn tĂ­pica: Ď&#x192;

ď&#x192;&#x2DC; ď&#x192;&#x2DC;

FunciĂłn de densidad de la distribuciĂłn normal general FunciĂłn de densidad de la distribuciĂłn tipificada SimĂŠtrica respecto a đ?&#x2018;?= 0 đ?&#x2018;?= 0; presenta un mĂĄximo đ?&#x2018;?=+ â&#x2C6;&#x2019;1; presenta dos puntos de inflexiĂłn La distribuciĂłn normal reducida (tipificada) es una funciĂłn de distribuciĂłn de probabilidad FunciĂłn generatriz de momentos (F.G.M.) de la normal general y aplicar đ?&#x2018;&#x2039; = đ?&#x2018;&#x2020;. đ?&#x2018;? + đ?&#x2018;&#x161;

ď&#x192;&#x2DC; ď&#x192;&#x2DC;

1

FGM de la normal general: đ?&#x153;&#x2018;đ?&#x2018;§ đ?&#x2018;Ą = đ?&#x2018;&#x2019; đ?&#x153;&#x2021;đ?&#x2018;Ą + 1

ď&#x192;&#x2DC; ď&#x192;&#x2DC; ď&#x192;&#x2DC;

2 2 2đ?&#x153;&#x17D; đ?&#x2018;Ą 2

FGM de la normal reducida: đ?&#x153;&#x2018;đ?&#x2018;§ đ?&#x2018;Ą = đ?&#x2018;&#x2019; 2đ?&#x2018;Ą La media: el momento ordinario de primer orden La varianza: ď&#x192; đ?&#x2018;&#x17D;2 : momento ordinario de segundo orden Coeficiente de asimetrĂ­a de la normal reducida o tipificada: đ?&#x203A;ž1 đ?&#x2018;§ = đ?&#x153;&#x2021;3 đ?&#x2018;§ = đ?&#x2018;&#x17D;3 đ?&#x2018;§ = 0 Media=mediana: momento ordinario de tercer orden de la variable tipificada Coeficiente de curtosis: đ?&#x203A;ž2 = đ?&#x153;&#x2021;4 đ?&#x2018;§ â&#x2C6;&#x2019; 3 = đ?&#x2018;&#x17D;4 đ?&#x2018;§ â&#x2C6;&#x2019; 3 = 0 Teorema de adiciĂłn Dado un conjunto de variables aleatorias normales independientes de distintas medias y distintas varianzas , la variable suma de todas ellas se distribuirĂĄ segĂşn una distribuciĂłn normal con media, la suma de las medias; y con varianza , la suma de las varianzas

ď&#x192;&#x2DC;

Teorema fundamental de las distribuciones normales Cualquier combinaciĂłn lineal de variables aleatorias normales independientes es una variable aleatoria normal con media la misma combinaciĂłn lineal de las medias y con varianza la combinaciĂłn lineal de las varianzas con los coeficientes que las acompaĂąan al cuadrado

ď&#x192;&#x2DC;

Distribuciones normales-transformadas Una variable aleatoria x sigue una distribuciĂłn normal-transformada si, no siendo ella misma normal, si lo es una cierta funciĂłn de ella donde el jacobiano


Tercer seminario