Criterios de diagnostico de la regresion

Hay que considerar los mismos supuestos que en la RLS

D de COOK

Mide la importancia de la remocion de cada valor Si:

D > F(0.5, p, n-p)

se considera que remover la observacion sera importante en el modelo.

VIF COLINEALIDAD: Es la asociacion que puede existir entre la variables regresoras. Si esa asociacion es alta, el determinanate de la matriz (Xâ&#x20AC;&#x2122;X) -1 puede no tener una solucion unica. El ajuste de la function se vuelve imposible o inestable.

Moments M ean St d Dev St d Error M ean Upper 95% M ean Lower 95% M ean N Sum W eight s

Y

-4

-3

-2

-1

0

1

2

3

-0. 001 1. 137 0. 028 0. 055 -0. 057 1600. 000 1600. 000

4

Moments

X1

-3. 0

-2. 0

-1. 0

.0

1. 0

2. 0

3. 0

X2

-3. 0

-2. 0

-1. 0

.0

1. 0

2. 0

Correlations Variable Y X1 X2

3. 0

M ean St d Dev St d Error M ean Upper 95% M ean Lower 95% M ean N Sum W eight s

-0. 022 1. 016 0. 025 0. 028 -0. 071 1600. 000 1600. 000

Moments M ean St d Dev St d Error M ean Upper 95% M ean Lower 95% M ean N Sum W eight s

-0. 021 1. 028 0. 026 0. 030 -0. 071 1600. 000 1600. 000

Partial Corr Y 1.0000 0.1583 0.7078

X1 0.1583 1.0000 -0.0172

X2 0.7078 -0.0172 1.0000

Variable Y X1 X2

Y • 0.2414 0.7197

X1 0.2414 • -0.1853

X2 0.7197 -0.1853 •

partialled with respect to all other variables

Figure 7-1. Characteristics of the variables in the data set without collinearity. The true model is Y= 0.2 X1 + 0.8 X2 +e.

Moments

Yr

-5

-4

-3

-2

-1

0

1

2

Mean Std Dev Std Error Mean Upper 95% Mean Lower 95% Mean N Sum Weights

3

-0.081 1.279 0.032 -0.018 -0.144 1600.000 1600.000

4

Moments

Xr1

-3.0

-2.0

-1.0

.0

1.0

2.0

3.0

Xr2

-3.0

-2.0

-1.0

.0

1.0

2.0

Correlat ions Va ria ble Yr X1r X2r

3.0

Mean Std Dev Std Error Mean Upper 95% Mean Lower 95% Mean N Sum Weights

-0.022 1.016 0.025 0.028 -0.071 1600.000 1600.000

Moments Mean Std Dev Std Error Mean Upper 95% Mean Lower 95% Mean N Sum Weights

-0.024 1.023 0.026 0.026 -0.075 1600.000 1600.000

Partial Corr Yr 1.0000 0.7889 0.7919

X1r 0.7889 1.0000 0.9952

X2r 0.7919 0.9952 1.0000

Va ria ble Yr X1r X2r

Yr • 0.0134 0.1124

X1r 0.0134 • 0.9874

X2r 0.1124 0.9874 •

partialled with respect to all other variables

Figure 7-2. Characteristics of the variables in the data set with collinearity. The true model is Y= 0.2 X1 + 0.8 X2 +e.

Criterios para medir el ajuste de un modelo

Criterios para medir el ajuste del modelo R2 : Coeficiente de determinacion SC Re g SCE R  1 SCTOT SCTOT 2

 Aumenta al aumentar el numero de variables en el modelo, aunque no sean significativas  Requiere un grado de subjetividad para decidir que aumento en R2 justifica aumentar la complejidad del modelo.

Criterios para medir el ajuste del modelo R2 : Coeficiente de determinacion  Aumenta al aumentar el numero de variables en el modelo, aunque no sean significativas.  Requiere un grado de subjetividad para decidir que aumento en R2 justifica aumentar la complejidad del modelo. Ra2 : Coeficiente de determinacion ajustado  Calculado de forma tal que el aumento de SC del modelo se ve balanceado por la perdida de GL.  El Ra2 aumenta solo si el modelo propuesto disminuye el CME.

Ra2 : Coeficiente de determinacion ajustado  n  1  SCE CME R  1    1  SCTOT / n  1  n  p  SCTOT 2 aj

 Calculado de forma tal que el aumento de SC del modelo se ve balanceado por la pedida de GL.  El Ra2 aumenta solo si el modelo propuesto disminuye el CME

Cp de Mallow

 SCE p    n  2 p  Cp    CME 

SCErrorp es la de un modelo reducido (con p parámetros incluida la constante) CMError es el cuadrado medio de error para el modelo completo  n el número total de observaciones  Cada regresora se tiene un indicador de contribución en el ajuste del modelo general: valores de Cp cercanos a p corresponden a modelos con pequeño sesgo en la predicción.  Si al sacar una regresora el valor Cp se incrementa mucho se puede pensar que esa regresora es importante para el ajuste del modelo. Cp grande: faltan variables importantes en el modelo Cp muy chico: Demasiadas variables incluidas en el modelo (sobreparametri

Criterio de informacion de AKAIKE

AIC  n lnSCE p   2 p  n lnn  Relaciona la precision del ajuste con el numero de parametros .  Mejor modelo: menor AIC  Tiende a seleccionar modelos con mas parametros que los significativos

Criterios de regresion

regresion

Criterios de regresion

regresion