Issuu on Google+

ESTADÍSTICA DESCRIPTIVA CORRELACION Y REGRECION LINEAL SIMPLE

CORRELACIÓN Hay correlación entre dos variables cuando éstas cambian de tal modo que los valores que toma una de ellas son, hasta cierto punto, predecibles a partir de los que toma la otra. El análisis de correlación es el conjunto de técnicas estadísticas empleado para medir la intensidad de la asociación entre dos variables. El principal objetivo del análisis de correlación consiste en determinar que tan intensa es la relación entre dos variables, estas pueden ser. Variable Dependiente.- es la variable que se predice o calcula. Cuya representación es "Y" Variable Independiente.- es la o las variables que proporcionan las bases para el calculo. Cuya representación es: “X”. Esta o estas variables suelen ocurrir antes en el tiempo que la variable dependiente.


ESTADÍSTICA DESCRIPTIVA CORRELACION Y REGRECION LINEAL SIMPLE

COEFICIENTE DE CORRELACIÓN.( Pearson ) Este es un índice estadístico que mide la relación lineal entre dos variables cuantitativas, es una forma de medir la intensidad de la relación lineal entre dos variables. El valor del coeficiente de correlación puede tomar valores desde menos uno hasta uno, -1 < r < 1, indicando que mientras más cercano a uno sea el valor del coeficiente de correlación, en cualquier dirección, más fuerte será la asociación lineal entre las dos variables. El coeficiente de correlación de cálculo “r” es un estimador muestral del coeficiente poblacional Rho, . Fuerte

Fuerte -1 <

0

< 1

Mientras más cercano a cero sea el coeficiente de correlación, este indicará que más débil es la asociación entre ambas variables. Si es igual a cero se concluirá que no existe relación lineal alguna entre ambas variables.


ESTADÍSTICA DESCRIPTIVA CORRELACION Y REGRECION LINEAL SIMPLE

COEFICIENTE DE CORRELACIÓN.( Pearson ) Formula

Valor de R

Nivel de Correlación

≤ 0.20

Insignificante

0.21 a 0.40

Baja

0.41 a 0.70

Moderada

0.71 a 0.90

Alta

0.91 a 1

Muy alta


ESTADÍSTICA DESCRIPTIVA CORRELACION Y REGRECION LINEAL SIMPLE

GRADO DE CORRELACIÓN El coeficiente de correlación, r, presenta valores entre –1 y +1. Cuando r es próximo a 0, no hay correlación lineal entre las variables. La nube de puntos está muy dispersa o bien no forma una línea recta. No se puede trazar una recta de regresión. Cuando r es cercano a +1, hay una buena correlación positiva entre las variables según un modelo lineal y la recta de regresión que se determine tendrá pendiente positiva, será creciente. Cuando r es cercano a -1, hay una buena correlación negativa entre las variables según un modelo lineal y la recta de regresión que se determine tendrá pendiente negativa: es decreciente. No hay correlación

r 0

Hay correlación no lineal

r 0

Correlación lineal positiva

r  1

Correlación lineal negativa

r  1


ESTADÍSTICA DESCRIPTIVA CORRELACION Y REGRECION LINEAL SIMPLE

COEFICIENTE DE DETERMINACIÓN, R2 Para estimar la bondad de un ajuste frecuentemente se prefiere utilizar el Coeficiente de Determinación, R2, que es el Coeficiente de Correlación elevado al cuadrado. Se determina mediante cualquiera de las dos expresiones siguientes: Grado de dependencia de una variable respecto a la otra Su valor oscila entre 0 y +1. Cuando hay una buena correlación lineal, R2 es muy cercano a +1. Normalmente se acepta para valores de R2 >= 0’99. Cuando no hay correlación o bien ésta no es lineal, R2 es bajo e incluso cercano a cero


ESTADÍSTICA DESCRIPTIVA CORRELACION Y REGRECION LINEAL SIMPLE

REGRESION LINEAL Si solamente están involucradas dos variables, se dice que la técnica es una regresión o correlación simple. Cuando están implicadas tres o más variables, se tratará de una regresión o correlación múltiple. Mientras que la correlación mide el grado de vinculación entre variables, la regresión se encarga de calcular, a partir de las observaciones, el valor real de los coeficientes que explican una relación funcional matemática. En Estadística la regresión lineal o ajuste lineal es un método matemático que modeliza la relación entre una variable dependiente Y, las variable Independiente X y un término aleatorio


ESTADÍSTICA DESCRIPTIVA CORRELACION Y REGRECION LINEAL SIMPLE

RECTA DE REGRESION En el modelo de regresión lineal simple la función elegida para aproximar la relación entre las variables es una recta, es decir y=a+bx, donde a,b son los parámetros. A esta recta la llamaremos RECTA DE REGRESIÓN. Propósito: determinar la ecuación de regresión; se usa para predecir el valor de la variable dependiente (Y) basado en la variable independiente (X). Procedimiento: Seleccionar una muestra de la población y enumerar los datos por pares para cada observación; dibujar un diagrama de dispersión para visualizar la relación; determinar la ecuación de regresión. La ecuación de regresión: Y’= a + bX, donde: Y’ es el valor promedio pronosticado de Y para cualquier valor de X. a es la intercepción en Y, o el valor estimado de Y cuando X = 0 b es la pendiente de la recta, o cambio promedio en Y’ por cada cambio de una unidad en X se usa el principio de mínimos cuadrados para obtener a y b


ESTADÍSTICA DESCRIPTIVA CORRELACION Y REGRECION LINEAL SIMPLE

RECTA DE REGRESION (y=a+bx) Cuando la línea de regresión que mejor se ajusta a la nube de puntos es la recta, es un problema de regresión lineal y distinguiremos dos casos: Recta de regresión de Y sobre X: Se obtienen valores aproximados de la variable Y conocidos los valores de la variable X Recta de regresión de X sobre Y: Se obtienen valores aproximados de la variable X conocidos los valores de la variable Y El criterio de mínimos al cuadrado implica que la recta elegida para ajustar los puntos del diagrama de dispersión sea tal que la suma de los cuadrados de las distancias verticales entre los puntos y la recta sea lo más pequeño posible. Los valores para los coeficientes de a y b son:


ESTADÍSTICA DESCRIPTIVA CORRELACION Y REGRECION LINEAL SIMPLE

EJEMPLO COEFICIENTE DE CORRELACIÓN.( Pearson )

Un comerciante a menudo lleva a cabo un estudio para determinar la relación entre los gasto de publicidad semanal y las ventas. Se obtuvieron los siguientes resultados Determinar el coeficiente de correlación de Pearson y determinar cual es su nivel. Dibuje el diagrama de dispersión. Encuentre la ecuación y grafique la recta de regresión para pronosticar las ventas semanales resultante del gasto de publicidad. Estimes las ventas semanales cuando los gastos de publicidad asciende a 35$

Costo de publicidad ($) 40 20 25 20 30 50 40 20 50 40 25 50

Ventas ($) 385 400 395 365 475 440 490 420 560 525 480 510


ESTADÍSTICA DESCRIPTIVA CORRELACION Y REGRECION LINEAL SIMPLE

EJEMPLO COEFICIENTE DE CORRELACIÓN.( Pearson ) Costo de Publicidad Ventas ($) X*Y ($) (X) (Y) 40 385 15400 20 400 8000 25 395 9875 20 365 7300 30 475 14250 50 440 22000 40 490 19600 20 420 8400 50 560 28000 40 525 21000 25 480 12000 50 510 25500 410 5445 191325

X2 1600 400 625 400 900 2500 1600 400 2500 1600 625 2500 15650

Y2 148225 160000 156025 133225 225625 193600 240100 176400 313600 275625 230400 260100 2512925

Nivel de Correlación Moderada

Las ventas depende del costo de publicidad en 0.401*100= 40.1%


ESTADÍSTICA DESCRIPTIVA CORRELACION Y REGRECION LINEAL SIMPLE

EJEMPLO COEFICIENTE DE CORRELACIÓN.( Pearson )

Ecuación de la Recta Y = a+bx

Coeficiente de Correlación de Pearson 600

y = 3,220x + 343,7 R² = 0,403

Ventas

550

500

456.4 450

400

35

350

0

10

20

30

40

50

60

Costo de Publicidad

Si X= 35$ (Gastos de Publicidad)

Y = ? (Ventas)

Y =343.70+3.22*35 = 456.40 $


Teoria de correlación