Dossier De Estadística Inferencial Nocturna

Page 1

AJUSTE DE DATOS CON LA UTILIZACIÓN DE REGRESIÓN Y CORRELACIÓN PONDERADA Y LINEAL PROYECTADO POR LA EMPRESA COMODICENTER LTDA.

AUTORES: EDWIN JOHAN DURÁN 231112 JHOAN SEBASTIÁN GUERRERO 231111 RODOLFO MIGUEL MONTAGUT BERMON 231093

Trabajo para obtener una nota en la materia de Estadística Inferencial

DOCENTE AURA ESMIR NAVARRO CARRASCAL ESP. DOCENCIA UNIVERSITARIA ESP. INFORMATIVA EDUCATIVA

UNIVERSIDAD FRANCISCO DE PAULA SANTANDER OCAÑA FACULTAD DE CIENCIAS ADMINISTRATIVAS Y ECONÓMICAS CONTADURIA PUBLICA ESTADÍSTICA INFERENCIAL Ocaña, Colombia

Noviembre de 2020


Índice

1. Introducción.........................................................................................................1 2. Objetivos del proyecto.........................................................................................2 2.1 Objetivo general.................................................................................................................2 2.2 Objetivos específicos.........................................................................................................2

3. Ajuste de Datos con la Utilización de Regresión y Correlación Ponderada y Lineal proyectado por la empresa COMODICENTER LTDA...........................3 3.1 Planteamiento del problema...................................................................................................3

4. Conclusiones.......................................................................................................22 5. Recomendaciones...............................................................................................23

2


Lista de Tablas Tabla 1 Consolidado de datos obtenidos.........................................................................................3 Tabla 2 Tabulacion y obtención de datos necesarios para la regresión lineal ponderada...............4 Tabla 3 Datos finales para las rectas de regresión lineal ponderada.............................................12 Tabla 4 Aplicación de regresión lineal..........................................................................................13 Tabla 5 Datos finales de la aplicación de regresión lineal............................................................20

3


Lista de Figuras

Figura 1. Diagrama de dispersi贸n para Y......................................................................................11 Figura 2. Diagrama de dispersi贸n para X......................................................................................11 Figura 3. Diagrama de dispersi贸n para Y.......................................................................................19 Figura 4. Diagrama de dispersi贸n para Y.......................................................................................19

4


1. Introducción

COMODICENTER LTDA, es una empresa ocañera dedicada a la consultoría de proyecciones económicas de los almacenes que se encuentren ubicados dentro del Municipio. Desatancándose a lo largo de los últimos años, en los análisis del impacto económico frente al números de empleados que puede contratar un almacén, de manera que obtenga ventas mensuales que satisfagan los gastos en los que incurren los almacenes y se pueda incrementar las utilidades de los mismos.

En el 2019, se realizó una investigación con el personal adscrito a la empresa, donde se consultó a lo largo de los meses del año, en diversos almacenes del Municipio de Ocaña, los datos del número de empleados contratados y el monto en millones de pesos de las ventas generadas por el personal.

De manera que se pueda elaborar un modelo matemático, relacionado a la estadística, que permita conocer el número de empleados en función de las ventas y recíprocamente, tomando como referencia un valor de ventas y obtener el número de empleados necesarios para el mismo. El método a aplicar es la regresión lineal ponderada, la cual se desarrollará a lo largo del proyecto.

Además, se analizará y calculará otros parámetros estadísticos pertinentes, que soporten los datos obtenidos de la investigación realizada.

1


2. Objetivos del proyecto

2.1 Objetivo general.

Realizar el ajuste de los datos obtenidos con la utilización de la regresión y correlación ponderada, proyectado y ejecutado por la empresa COMODICENTER LTDA, en el Municipio de Ocaña, Norte de Santander.

2.2 Objetivos específicos.

Calcular las variables estadísticas necesarias para realizar la regresión lineal para los datos consolidados de los almacenes de la ciudad de Ocaña.

Obtener las gráficas de las regresiones lineales correspondientes a cada variable en análisis dentro del proyecto de consultoría realizado por la empresa COMODICENTER LTDA.

Obtener los parámetros estadísticos como la correlación de los datos y demás pertinentes para el proceso de consultoría.

2


3. Ajuste de Datos con la Utilización de Regresión y Correlación Ponderada y Lineal proyectado por la empresa COMODICENTER LTDA.

3.1 Planteamiento del problema

La empresa COMODICENTER LTDA, evaluará la relación que existe entre ventas mensuales (en millones de pesos) (Y), y el número de empleados (X) para un grupo de almacenes del sector de alimentos del Municipio de Ocaña, Norte de Santander. Los datos obtenidos en la investigación se muestran en la Tabla 1.

Tabla 1 Consolidado de datos obtenidos Meses

Empleados (X)

Ventas (Y)

ni

Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre

8 12 15 24 30 24 36 31 44 45 56 64

70 95 120 153 320 230 378 390 410 415 440 480

8 10 15 17 21 16 22 24 23 26 18 24

∑ 389 3501 224 Nota: La tabla muestra los datos obtenidos de las ventas y el número de empleados de los diferentes almacenes del Municipio de Ocaña. Fuente: Autores (2020).

3


En primera instancia, se les delegó la tarea a unos de los funcionarios de la empresa, para que realizara el análisis estadístico por medio de una regresión lineal ponderada, aplicando cada una de las fórmulas y pasos a seguir en este modelo. Se optó por éste, debido a que en la recolección se tomaron tres tipos de variables, siendo la primera el número de empleados de los almacenes (X), la segunda es la cantidad de ventas mensuales y la tercera es la frecuencia mensual de cada una de ellas (ni).

El modelo matemático se inició con la tabulación de los datos requeridos para aplicar las fórmulas y requerimientos de la regresión lineal. Por ello, la primera parte fue completar la Tabla 2, como se muestra a continuación.

Tabla 2 Tabulacion y obtención de datos necesarios para la regresión lineal ponderada Meses Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembr e Octubre Noviembre Diciembre ∑

Empleados (X) 8 12 15 24 30 24 36 31

Ventas (Y) 70 95 120 153 320 230 378 390

ni

Xi*ni

Yi*ni

Yi*Xi*ni

Xi2*ni

Yi2*ni

8 10 15 17 21 16 22 24

64 120 225 408 630 384 792 744

560 950 1800 2601 6720 3680 8316 9360

4480 11400 27000 62424 201600 88320 299376 290160

512 1440 3375 9792 18900 9216 28512 23064

39200 90250 216000 397953 2150400 846400 3143448 3650400

44

410

23

45 56 64 389

415 440 480 3501

26 18 24 224

1012 1170 1008 1536 8093

9430 10790 7920 11520 73647

414920 485550 443520 737280 3066030

44528 52650 56448 98304 346741

3866300 4477850 3484800 5529600 27892601

4


Nota: La tabla muestra los parámetros calculados para el desarrollo del modelo estadísticos de los almacenes del Municipio de Ocaña. Fuente: Autores (2020).

Luego de obtenidas los variables estipuladas por la regresión rectilínea ponderada, se procedió a obtener los parámetros byx y Cyx. De la siguiente manera:

1¿ Σ Y i ni=b yx Σ X i ni +ni C yx

2 ¿ Σ Y i X i ni=b yx Σ X 2i ni+ Σ X i ni C yx

Reemplazando los valores obtenidos en la Tabla 2 en el sistema de ecuaciones estipulado anteriormente:

1) 73647=8093byx+224Cyx 2) 3066030=346741byx+8093Cyx

El funcionario aplicó el método de eliminación para resolver el sistema de ecuaciones (2x2), aprendido a lo largo de su trayectoria académica. Por lo tanto, multiplicó la ecuación (1) por (-36.1294), con la final de eliminar la variable Cyx.

1) -2660821.922=-292395.2342 byx-8093 Cyx 2) 3066030

=346741byx

+8093Cyx

405208.078=54345.7658 byx b yx =

405208.078 b =7.456 54345.765 yx

5


De lo cual se obtuvo que el valor del parámetro byx =7.456, se reemplaza en la ecuación (1), para obtener Cyx:

1) 73647=8093(7.456) +224Cyx 73647=60341.408+224 Cyx 73647-60341.408=224 Cyx 13305.592=224 Cyx c yx =

13305.592 c yx =59.4 224

Por lo tanto, se tiene que el valor del parámetro Cyx es 59.4. Posteriormente, se vio a la necesidad de calcular el promedio de las variables X y Y, para continuar con la aplicación del modelo estadístico.

Cálculo de

x́=

y

ý :

Σ X i ni 8093 Σ Y i ni 73647 = =36.13 ý= =328.78 Σn 224 Σ n 224

Luego, se estructuró las ecuaciones de regresión para Y estimada en función de X será:

6


Y^ yx=b yx X i +C yx

Y^ yx=7.456 X i+ 59.4

X (¿¿ i−x́ )+ ý Y^ yx=b yx ¿

X (¿¿ i−36.13)+328.78 Y^ yx=7.456 ¿

Por otra parte, de manera similar, se obtuvo la ecuación de regresión lineal de X en función de Y, para ello se tiene:

1¿ Σ X i ni=b yx Σ Y i ni +ni C yx

2 ¿ Σ X i Y i ni=b yx Σ Y 2i ni + Σ Y i n i C yx

Para el desarrollo de esta parte, otro compañero del equipo de trabajo de la empresa COMODICENTER LTDA, brindó sus conocimientos para dar continuidad al análisis que se venía realizando. Luego de contextualizarlo en la nueva función, procedió a reemplazar los valores obtenidos en la Tabla 2, en el sistema de ecuaciones estipulado anteriormente:

1) 8093=73647bxy+224Cxy 2) 3066030=27892601bxy+73647Cxy

Luego, se aplicó nuevamente el método de eliminación para resolver el sistema de ecuaciones, por lo tanto, se multiplicó la ecuación (1) por (-328.7812), con la finalidad de eliminar la variable Cyx.

7


1) -2660826.252=-24213749.04bxy-73647Cxy 2)

3066030= 27892601bxy

+73647Cxy

405203.748=-3678851.964 bxy b xy =

405203.748 b =0.1101 3678851.964 xy

De allí se obtuvo que el valor del parámetro bxy =0.1101, lo reemplazamos en la ecuación (1) para obtener Cxy:

1) 8093=73647bxy+224Cxy 8093=73647(0.1101) +224Cxy 8093=8108.5347 +224Cxy 8093-8108.5347 =224Cxy -15.5347 =224Cxy c xy =

−15.5247 c xy=−0.0694 224

Al final, se consiguió la ecuación de la recta de la regresión de X estimada en función de y, la cual será:

8


^ X xy=b xy Y i +C xy

Y (¿¿ i− ý )+ x́ ^ X xy=b yx ¿

^ X xy=0.1101 Y i−0.0694

Y (¿¿ i−328.78)+36.13 ^ X yx=0.1101 ¿

Posteriormente de obtener las ecuaciones de regresión lineal pondera, se solicitó obtener la covarianza y los coeficientes angulares, los cuales se calcularon de la siguiente manera:

Covarianza:

S xy =

Σ x i y i ni 3066030 −x́ ý S xy = −(36.13∗328.78) n 224

S xy =1808.812

Varianza residual con respecto a X:

S x 2= 2

Sx =

Σ x i2 ni −x́ 2 n 346741 2 −36.13 224

S x 2=242.57

9


Varianza residual con respecto a Y:

Σ y i2 ni Sy = − ý 2 n 2

S y 2=

27892601 −328.782 224

2

S y =16424.25

Además, se quiso conocer el coeficiente de correlación y de determinación de los datos.

Coeficiente de determinación: Esta dado por la expresión: n

∑ X i Y i ni−n x́ ý r=

i=1

√[ [∑ n

i=1

r=

2

2

X n i−n( x́ )

][∑ n

i=1

Y i2 ni −n( ý )2

]]

3066030−224∗36.13∗328.78

√ [ [ 346741−224∗36.13 ] [ 27892601−224∗328.78 ] ] 2

2

r=0.906

Coeficiente de determinación: Esta dado por la expresión:

2

r=

suma de los c uadrados de regresión suma de cuadr a dos

r 2=(0.906)2

10


2

r =0.821

Por último, se realizó el cuadro resumen contemplado en la Tabla 3, donde se plasmaron los valores de las rectas de regresión, las cuales se muestran en las Figuras 1 y 2.

DIAGRAMA DE DISPERSION PARA Y 600 f(x) = 7.46x + 59.4

500 400 300 200 100 0

0

10

20

30

40

Figura 1. Diagrama de dispersión para Y. Fuente: Autores (2020).

11

50

60

70


DIAGRAMA DE DISPERSION PARA X 60 f(x) = 0.11x + 0.08

50 40 30 20 10 0

0

100

200

300

400

Figura 2. Diagrama de dispersiรณn para X. Fuente: Autores (2020).

12

500

600


Tabla 3 Datos finales para las rectas de regresión lineal ponderada Meses

Empleados (X)

Ventas (Y)

ni

Xi*ni

Yi*ni

Yi*Xi*ni

Xi2*ni

Yi2*ni

Y^ yx=7.456 X i+^ X59.4 xy =0.11Y i −0.069

Enero 8 70 8 64 560 4480 512 39200 119,045276 7,79392792 Febrero 12 95 10 120 950 11400 1440 90250 148,869659 10,5475298 Marzo 15 120 15 225 1800 27000 3375 216000 171,237945 13,3011317 Abril 24 153 17 408 2601 62424 9792 397953 238,342805 16,9358862 Mayo 30 320 21 630 6720 201600 18900 2150400 283,079379 35,3299469 Junio 24 230 16 384 3680 88320 9216 846400 238,342805 25,41698 Julio 36 378 22 792 8316 299376 28512 3143448 327,815952 41,7183033 Agosto 31 390 24 744 9360 290160 23064 3650400 290,535474 43,0400322 Septiembre 44 410 23 1012 9430 414920 44528 3866300 387,464716 45,2429137 Octubre 45 415 26 1170 10790 485550 52650 4477850 394,920812 45,7936341 Noviembre 56 440 18 1008 7920 443520 56448 3484800 476,937863 48,5472359 Diciembre 64 480 24 1536 11520 737280 98304 5529600 536,586627 52,952999 ∑ 389 3501 224 8093 73647 3066030 346741 27892601 Nota: La tabla muestra los datos consolidados para las rectas de regresión lineal ponderada de los almacenes del Municipio de Ocaña. Fuente: Autores (2020).

13


De manera simultánea, la empresa desarrollo el modelo de regresión lineal, donde se contempla la información en la Tabla 4.

Tabla 4 Aplicación de regresión lineal Meses Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre ∑

Empleados (X) 8 12 15 24 30 24 36 31 44 45 56 64 389

Ventas (Y)

Yi*Xi

Xi2

Yi2

70 95 120 153 320 230 378 390 410 415 440 480 3501

560 1140 1800 3672 9600 5520 13608 12090 18040 18675 24640 30720 140065

64 144 225 576 900 576 1296 961 1936 2025 3136 4096 15935

4900 9025 14400 23409 102400 52900 142884 152100 168100 172225 193600 230400 1266343

Nota: La tabla muestra los datos para la regresión lineal de los almacenes del Municipio de Ocaña. Fuente: Autores (2020).

Luego de ello, se obtuvieron las variables de la regresión lineal:

Cálculo de la media, la varianza, la desviación estándar y la covarianza; con respecto a x.: Media =

x́=

∑ xi ⇒ N

x́=

389 =32.42 12

14


Varianza =

σx

2

2 xi ∑ = −x́ 2

Desviación típica =

N

σ x 2=

σ x =√ 276.86=¿ 16.639

Respecto a y: Media =

ý=

∑ yi

Covarianza=S x y =

N

2

y Varianza = σ y2 = ∑ i − ý 2 N Desviación típica =

15935 − ( 32.42 )2 =276.86 12

σ y2 =

ý=

3501 =291.75 12

1266343 −( 291.75 )2 =20410.52 12

σ y =√ 20410.52=142.865

∑ x i y i − x́ ý ⇒ S n

xy

=

140065 −( 32.42 ) (291.75) 12

S xy =2213.55

A demás de ello, se calcularon los parámetros para establecer las ecuaciones de la estimación mediante la regresión tanto para Y como para X.

Los parámetros b y c en la recta de regresión “2 en 1”

1. 2.

∑ Y i=b yx ∑ X i +nC yx ∑ Y i X i=b yx ∑ X i2 +∑ X i C yx

A partir de las ecuaciones, se reemplazan los valores pertinentes de la Tabla 4, se tiene:

15


1) 3501=389byx+12cyx 2) 140065=15935 byx+389cyx

Para resolver el sistema de ecuaciones se aplicó nuevamente el método de eliminación, debido a que es el método más afianzado por el personal de la empresa COMODICENTER LTDA, por lo cual multiplicó la ecuación (1) por (-32.417) para eliminar la variable cyx.

-113490.75=-12610.083 byx-389cyx 140065=15935 byx+389cyx 26574.25=3324.914 byx

b yx =

26574.25 b =7.9925 3324.914 yx

De lo anterior de determino que el valor del parámetro byx es 7.9925, dicho valor se reemplaza en la ecuación (1) para obtener la variable de cyx.

3501=389(7.9925) +12cyx 3501=3109.0825+12 cyx 3501-3109.0825=12 cyx 391.9175=12 cyx

16


c yx =

391.9175 c yx =32.66 12

Posteriormente, se estructuró las ecuaciones de regresión para Y estimada en función de X siendo estas:

Y^ yx=b yx X i +C yx ⇒ Y^ yx =7.9925 X i +32.66 Aplicando la regresión lineal para X en función de Y.

Los parámetros b y c en la recta de regresión “1 en 2”.

1)

∑ X i=b xy ∑ Y i+ nC xy

2)

∑ Y i X i=bxy ∑ Y i2 +∑ Y i C xy Del mismo modo, el equipo de trabajo de la empresa continúa aplicando las bases teóricas

de la regresión lineal, por cual se reemplaza cada variable por los datos de la Tabla 4, se tiene:

1) 389=3501 b xy +12C xy 2) 140065=1266343 b xy +3501C xy

17


Nuevamente se aplicará el método de eliminación de variables, por lo cual se multiplicará la ecuación (1) por (-291.75), se tiene que:

-113490.75=-1021416.75bxy-3501cxy 140065=1266343 bxy+3501cxy 26574.25=244926.25 bxy

b xy =

26574.25 b =0.1085 244926.25 xy

El valor del parámetro bxy es 0.1085, ahora se reemplazará este valor en la ecuación (1):

389=3501(0.1085) +12cxy 389=379.8585+12cxy 389-379.8585=12cxy 9.1415=12cxy

c xy =

9.1415 c xy =0.7617 12

Por lo tanto, los parámetros b y c se reemplazan en la ecuación de regresión “1 en 2”

18


^ X xy=b xy Y i +C xy ⇒ ^ X xy=0.1085 Y i +0.7617 También se solicita conocer el coeficiente de correlación y el coeficiente de determinación de los datos analizados:

Coeficiente de correlaciona. Esta dado por la expresión:

n

∑ X i Y i−n x́ ý r=

r=

i=1

√[ [

n

][

n

∑ X 2−n( x́ )2 ∑ Y i2−n( ý)2 i=1

i=1

]]

140065−12∗32.42∗291.75

√ [ [ 15935−12∗32.42 ][ 1266343−12∗291.75 ] ] 2

2

r=0.93 Coeficiente de determinación: Esta dado por la expresión:

2

r=

suma de los c uadrados de regresión suma de cuadr a dos

0.93 ¿2 r 2=¿ r 2=0.867

19


Por último, en la Tabla 5 se muestra el cuadro resumen, donde se detalla los valores para las rectas de regresión para ambas variables, las cuales se detallan en las Figuras 3 y 4.

DIAGRAMA DE DISPERSION PARA Y 600 f(x) = 7.99x + 32.66

500 400 300 200 100 0

0

10

20

30

40

50

60

70

Figura 3. Diagrama de dispersión para Y. Fuente: Autores (2020).

DIAGRAMA DE DISPERSION PARA X 70 60 50

f(x) = 0.11x + 0.76

40 30 20 10 0

0

100

200

300

400

20

500

600


Figura 4. Diagrama de dispersiรณn para Y. Fuente: Autores (2020).

21


Tabla 5 Datos finales de la aplicación de regresión lineal Meses

Empleados (X)

Ventas (Y)

Yi*Xi

Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre

8 12 15 24 30 24 36 31 44 45 56 64

70 95 120 153 320 230 378 390 410 415 440 480

560 1140 1800 3672 9600 5520 13608 12090 18040 18675 24640 30720

Xi2

Yi2

Y^ yx=7.9925 X i +32.66 ^ X xy =0.1085 Y i +0.7617

64 4900 96,6008672 8,35701631 144 9025 128,570691 11,069491 225 14400 152,548059 13,7819657 576 23409 224,480162 17,3624322 900 102400 272,434898 35,481763 576 52900 224,480162 25,7168542 1296 142884 320,389634 41,7747043 961 152100 280,427354 43,0766921 1936 168100 384,329281 45,2466719 2025 172225 392,321737 45,7891668 3136 193600 480,238753 48,5016415 4096 230400 544,1784 52,841601 ∑ 389 3501 140065 15935 1266343 Nota: La tabla muestra los datos consolidados para las rectas de regresión lineal de los almacenes del Municipio de Ocaña. Fuente: Autores (2020).

22


Para finalizar la consultoría realizado por la empresa COMODICENTER LTDA, se quiere conocer el número de ventas que deben realizar los almacenes del Municipio de Ocaña, teniendo como base 40 empleados para el año 2021. Tomando como base la regresión lineal ponderada.

Y^ yx=7.456 X i+ 59.4 Y^ yx=7.456 (40)+59.4 Y^ yx =357.64

De lo anterior, se evidencia que, con una planta de personal de 40 personas, puede generar ventas mensuales de 357.64 millones de pesos ($357640000).

También se requiere conocer cuantos empleados son necesarios parar generar ventas de 250 (millones de pesos) dentro del Municipio de Ocaña.

^ X xy=0.1101 Y i−0.0694 ^ X xy=0.1101 (250)−0.0694 ^ X xy=27.46 ≅ 28

En relación a la expresión de la regresión, se estipula 28 empleados para generar la cuantiar de venta con un valor de 350 millones de pesos.

23


4. Conclusiones

Luego de realizadas las visitas a los diversos almacenes del Municipio de Ocaña, se ordenaron los datos mediante tablas y se calcularon las variables necesarias para obtener las ecuaciones de regresión lineal para ambas variables, siendo en este caso el número de empleados y el valor de ventas. Estas ecuaciones permitirán realizar una proyección frente a los requerimientos de los almacenes frente a la toma de decisiones frente al personal contratado.

Al momento de conocer las ecuaciones de las regresiones lineales, se procedió a obtener los gráficos de las mismas, para detallar el comportamiento a ambas variables, a partir de las graficas obtenidas y de la ecuación de la recta, se determinó que se presenta un comportamiento creciente, es decir que mientras una variable aumenta, la otra también. Lo que indica que son variables directamente proporcionales. Esto se logró evidenciar mediante un ejemplo en que se asumió un número de empleados y se obtuvo un valor representativo de ventas y en caso opuesto en el que se dio un valor de ventas y se conoció el numero de empleados necesarios.

En relación al comportamiento de los datos obtenido y su dispersión, se obtuvo un coeficiente de relación de 0.906, el cual indica que se presenta una correlación excelente, debido a presentó un valor cercano a 1, además de ello se constató que el comportamiento de la regresión es creciente y proporcional a las variables en análisis.

24


5. Recomendaciones

Se preciso a los almacenes que tengan actualizadas las bases de datos de sus nominas de personas mes a mes y que registren adecuadamente el valor de las ventas obtenidas, de manera que se conozca la rentabilidad y sostenibilidad del almacén.

Buscar asesorías técnicas en temas comerciales y manejo del flujo de dinero con profesionales idóneos, como los Contadores Públicos, de manera que se tomen decisiones oportunas y prevenir fracaso o inestabilidad de los almacenes.

Llevar un orden riguroso de las transacciones realizadas por los almacenes para evitar confusiones y de tal manera proporcionar una seguridad financiera en las entidades.

25


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.