ESTADISTICA ------- REGRESION LINEAL SIMPLE1 EJERCICIOS - REGRESIÓN LINEAL SIMPLE 1. En una muestra de 10 adultos se registraron las siguientes mediciones de edad en años (X) y la hipertensión arterial (HTA) (Y): X 38 42 43 46 48 50 54 60 65 67 Y 120 124 135 138 135 140 143 150 160 170 a. Indique la tendencia y obtenga la línea recta de regresión de la HTA en función de la edad. ¿Qué opina Ud. del nivel de correlación entre las dos variables? b. Compruebe la idoneidad del modelo lineal de regresión. Si el modelo es apropiado pronostique la HTA de un adulto de 70 años. c. De seguir la tendencia, cuánto se espera aumente la HTA para el próximo año. a. Indique la tendencia y obtenga la línea recta de regresión de la HTA en función de la edad. ¿Qué opina Ud. del nivel de correlación entre las dos variables? Y=A+BX B = 1.4869 A = 65.2214 Y=65.2214+1.4869X PERSONAS EDAD(X) HTA(Y) XY XX YY 1 38 120 4560 1444 14400 2 42 124 5208 1764 15376 3 43 135 5805 1849 18225 4 46 138 6348 2116 19044 5 48 135 6480 2304 18225 6 50 140 7000 2500 19600 7 54 143 7722 2916 20449 8 60 150 9000 3600 22500 9 65 160 10400 4225 25600 10 67 170 11390 4489 28900 ∑ 513 1415 73913 27207 202319 N = 10 MEDIA DE X = 51.3 MEDIA DE Y = 141.5 ESTADISTICA ------- REGRESION LINEAL SIMPLE 2 b. Compruebe la idoneidad del modelo lineal de regresión. Si el modelo es apropiado pronostique la HTA de un adulto de 70 años. COEFICIENTE DE COREELACION DE PIRSON r= 0.9689 COEFIECIENTE COVARIANZA = 1323.5 r es positiva, indica que tiene una tendencia lineal positiva, a mayor X, mayor Y r = 0.9689 ˃0.60, POR LO TANTO LA RECTA DE REGRESION ES CONFIABLEPARA PREDICIR SI X=70, ENTONCES Y= 169.305247 % VARIANZA TOTAL = 100% % EXPLICADA POR LA RR= 94% %VAR NO EXPLICADA= 6% c. de seguir la tendencia, cuánto se espera aumente la hta para el próximo año. la variación del siguiente año es =1.5 y = 1.4869x + 65.221 R² = 0.9387 0 20 40 60 80 100 120 140 160 180 0 10 20 30 40 50 60 70 80 Chart Title Series1 Linear (Series1) Linear (Series1) ESTADISTICA ------- REGRESION LINEAL SIMPLE 3 2. Un estudio de mercado trata de averiguar si es efectiva la propaganda televisada de un producto que salió a la venta con relación al tiempo de publicidad (horas/semana). Se recopilaron datos a partir de la segunda semana de iniciada la publicidad resultando la tabla siguiente. No se pudo recopilar datos de la cuarta semana. Semana 2 3 4 5 6 7 Tiempo de propaganda 20 25 22 28 36 40 Venta del producto S/. 300 310 - 320 350 420 Semana Tiempo de Venta XX YY XY Propaganada (X) del producto (Y) 2 20 300 400 90000 6000 3 25 310 625 96100 7750 4 22 297 484 88209 6534 5 28 320 784 102400 8960 6 36 350 1296 122500 12600 7 40 420 1600 176400 16800 ∑ Total 171 1997 5189 675609 58644 n=6 Media X =28.5 Media Y =332.8 y = a + bx b=5.5 a=176.6 a. Es efectiva la publicidad del producto Y = 176.6 +5.5X COEFICIENTE DE CORRELACION DE PIRSON r= 0.9309 COEFIECIENTE COVARIANZA = 1729.5 r es positiva, indica que tiene una tendencia lineal positiva, a mayor X, mayor Y r = 0.9309 ˃0.60, por lo tanto la recta de regresion es confiable para predicir b. En cuanto estimaría las ventas para la semana 4? Reemplazando datos ala ecuación 1 del cuadro anterior. ESTADISTICA ------- REGRESION LINEAL SIMPLE 4 hallamos la venta para la semana cuarta utilizando la formula siguiente: Media = Y Media= X (Y)= y (X)= x y - Y = b (x-X)…….. 1 Reemplazando datos ala ecuación 1 del cuadro anterior. m -(1700+)/6= b (22-28.5) Ahora calculamos la b. = (6(52110+22) −171 (1700+))/ (6(5189) − (〖171) 〗^2)) = (21960−3)/1893 (6−1700−)/6=(21960−39)/1893(−6.5) (6−1700−)/2=(21960−39)/631(−6.5) 3155m-631*1700 = (2(21960)-78m) (-6.5m) 3155m-631*(1700) = -285480+507m 2648m = 787220 m = 297.3 = 297. 3. Un editor tomó una muestra de 7 libros, anotando el precio y el número de páginas respectivo, si los resultados: Nro. de Pago. 630 550 400 250 370 320 610 Precio S/. 10 8 7 4 6 6 9 a. Obtenga el modelo de regresión lineal simple entre el precio y el número de páginas, con el fin de predecir precios. ¿Qué porcentaje de la varianza total de precios se explica por esta función?. b. Estime el precio de un libro de 300 páginas. Si a este libro se le incrementa 20 páginas en una segunda edición. En cuento se incrementaría su precio. c. Cuántas páginas debería tener un libro cuyo precio se estima en 12.27 soles. N° DE N° de Pagina Precio S/. (Y) XX YY XY ESTADISTICA ------- REGRESION LINEAL SIMPLE 5 a. Obtenga el modelo de regresión lineal simple entre el precio y el número de páginas, con el Fin de predecir precio. ¿Qué porcentaje de la varianza total de precios se explica por esta función? Y = 1.216+0.01326X b. Estima el precio de un libro de 300 páginas. Si a este libro se le incrementa 20 paginas en una segunda edición. En cuanto se incrementara su precio. COEFICIENTE DE CORRELACION DE PIRSON r= 0.9723 COEFIECIENTE COVARIANZA =1772.857143 r es positiva, indica que tiene una tendencia lineal positiva, a mayor X, mayor Y y = 0.0133x + 1.2157 R² = 0.9454 0 2 4 6 8 10 12 0 100 200 300 400 500 600 700 PRECIO LIBROS (X) 1 630 10 396900 100 6300 2 550 8 302500 64 4400 3 400 7 160000 49 2800 4 250 4 62500 16 1000 5 370 6 136900 36 2220 6 320 6 102400 36 1920 7 610 9 372100 81 5490 ∑ Total 3130 50 1533300 382 24130 ESTADISTICA ------- REGRESION LINEAL SIMPLE 6 r = 0.9723 ˃0.60, por lo tanto la recta de regresion es confiablepara predicir SI X=300, ENTONCES Y= 5.19 Si incrementa en 20 paginas entonces seria 320 hojas, entonces x=320 y= 5.46 y ahora la diferencia es = 0.27 RPTA. % VARIANZA TOTAL = 100% % EXPLICADA POR LA RR =95% %VAR NO EXPLICADA= 5% c. Cuántas páginas debería tener un libro cuyo precio se estima en 12.27 soles. SI Y = 12.27, ENTONCES X= 833.93 4. Una muestra de 5 varones adultos de quienes se observaron las estaturas (X en pies, pulgadas) y los pesos (Y en libras) ha dado los siguientes resultados: X 5´1´´ 5´2´´ 5´3´´ 5´4´´ 5´5´´ Y 125 130 140 145 160 a. Realice una regresión lineal y utilice los datos para verificar que la varianza total de Y es igual a la varianza residual más la varianza explicada por la recta de regresión. b. Usando la descomposición de la varianza calcule r 2 e interprete el resultado. Varones Publicidad (X) Ventanas (Y) XX YY XY 1 0.039 125 0.001521 15625 4.875 2 0.077 130 0.005929 16900 10.01 3 0.116 140 0.013456 19600 16.24 4 0.154 145 0.023716 21025 22.33 5 0.193 160 0.037249 25600 30.88 ∑Total 0.579 700 0.081871 98750 84.335 Publicidad (X) 5´1´´= 0.0385 5´2´´= 0.077 5´3´´=0.1155 5´4´´=0.154 5´5´´= 0.1925 ESTADISTICA ------- REGRESION LINEAL SIMPLE 7 0.579 1pies*pulg = 7.7*(10*-3) n=5 Media X =0.12 Media Y =140.0 y = a + bx b= 220.94 a=114.41 a. Realice una regresión lineal y utilice los datos para verificar que la varianza total de Y es igual a la varianza residual más la varianza explicada por la recta de regresión. Y = 114.41+ 220.94 X b. Usando la descomposición de la varianza calcule r 2 e interprete el resultado. COEFICIENTE DE CORRELACION DE PIRSON r= 0.982235323 COEFIECIENTE COVARIANZA =3.275 r es positiva, indica que tiene una tendencia lineal positiva, a mayor X, mayor Y r = 0.98224 ˃0.60, POR LO TANTO LA RECTA DE REGRESION ES CONFIABLEPARA PREDICIR r 2 = 0.9648 R² = 0.5332 y = 220.94x - 114.41 0 20000 40000 60000 80000 100000 120000 0 1 2 3 4 5 6 7 PESO Ventanas (Y) XX YY XY Linear (YY) Linear (YY) ESTADISTICA ------- REGRESION LINEAL SIMPLE 8 5. Una compañía de alimentos maneja una cadena de tiendas al menudeo. Para medir la eficiencia de las tiendas se estudió la relación del número de empleados (X) y el promedio del volumen de ventas mensuales (Y) en cientos de dólares para todas las tiendas durante el año pasado. La gráfica de los datos sugiere una relación lineal entre las variables. Se tiene la siguiente información: n=100, ∑X=600, ∑Y=1600, ∑XY=13600, ∑X 2 =5200, ∑Y 2 =37700 a. Obtenga el modelo de regresión lineal simple para predecir las ventas a partir del número de empleados. ¿En cuánto se estiman las ventas para una tienda de 8 empleados? b. ¿Qué porcentaje de las varianzas de las ventas es explicada por la variabilidad del número de empleados? c. ¿Cuántos empleados tiene la tienda cuya venta promedio se estima en 1100 dólares. EMPLEADOS N. EMPL.(X) P. VENT. (Y) XY XX YY ∑ 600 1600.00 13600 5200 37700 N = 100 MEDIA DE X =6.000 MEDIA DE Y =16.000 Y=A+BX B =2.50 A =1.00 Y=2.50X-1.00 Covarianza COVxy=4000 coef. Correlación de Pearson r =0.9091 copef. De determinación r*r = 0.8264 r es positiva, indica que tiene un a tendencia lineal positiva, a mayor X, mayor Y y = 155.31x - 184.68 R² = 0.9813 0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00 80.00 1.54 1.56 1.58 1.6 1.62 1.64 1.66 VENTAS ESTADISTICA ------- REGRESION LINEAL SIMPLE 9 r=0.9723>0.60, por lo tanto la recta de regresion es confiable para predecir. a. Obtenga el modelo de regresión lineal simple para predecir las ventas a partir del número de empleados. ¿En cuánto se estiman las ventas para una tienda de 8 empleados? si, X=8, entonces Y=21.000 el precio incremento se le aumenta 20pag mas si, X=320, entonces Y= 801.000 b. ¿Qué porcentaje de las varianzas de las ventas es explicada por la variabilidad del número de empleados? % varianza total= 100% % var. Explicada por la RR= 82.6% % var. No explicada= 17.4% c. ¿Cuántos empleados tiene la tienda cuya venta promedio se estima en 1100 dólares. El número de empleados que tiene la tienda, si su venta promedio es 1100 dólares es: 440.4 6. Sea Y el índice de precios al consumidor, tomando como base al año 2000 (es decir 2000=100). Para los datos que siguen: Año 2001 2002 2003 2004 2005 2006 2007 Y 106.0 111.1 117.2 121.3 125.2 128.0 132.6 a. Obtenga la recta de mínimos cuadrados que se ajuste a los datos. b. Realice la predicción del índice de precios para el año 2008, y compararlo con el valor verdadero (144.4). ¿En qué año podemos esperar que el índice de precios sea 150.57, suponiendo que las tendencias presentes continúen?. N AÑO(X) IND. CONS.(Y) XY XX YY 1 2001 106.0 212106 4004001 11236 2 2002 111.1 222422.2 4008004 12343.21 3 2003 117.2 234751.6 4012009 13735.84 4 2004 121.3 243085.2 4016016 14713.69 5 2005 125.2 251026 4020025 15675.04 6 2006 128.0 256768 4024036 16384 7 2007 132.6 266128.2 4028049 17582.76 ∑ 14028 841.4 1686287.2 28112140 101670.54 ESTADISTICA ------- REGRESION LINEAL SIMPLE 10 N = 7 MEDIA DE X =2004.000 MEDIA DE Y =120.200 Y=A+BX B =4.3429 A =-8582.9 Y=4.33429X-8582.9 covarianza COVxy=121.6 coef. Correlación de Pearson r = 0.9942 copef. De determinación r*r = 0.9885 r es positiva, indica que tiene un a tendencia lineal positiva, a mayor X, mayor Y r=0.6337>0.60, por lo tanto la recta de regresión es confiable para predecir. si, Y=150.57, entonces X=2011 % varianza total =100% % var. Explicada por la RR =98.8% % var. No explicada =1.2% y = 4.3429x - 8582.9 R² = 0.9885 0.0 20.0 40.0 60.0 80.0 100.0 120.0 140.0 2000 2001 2002 2003 2004 2005 2006 2007 2008 INDICE DE PRECIOS