EJERCICIOS DE REGRESIÓN MULTIPLE (Estadística) CASO 6 En el béisbol, el éxito de un equipo se suele considerar en función del desempeño en bateo y en lanzamiento del equipo. Una medida del desempeño en el bateo es la cantidad de cuadrangulares que anota el equipo y una medida del desempeño en lanzamiento es el promedio de carreras ganadas por el equipo que lanza. En general, se cree que los equipos que anotan más cuadrangulares (home run) y tienen un promedio menor de carreras ganadas ganan un mayor porcentaje de juegos. Los datos siguientes pertenecen a 16 equipos que participaron en la temporada de la Liga Mayor de Béisbol de 2003; se da la proporción de juegos ganados, la cantidad de cuadrangulares del equipo (HR, por sus siglas en inglés) y el promedio de carreras ganadas (ERA, por sus siglas en inglés) (www.usatoday.com, 17 de enero de 2004). a. Obtenga la ecuación de regresión estimada para predecir la proporción de juegos ganados en función de la cantidad de cuadrangulares. b. Obtenga la ecuación de regresión estimada para predecir la proporción de juegos ganados en función del promedio de carreras ganadas por los miembros del equipo que lanza. c. Obtenga la ecuación de regresión estimada para predecir la proporción de juegos ganados en función de la cantidad de cuadrangulares y del promedio de carreras ganadas por los miembros del equipo que lanza. d. En la temporada de 2003, San Diego ganó sólo el 39.5% de sus juegos, siendo el más bajo de la liga nacional. Para mejorar para el año siguiente, el equipo trató de adquirir nuevos jugadores que hicieran que la cantidad de cuadrangulares aumentara a 180 y que el promedio de carreras ganadas por el equipo que lanza disminuyera a 4.0. Use la ecuación de regresión estimada obtenida en el inciso para estimar el porcentaje de juegos que ganaría San Diego si tuviera 180 cuadrangulares y su promedio de carreras ganadas fuera 4.0. Solución ejercicio 6 a. Obtenga la ecuación de regresión estimada para predecir la proporción de juegos ganados en función de la cantidad de cuadrangulares. 1. LA RELACIÓN ESPERADA(TEÓRICA) HR-Proporción de ganados: relación Directa 2. DIAGRAMA DE DISPERSIÓN Según lo esperado podemos observar la proporción de ganados tiene una relación directa con respecto a HR, ver el siguiente diagrama 3. CORRELACIÓN H0: ρ=0; h1: ρ ≠0 Según lo observado en la siguiente tabla. Correlaciones Proporción de ganados Proporción de ganados Correlación de Pearson HR 1 Sig. (bilateral) N HR ,391 ,134 16 16 Correlación de Pearson ,391 1 Sig. (bilateral) ,134 N 16 16 Con un p-value mayor al 0.05, se acepta hipótesis nula, no presenta una relación significativa. 4. EL COEFICIENTE DE CORRELACIÓN: r=0.391, existe un correlación Significativamente baja entre la HR con la proporción de ganados. 5. COEFICIENTE DE DETERMINACIÓN AJUSTADO r2adj=0.093; el HR explica en 9.30 % a la estimación de la proporción de ganados y no es explicado en 91.00% Resumen del modelo Modelo R Error estándar ajustado de la estimación R cuadrado ,391a 1 R cuadrado ,153 ,093 ,066663 a. Predictores: (Constante), HR 6. PRUEBA DE VALIDEZ DEL MODELO H0: ρ=0 : la correlación no es significativa Ha: ρ ≠0 : la correlación es significativa ANOVAa Suma de Modelo 1 cuadrados Media gl cuadrática F Regresión ,011 1 ,011 Residuo ,062 14 ,004 Total ,073 15 Sig. ,134b 2,532 a. Variable dependiente: Proporcion de ganados b. Predictores: (Constante), HR o Con 5% de n.s, se acepta Ho. El modelo es NO significativo 7. EL MODELO β =0 ; β ≠0 Ho: i Ha: i Coeficientesa Coeficientes Coeficientes no estandarizad 95.0% intervalo de estandarizados os confianza para B Error Modelo 1 B (Constante ) estándar ,354 ,096 Beta t 3,691 Sig. ,002 Límite Límite inferior superior ,148 ,560 Correlaciones Proporcion de ganados ERA . CORRELACIÓN H0: ρ=0.000 a.354+0.591 . LA RELACIÓN ESPERADA(TEÓRICA) ERA – Proporción de ganados: relación inversa 2. DIAGRAMA DE DISPERSIÓN Según lo esperado podemos observar que la proporción de ganados con respecto a ERA presentan una relación inversa.HR .001 . ver el siguiente diagrama 3. 1.002 . Variable dependiente: Proporcion de ganados Proporción de ganados=0.001 .391 1. h1: ρ ≠0 Según lo observado en la siguiente tabla. Obtenga la ecuación de regresión estimada para predecir la proporción de juegos ganados en función del promedio de carreras ganadas por los miembros del equipo que lanza.134 .001*HR b. 709** 1 .s.Proporcion de ganados Correlación de Pearson 1 -. La proporción de ganados con ERA si presenta relación significativa al 5% de 4.051072 a.073 15 F Sig.503 . ERA explica en 46. El modelo es significativo . ERA 6.003 Total .002b . (bilateral) .709.037 14 . COEFICIENTE DE DETERMINACIÓN AJUSTADO r2adj=0. La correlación es significativa en el nivel 0. PRUEBA DE VALIDEZ DEL MODELO H0: ρ=0 : la correlación no es significativa Ha: ρ ≠0 : la correlación es significativa ANOVAa Suma de Modelo 1 cuadrados Media gl cuadrática Regresión .3% Resumen del modelo Modelo R R cuadrado .467 .467. (bilateral) 16 16 -.709a 1 R cuadrado Error estándar ajustado de la estimación .709** Sig. con la 5. existe un correlación alta significativa entre ERA proporción de ganados.002 N ERA Correlación de Pearson Sig. Variable dependiente: Proporcion de ganados b.167 a. 14. EL EFICIENTE DE CORRELACIÓN: r=0.7 % a la estimación de la proporción de ganados y no es explicado en 53. Predictores: (Constante).037 Residuo . ERA o Con 5% de n.002 N 16 16 **. se rechaza Ho.01 (2 colas).037 1 . Predictores: (Constante). 022 Beta t Sig.131 -. LA RELACIÓN ESPERADA (TEÓRICA) o o HR-Proporción de ganados: relación directa ERA – Proporción de ganados: relación inversa 2. Límite Límite inferior superior 8.709 a.865-0.951 .658 1.865 .097 -. Obtenga la ecuación de regresión estimada para predecir la proporción de juegos ganados en función de la cantidad de cuadrangulares y del promedio de carreras ganadas por los miembros del equipo que lanza.764 .000 .0% intervalo de confianza estandarizados os para B Error Modelo 1 B (Constante estándar . ver el siguiente diagrama .084 . β =0 . Variable dependiente: Proporcion de ganados Proporción de ganados=0. β ≠0 Ho: i Ha: i Coeficientesa Coeficientes Coeficientes no estandarizad 95. 1.002 -. DIAGRAMA DE DISPERSIÓN Según lo esperado podemos observar la proporción de ganados tiene una relación directa con respecto a HR.084*ERA c.072 -3.036 ) ERA -.7. EL MODELO –EVALUACION DE LOS PARÁMETROS. CORRELACIÓN H0: ρ=0. ver el siguiente diagrama 3.Según lo esperado podemos observar que la proporción de ganados con respecto a ERA presentan una relación inversa. Correlaciones Proporción de ganados HR ERA . h1: ρ ≠0 Según lo observado en la siguiente tabla. s. (bilateral) .374 Sig.260 Sig.391 -.002 . COEFICIENTE DE DETERMINACIÓN AJUSTADO r2adj=0.837 .063 2 . 5.391 1 .032 Residuo .Proporción de ganados .073 15 F 39.331 16 **.028298 a.7 % a la estimación de la proporción de ganados y no es explicado en 16.134 . EL EFICIENTE DE CORRELACIÓN r=0.010 13 .3% Resumen del modelo Modelo 1 R R cuadrado .260 1 . La proporción de ganados con ERA si presenta relación significativa al 5% de n. La correlación es significativa en el nivel 0. PRUEBA DE VALIDEZ DEL MODELO H0: ρ=0 : la correlación no es significativa Ha: ρ ≠0 : la correlación es significativa ANOVAa Suma de Modelo 1 cuadrados Media gl cuadrática Regresión . o o 4.858 . existe un correlación alta significativa entre la HR y era con la proporción de ganados. HR 6.926a R cuadrado Error estándar ajustado de la estimación . (bilateral) N . ERA y HR explica en 83. . La proporción de ganados con HR no presenta relación de significativa.709 Sig.134 Correlación de Pearson 1 Sig.000b . (bilateral) N HR N ERA Correlación de Pearson 16 16 16 ** .001 Total .002 16 16 16 Correlación de Pearson .331 16 16 -. ERA. Predictores: (Constante).926.01 (2 colas).709** .837. 9% Ejercicio 7 Los diseñadores de mochilas usan materiales exóticos como supernailon Derlin. HR o Con 5% de n. siendo el más bajo de la liga nacional.839 . El confort está medido con una escala del 1 al 5.103 . San Diego ganó sólo el 39.0% intervalo de confianza estandarizados s para B Error Modelo 1 B Límite estándar (Constante) . β ≠0 Ho: i Ha: i Coeficientesa Coeficientes Coeficientes no estandarizado 95.075 a. Variable dependiente: Proporcion de ganados Proporción de ganados= 0. polietileno de alta densidad.709+0.709 .579 .709+0.252 -0. En la temporada de 2003. En los datos siguientes se proporciona capacidad (en pulgadas cúbicas).013 ERA Beta t Sig.103*ERA d.001*HR-0. Límite inferior 11. El modelo es significativo 7.412 0.000 . aluminio para aviones o espumas termo-moldeadas para hacer que las mochilas sean más confortables y que el peso se distribuya uniformemente eliminándose así los puntos de mayor presión.000 -. ERA.103*4 0.0.710 . Predictores: (Constante).001*HR-0.s.103*ERA 0. β =0 . EL MODELO –EVALUACION DE LOS PARÁMETROS.001 .001 . y precio de 10 mochilas probadas por Outside Magazine.001*180-0.0.5% de sus juegos. evaluación del confort.709+0.870 -8.808 .549 54. se rechaza Ho. el equipo trató de adquirir nuevos jugadores que hicieran que la cantidad de cuadrangulares aumentara a 180 y que el promedio de carreras ganadas por el equipo que lanza disminuyera a 4.a. Proporción Proporción Proporción Proporción Proporción de de de de de ganados= ganados= ganados= ganados= ganados= superior 0. Use la ecuación de regresión estimada obtenida en el inciso para estimar el porcentaje de juegos que ganaría San Diego si tuviera 180 cuadrangulares y su promedio de carreras ganadas fuera 4.617 5.130 -.002 -. en la .709+0.000 .000 -.060 HR . Variable dependiente: Proporcion de ganados b. Para mejorar para el año siguiente.043 . LA RELACIÓN ESPERADA (TEÓRICA) o o o Capacidad – precio: Relación directa Confort – precio: Relación directa Capacidad – confort: No hay relación 2. 2001). ver el siguiente diagrama: . (Outside Buyer’s Guide.que 1 denota un confort mínimo y 5 un confort excelente. dada su capacidad y la evaluación de su confort. Solución ejercicio 7 a. Obtenga la ecuación de regresión estimada que permita predecir el precio de una mochila. DIAGRAMAS DE DISPERSIÓN: o Capacidad – precio: Contra lo esperado podemos observar que los datos no presentan relación alguna. 1. o Confort – precio: Según lo esperado podemos observar que los datos presentan relación directa. con algunos puntos dispersos. con algunos puntos dispersos. ver el siguiente diagrama: o Capacidad – confort: Contra lo esperado podemos observar que los datos presentan relación directa. ver el siguiente diagrama: . COEFICIENTE DE CORRELACIÓN R=0. 4.s.912 . La capacidad y el confort no tienen una relación significativa. El confort y el precio si presentan correlación significativa al 5% de n.3. CORRELACIÓN VARIABLES o o o - PRUEBA DE HIPÓTESIS ENTRE Ho: ρ=0: la correlación no es significativa Ha: ρ≠0: la correlación es significativa Según lo observado en la siguiente tabla: La capacidad no tiene relación significativa con el confort. 6% 6. El modelo es significativo. entonces con 5% de n. se rechaza Ho. Ha: β1≠0. EL MODELO – EVALUACIÓN DE LOS PARÁMETROS. 5. el confort si contribuye significativamente para estimar el precio en el modelo. Ha: βi≠0 Para Ho: β1=0.784 DE DETERMINACIÓN AJUSTADO: El confort y la capacidad explican en 78. Ho: βi=0. Por lo tanto. PRUEBA DE VALIDEZ DEL MODELO: Ho: El modelo no es significativo Ha: El modelo es significativo.002.849 . Como p-value=0.Existe una correlación alta significativa entre el confort y la capacidad con el precio. COEFICIENTE R2ADJ=0.4% a la estimación del costo.s. 7. COEFICIENTE DE CORRELACIÓN NUEVO R=0. y no es explicado en 21. donde el nuevo modelo a buscar es: Precio = bo + b1*Confort o 8. rediseñamos el modelo con una variable menos. la capacidad NO contribuye significativamente para estimar el precio en el modelo. Ha: β2≠0. o Para Ho: β2=0. entonces con 5% de n. Ho: βi=0. Como p-value=0. EL MODELO – EVALUACIÓN DE LOS PARÁMETROS. 11.9% 10. se rechaza Ho.s. PRUEBA DE VALIDEZ DEL MODELO: Ho: El modelo no es significativo Ha: El modelo es significativo. el confort si contribuye significativamente para estimar el precio en el modelo.002. 9. 12. COEFICIENTE DE DETERMINACIÓN AJUSTADO NUEVO: R2ADJ=0. y no es explicado en 27. Ha: βi≠0 o Para Ho: β1=0.721 El confort explica en 72.Existe una correlación alta significativa entre el confort con el precio. Ha: β1≠0. El modelo es significativo.1% a la estimación del precio. EL MODELO ES: . 867*Confort Sin embargo. el modelo estimado es: Precio = -41. o o Con el segundo modelo en el que si hay nivel de significancia: 93. 122.099*(4500) +122. Diga cuál será el precio de una mochila cuya capacidad sea 4500 pulgadas cúbicas y la evaluación de su confort sea 4.89 = 334 .867*(4) = 402.099*Capacidad +122.618 + 93.876*Confort b.876*Confort El precio de la mochila sin nivel de significancia y con las dos variables es: Precio = 356.618 + 93.867 es la estimación del aumento esperado en el precio que corresponde al aumento de la evaluación del confort cuando la capacidad permanece constante.876 es la estimación del aumento esperado en el precio que corresponde al aumento de la evaluación del confort cuando la capacidad permanece constante.099 es la estimación del decremento esperado en el precio que corresponde al aumento en una pulgada cúbica en la capacidad cuando el confort permanece constante. o Con el primer modelo en el que el primer coeficiente (capacidad) no contribuye significativamente al modelo: Precio = 356. con nivel de significancia al 5%. Con el primer modelo en el que el primer coeficiente (capacidad) no contribuye significativamente al modelo: 0. Interprete b1 y b2.09 = 402 o Con el segundo modelo en el que si hay nivel de significancia: Precio = -41.121 -0.Precio de la mochila = -41.121 -0. c.618 + 93.876*(4) = 333. Evaluación de seguridad: relación inversa. coeficiente de gastos anuales: no hay relación. Evaluación de seguridad vs. 10 segura) y el coeficiente de gastos anuales de 20 fondos extranjeros (Mutual Funds.Ejercicio 8 En la siguiente tabla se da el rendimiento anual. coeficiente de gastos anuales: relación directa. a. Obtenga la ecuación de regresión estimada que relaciona el rendimiento anual con la evaluación de la seguridad y con el coeficiente de gastos anuales. marzo del 2000). RELACIÓN ESPERADA (teórica): o o o Rendimiento anual vs. no hay relación entre estas variables. la evaluación de la seguridad (0=de alto riesgo. DIAGRAMA DE DISPERSIÓN: Rendimiento vs Factor de seguridad: como se puede observar. Rendimiento vs. 2. . 1. 8 Factor de Seguridad o Rendimiento vs coeficiente de gasto: como se puede observar.2 6. no hay relación entre estas variables.8 1 1.2 2.6 7.2 7.6 1.8 7 7.4 1.8 2 2.2 1. no hay relación entre estas variables. Diagrama de dispersión 2 140 120 100 80 Rendimiento Anual 60 40 20 0 0.4 7.4 6. .Diagrama de dispersión 1 140 120 100 80 Rendimiento Anual 60 40 20 0 6 6.6 6.4 Coeficiente de gastos anuales o Coeficiente de gasto vs Factor de seguridad: como se puede observar. 659** .513 -.659 . (bilateral) N COEFA COEFA -. (bilateral) N Correlación de Pearson RENDA Sig.2 7.513 .8 7 7. 20 .6 7.8 Factor de seguridad 3.002 .021 .021 .5 Coeficiente de variación 1 0.002 20 20 20 * 1 .668** 1 Sig.05 (bilateral).5 2 1. CORRELACIÓN: Ho : p=0 :la correlacion no es significativa o Ha : p ≠ 0:la correlacion es significativa o Segun lo observado enla siguiente tabla : Correlaciones FS Correlación de Pearson FS Correlación de Pearson Sig.001 20 20 *.4 7.4 6.6 6. La correlación es significante al nivel 0.2 6.001 20 20 20 ** ** 1 -.5 0 6 6. (bilateral) N RENDA * -.Diagrama de dispersión 3 2.668 . 763 Resumen del modelo Modelo 1 R R cuadrado .01 (bilateral).533 16.97705 a. 4. FS 7.001b .207 2 3411. La correlación es significativa al nivel 0. Con el rendimiento anual presenta correlación significativa del 5%.220 11722.582 .**. el factor de seguridad y el coeficiente anual explican en 53. COEFICIENTE DE CORRELACIÓN: r=0. Variables predictoras: (Constante). COEFA. de la corregida estimación . de la corregida estimación .763a R cuadrado Error típ. o o El factor de seguridad no tiene relación de significancia con el coeficiente anual.3% al rendimiendo anual y no es explicado en 46. COEFA. COEFA. PRUEBA DE VALIDEZ DEL MODELO: o Ho: ρ=0 : la correlación no es significativa o Ha: ρ ≠0 : la correlación es significativa ANOVAa Modelo Suma de gl Media cuadrados 1 6823.763 a R cuadrado Error típ. Variable dependiente: RENDA b.7%.533 16.582 . Variables predictoras: (Constante).743 17 288.604 Residual 4899. El coeficiente anual tiene correlación de significancia al 5% de n.837 a. EL MODELO – EVALUACIÓN DE LOS PARÁMETROS: Ho: B1=0 o .533. cuadrática Regresión Total F Variables predictoras: (Constante). COEFICIENTE DE CORRELACIÓN AJUSTADO: r2 adj=0.950 19 11. FS 5. Sig. Resumen del modelo Modelo 1 R R cuadrado .97705 a. FS 6.s con el rendimiento anual. Estime el rendimiento anual de una empresa cuya evaluación de seguridad es de 7. . en millas por hora.589∗Coeficiente anual c. puede no ser una tarea sencilla.2 Ejercicio 9 El ski acuático y el wakeboarding son dos deportes acuáticos muy actuales. Rendimiento=b 0+ b1∗FS+ b2∗Coeficiente anual Rendimiento=247. Rendimiento=247.358-32.589∗Coeficiente anual Rendimiento=247. Ha : B2 ≠ 0 .845*7. El factor de seguridad si contribuye significativamente para estimar los rendimiento anuales.o o Ha: B1 ≠ 0 Para Ho: B1=0 . HP son los caballos de fuerza del motor y velocidad máxima es la velocidad máxima que alcanza la lancha. hallar el modelo que mejor se ajuste a las necesidades.845∗FS+34. Ya sea que se trate de ski acuático. La manga es el ancho máximo de la lancha (en pulgadas).5+34. de wakeboarding o de navegación. A continuación se presenta una parte de los datos que publicaron sobre 20 lanchas de 20 y 22 pies longitud (Water Ski.358−32. La revista Water Ski probó 88 lanchas y proporcionó una amplia información como ayuda para los consumidores.589*2 Rendimiento=70. El coeficiente anual si contribuye significativamente para estimar los rendimiento anuales.845∗FS+34. enero/febrero 2006). o Para Ho: B2=0 .358−32. Ha: B1 ≠ 0 .5 y el coeficiente de gastos anuales es 2. 5 96 90 94 96 92 91 330 375 375 340 400 340 400 340 400 340 320 350 310 310 350 330 330 46. DIAGRAMA DE DISPERSIÓN o Manga-Velocidad Máxima: Según lo esperado podemos observar que los datos no tienen comportamiento directo.Hp: No hay relación 2.5 44.8 42.5 45.2 46 44 47. ver el siguiente diagrama: . Empleando estos datos obtenga la ecuación de regresión estimada que relaciona la velocidad máxima con la manga y los caballos de fuerza de la lancha.5 44. LA RELACIÓN ESPERADA (TEÓRICA) o o o Manga-Velocidad Máxima : Relación directa Hp-Velocidad Máxima: Relación directa Manga .7 a.3 44.5 98 98 98 98 98 93.9 91 96 83 93.2 47.7 50.2 45.8 43.1 52.5 42.9 47.Fabricante y Modelo Calabria Cal Air Por V-3 Correct Craft Air Nautique 210 Correct Craft Air Nautique SV-211 Corrrect Craft Air Nautique 206 Limited Gekko GTR 22 Gekko GTS 20 Malibu Response Lxi Malibu Sunsetter Lxi Malibu Sunsetter 21 XTi Malibu Sunscape 21 LSV Malibu Wakesetter 21 XTi Malibu Wakesetter VLX Malibu vRide Malibu Ride XTi Mastercraft ProStar 209 Mastercraft X-1 Mastercraft X-2 Mastercraft X-9 MB Sports 190 Plus Svfara SVONE Manga 100 91 93 HP 330 330 375 Velocidad Máxima 45.3 47.3 47.5 93. sino que estos no presentan relación.3 46. 1. ver el siguiente diagrama: o Manga .Hp: Según lo esperado podemos observar que los datos no poseen ninguna relación. sino que estos no presentan relación.o Hp-Velocidad Máxima: Según lo esperado podemos observar que los datos no tienen comportamiento directo. ver el siguiente diagrama: . (bilateral) 0.272 1 Sig. CORRELACIÓN – PRUEBA DE HIPÓTESIS ENTRE VARIABLES Ho : p=0 :la correlacion no es significativa Ho: p ≠ 0:la correlacion es significativa Segun lo observado enla siguiente tabla Correlaciones Manga -0. o La manga no tiene relación significativa con el Hp.045 20 20 20 *. (bilateral) N Hp N Correlación de Pearson Velocidad_Maxima Velocidad_Maxima .453* 1 0. .045 20 20 20 -0.s.029 20 20 20 Correlación de Pearson 0.258 1 0.488* .453* Sig. La correlación es significante al nivel 0.029 0.05 (bilateral).2 Hp también presenta una correlación significativa al 5% de n. (bilateral) N 0.272 0.258 Correlación de Pearson Manga Hp Sig.488* 0. Con Velocidad_Maxima presenta correlación significativa al 5% de n.3.s con Velocidad_Maxima. o 1. 078 Residual 43.597 . Variables predictoras: (Constante).157 2 32.603 .426 19 Total F 12.773a 1 R cuadrado Error típ.545 107. Variable dependiente: Velocidad_Maxima b. Hp.773 . 4. ANOVAa Modelo Suma de gl Media cuadrados 1 Sig. Manga 6. PRUEBA DE VALIDEZ DEL MODELO Ho: El modelo no es significativo H 1 : El modelo es significativo. EL MODELO – EVALUACIÓN DE LOS PARÁMETROS Ho: B1=0 Ha: B1 ≠ 0 o Para Ho: B1=0 . . Hp. COEFICIENTE DE CORRELACIÓN: Existe una correlación alta significativa entre la manga y hp con el costo: Resumen del modelo Modelo R R cuadrado . El manga si contribuye significativamente para estimar la velocidad de máxima del modelo.r=0.269 17 2. Manga 5. Variables predictoras: (Constante).000b a. de la corregida estimación . Ha: B1 ≠ 0.59538 a.550 1. cuadrática Regresión 64. Los resultados se ponderan para obtener una evaluación general y a cada corredor se le asigna una evaluación final que va de cero a cinco estrellas. Velocidad=b0 + b1∗Manga+ b2∗Hp Veloci dad=64.646 Ejercicio 25 Borron’s realiza revisiones anuales de los corredores de bolsa en línea. 2. Un 5 en gama de ofertas significa que todas las transacciones pueden realizarse en línea.4 3.39∗85+0. En los datos siguientes se presentan las puntuaciones obtenidas en ejecución de la operación.7 2.0 3.051∗330 Velocidad=48.2 3.2 3.7 3. Utilice la ecuación de regresión estimada obtenida en el inciso a) para estimar la velocidad máxima de la Svfara SV609.0 3.3 3. 5 significa que el sitio es de fácil uso y que se puede ajustar para ver lo que le interesa al usuario ver.5 3. 10 de marzo de 2003).5 E*Trade 2.0 4.5 3.o Para Ho: B2=0 . El Hp si contribuye significativamente para estimar los la velocidad de máxima del modelo. Corredor Ejecución de la Uso Gama Estrella operación s Wall St.8 3.0 4. así como corredores que tienen acceso directo y que ponen al cliente en contacto directo con el servidor de una red de corredores de bolsa.5 Brown & Co.0 . La Svfara SV 609 tiene una manga de 85 pulgadas y motor de 330 caballos de fuerza. Ha: B2 ≠ 0.0 E*Trade (Power) 3.7 4. facilidad de uso y gama de ofertas y el número de estrellas obtenidas por los integrantes de una muestra de 10 corredores de bolsa (Barron’s. empleando para cada área una escala de 0 a 5.0 4.5 (Standard) Preferred Trade 4.8 4. Un 5 en ejecución de la operación significa que la llegada del pedido y el proceso de ejecución fluyeron con facilidad de un paso a otro.5 4.6 3.0 3.5 TD Waterhouse 3. en la que se incluyen tanto corredores a los que se les puede contactar vía un explorador de Internet. La oferta y el desempeño de cada corredor se evalúan en seis áreas. Access 3.966−0. En facilidad de uso. Tres de las áreas evaluadas son ejecución de la operación. Velocidad=b0 + b1∗Manga+ b2∗Hp b.5 my Track 4. facilidad de uso y gama de ofertas.5 4.4 3. Estrellas: Relación Directa Gama . LA RELACIÓN ESPERADA (TEÓRICA) o o o o o o Ejecución de la operación .6 2.0 a.5 1. Emplee la prueba t para determinar la significancia de cada una de las variables independientes.5 2. facilidad de uso y gama de ofertas. Empleando como nivel de significancia 0.Estrellas: Relación Directa Uso .4 3.5 3.1 3.0 2. ¿Cuál es la ecuación de regresión estimada que recomienda? Compare R2 con el valor de R2 para el inciso a). b. Solución ejercicio 25 1. Empleando como nivel de significancia 0. Elimine cualquiera de las variables independientes que no sea significativa para la ecuación de regresión estimada. ¿cuál es la conclusión? d. Emplee la prueba F para determinar la significancia global de la relación. Analice las diferencias.7 3.7 3.95. ¿cuál es la conclusión? c.05.Brokerage America Merrill Lynch Direct Strong Funds 1.0 2.2 2.Estrellas: Relación Directa Ejecución de la operación – Uso: Relación Directa Ejecución de la operación – Gama: Relación Directa Uso – Gama : Relación Directa . Determine la ecuación de regresión estimada que se puede usar para predecir el número de estrellas dadas las evaluaciones a ejecución. la gama con el uso tampoco presentan relación. Uso y la ejecución de la operación con las estrellas. la gama con la ejecución de la operación no tienen relación aparente. Además. También se observa que el uso no tiene relación con la ejecución de la operación.229 .434 .2. 3. A sí mismo.746* . CORRELACIÓN: PRUEBA DE HIPÓTESIS Ho: p=0: La correlación no es significativa Ha: p≠0: La correlación es significativa Correlaciones Ejecución de la Uso Gama Estrellas operación Ejecución de la operación Correlación de Pearson 1 . DIAGRAMA DE DISPERSIÓN o o o o Según lo esperado podemos observar que los datos si tienen comportamiento directo entre la Gama. 05 (bilateral). COEFICIENTE DE CORRELACIÓN R= 0.827 *.301 .003 10 10 10 Correlación de Pearson .397 10 N Estrellas . PRUEBA DE VALIDEZ DEL MODELO Ho: ρ =0: el modelo no es significativo Ha: ρ ≠0: La correlación es significativa ANOVAa Modelo Suma de cuadrados gl Media cuadrática F Sig.746 * .210 . (bilateral) . Variables predictoras: (Constante).229 1 .420 ** 1 Sig.8% a la estimación de las estrellas.013 10 10 10 10 Correlación de Pearson . COEFICIENTE DE CORRELACIÓN AJUSTADO R2 adj = 0. uso y la gama. Existe una correlación alta significativa entre la ejecución de la operación.524 .Sig.43100 a.210 . uso y la gama explican en 82. Uso.827** Sig.420 Sig.227 .941a 1 R cuadrado Error típ. ejecución de la operación-gama y la gama-uso no se encuentra relación significativa.828.434 . (bilateral) . o o 4. (bilateral) . 6.2% .397 . y no es explicado en 17. Ejecución de la operación 5. La correlación es significante al nivel 0.828 2. Las estrellas presentan correlación significativa al 5% de nivel de significancia con la ejecución y la gama. Entre la ejecución de la operación-uso.01 (bilateral). 10 .013 . mientras que con el uso no presenta relación significativa. de la corregida estimación . Resumen del modelo Modelo R R cuadrado .301 1 .227 N Uso N Gama 10 10 10 10 Correlación de Pearson . la ejecución de la operación. La correlación es significativa al nivel 0.524 . Gama.886 .941.003 10 10 10 N . (bilateral) . **. Ha: β2 ≠0. de la corregida estimación .123 .255 .534 16.045 . Ejecución de la operación Se prueba que el modelo es significativo.541 3 91.650 . La ejecución de la operación si contribuye significativamente para estimar las estrellas del modelo. Variable dependiente: Estrellas b.132∗Uso+ 0. 3. Beta 95.451 5.0% para B Límite Límite inferior superior .460 2.157 .760 a. Variable dependiente: Estrellas Para Ho: β1 =0.932. o Para Ho: β3 =0.255∗ejecución+0. el uso NO contribuye significativamente para estimar las estrellas del modelo. uso y la gama. Ha: β1 ≠0. Resumen del modelo Modelo R R cuadrado R cuadrado Error típ.586 3.Regresión 1 274.382 -. Existe una correlación alta significativa entre la ejecución de la operación. Uso.476 .086 Uso .910 310.307 .514 35.944 . 7. Ha: β3 ≠0.211 .436 . Gama.138 .485 . Variables predictoras: (Constante).025 .978 .722 .000 9 Residual Total 15.459∗Gama COEFICIENTE DE CORRELACIÓN R= 0.415+0. el uso si contribuye significativamente para estimar las estrellas del modelo.010 . El modelo es: o Estrellas=3.459 (Constante) Ejecución de la 1 Coeficientes no operación Intervalo de confianza de t Sig. EL MODELO – EVALUACIÓN DE LOS PARÁMETROS Ho: βi =0: El modelo no es significativo Ha: βi ≠0: El modela es significativo Coeficientesa Modelo Coeficientes estandarizados tipificados B Error típ.464 .540 -9.140 .003b a. o Para Ho: β2 =0.459 6 5.132 Gama . 000 9 Residual Total F 23.131 . Para Ho: β3 =0.817 310.2% a la estimación de las estrellas. la ejecución de la operación.989 .001b a.080 .146 . Gama.1 .476 3. Beta 95. Variable dependiente: Estrellas b. El modelo es: Estrellas=6.621 4.065 .084 .869 . uso y la gama explican en 83. Variables predictoras: (Constante).264 . Gama.684 . y no es explicado en 16.715 16.485∗Gam . Ha: β3 ≠0. 6.264∗ejecución+ 0. La ejecución de la operación si contribuye significativamente para estimar las estrellas del modelo.119 Intervalo de confianza de t Sig.204 .0% para B Límite Límite inferior superior 1.718+0.718 3.831. Ha: β1 ≠0. Variable dependiente: Estrellas o o Para Ho: β1 =0. EL MODELO – EVALUACIÓN DE LOS PARÁMETROS Ho: βi =0: El modelo no es significativo Ha: βi ≠0: El modela es significativo Coeficientesa Modelo (Constante) 1 Ejecución de la operación Gama Coeficientes no Coeficientes estandarizados tipificados B Error típ. Ejecución de la operación Se prueba que el modelo es significativo.831 2.767 a.281 2 134.005 .017 . Ejecución de la operación COEFICIENTE DE CORRELACIÓN AJUSTADO R2 adj = 0. PRUEBA DE VALIDEZ DEL MODELO Ho: ρ=0: el modelo no es significativo Ha: ρ≠0: La correlación es significativa ANOVAa Modelo Suma de gl Media cuadrados Regresión 1 Sig.640 40. el uso si contribuye significativamente para estimar las estrellas del modelo.41186 a. cuadrática 269.932a .151 .485 .719 7 5.136 -2.8%.463 . Variables predictoras: (Constante). Uso. Por ello.003b a.485 .132∗Uso+ 0.415+0. facilidad de uso y gama de ofertas.910 310.255∗ejecución+0.RESULTADOS a.514 35.485. Variable dependiente: Estrellas b.459∗Gama b. ¿cuál es la conclusión? Utilizando la prueba F en el Análisis 1: Ho: ρ=0: el modelo no es significativo Ha: ρ≠0: La correlación es significativa ANOVAa Modelo Suma de gl Media cuadrados Regresión 1 Total Sig.541 3 91. se concluye que el la prueba proporciona evidencia estadística suficiente para concluir que los parámetros no son igual a cero y que la relación global entre las estrellas y el conjunto de variables independientes es significativa. y un p-value de 0. Estrellas=3.459 6 5.003 que con un 5% de significancia se rechaza Ho.95. cuadrática 274. Gama. Variables predictoras: (Constante). .000 9 Residual F 15. Ejecución de la operación Se obtiene para F=15. Emplee la prueba F para determinar la significancia global de la relación. Determine la ecuación de regresión estimada que se puede usar para predecir el número de estrellas dadas las evaluaciones a ejecución. Empleando como nivel de significancia 0. Ha: β1 ≠0.978 .451 5.436 . ¿Cuál es la ecuación de regresión estimada que recomienda? Compare R2 con el valor de R2 para el inciso a).650 .534 16. d. 3. ¿cuál es la conclusión? Ho: βi =0: El modelo no es significativo Ha: βi ≠0: El modela es significativo Coeficientesa Modelo Coeficientes estandarizados tipificados B Error típ.c.828 Del segundo análisis: R2=0. donde el nuevo modelo a buscar es: Estrellas= β0 + β1 * La ejecución de la operación + β2 * Gama Comparando R2: Del primer análisis: R2=0. Elimine cualquiera de las variables independientes que no sea significativa para la ecuación de regresión estimada.0% para B Límite Límite inferior superior . Ha: β2 ≠0.045 .459 (Constante) Ejecución de la operación 1 Coeficientes no Intervalo de confianza de t Sig. el uso NO contribuye significativamente para estimar las estrellas del modelo. Empleando como nivel de significancia 0.010 .460 2.123 . Para Ho: β2 =0.722 .211 .540 -9. Beta 95.157 .464 .132 Gama .476 . La ejecución de la operación si contribuye significativamente para estimar las estrellas del modelo. Ha: β3 ≠0. el uso si contribuye significativamente para estimar las estrellas del modelo.831 Se observa que cuando se eliminó la variable que no era significante para el modelo.586 3.140 .086 Uso . Por lo tanto rediseñamos el modelo con una variable menos. Emplee la prueba t para determinar la significancia de cada una de las variables independientes.307 . .025 .944 .382 -. Variable dependiente: Estrellas o o o Para Ho: β1 =0. Analice las diferencias.05.255 .138 . Para Ho: β3 =0.760 a. aumento el R2 lo que explica que hay menor porcentaje de variabilidad de las estrellas cuando se usan las variables de ejecución de la operación y la Gama. Otro de los automóviles deportivos/GT evaluados por Car and Driver es el Honda Accord.Ejercicio 31 La sección “Guía para el usuario” del sitio en la Red de la revista Car and Driver proporciona información sobre pruebas viales (road test) de automóviles.28. Compare esta evaluación con las estimaciones obtenidas en los incisos b) y d). y ajuste y terminado para predecir la calidad general.65.06 y 8. Las evaluaciones de manejo.com.07. Abajo se presentan las puntuaciones generales para calidad general. transmisión dadas a diversos vehículos empleando una escala del 1 (lo peor) a 10 (lo mejor). confiabilidad. Estime la evaluación general dada a este automóvil. modelo de vehículo. Dé una ecuación de regresión estimada usando manejo. . manejo. confiabilidad. c. La evaluación general dada por Car and Driver para el Honda Accord fue 8. economía de combustible. camiones. Aquí se presenta una parte de los datos de 14 automóviles Deportivos/GT (www. respectivamente. confort interior. frenado. 7 de enero de 2004). 9. e.caranddriver. d. SUV (acrónimo en inglés de Sport Utility Vehicle) y vans. aceleración. a. confiabilidad. Dé un intervalo de predicción de 95% para la calidad general del Honda Accord descrito en el inciso b). y ajuste y terminado dadas a este automóvil fueron 8. Dé un intervalo de 95% de confianza para la calidad general de todos los automóviles deportivos y GT con las características enumeradas en el inciso a). ajuste y terminado. b. Dé una ecuación de regresión estimada usando manejo.Solución ejercicio 31 a. ver el siguiente diagrama: . confiabilidad. LA RELACIÓN ESPERADA: Manejo-General: relación directa Confiabilidad-General: relación directa Ajuste y terminado-General: relación directa Manejo – Confiabilidad: relación directa Manejo – Ajuste: relación directa Ajuste – Confiabilidad: relación directa 2. y ajuste y terminado para predecir la calidad general. DIAGRAMA DE DISPERSIÓN Manejo-General: Según lo esperado los datos tienen comportamiento directo. 1. Confiabilidad-General: Según lo esperado comportamiento directo. ver el siguiente diagrama: los datos tienen Ajuste y terminado-General: Según lo esperado los datos tienen comportamiento directo. ver el siguiente diagrama: . Entre las variables independientes se espera que exista cierta relación y lo observado es: Manejo – Confiabilidad: sin relación Manejo – Ajuste: relación directa Ajuste – Confiabilidad: sin relación 3. CORRELACIÓN POR CADA PAR DE VARIABLES . 4% a la estimación del costo. 7. 5.824 Ajuste y terminado. VALIDEZ DEL MODELO P-value =0.93 Coeficiente de correlación: r=0.93. Entre el manejo y la confiabilidad no existe relación COEFICIENTE DE CORRELACIÓN: R=0. Confiabilidad y manejo con el general. El ajuste y el manejo existe cierta relación significativa. La puntuación de la calidad general tiene relación con el manejo.EVALUACIÓN DE LOS PARÁMETROS . COEFICIENTE DE DETERMINACIÓN AJUSTADO: R2ADJ=0. Confiabilidad y manejo explican en 82. existe una correlación alta significativa entre la Ajuste y terminado. EL MODELO . y no es explicado en 17. confiabilidad y ajuste terminado.6% 6.o o o 4. entonces el modelo es significativo con 5% de nivel de significancia. por lo tanto puede afectar al modelo. 276*8.276*Manejo+0. respectivamente. HA: B3≠o El ajuste y terminado si contribuye significativamente para estimar los costos en el modelo.28.55+0. confiabilidad.06+0. Ha: B2≠o . Para Ho: B3=o. 9.Para ho: B1=0.964 . El manejo si contribuye significativa para estimar los costos en el modelo. La confiabilidad si contribuye significativamente para estimar los costos en el modelo.55+0. Para ho: B2=o.28+0.447*9. Por lo tanto el modelo a usar es: General=0.447*Confiabilidad+0.07. Ha: B1≠o.270*8.06 y 8. Las evaluaciones de manejo.07=7. Estime la evaluación general dada a este automóvil General=-0.270*Ajuste b) Otro de los automóviles deportivos/GT evaluados por Car and Driver es el Honda Accord. y ajuste y terminado dadas a este automóvil fueron 8.