20130413150459

June 6, 2018 | Author: Carlos Arana | Category: Quantile, Median, Statistical Dispersion, Variance, Standard Deviation
Report this link


Description

Docente:Ms.Selene Yengle Del Castillo Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego 1 CAPITULO III MEDIDAS DE RESUMEN INTRODUCCIÓN. Son valores numéricos que sirven para caracterizar un conjunto de datos; es decir, que nos permiten describir el comportamiento de los datos. Se clasifican en medidas de Tendencia Central, medidas de posición, medidas de Dispersión y medidas de Forma. 3.1. MEDIDAS DE TENDENCIA CENTRAL. Son medidas de resumen que nos indican alrededor de qué valor se agrupan o concentran los datos. Son medidas de Tendencia Central o Centralidad: la Media Aritmética, la Mediana, la Moda, la Media Geométrica. 3.1.1. Media Aritmética. Conocida también como promedio o simplemente media, se define como el cociente de la suma de los datos y el tamaño de la muestra. Sean los datos n X X X X ,..., , , 3 2 1 la media aritmética se denota con X y se define como: n X X X X X n + + + + = ... 3 2 1 o, utilizando el signo de suma: Media muestral: n X X n i i ¿ = = 1 , Fórmula para datos no agrupados o sin tabular (1) Donde: n= Numero total de datos o tamaño de la muestra. Media poblacional: N X N i i ¿ = = 1 µ , donde N=tamaño de la población Calcule la media de los siguientes conjuntos de datos: A: 13, 17, 20, 10, 12, 18 B : 11.8, 13.6, 14.2, 16.5, 12.5, 18.5, 14.6, 15.4 Dados los siguientes datos: 20, 24, 22, 25, 28, 20, 20, 20, 22, 22, 20, 24, 25, 28, 20, 24, su media aritmética es: 16 24 20 28 25 24 20 22 22 20 20 20 28 25 22 24 20 + + + + + + + + + + + + + + + = X 16 28 28 25 25 24 24 24 22 22 22 20 20 20 20 20 20 + + + + + + + + + + + + + + + = X Docente:Ms. Selene Yengle Del Castillo Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego 2 16 ) 2 ( 28 ) 2 ( 25 ) 3 ( 24 ) 3 ( 22 ) 6 ( 20 + + + + = X (2) 75 . 22 16 364 16 56 50 72 66 120 = = + + + + = X El numerador de (2) se puede disponer en una tabla como: X i f i Xifi 20 6 120 22 3 66 24 3 72 25 2 50 28 2 56 Total 16 364 Puede utilizarse cuando los datos se repiten la fórmula: n f X X k i i i ¿ = = 1 Fórmula para Datos Agrupados o también llamados tabulados (3) La fórmula (3) también puede utilizarse cuando los datos están agrupados en una distribución de frecuencias, siendo los X i los puntos medios de los intervalos. Dada la distribución de frecuencias: Intervalos f i X i f i Xifi 10-16 7 13 7 91 16-22 13 19 13 247 22-28 15 25 15 375 28-34 10 31 10 310 34-40 5 37 5 185 50 50 1208 Aplicando la fórmula (3) 16 . 24 50 1208 = = X Calcule la media aritmética de: (a) X i f i (b) Intervalos f i 12 4 7-13 7 13 6 13-19 13 14 7 19-25 15 15 13 25-31 10 16 10 31-37 5 Docente:Ms. Selene Yengle Del Castillo Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego 3 Casos Prácticos: 1) Se tiene la información correspondiente a un grupo de 45 anuncios publicitarios luminosos respecto al peso en Kg de éstos, la suma de los 45 datos no tabulados es 147776 Kg. Entonces el peso promedio de los anuncios publicitarios luminosos es de: . 91 . 3283 45 147776 Kg X = = Interpretación: El peso promedio de los anuncios publicitarios luminosos es de 3283.91 Kg. 2) Los pesos de sei s ami gos son: 84, 91, 72, 68, 87 y 78 kg. Hal l ar el peso medi o. Interpretación: El peso medio de los amigos en estudio es de 80 Kg. 3) El profesor de la materia de estadística desea conocer el promedio de las notas finales de los 10 alumnos de la clase. Las notas de los alumnos son: 3,2 3,1 2,4 4,0 3,5 3,0 3,5 3,8 4,2 4,0 ¿Cuál es el promedio de notas de los alumnos de la clase? SOLUCIÓN Aplicando la fórmula para datos no agrupados tenemos: Cabe anotar que en el ejemplo estamos hablando de una población correspondiente a todos los alumnos de la clase (10 alumnos en total). El promedio de las notas es de 3,47. Modifiquemos la primera nota por 0,0 y calculemos nuevamente la media aritmética. En este caso la media pasa de 3,47 a 3,15. Esta variación notoria se debió a que la media aritmética es sensible a los valores extremos cuando tratamos con pocos datos. El 0,0 es una nota atípica comparada con las demás, que están ubicadas entre 3,0 y 4,2. PROPIEDADES: 1. La media aritmética es el centro de gravedad o punto de equilibrio de un conjunto de observaciones. 2. Para un conjunto de observaciones la media es única. 3. Si un valor se modifica entonces la media cambia de valor. 4. Si la media sustituye a cada observación, la suma total no cambia. 5. La suma de las desviaciones de las observaciones con respecto al promedio es igual a cero. ( ) 0 1 1 = ÷ = ÷ = ÷ ¿ ¿ = = X n X n X n X X X n i i n i i Docente:Ms. Selene Yengle Del Castillo Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego 4 6. La suma de los cuadros de las desviaciones de las observaciones con respecto a la media es mínima: ( ) ( ) R c , 1 2 2 1 e ÷ s ÷ ¿ ¿ = = donde c X X X n i i n i i 7. Si a cada observación se le suma algebraicamente una constante, la media queda sumada algebraicamente en esa constante. (ver tabla) c X Y + = 8. Si a cada observación se le multiplica por una constante, la media queda multiplicada por la constante. (ver tabla) 9. Si W i = aX i +b; entonces ) (Ver tabla . b X a W + = Tabla (propiedades 7,8 y 9) Propiedad 7 Propiedad 8 Propiedad 9 X Y = X + c Z = d X W = a X +b X 1 Y 1 = x 1 + c z 1 = d x 1 W 1 = a X 1 +b X 2 Y 2 = x 2 + c Z 2 = d x 2 W 2 = a X 2 +b . . . . . . . . . . . . X n Y n = x n + c Z n = d x n W n = a X n +b X y=x+c z=d x w=ax+b Ejemplo Los siguientes datos corresponden a los ingresos mensuales de 4 personas: 520, 525, 518 y 523. De ellos se obtiene X = 521.5. Suponga que a partir del siguiente mes estas personas recibirán un aumento del 20% pero se les descontara, por el aporte a su gremio, una suma de 8 unidades monetarias (um), ¿Cuál es el nuevo ingreso promedio de estas 4 personas? Solución Sean: X = Ingreso anterior, Y = Nuevo ingreso Y= (X + 0.2 X) – 8 Y = 1.2 X – 8 Entonces utilizando la propiedad 9 : Y = 1.2 X - 8 = 617.8 um Desventaja de la media aritmética queda fuertemente afectada por valores extremos. Ejemplo: Los siguientes datos corresponden a los ingresos mensuales de dos grupos de personas: Grupo Ingreso X A 520 525 518 523 521.5 B 520 525 518 8000 2390.75 Nótese que en el grupo A el promedio similar a los 4 valores por lo tanto los datos representan apropiadamente mientras que en el grupo B eso no ocurre. Docente:Ms. Selene Yengle Del Castillo Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego 5 3.1.2. Mediana Mediana para datos no agrupados o también para datos agrupados sin intervalos de clase. Calcule la mediana de los siguientes datos: A: 5, 7, 9, 11, 13 n=5 Me=9 B: 8, 10, 11, 13, 15, 16 n=6 Me=(11+13)/2=12 C: 12, 7, 8, 10, 3, 5, 9, 15 c: 3,5,7,8,9,10,12,15 n=8 Me=(8+9)/2=8.5 La mediana es el valor que se encuentra en el centro de un conjunto ordenado de datos. Así, para obtener la mediana de un conjunto de datos, previamente debe ordenarse los datos de menor a mayor. Luego debe determinarse el lugar que ocupa la mediana calculando 2 1 + n . Si el número de datos es impar la mediana es el dato que se encuentra en el centro y, si el número de datos es par, la mediana es el promedio de los dos valores que están en el centro. - Calcule la mediana para los siguientes datos: A: 8, 5, 2, 9, 12, 7, 16, 4, 10 B: 12, 10, 8, 5, 9, 11, 14, 7,15, 13 C: X i 4 6 8 10 12 14 f i 3 5 8 6 4 2 Mediana para datos agrupados en intervalos. Para el cálculo de la mediana se procede de la siguiente manera: a) Se obtienen las frecuencias absolutas acumuladas (Fi) b) Se identifica el intervalo que contiene a la mediana. 2 1 + n El intervalo de la mediana es el intervalo que tiene como frecuencia acumulada a F i , la frecuencia acumulada menor tal que F i > 2 1 + n c) Se utiliza la fórmula: Me = i i f F n A LRI ) 2 1 ( 1 ÷ ÷ + + Donde LRI: es el límite real inferior del intervalo mediano. A: la amplitud del intervalo mediano. F i-1 : frecuencia acumulada del intervalo que antecede al intervalo mediano. f i : es la frecuencia simple del intervalo mediano. Docente:Ms. Selene Yengle Del Castillo Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego 6 Ejemplo: Intervalos f i F i 7-13 7 7 13-19 13 20 F i-1 19-25 15 35 = Fi 25-31 10 45 31-37 5 50 5 . 25 2 1 50 2 1 = + = + n busca en las frecuencias absolutas acumuladas Como 35 es la frecuencia absoluta acumulada menor tal que 35 > 25.5, el intervalo que contiene a la mediana es el intervalo 19-< 25. Así: LRI = 19, A = 6, F i-1 = 20 y f i = 15. La mediana es: Me = 19 + 6 15 ) 20 5 . 25 ( ÷ = 19 + 2.2 Me = 21.2 Significa que el 50% de los datos son menores que 21.2 y el otro 50% de los datos son mayores que 21.2 Ejercicio. Calcule la mediana de los datos de la distribución: Intervalos f i 3-11 5 11-19 7 19-27 8 27-35 13 35-43 17 43-51 10 3.1.3. Moda Moda para datos no agrupados o también para datos agrupados sin intervalos. Cuál es la moda en los siguientes conjuntos de datos: A : 3, 5, 7, 5, 8, 5, 2, 5 Mo=5 Distribución unimodal B: 5, 5, 3, 4, 7, 7, 7, 8, 5 Mo=5 y 7 Distribución bimodal C: 5, 3, 7, 9, 8, 1, 12, 11 No existe moda Qué es moda? La moda es el dato que más se repite. Es el dato que tiene mayor frecuencia. Docente:Ms. Selene Yengle Del Castillo Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego 7 Cuál es la moda en la distribución: X i 4 6 8 10 12 14 f i 3 5 12 6 4 2 Mo=8 porque tiene la mayor frecuencia absoluta simple. Moda en datos agrupados en intervalos: Intervalos f i 3-11 5 11-19 7 19-27 8 27-35 13= fi-1 35-43 17=fi 43-51 10=f i+1 Para hallar la moda se procede así: a) Se determina el intervalo que contiene a la moda( intervalo de mayor frecuencia) b) Se aplica la fórmula: M o = LRI + A ( ) 2 1 1 A + A A donde 1 1 ÷ ÷ = A i i f f y 1 2 + ÷ = A i i f f siendo i f la frecuencia simple del intervalo modal, 1 ÷ i f la frecuencia simple del intervalo que precede al modal, y 1 + i f la frecuencia simple del intervalo que sigue al modal. Para el ejemplo, el intervalo modal es 35 -< 43, por lo tanto la moda es : M o = 35 + 8 ( 7 4 4 + ) = 35 + 2.9 = 37.9 Ejercicio. Halle la moda de: Intervalos f i 12- 17 5 17- 22 8 22- 27 15 27- 32 22 32- 37 17 37- 42 13 Docente:Ms. Selene Yengle Del Castillo Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego 8 3.1.4. Media aritmética ponderada La media ponderada de un conjunto de observaciones X 1 . X 2 . X 3 . ... X k con pesos o ponderaciones w 1 . w 2 . w 3 . ... w k esta dada por: k k k k i i k i i i p w w w w x w x w x w w x x + + + + + + = = ¿ ¿ = = ... ... 2 1 2 2 1 1 1 1 La media ponderada se usa en aquellos casos en donde las observaciones no tienen la misma importancia dentro de una población o muestra. Ejemplo En una firma se tiene la siguiente información en u.m. Cargo Número de trabajadores (wi) Remuneración diaria de c/u (xi) Asesores 15 25 Jefes 5 45 Especialista 1 70 La remuneración promedio por día será: 905 . 31 21 670 1 5 15 ) 1 ( 70 ) 5 ( 45 ) 15 ( 25 1 1 = = + + + + = = ¿ ¿ = = k i i k i i i p w w x x Ejemplo Los siguientes datos corresponden a las observaciones de la variable número de focos de luz amarilla por vivienda en una determinada urbanización. Tabla de frecuencias Nº de focos (xi) Frecuencia absoluta Nº de viviendas (wi) Frecuencia relativa simple Frecuencia porcentual simple 1 12 0.27 27 2 16 0.35 35 3 11 0.24 24 4 3 0.07 7 5 3 0.07 7 Total 45 1.00 100 Docente:Ms. Selene Yengle Del Castillo Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego 9 El número de focos de luz amarilla promedio de las viviendas en estudio será: 3111 . 2 45 104 3 3 11 16 12 ) 3 ( 5 ) 3 ( 4 ) 11 ( 3 ) 16 ( 2 ) 12 ( 1 1 1 = = + + + + + + + + = = ¿ ¿ = = k i i k i i i p w w x x En este ejemplo, las frecuencias absolutas (f 1 ) hacen las veces de las ponderaciones (w 1 ) Caso particular Si k x x x ,..., , 2 1 son las medias de K grupos de valores y cada grupo tiene tamaño n 1, n 2… …., nk respectivamente, entonces la media de los n = n 1, + n 2 +….+ n k , datos es: ¿ ¿ = = = k i i k i i i p n x n x 1 1 1.2. MEDIDAS DE POSICIÓN Estas medidas, llamadas también Cuantiles, dividen a un conjunto de datos ordenados en grupos iguales. Entre estas medidas tenemos a los cuartiles, a los deciles y a los percentiles. CUANTILES PARA DATOS SIN AGRUPAR: 1.2.1. CUARTILES Son tres valores Q 1 , Q 2 y Q 3 que dividen al conjunto de datos ordenados en cuatro grupos iguales: _______ !_______!_______!______ 25% Q 1 25% Q 2 25% Q 3 25% El cuartil 1, Q 1 , es el valor que supera al 25% de los datos y es superado por el 75% de los datos. ¿Qué es el cuartil 2, Q 2 ? El cuartil 3, Q 3 , es el valor que supera al 75% de los datos y es superado por el 25% de los datos. Calculo del cuartil Q i Se ordenan los datos. Se ubica el lugar que ocupa el cuartil, calculando i = 1, 2, 3. El cuartil Q i , es el valor que ocupa el lugar donde i = 1, 2, 3. En todo caso, realizamos una interpolación, para obtener el cuartil. Docente:Ms. Selene Yengle Del Castillo Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego 10 Ejemplo Datos: 13, 8, 5, 20, 25, 22, 16, 2, 10, 15, 7, 11 Q 3 =? Datos ordenados: 2, 5, 7, 8, 10, 11, 13, 15, 16, 20, 22, 25 n=12 Lugar que ocupa el Q 3 : = 9.75 Es un valor que está entre el dato que se encuentra en el lugar 9 y el dato que se encuentra en el lugar 10. = 16 + 0.75 ( 20- 16) = 16 + 3 = 19 Significa que el 75% de los datos son menores que 19 y el 25% de los datos son mayores que 19. 1.2.2. DECILES Son nueve valores D 1 , D 2 , …, D 9 que dividen a un conjunto ordenado de datos en diez grupos iguales. ¿Qué significa D 2 ? ¿Qué significa D 6 ? 1.2.3. PERCENTILES Son 99 valores P 1 , P 2 , …, P 99 que dividen a un conjunto ordenado de datos en 100 grupos iguales. ¿Qué significa P 30 ? ¿Qué significa el P 80 ? Podemos notar que el Q 2 = Me, Q 3 = P 75 , Q 1 = P 25 , P 50 = D 5 = Me CUANTILES PARA DATOS AGRUPADOS EN INTERVALOS. Hallando percentiles, hallamos también los deciles y cuartiles. Para hallar los percentiles seguimos el procedimiento siguiente: Para hallar el percentil P i 1) Obtenemos las frecuencias absolutas acumuladas. 2) Identificamos el intervalo del percentil. Calculamos: 3) Aplicamos la fórmula: | | | | . | \ | ÷ + = ÷ i i i f F in A LRI P 1 100 Donde LRI es el límite inferior verdadero del intervalo del percentil F i-1 es la frecuencia acumulada inmediata menor que f i : es frecuencia simple del intervalo del percentil A: la amplitud del intervalo. Docente:Ms. Selene Yengle Del Castillo Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego 11 Ejemplo: Dada la distribución de frecuencias obtener el Percentil 40. Intervalos f i F i 20-27 8 8 28-35 12 20 36-43 15 35 44-51 20 55 52-59 17 72 60-67 9 81 68-75 3 84 Identificamos intervalo de P 40 =33.6 El intervalo del percentil 40 es 36-43 P 40 = 35.5 + 8( P 40 = 35.5 + 7.25 P 40 = 42.75 El 40% de los datos son menores que 42.75 y el 60% de los datos son mayores que 42.75. Calcule el decil 4. Para el caso de encontrar los cuartiles y deciles en datos agrupados utilizamos las siguientes formulas: CUARTILES: | | | | . | \ | ÷ + = ÷ i i i f F in A LRI Q 1 4 DECILES: | | | | . | \ | ÷ + = ÷ i i i f F in A LRI D 1 10 1.3. MEDIDAS DE DISPERSIÓN A y B son dos conjuntos de datos: A: 121 119 122 118 118.5 121.5 B: 90.5 149.5 100 140 95.5 144.5 Calcule la media para los dos conjuntos. En un solo segmento construya el diagrama de puntos para ambos conjuntos. Docente:Ms. Selene Yengle Del Castillo Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego 12 Las medidas de dispersión miden la diseminación, el grado de esparcimiento de los puntos. También se llaman medidas de variabilidad.. Los puntos del conjunto B tienen mayor diseminación que los puntos del conjunto A. Entre las medidas de dispersión tenemos a las siguientes: 1.3.1. Rango. Llamado también recorrido o alcance, es la diferencia entre el dato mayor y el dato menor: Rango = X mayor - X menor Calcule los rangos de los conjuntos A y B. 1.3.2. Varianza. Varianza para datos no agrupados: Si a cada uno de los datos del conjunto A le restamos la media obtenemos las desviaciones de los datos con respecto a su media. Estas desviaciones son: 1 -1 2 -2 -1.5 1.5 ¿Cuál es la suma de estas desviaciones? ¿Cuáles son los cuadrados de estas desviaciones? Sume los cuadrados de las desviaciones y divida la suma por el número de datos menos uno. El resultado obtenido se llama varianza de la muestra y se denota con S 2 . 5 25 . 2 25 . 2 4 4 1 1 2 + + + + + = S = 2.9 Calcule la varianza de los datos del conjunto B. Las desviaciones se denotan: X X i ÷ . ¿Cuántas son estas? La fórmula para la varianza de la muestra es: 1 ) ( 2 2 ÷ ÷ = ¿ n X X S i Al elevar al cuadrado las diferencias y distribuyendo la sumatoria, se obtiene una fórmula de mayor uso en la práctica: 1 ) ( 2 2 2 ÷ ÷ = ¿ ¿ n n X X S i i Docente:Ms. Selene Yengle Del Castillo Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego 13 Para obtener la varianza de los datos del conjunto A: X i 2 i X 121 14641 119 14161 122 14884 118 13924 118.5 14042.25 121.5 14762.25 720.0 86414.5 La varianza es: 5 6 ) 720 ( 5 . 86414 2 2 ÷ = S = 5 86400 5 . 86414 ÷ S 2 = 2.9 Calcule la varianza para los datos del conjunto B. Cómo se calcula la varianza para datos agrupados en una distribución de frecuencias? Varianza para datos agrupados en una distribución de frecuencias La fórmula que se utiliza es: 1 ) ( 2 2 2 ÷ ÷ = ¿ ¿ n n f X f X S i i i i donde X i son puntos medios de los intervalos. Ejemplo. Dada la distribución de frecuencias: Intervalos f i X i f i Xifi i i f X 2 3-<11 5 7 5 35 245 11-<19 7 15 7 105 1575 19-<27 8 23 8 184 4232 27-<35 13 31 13 403 12493 35-<43 17 39 17 663 25857 43-<51 10 47 10 470 22090 60 60 1860 66492 59 57660 66492 59 60 ) 1860 ( 66492 2 2 ÷ = ÷ = S = 149.69 Docente:Ms. Selene Yengle Del Castillo Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego 14 La desventaja de la varianza es que está expresada en el cuadrado de las unidades; es decir, si los datos están dados en metros la varianza está dada en m 2 o si los datos están dados en segundos la varianza está dada en segundos 2 . 1.3.3. La desviación estándar. Llamada también desviación típica, es la raíz cuadrada de la varianza. Se la denota con S. La desviación estándar, a diferencia de la varianza, se expresa en las unidades de los datos. Para los datos agrupados, del ejemplo, su desviación estándar es: S = 69 . 149 = 12.23 3.3.4. El coeficiente de variación. Es una medida relativa de dispersión y se define como: C.V. = % 100 x X S Expresa qué porcentaje de la media es la desviación estándar. Ejemplos, el coeficiente de variación para el conjunto A es: C.V. = % 42 . 1 % 100 120 70 . 1 = x La desviación estándar es el 1.42% de la media. Calcule el coeficiente de variación para los datos de la distribución de frecuencias. El coeficiente de variación sirve para comparar la dispersión dos o más conjuntos de datos que tienen diferentes unidades de medidas. También sirve para comparar la dispersión de dos o más conjuntos de datos que difieren en media aritmética. Ejemplo: Dados los conjuntos de datos: A : 65, 68, 70, 64, 60 B: 7, 9, 5, 3, 10 que son los pesos, en kilogramos, de un conjunto de personas adultas y de un conjunto de niños, respectivamente. En qué conjunto hay mayor dispersión?. Docente:Ms. Selene Yengle Del Castillo Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego 15 Las medias de los conjuntos son kg X A 4 . 65 = y kg X B 8 . 6 = y las desviaciones estándar kg S A 85 . 3 = y kg S B 86 . 2 = , respectivamente. De acuerdo a las desviaciones estándar podemos estar tentados a afirmar que en el conjunto A hay mayor dispersión que en el conjunto B, Sin embargo, los coeficientes de variación nos permiten dar una respuesta correcta a la pregunta. C.V. A = % 89 . 5 % 100 4 . 65 85 . 3 = x y C.V. B = % 06 . 42 % 100 8 . 6 86 . 2 = x 1.4. MEDIDAS DE FORMA Sirven para describir las deformaciones horizontales o verticales de una distribución de los datos. Tenemos a las medidas de asimetría y de apuntamiento. 1.4.1. MEDIDAS DE ASIMETRIA Estas medidas describen las deformaciones horizontales. Para este propósito se utiliza el coeficiente de asimetría. ̅ Si > 0, la distribución tiene asimetría positiva; Si = 0, la distribución es simétrica; Si < 0, la distribución tiene asimetría negativa 1.4.2. MEDIDAS DE APUNTAMIENT0 Describen las deformaciones verticales. Con este propósito se utiliza el coeficiente de apuntamiento. ∑ ̅ Si , la distribución es platicúrtica; Si = 0 , la distribución es mesocúrtica; Si > 0, la distribución es leptocúrtica Docente:Ms. Selene Yengle Del Castillo Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego 16 DIAGRAMA DE TALLO Y HOJAS A continuación mostramos un diagrama de tallo y hojas para la variable Talla. 3 1.3 | 468 6 1.4 | 467 13 1.5 | 1223489 23 1.6 | 3455678899 (9) 1.7 | 024445688 18 1.8 | 000349 12 1.9 | 0034566889 2 2.0 | 02 El recorrido de la variable se ha dividido en 8 partes (los tallos), que vienen representados por los valores 1.3, 1.4, 1.5, etc. Los valores que le siguen, tras la línea vertical, son las hojas que corresponden a cada tallo. Así en el primer tallo tenemos las hojas 4, 6, 8. Esta rama corresponde a los datos más pequeños de la variable talla 1.34, 1.36, 1.38. La frecuencia acumulada de cada rama esta especificada a su izquierda. Así la frecuencia de la primera rama es 3, la de la segunda también es 3, pero la acumulada es 6. En este caso la acumulación de las frecuencias se hace por ambos lados de la tabla hasta llegar al tallo que contiene a la mediana. Este tallo contiene 9 elementos como está indicado entre paréntesis. Esta representación tiene la ventaja de que superpone una tabla de frecuencias y una representación gráfica dada por la forma que toman los números, y que es similar al histograma de frecuencias. Además no hay pérdida de información, ya que se puede reconstruir todos los datos de la variable primitiva contenida en la muestra a partir de esta representación. Docente:Ms. Selene Yengle Del Castillo Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego 17 GRÁFICA DE CAJA Y BIGOTES (BOX AND WHISKER) En está gráfica los datos se dividen en cuatro intervalos de igual frecuencia. La parte ancha, llamada Caja, contiene el 50% central de los datos de la variable. Comienza en el primer cuartil y termina en el tercer cuartil. La muestra de la caja marca la mediana (la definición de mediana y de cuartil se verá más adelante en el apartado de medidas de posición). En el gráfico de Box-Whisker correspondiente a la variable Talla, que aparece a continuación, se ha marcado además un punto, que corresponde a la media aritmética de los valores muestrales. Las dos líneas horizontales se llaman Bigotes y se extienden a derecha e izquierda de la Caja. El bigote de la izquierda comienza por el dato más pequeño que dista del primer cuartil menos que 1.5 veces el rango intercuartílico (distancia entre el primer y tercer cuartil). En este caso corresponde al valor 1.34 El bigote de la derecha acaba en el mayor valor de la variable talla que diste del tercer cuartil menos que 1.5 veces el rango intercuartílico. Corresponde en este caso al valor mayor de la variable talla que es 2.02. A veces hay valores de la variable que sobresalen de los bigotes. Estos valores se clasifican como valores atípicos (Outliers). Las tablas y las gráficas pretenden ordenar y clarificar la información contenida en la muestra. En los casos tratados, excepto en el caso del diagrama de tallo y hojas, siempre se hace perdiendo parte de información. En el siguiente apartado se darán algunos definiciones que pretenden reducir la información contenida en la muestra de una forma aún más drástica: a sólo unos cuantos valores, los parámetros estadísticos de la muestra. Entre ellos destacamos las medidas de posición y las de dispersión. Docente:Ms. Selene Yengle Del Castillo Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego 18 EJERCICIOS PROPUESTOS 1. Los datos que se muestran a continuación representan el costo de la energía eléctrica durante el mes de julio del 2011 para una muestra aleatoria de 50 departamentos con dos habitaciones en una ciudad grande. Los costos de energía eléctrica en dólares son: a) Determine una tabla de frecuencias, para K = 7 b) Elabore un histograma de frecuencias y polígono de frecuencias con los datos. c) Alrededor de que cantidad parece concentrarse el costo mensual de energía eléctrica. d) Calcule e interprete las principales medidas de resumen. 2. Se identificó una muestra de estudiantes que poseía automóviles producidos por la General Motors y se registró la marca de cada automóvil. A continuación se presenta la muestra que se obtuvo (Ch = Chevrolet, P = Pontiac, O = Oldsmobile, B = Buick, Ca = Cadillac): a) Encuentre el número de automóviles de cada marca que hay en la muestra. b) ¿Qué porcentaje de estos automóviles son Chevrolet, Pontiac, Oldsmobile, Buick, Cadillac? c) Trace una gráfica de barras que muestre los porcentajes encontrados en el inciso b). 3. Un policía de una ciudad, usando radar, verificó la velocidad de los automóviles que circulaban por una calle de la ciudad: 27 23 22 38 43 24 25 23 22 52 31 30 29 28 27 25 29 28 26 33 25 27 25 21 23 24 18 23 a) Organice los datos en una tabla y elabore una gráfica adecuada para estos datos. b) Calcule e interprete las principales medidas estadísticas. Docente:Ms. Selene Yengle Del Castillo Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego 19 4. Los siguientes son los números de torsiones que se requirieron para cortar 12 barras de aleación forjada: 33, 24, 39, 48, 26, 35, 38, 54, 23, 34, 29 y 27. Determine e interprete: a) La media b) La mediana c) El rango promedio d) Varianza y desviación estándar 5. Por un error, un profesor borró la calificación obtenida por uno de diez alumnos. Si los otros nueve estudiantes obtuvieron 43, 66, 74, 90, 40, 52, 70, 78 y 92 y la media de las diez calificaciones es 67, ¿Qué calificación borró el profesor? 6. En los siguientes ejercicios, calcule el rango, el rango promedio, la varianza y la desviación estándar para los datos que se dan. a) Los valores que se dan son pesos (en onzas) de carnes listadas en el menú de un restaurante como cortes “Porterhouse de 20 onzas” (basados en datos recolectados por un estudiante del autor). 17 20 21 18 20 20 20 18 19 19 20 19 21 20 18 20 20 19 18 19 b) Dígitos seleccionados en la lotería Maryland Pick Three: 0 7 3 6 2 7 6 6 6 3 8 1 7 8 7 1 6 8 6 9 5 2 1 5 0 3 9 9 0 7 c) Concentraciones de alcohol en la sangre de 15 conductores implicados en accidentes mortales y luego condenados a prisión (basados en datos del departamento de Justicia de Estados Unidos). 0.27 0.17 0.17 0.16 0.13 0.24 0.29 0.24 0.14 0.16 0.12 0.16 0.21 0.17 0.18 7. La concentración de sólidos suspendidos en agua de un río es una característica ambiental importante. Un artículo científico reportó sobre la concentración (en partes por millón, o ppm) para varios ríos diferentes. Supongamos que se obtuvieron las siguientes 50 observaciones para un río en particular: 55.8 60.9 37.0 91.3 65.8 42.3 33.8 60.6 76.0 69.0 45.9 39.1 35.5 56.0 44.6 71.7 61.2 61.5 47.2 74.5 Docente:Ms. Selene Yengle Del Castillo Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego 20 83.2 40.0 31.7 36.7 62.3 47.3 94.6 56.3 30.0 68.2 75.3 71.4 65.2 52.6 58.2 48.0 61.8 78.8 39.8 65.0 60.7 77.1 59.1 49.5 69.3 69.8 64.9 27.1 87.1 66.3 a) Calcule la media b) Calcule la media recortada al 25% y la media recortada al 10% c) Calcule la varianza y la desviación estándar 8. Use los datos del ejercicio 7 (50 observaciones de un río) y calcule lo siguiente: a) Q1, Q2 y Q3 b) Realice un diagrama de caja con estos datos c) Calcule P15, P20, P25 d) Calcule e interprete las medidas de dispersión. 9. Use los datos del ejercicio 1 (costos de energía eléctrica para una muestra de 50 departamentos) y calcule lo siguiente: a) Q1, Q2 y Q3 b) Calcule el percentil correspondiente a: 191, 70 y 175 c) Realice un diagrama de caja d) Calcule e interprete las medidas de tendencia central, dispersión y forma. 10. Los siguientes son los números de los minutos durante los cuales una persona debió esperar el autobús hacia su trabajo en 15 días laborales: 10, 1, 13, 9, 5, 2, 10, 3, 8, 6, 17, 2, 10 y 15. Determine: a) La media b) La mediana c) Trace un diagrama de caja. d) Calcule e interprete las principales medidas de resumen. Docente:Ms. Selene Yengle Del Castillo Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego 21 11) Los datos siguientes corresponden al tiempo en seg. necesario para procesar 25 trabajos en una CPU: 0.02 0.75 1.17 1.61 2.59 0.15 0.82 1.23 1.94 3.07 0.19 0.92 1.38 2.01 3.53 0.47 0.96 1.40 2.16 3.76 0.71 1.16 1.59 2.41 4.75 Vamos a calcular distintas medidas de centralización y a comentarlas. 12) En una Universidad que ofrece un programa de postgrado especializado en manejo de desechos peligrosos. Para planificar futuros cambios, se hizo una encuesta para determinar los antecedentes y objetivos de los 223 estudiantes que actualmente están inscritos en el programa (Fuente: Journal of Professional Issues in Engineering, abril de 1990). La gráfica circular muestra un desglose de las licenciaturas que cursaron los 223 estudiantes. Interprete la gráfica. Transforme este gráfico en un gráfico de barras donde se muestren las frecuencias absolutas. 13) ¿Qué forma tiene las distribuciones descritas por las siguientes medidas de tendencia central?: a. Media = 46, Mediana = 42, Moda = 39. b. Media = 3,1, Mediana = 3,1, Moda = 3,1. c. Media = 105, Mediana = 110, Moda = 115. 14) Determine si las siguientes aseveraciones son verdaderas ó falsas. Una aseveración verdadera tiene que ser siempre verdadera. a. El rango entre cuartiles es la mitad del rango. b. El promedio está siempre entre el primer y tercer cuartil. c. La mediana está siempre entre el primer y tercer cuartil. d. La desviación estándar de una distribución simétrica es siempre igual al rango entre cuartiles. e. El promedio de una distribución simétrica es siempre igual a la mediana. 15) Un Profesor le entrega las notas en el primer control y les dice que el promedio fue de 5,7. Si usted obtuvo un 6,2: a. ¿Puede su nota ser la máxima? b. ¿Puede ser que el 50% de los estudiantes tuvieron mejor nota que usted? c. Si además el Profesor da la desviación estándar, ¿Con cuál se sentiría mejor: con una desviación estándar de 0,6 ó con una de 1,1? Explique. Docente:Ms. Selene Yengle Del Castillo Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego 22 16) Un estudio encontró que los estudiantes hombres de una Universidad pesaban en promedio 66 kilos con una desviación estándar de 9 kilos. Las mujeres pesaban en promedio 55 kilos, con una desviación estándar de 9 kilos. a. Puede decir si el estudiante de más peso es ¿Un hombre ó una mujer? Explique. b. Encuentre el promedio y la desviación estándar en libras (1 kg = 2,2 libras). c. Si juntamos los hombres y las mujeres, la desviación estándar será: ¿Menor que, mayor que ó igual a 9? 17) Los estudiantes de Sociales siempre manifiestan que tienen mayor dificultad en los cursos que involucre el tratamiento de cálculos matemáticos, es por ello que se realizó una medición de la memoria en estudiantes de primer año de la carrera. La experiencia consistió en exponer 10 palabras y 10 números ante los estudiantes durante 10 segundos. Después de cuatro días de clases, se pidió a los alumnos que recordaran las palabras y números que se habían mostrados previamente, registrándose los siguientes resultados: a. En término medio, ¿Qué cantidad de palabras y números recuerdan los estudiantes? b. ¿Cuál es la cantidad de palabras y de números que recuerdan con mayor frecuencia? c. Determine la mediana de ambos casos. Interprete sus resultados. d. ¿En cuál de los dos grupos se recopiló una información más homogénea? 18) Dos Profesores (A y B) están interesados en estudiar los hábitos de sueño de los estudiantes en sus clases. Ambos profesores registran el tiempo (en minutos) que demoran en quedarse dormidos sus alumnos desde que empieza la clase. El gráfico siguiente muestra los tiempos que demoran en quedarse dormidos los alumnos del profesor A. Docente:Ms. Selene Yengle Del Castillo Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego 23 a. ¿Cuál es el valor aproximado de las medidas de dispersión del tiempo del Profesor A? b. ¿Qué porcentaje de alumnos se queda dormido antes de los 14 minutos con el Profesor A? Justifique. c. Los datos del Profesor B son los siguientes: 10,5 11,3 11,9 12,0 12,3 12,3 12,5 12,7 13,4 13,7 13,8 14,2 14,8 15,1 15,3 16,7 16,8 18,8 20,8 Construya un diagrama de caja (junto al diagrama de caja del profesor A) correspondiente a los tiempos en que se quedan dormidos los alumnos en la clase del Profesor B y compare ambos grupos respecto de la variable en estudio.


Comments

Copyright © 2024 UPDOCS Inc.