tamaño muestra e intervalos de confianza

May 6, 2018 | Author: Anonymous | Category: Documents
Report this link


Description

TAMAÑO DE MUESTRA 1 - : Nivel de confianza (regularidad) : Estimador ( , , etc.) Ө: parámetro (µ, P, etc.) : Nivel de significación (riesgo). Z = Z1 coeficiente de confianza LI: Limite inferior del intervalo de confianza LS: Limite superior del intervalo de confianza = – Ө: error de estimación. De la variable aleatoria Z tenemos: Z= – = Z = Elevándolo al cuadrado tenemos: Z2 = ecuación fundamental del muestreo 1. TAMAÑO DE MUESTRA PARA LA MEDIA. Sabemos: ={ ( ) ( ) a). cuando la población es infinita Remplazamos en la ecuación fundamental de muestreo = despejando “n” obtenemos que: n= b). cuando la población es finita. Remplazamos en la E.F.M; obtenemos n= = Nota: Si el método de muestreo es por estrato el tamaño de muestra será: ∑ ⁄ ∑ = k: Nº de estado W: Proporción por estado I: 1, 2,3. ….k 2. TAMAÑO DE MUESTRA PARA LA PROPORCIÓN Ecuación fundamental del muestreo: a). Cuando la población es infinita: Remplazamos en la E.F.M témenos: b). Cuando la población es finita: Remplazamos en la E.F.M tenemos: Si el método de muestreo fuera por estrato el tamaño de muestra seria: ∑ ⁄ ∑ = K: nº de estrato i=1,2,3…K = : Proporción por estrato. Ejm: un fabricante afirma que el peso promedio de las latas de frutas en conserva que saca al mercado es de 12 onzas, para verificar esta información ¿que tamaño de muestra se debe escoger para estimar si se quiere un error no superior a 0.98 onzas con confianza del 95%.? Suponga que la población de los pesos es normal con una desviación estándar de 2 onzas Solución: X: Peso de latas de frutas con conserva : Peso promedio de las latas de frutas en conserva X N( ); = 2 onzas 1- = 0.95 = = n= = = 16 latas tamaño de la muestra = 0.025 = 0.975 Ejm: Si la población de latas de conserva es de 2000 en el ejemplo anterior ¿Cuál es el tamaño de muestra? = El otro método = = 15.88 = = = = = 15.87 Ejm:la oficina de planificación familiar de cierta provincia quiere estimar el % de familias con mas de 4 hijos ¿Qué tamaño de la muestra se requiere para asegurar con una confianza del 95%? Que el error de la estimación de tal % no sea superior a 0.05. : Proporción al número de familias con más de 4 hijos. Si la proporción “P” no se conoce se asume que. p = q; además p + q = 1 p = q = 0.5 1 - = 0.95 = 1.96 =0.05 5% Tamaño de muestra = La otra forma: N = 4000 ¿n? = 385 = = = = 351.19 aprox. 352 familias = = 384.16 385 familias Estimación estadística de parámetro. I.- Estimación puntual (estadística descriptiva) Parámetro µ: media poblacional : Varianza poblacinal P: proporción poblacional Estimador ∑ = , media muestral =∑ ( ) ; varianza muestral = , proporción muestral PROPIEDADES DE LOS BUENOS ESTIMADORES. a). insesgamiento: E (ô) = Ө b). eficiencia Estimador con varianza mínima: ô ô ô ={ ô ô E= c). Consistencia. A medida que el tamaño de la muestra aumenta los estimadores tienden a acercarse al valor del parámetro. N ô Ө d). Suficiencia.los estimadores son suficientes si utilizan la mayor cantidad de observaciones. Md = Me = = La media es más suficiente que los demás indicadores. II.- Intervalos de confianza. ô Z= P ()=1ô ∑ …………………….. * en * Remplazando Z = Tenemos P ( P (-ô P (ô + P (ô - ô )=1ô )=1)=1)=1)% ô conocida. ô ô Intervalo de confianza al (1 ôô 1). Intervalo de confianza para la media: µ 2). Intervalo de confianza para la media: a).Población no normal. µ desconocida. b).Población normal. Cuando n es pequeño µ = , n-1 t significa etsdent. 3). Intervalo de confianza para la varianza. 4). Intervalo de confianza para la razón de varianza. 5). Intervalo de confianza para la diferencia entre dos medias. y supuestos conocidos σ + σ - 6). Intervalo de confianza para la diferencia entre dos varianzas. y supuestos desconocidos √ a).Población no normal. b).Población normal. b.1). varianzas supuestos iguales = √ : varianza conjunta = : √ b.2). varianzas supuestos distintas = : 7). Intervalo de confianza para la proporción. ± 8). Intervalo de confianza para la diferencia de dos proporciones. ( )± Ejercicios: 1. Una muestra aleatoria de 100 hogares de una unidad indica que el promedio de los ingresos normales es de 500. Encuentre un intervalo de confianza del 95 % para la media poblacional de los ingresos de todos los hogares de esta ciudad. Suponga σ = $ 100. X: ingreso mensual : promedio de los ingresos mensuales $ 500 σ: $100 n: 100 = $ 500 (1 - ) = 0.95 = 1.96 = = = = 10 remplazando 500 1.96 (10) √ √ 19.6 = 480.4 519.6 Interpretación: El 95 % de los ciudadanos tienen un ingreso promedio de $ 480.4 y 519.6 2. Un análisis de investigación de mercado escoge una muestra aleatoria de 100 clientes de un conjunto de 500 clientes de una gran tienda que declara mayor ingreso a $ 5000. La encuesta de los clientes de la muestra gastaron en la tienda en promedio $ 2500. Si con este valor de la muestra se estima que el gasto promedio de la población finita suma de 2446 a 2554 ¿Qué nivel de confianza se utiliza? Suponga que la desviación estándar es σ = % 300. Y: ingreso X: gasto : gasto promedio n = 100 = $ 2500 2446 2554 N = población finita σ = $ 100 (1 - ) = ¿? µ = √ √ = √ √ = . 0.81786 = 24.54 Remplazando tenemos: 2500 - (24,54) 2500 + (24,54) 2446 2554 2500 + (24,54) = 24,54 (24,54) = 24,54 - 2500 = = 2.20 (1 - ) = P ( =P( =P( =P( =2P( ) ) )-P( ) )- 1-P( )] - 1) 2 (0, 9861) – 1 1, 9722 -1 = 0.9722 3. En un studio socioeconómico se forma una muestra aleatoria de 100 comerciantes informales y se encontró entre otros datos los siguientes: un ingreso medio de s/. 50,00 y solo en 30 % tiene ingresos superiores a s/. 80,00. a. Estimar la proporción de todos los comentarios con ingresos superiores a s/. 800,00 mediante un intervalo de confianza de 98 %. b. Si la proporción de todos los comerciales con ingresos superiores a s/. 800,00 se estima entre 20,06 % y 39,94 % ¿Qué grado de confianza se utilizo?. X: numero de comerciantes con ingresos superiores a s/. 800,00. = 0,30, n = 100  1 - = 0,98 = 0.02 = 0,01 1 - = 0,99 = = = 2,33 = √ En la formula 0.30 2.33 (0.046) 0.193 P 0.407 Interpretación: el98%de los comerciantes Con la confianza del 98% estimamos q el porcentaje de comerciantes con ingresos superiores a 800,00 varia entre el 19 % a 41 %.  Se estima entre 20,06 % 39,94 % 0,2006 0,3994 + Igualemos ( ) + = 0,3994 0,30 + + (0,046) = 0,3994 = = 2,16 (1 - ) = P ( =P( = = = 2 (0, 9846) – 1 ) ) =√ = 0,046 ( 1- = 0, 9692 0, 97 = 97 %. 4. Se quiere estimar la diferencia entre dos promedios de tiempo (en minutos) que utilizan dos operarios para realizar determinada tare. Suponga que las poblaciones de los dos tiempos se distribuyen normalmente con varianza común. Estime la diferencia entre los dos promedios poblacionales mediante un intervalo de confianza de 95 % si el registro de 16 tiempos en cada operario han dado: = 6; 2 = 35; = 4 1 = 38; = = ¿? Desconocidas. ) ……………………………………….* = 0,95 1= ( - 0,975 = 2,04 = ) = 38 – 35 = 3 √ = √ = = 1,8028 = = 26 Remplazando en * tenemos: 3,68 Según el 95 % 1 aventaja al operario 2 entre 0,68 y 6,68 minutos. 5. Una firma distribuye dos marcas de cerveza en una reciente encuesta se encontró que 60 de 120 la marca A y 50 de 80 prefieren la marca B. use un intervalo de confianza del 99 % sea la diferencia de proporciones con el fin de determinar si son diferentes las proporciones de diferencias poblacionales. Marca “A” Marca “B” (1 √ ) = 0,99 = 120; = 80; 1=√ 2 1 = 60 1 = = 0,500 = 0,625 = = 2,58 =√ = 50 = ……………………………………….* = 0,995 0,071 Remplazando en (*) (0,500 – 0,625) 2,58 (0,071) – 0,125 2,18 Cuando el intervalo de confianza incluye a 6. Se escoge una muestra de 13 tiendas y se encuentra que las ventas de la semana de un determinado producto de consumo popular tiene una deviación estándar igual a $ 6 se supone que las ventas del producto tienen distribución normal. Estimar  La varianza  La desviación estándar poblacional mediante un intervalo de confianza del 95 % Datos. Ŝ = $ 6; n = 13 = Remplazando = 23,34 = = 4,40 7. Una de las maneras de medir el grado de satisfacción des empleados de una misma categoría en cuanto a la política salarial, es a través de las desviaciones estándares de sus salarios. La fabrica A afirma ser mas homogénea en la política salarial que la fabrica B. para verificar esa afirmación se escoge una muestra aleatoria de 10 empleados no especializados de la fabrica A y de 13 de B obteniéndose las dispersiones del salario mínimo ¿Cuál seria su conclusión si utiliza un intervalo del 95 % para el cociente de varianza? Suponga distribuciones normales. Datos. ; (1 - ) = 0,95 = = 3,87 Remplazando es la formula tenemos: Este intervalo incluye al 1 entonces dos fábricas es homogénea. son iguales. Entonces la política salarial en las PRUEBA DE HIPOTESIS. HIPOTESIS: solución anticipada al problema que necesita ser demostrada es una afirmación o conjetura sobre el problema. Hipótesis estadística: es una afirmación o conjetura sobre los parámetros de la población o sobre el comportamiento de una variable aleatoria. Por ejm. Tipos de hipótesis. 1) Hipótesis nula : es la hipótesis que es aceptada provisionalmente como verdadera y cuya valides será comprometida a comprobación experimental. 2) Hipótesis alternativa : es la hipótesis que será aceptada cuando se rechace la hipótesis nula. Ejm: a) :Ө= ; :Ө b) :Ө ; :Ө c) :Ө ; :Ө Ejm: X: ingreso mensual de encuestados. :µ= :µ :µ 800,00; 800,00; 800,00; :µ :µ :µ 800,00 800,00 800,00 Ejm: X: numero de personas que prefieren un producto W. : p = 0, 45 ; :p :p ; :p :p ; :p Prueba de una hipótesis estadística. Es un proceso que nos conduce a tomar la decisión de aceptar o rechazar la hipótesis nula en contra posición de la hipótesis alternativa y en base a los resultados de una muestra aleatoria seleccionada de una población en estudio. Error tipo I y tipo II a nivel de significación . DESICION Rechazar verdadero Error tipo I Probabilidad : falso Decisión correcta Probabilidad: Error tipo II Probabilidad : Aceptar Decisión correcta Probabilidad: = p (rechazo / es verdadero) = p (acepto / es falso) = nivel de significancia. Regiones críticas y de aceptación. (Tipo de colas de las pruebas) a) :Ө= :Ө Prueba de dos colas ( ) RA: región de aceptación RC: región critica o de rechazo. ⁄ 1O ⁄ R.C. R.C. :Ө :Ө Prueba de la cola izquierda. b) Ө Ô RC 0 RA :Ө :Ө Prueba de cola derecha. Z (T, X2, F) c) Ө Ô 0 RC RA Regla de decisión. Si el estadístico de prueba ( ) cae en la región de aceptación, entonces aceptamos ; si cae en la región critica rechazamos y aceptamos . Estadístico de prueba: Z= . Procedimiento de Prueba de Hipótesis.  Formulación de la hipótesis :Ө= Ө Ө :Ө Ө Ө     Especificar el tamaño del nivel de significación ( ) Definir las regiones de aceptación y rechazo (RA y RC) Calcular en estadístico de prueba después de seleccionarlo apropiadamente. Decisión estadística. Aceptar o rechaza , según comparación del estadístico de prueba y regiones (RA y RC).  Decisión estadística en términos del problema planteado (interpretación de resultados). PRUEBA DE HIPÓTESIS ACERCA DE UNA MEDIA. A. Supuesto: si la varianza es conocida. Probar la hipótesis nula : = CONTROLA LA UTILIZA PRUEBA DE: ALTERNATIVA Cola izquierda Cola derecha Dos colas = RA = ( estadístico de prueba. ); Z ~ RECHAZA SI: RA Ejm: un proceso automatico llena latas de palmito. Si el peso medio de las lata llenas es de 400gr. Se afirma que el proceso esta controlado, en caso contrario el proceso no esta controlado. En el proceso de estado se ha determinado que los pesos de las latas llenas tiene una desviación estándar de 20gr. Si una muestra aleatoria de 100 latas llenas de palmito a dado el peso medio de 395gr, a la interrogación se podría concluir que el proceso esta fuera de control al nivel de significación del 5 %. Solución: : µ =400gr. (proceso controlado) : µ 400gr. (proceso descontrolado) = 5 % = 0,05 = = ⁄ √ = = 1.96 = ⁄ √ = - 2,5 en grafico se ubica en la región critica. cae en la región critica. = - 2,5 - = - 1,96 Rechazamos = 400gr. El proceso esta descontrolado. B. Supuesto: si la varianza Probar la hipótesis nula CONTROLA LA ALTERNATIVA : es desconocida. = RECHAZA SI: UTILIZA PRUEBA DE: Cola izquierda Cola derecha Dos colas RA = RA = ( estadístico de prueba. ); ~ Nota: la población es normal. Ejm: las cajas de cierto tipo de cereal procesado por una fábrica deben tener un contenido promedio de 160gr. Por una queja ante en defensor del consumidor de que tales cajas de cereal tienen menos contenido, un inspector tomo una muestra aleatoria de 10 cajas encontrando los siguientes pesos de cereal en gramos 157; 157; 163; 185; 161; 159; 162; 159; 158; 156. ¿Es razonable que el inspector multe al fabricante utilicen un nivel del 5 % y supongan que los contenidos tienen distribución normal? De los datos podemos sacar :µ :µ = 5 % = 0,05 = = = = 160gr (no lo multe al fabricante) 160gr (multe al fabricante) = = = -1,833. = - 1,36 en grafico se ubica en la región aceptación. cae en la región aceptación. ⁄ √ ⁄ √ = - 1,36 = - 1,833 Aceptamos : u = 160gr. No se multa al fabricante. PRUEBA DE HIPÓTESIS ACERCA DE LA VARIANZA. Supuesto: si lo parámetros son desconocida. Probar la hipótesis nula CONTROLA LA ALTERNATIVA : = RECHAZA SI: UTILIZA PRUEBA DE: Cola izquierda Cola derecha Dos colas RA = RA = [ estadístico de prueba. ]; Nota: la población es normal. Ejm: una muestra de 16 sobres de cierto producto cuyos pesos se distribuyen normalmente a dado una desviación estándar de 0,6 gramos. Utilizando un nivel de significación del 5 %, es valido inferir que la varianza de los pesos de tales sobres es mayor de 0, 25 : : = 0,05 = 0, 25 0, 25 = = 24,99 25 = = = = 21,6. = 21,6 = 25 cae en la RA Aceptamos : = 0,25 No es valido inferir que la varianza es mayor que 0,25. PRUEBA DE HIPÓTESIS ACERCA DE LA RAZÓN DE DOS VARIANZAS. Supuesto: población normal. Probar la hipótesis nula : = CONTROLA LA UTILIZA RECHAZA PRUEBA DE: SI: ALTERNATIVA Cola izquierda Cola derecha Dos colas RA Estadístico de prueba. * ; Ejm: los tiempos en minutos para realizar cierta tarea observada en 10 hombres y 10 mujeres fueron: Hombres: 50; 45; 49; 50; 38; 58; 53; 47; 48; 55 Mujeres: 55; 56; 57; 56; 58; 53; 54; 59; 60; 57 = = +; ~ Suponiendo `poblaciones normales ¿se podría concluir que las varianzas poblacionales son diferentes? = 5 %. = = = 5 % = 0,05 = = = = = 6,52 cae en la región critica. = = 0,248 = 4,025 Rechazamos = = Las varianzas poblaciones son diferentes. PRUEBA DE HIPÓTESIS ACERCA DE DOS MEDIA. A. Supuesto: si la varianza es conocida (población normal) Probar la hipótesis nula : CONTROLA LA UTILIZA =0 RECHAZA ALTERNATIVA 0 0 0 = RA = ( PRUEBA DE: Cola izquierda Cola derecha Dos colas SI: RA estadístico de prueba ); Z ~ 30 Nota: para poblaciones no normales. aprox. Varianza desconocida. Ejm: una fábrica quiere comparar dos marcas A y B; para fabricar un tipo de artículo. Observa dos muestras aleatorias de 60 artículos procesados por A y B respectivamente y encuentra que las medias respectivas son 1230 y 1190 segundos. Suponga segundos al nivel de significancia del 5 %, ¿se puede inferir que la maquina B es mas rápida que la maquina A? Solución: = 0,05 1 - = 0,95 = = = 2,07 = 1,64 = RC = √ 0 0 = √ = 2,07 Rechazamos 0 Aceptamos 0 La marca B utiliza menos tiempo en el proceso de fabricación. B. Supuesto: si la varianzas son desconocidas CONTROLA LA UTILIZA RECHAZA PRUEBA DE: SI: ALTERNATIVA Cola izquierda 0 Cola derecha 0 Dos colas RA 0 = RA = ( estadístico de prueba. ) (población normal) Ejm: se quiere determinar la diferencia entre los promedios de tiempos (en minutos) que utilizan los hombres y las mujeres para realizar determinada tarea con este fin se escogen 10 hombres y 16 mujeres resultado los tiempos promedios respectivos 40 y 35 minutos y desviaciones estándares respectivas 9 y 8 minutos. Suponga que las poblaciones de ambos tiempos son independientes y se distribuyen normalmente con varianzas iguales. Al nivel de significación del 1 %. ¿Este tiempo promedio de hombres mayor al tiempo promedio de mujeres? Solución: = 0,01 =0 0 = = = √ = 2,46 = = 1,66 De varianzas desconocidas iguales entra a tallar la varianza conjunta. √ = = = 72,5 = 1,66 RA aceptamos =0 No existe diferencia entre hombres y mures para realizar la tarea es decir al 1 % pero si este porcentaje aumenta los resultados pueden ser otros. C. Supuesto: si la varianzas son desconocidas (población normal) CONTROLA LA UTILIZA RECHAZA PRUEBA DE: SI: ALTERNATIVA Cola izquierda 0 Cola derecha 0 Dos colas RA 0 = estadístico de prueba. RA = ( ); ( = ( ) ( ) ) √ Ejm: una compañía debe decidir cual de dos tipos de componente electrónica va adquirir A o B hace una prueba de 5 componentes escogidos al azar para cada marca resultando 1 = 8000 y = 2500 horas para A y = 800 horas para B. suponga poblaciones normales con varianzas 2 = 7000 y diferentes. Pruebe la hipótesis nula que los rendimientos medios son iguales contra la alternativa de que A rinde mas que B use = 5%. Datos: = 2500; =5 = 5%. 1 = 8000 y 7000 y = 800; =5 2= Solución: = 0,05 = =0 0 = = 2,02 ( = ( ) ( ) = ) (( ( ) ) (( ) = 2,02 ) ) = √ = √ = 0, 85 Aceptamos =0 Tienen rendimientos iguales A y B. PRUEBA DE HIPÓTESIS ACERCA DE UNA PROPORCION. Se resume en la siguiente tabla: Probar la hipótesis nula : = CONTROLA LA UTILIZA RECHAZA PRUEBA DE: SI: ALTERNATIVA Cola izquierda Cola derecha p Dos colas RA = RA = ( estadístico de prueba ); Z ~ Ejm: una fábrica afirma que el 30% de los consumidores prefieren su producto con el fin de evaluar esta afirmación se tomo una muestra aleatoria de 400 consumidores y se encontró que 100 de ellos prefieren dicho producto. ¿Esta es suficiente evidencia para inferir el % de preferencia del producto no es 30 % utilice = 1? Solución: : p = 0, 30 : p 0, 30 = 1 % = 0, 01 = =2, 58 = = √ = = - 2, 18 = 0, 25 = √ Se acepta que = 30 %. La afirmación del fabricante es correcta. PRUEBA DE HIPÓTESIS ACERCA DE DOS PROPORCIONES. Se resume en la siguiente tabla: Probar la hipótesis nula : CONTROLA LA UTILIZA RECHAZA PRUEBA DE: SI: ALTERNATIVA Cola izquierda Cola derecha Dos colas RA = RA = ( estadístico de prueba. ); ~ √ Población infinita. Ejm: una empresa de estudio de mercado quiere saber si un producto promocionado a nivel nacional lo adquieren en mayor porcentaje que las mujeres si en dos muestras aleatorias independientes de 900 hombres y 800 mujeres se encontró que 270 hombres y 200 mujeres adquieren el producto, ¿Cuál es su decisión? Datos: = 0,04; = 900; 1 = 270; = = 0,30 = 800 Solución: =0 0 = 0,04 = = 2,66 = = √ 2 = 200 = = 0,25 = √ = 2,31. Se acepta que =0 Por tanto hombres y mujeres adquieren la misma cantidad. PRUEBA DE INDEPENDENCIA. Las pruebas de hipótesis de independencia implican dos variables categóricas (cualitativas) y lo que se prueba es la suposición de que las dos variables son estadísticamente independientes para cada frecuencia observada en una celda hay una frecuencia esperada que se calcula a partir de sus hipótesis nula especificada y que se supone verdadera.  Formulación de la hipótesis. Las variables son independientes (no tienen relación) : Las variables son dependientes (si tienen relación)  Nivel de significación y tipo de prueba (Regiones) Dado  Calcular el estadístico de prueba. Datos observados. Variable Variable B A Total Total Datos esperados ( ) Variable Variable B A Total Total = Entonces: ∑ ∑ ( ) (Estadístico de prueba) Donde: : calcular.  Decisión estadística.  Decisión en término del problema. Ejm: en un proceso de producción se registro el numero de objetos defectuosos clasificándolos por turnos de producción y por maquina de producción. Las frecuencias observadas se registran en el cuadro dado posteriormente. Verificar al nivel de significación del 5 % si el numero de objetos, defectuosos producidos por la maquina e independiente de los turnos de producción. TABLA DE CONTINGENCIA 3*3 Datos Observados TURNOS MAQUINAS A B Mañana 75 90 Tarde 70 85 Noche 95 85 Total 240 260 A A A B B = = = = = = 82.19 = 73.97 = 83.84 = 89.04 = 80.30 Total C 85 70 75 230 250 255 255 730 B C C C = = = = = 90.82 = 78.77 = 70.89 = 80.34 Datos Esperados ( ) TURNOS MAQUINAS A B C Mañana 82,19 89.04 78.77 Tarde 73,97 80.30 70.89 Noche 83.84 90.82 80.34 Total Total El numero de objetos defectuosos población por la maquina no dependen de los turnos. : El numero de objetos defectuosos población por la maquina si dependen de los turnos. = 0.05 = = 9.49 1= 0.95 =∑ ∑ ( ) 3.87 Se acepta El numero de objetos defectuosos población por la maquina no dependen de los turnos. No hay relación no depende, los objetos producidos por la maquina.


Comments

Copyright © 2024 UPDOCS Inc.