INTRODUCCION A LA PROBABILIDAD Paralelamente al desarrollo de la Estadística, como disciplina científica en forma independiente, se desarrollo a partir del XVII al Cálculode probabilidades. Sus indicadores son los matemáticos Italianos y Franceses de ese siglo, particularmente FERMAT y PASCAL, quienes iniciaron los estudios del cálculo de probabilidades, tratando de resolver problemas de juegos de azar. A fines del siglo XVIII y principios del XIX, los trabajos de LAPLACE permitieron dar su definitiva estructuración al cálculo de probabilidades. A partir de LAPLACE, las dos disciplinas, calculo de probabilidades y Estadística, que hasta entonces habían permanecido separados se fusionaron de manera que el cálculo de probabilidades se constituye en el andamiaje matemático de la Estadística, mediante el cual, esta pudo tomar el impulso teórico que habría de llevarla al extraordinario desarrollo y perfeccionamiento que alcanzó en el siglo pasado y en el presente. La estadística moderna se caracteriza por hacer uso de la estadística inferencial. Esta incluye un conjunto de técnicas que, como se dijo en la primera parte tiene el propósito de INFERIR O INDUCIR leyes de comportamiento de una población a partir del estudio de una muestra GENERALIDADES: En muchas oportunidades nos hemos encontrado con afirmaciones donde no existe el100% de certeza sobre la aparición realización de un lecho o fenómeno. Por ejemplo continuamente escuchamos situaciones como las siguientes: Dado los niveles de inflación, en los últimos meses en el país, es probable que el próximo año, la economía alcance niveles de hiperinflación Dada la reducción continua, de los ingresos reales y el aumento de desempleo en la población, es probable que en los próximos mese, se desate una serie de conflictos sociales. En estos ejemplos se puede apreciar que el resultado final no se conoce con exactitud o certeza existe por lo tanto INCERTIDUMBRE. Así “se vive en un mundo donde se esta en la capacidad de predecir el futuro con completa certeza”. La necesidad de tener suficiente poder para manejar la incertidumbre obliga a estudiar y usar la teoría de la probabilidad. La probabilidad por tanto, nos proporciona la base para el estudio de la inferencia estadística. Aquí estudiaremos solo los conceptos y técnicas de probabilidad fundamentales que nos permita comprender el análisis estadístico. PROBABILIDAD La teoría de probabilidad tiene mucha importancia en problemas de Ingeniería, Administración, Economía, Etc. “Hay que tomar decisiones frente a la incertidumbre” Para un Ingeniero, posiblemente no tenga sentido el preguntarse ¿Durante cuanto tiempo funcionará un determinado mecanismo? Pero tendrá sentido el preguntarse y responderse a la pregunta ¿Cuál es la probabilidad que este mecanismo funcione más de 1000 horas? ó ¿Qué porcentaje de estos mecanismos funcionarán más de 1000 horas? Para un fabricante a gran escala tendrá sentido el preguntarse por porcentaje de su producto, será aceptado en el mercado. A un candidato presidencial posiblemente no le interese que Juan vote por el, per si le interesará saber el porcentaje de electores, que volarán por el. EXPERIMENTO ALEATORIO Usted aunque no lo crea esta familiarizado con lo que es un experimento aleatorio. Posiblemente más de una vez, ha tenido que definir una apuesta por medio de una moneda. En esta decisión, en el lenguaje corriente se dice “Gana el que tiene suerte” en teoría de probabilidades diremos que se determina “ALEATORIAMENTE” ó al azar al ganador. Evidentemente antes de lanzar la moneda, no se podrá afirmar quien va a ser el ganador (esta es una característica de un experimento aleatorio) Sin embargo si la monada esta perfectamente equilibrada, ambas tiene las mismas posibilidades de ganar. A mediados del siglo XVI GIROLAMO CARDANO, matemático, medico y jugador Italiano, escribió “El libro de los juegos de azar” en el que aparecía el primer estudio conocido, de los principios de probabilidad. Alrededor de 100 años mas tarde, el jugador CHEVALIER DE MERE propuso a BLAISE PASCAL el famoso “Problemas delos puntos”, que puede describirse como sigue: Dos personas participan en un juego de azar, la primera que logre acumular un cierto numero de puntos ganará la apuesta, si los jugadores se ven forzados a suspender el juego antes de que haya terminado, dado el número de puntos que ha acumulado cada uno de ellos ¿Cómo deberá dividirse la apuesta? Este problema constituyo un reto al ingenio de los astutos matemáticos Franceses BLAISE PASCAL Y PIERRE DE FERMAT, quienes iniciaron los estudios del cálculo de probabilidades tratando de resolver problemas de juego de azar propuestas por el caballero DE MERE. En general todos los juegos de azar constituyen experimentos aleatorios. RIFA, DADOS, CARRERA DE CABALLOS, LOTERÍAS, BARAJA, ETC. Este ejemplo nos da una idea de lo que es un experimento aleatorio “Un experimento aleatorio ó estadístico es cualquier experimento u operación) cuyo resultado no puede predecirse con exactitud antes de realizarse el experimento” Ejm.: Lanzar un moneda y observar la cara superior. Extraer un articulo de un lote que contiene artículos defectuosos D y no defectuosos N. Designar un delegado de un grupo de 50 personas. Calcular el número de automóviles que cruzan la intersección de dos calles, hasta antes que ocurra un accidente. Fabricar artículos hasta producir 5 artículos defectuosos y contar el número total de artículos fabricados. Son experimentos aleatorios, porque en cada caso el resultado del experimento no puede predecirse. En cambio. “Soltar una piedra en el aire” “Lanzar una pelota aun tanque de agua” No son experimentos aleatorios, puesen el primer caso la piedra caerá y en el segundo caso la pelota flotará En general todos los juegos de azar constituyen experimentos aleatorios. EXPERIMENTO : Se hace rodar un dado y se observa el número que aparece en la cara superior ESPACIO MUESTRAL : S = [1, 2, 3, 4, 5, 6] EVENTO A PROBABILIDAD La definición clásica de probabilidad puede enunciarse así: Si un evento A, Puede ocurrir de “m” formas de un total de “N” posibles formas y si estas “N” son todas las formas posibles de realización del evento, entonces la probabilidad de ocurrencia del evento A, denominada P(A), esta dada por: : Obtener numero par A= [2, 4, 6] P (A) = = Esto significa que si hay N elementos en el conjunto de resultados posibles, la probabilidad para cualquiera de ellos, será 1/N. Cual es la probabilidad que tirando un dado muestre un AS) En este caso puede obtenerse como resultado, cualquiera de los seis casos o lados (1, 2, 3, 4, 5, 6) que tiene el dado (casos posibles), esto significa que la suerte o probabilidad que tiene cada cara es P (A) = = = 0.1666 = 0.17 = 17% Si se espera obtener un número par, debemospensar que hay tres caras (2, 4, 6) que cumplen esta condición, luego la probabilidad de obtener número par será: P (par) = = = 0.50 En términos de conjunto será N = {1,2,3,4,5,6} Ejem.: Enumerar los resultados posibles de un experimento que consiste en lanzar dos monedas. Denotamos C Y S respectivamente Moneda 1 Moneda 2 :C :C C S S C S S Puntos muestrales m = {2,4,6} 2da moneda C S 1era moneda C CC CS S SC SS S = CC, CS, SC, SS Ejem.: Enumerar los resultados posibles de un experimento en el que se lanza una moneda tres veces Los resultados posibles son 8 S = CCC, CCS, CSC, CSS, SCC, SCS, SSC, SSS Para todo evento A 0 < P(A) < 1 Si la probabilidad de un evento es 0 se dice que es imposible y si es 1 se dice que hay certeza. Ejemplos: Lanzar una moneda dos veces, es equivalente a lanzar dos monedas una sola vez Si una moneda se lanza n veces, entonces el espacio muestral 2n eventos elementales _ Si en S se define al Evento A, entonces su complemento es A, donde: Si m es las veces que puede ocurrir el evento A, (N-m) denotará las veces que ese evento no ocurra. _ _ Si denotamos A la no ocurrencia de A, su probabilidad P(A) (ó q) esta dado por: (q =) P (A) = = - = 1 – P (A) De donde es fácil inferir que la suma de las probabilidades es de ocurrencia y no ocurrencia de un evento es uno (1), es decir p + q = P(A) + P (A)= 1 P (A)= 1- P(A) Ejem.: De un comité de 20 estudiantes constituido por estudiantes de Ingeniería, Económica y Agronomía, se va a elegir al azar al S A A Presidente; se sabe que la probabilidad de elegir un estudiante de Economía es 2/5 ¿Cuál es la probabilidad que el Presidente no sea de Economía? A = Economía Ā= No Economía P (Ā)= 1-P(A) = 1 - = = 0.6 LEYES DE PROBABILIDAD Las leyes de probabilidad son dos: La ley de suma y la de multiplicación. Debe tenerse en cuenta que no se aplica a cualquier caso, sin que su aplicación esta condicionada a la naturaleza de los eventos. LEY DE LA SUMA se aplica a dos clases de eventos. a. EVENTOS MUTUAMENTE EXCLUYENTES Dos eventos cualquiera A y B son (eventos) mutuamente excluyentes si y solo si A π B = Ø .Es decir, son eventos que no tienen elementos comunes. Son conjuntos disjuntos. S A B AπB = Ø Son mutuamente Excluyentes Si A y B son sucesos mutuamente excluyentes, entonces TEOREMA 1 P (AUB) = P(A) + P(B) Por ejemplo si en la población mayor de 20 años de edad se define los Eventos. A = {Población Analfabeta} B = {Abogados} Entonces A π B = Ø Porque no hay Abogados analfabeto En este caso los dos eventos A y B no tienen puntos en común de modo que A π B = Ø, no pueden ocurrir simultáneamente. En general si hay varios eventos, mutuamente excluyentes. La probabilidad de que ocurra algunos de ellos. P (A U B U C U …….) TEOREMA P (AU BU C) = P (A) + P (B) + P (C) “La suma de la probabilidad de los Eventos es igual a 1” Ejem.: Una caja tiene 220 tornillo iguales, de los cuales 80 son producidos por la maquina A, 60 por la maquina B, 50 por la maquina C y 30 por la maquina D. si se elige un tornillo al azar de la caja ¿Cuál es la probabilidad que el tornillo elegido haya sido producido por las maquinas A ó C? Es claro que A, B, C, D son Eventos mutuamente excluyentes, porque cada tornillo es producido por una y sólo una maquina. E = {A, C} P (A U C) = P (A) + P (C) = + = 0.591 S A B C Además S = {A, B,C, D} La probabilidad haya sido producido por las maquinas AoBoCoD. P (AUBUCUD) = P(A) + P(B) + P(C) + P(D) = + + + = =1 b. EVENTOS (INDEPENDIENTES) NO MUTUAMENTE EXCLUYENTES En este caso significa la probabilidad de que ocurra el evento A ó B ó que ocurran ambos. En la suma de sus probabilidades, es menos la probabilidad de si ocurrencia conjunta Es decir que estos dos eventos tiene una porción común o intersección A π B Del grafico se deduce que A y B no son mutuamente excluyentes, porque tienen una parte en común. A A B B TEOREMA: P (AUB) = P (A) + P (B) – P(A π B) Donde P(A π B) representa la probabilidad de que ocurran simultáneamente A y B En la suma de las probabilidades de todos los puntos P(A) + P(B) se incluyen dos veces los puntos de A π B, por lo tanto P(A π B) debe restarse dela suma P(A) + P(B). Se obtiene que el resultado es el total de probabilidades de todos los puntos de AUB, cada uno de los cuales se toma sólo una vez. Este teorema representa el teorema general de la suma de probabilidades. Ejemplo: Cual es la probabilidad de sacar un As ó una espada de una baraja de casino. Los eventos A y B no son mutuamente excluyentes, pues hay un AS de espadas. Luego de probabilidad de extraer una carta que sea AS o una espada o ambos casos es: P(A) = Extraer un AS = P(B) = Extraer una ESPADA= P (AUB) = P(A) + P(B) – P(A π B) = + -( )( )= = 0.308 A A B B Ejem. En una empresa comercial trabajan 8 hombres y 18 mujeres, de las cuales la mitad de los hombres y la mitad de las mujeres han nacido en Lima. Hallar la probabilidad de que un trabajador elegido al azar sea hombre ó que haya nacido en Lima. Sea A = {El trabajador sea hombre} B = {Trabajador nacido en Lima} Entonces ser hombre ó nacido en Lima será A U B P (AUB) = P(A) + P(B) – P(A π B) P(A) = P(B) = = P(A π B) = P (AUB) = + - = = 0.654 S = {A, B, C} P(AUBUC) A AB A B C A C B C B S C TEOREMA: P(AUBUC) = P(A) + P(B) + P(C) – P(A π B) – P(B π C) – P(A π C) + P(A π B π C) Ejem.: Un examen de automóviles recién desechados, debido a descomposturas del radiador, el motor ó la transmisión, demostró que el 40% tenía transmisiones malas, el40% tenían radiadores malos y el 50% tenían motores malos. El 15% tenía mal, tanto la transmisión como el radiador, el 20% la transmisión y el motor y el 20% el radiador y el motor. ¿Cuántos tenían las 3 cosas mal? Establecemos T = Transmisión Mal R = Radiador Mal M = Motor Mal 40% P(T) = 0.40 40% P(R) = 0.40 50% P(M) = 0.50 15% P(TR) = 0.15 20% P(TM) = 0.20 20% P(RM) = 0.20 Encontrar: P (TRM) T TRM TM RM T R R M P(TURUM) = P(T) + P(R) + P(M) – P(T π R) – P(R π M) – P(T π M) + P(T π R π M) 1 = 0.40 + 0.40 + 0.50 – 0.15 – 0.20 – 0.20 + P(T π Rπ M) 1.30 0.55 0.75 P(T π R π M) = 0.25 REGLA DEL PRODUCTO DE PROBABILIDADES Con frecuencia resulta necesario trabajar con probabilidades para una parte, más que para todo un espacio muestral. En este caso nos ocuparemos de la probabilidad de un evento, en un determinado subconjunto, del espacio muestral general. Las probabilidades asociadas con eventos en un determinado subconjunto del espacio muestral, se llaman PROBABILIDADES CONDICIONALES. Procedemos a desarrollar un método general para hallar probabilidades condicionales. DIAGRAMA DE VENN S A Na A B Nab B Nb Si en el espacio muestral S hay N resultados igualmente posibles de los que Na son favorables al evento A; Nb favorables al B, y Nab, favorables tanto al evento A como al B, entonces: P(A) = P(B) = P(A π B) = P(A/B) = P(B/A) = A Na A B Nab B Nb Si conocemos P(B) y P(A/B), podemos obtener P(A π B) directamente, notando que TEOREMA P(A π B) = P(B) P (A/B)= = A este resultado se le denomina con (frecuencia) REGLA DEL PRODUCTO DE PROBABILIDADES Es fácil verificar que P (A π B) es también igual al producto P(A) P(B/A) TEOREMA: P (A π B) = P(A) P(B/A) = = Extendiendo dicha regla a tres eventos A, B,C TEOREMA P (A π B π C) = P (A) P(B/A) P (C/A π B) Se conoce como la ley de la multiplicación de probabilidades y es útil en el calculo de probabilidades de eventos compuestos, es decir eventos que constan de dos ó más eventos simples. REGLA DEL PRODUCTO PARA EVENTOS INDEPENDIENTES. Si la ocurrencia o no ocurrencia de un evento A no tiene ningún efecto sobre la probabilidad de la ocurrencia de B y viceversa, los eventos A y B son denominados eventos independientes. En este caso, saber que se obtuvo en el primer evento, no tendría valor alguno en (la predicción) del resultado del segundo. Dos eventos A y B son independientes así: TEOREMA: P (A π B) = P (A) P (B) A B (Esta definición es llamada regla del producto para eventos independientes) El concepto de independencia, no se limita a dos eventos. En el caso de tres A, B, C (se dice que son independientes si solo si) TEOREMA: a. P (A π B π C) = P (A) P(B) P(C) A B C PROBABILIDAD CONDICIONAL La regla del producto de probabilidades, es utilizada (a menudo) para obtener probabilidades condicionales. Si P(B) es distinto de 0, podemos dividir los dos términos por P(B) para obtener P (A π B) = P(B) P(A/B) TEOREMA P (A/B) = P(B) ≠ 0 De manera similar, encontramos que la probabilidad de B dado A es. P (A π B) = P(A) P(B/A) P(A) ≠ 0 TEOREMA P (B/A) = Siempre que P (A) sea distinto de cero. VARIABLE ALEATORIA Y DISTRIBUCION DE PROBABILIDADES VARIABLE ALEATORIA Es una variable en la que no se puede fijar anticipadamente el valor que debe tomar, porque este valor depende de los posibles resultados de un experimento aleatorio. Se denotan por letras mayúsculas tales como: X, Y, Z etc. Ejemplo: En el experimento aleatorio de lanzar tres monedas legales el espacio muestral es: S = {ccc, ccs, csc, scc, css, scs, ssc, sss} Sea la variable aleatoria X que representa el número de caras que se puede obtener en cualquier resultado del experimento aleatorio. En el experimento aleatorio de lanzar tres monedas legales, el espacio muestral es: S = {ccc, ccs, csc, scc, css, scs, ssc, sss} 3 2 1 0 Sea la variable aleatoria X que designa el número de caras que se puede obtener en cualquier resultado del experimento. Vemos que el rango de X es el conjunto {3, 2, 1, 0} Los números 0, 1, 2, 3 se llaman valores de la variable aleatoria X. En el desarrollo de la teoría de las probabilidades y sus aplicaciones, es conveniente considerar cada uno de esos valores como un evento. Así tenemos los eventos: A = {X = 0} = {que la variable aleatoria tome el valor 0} B = {X = 1} = {que la variable aleatoria tome el valor 1} C = {X = 2} = {que la variable aleatoria tome el valor 2} D = {X = 3} = {que la variable aleatoria tome el valor 3} DISTRIBUCION DE PROBABILIDAD DISTRIBUCION BINOMIAL – BERNAULLI En este capítulo presentamos algunas distribuciones de probabilidad discreta, desarrollando en forma analítica ciertas suposiciones básicas de un fenómeno real. Estas distribución es tiene aplicaciones en Ingeniería, Administración, etc. La distribución de probabilidad es de Bernaulli (en homenaje a JACQUES BERNAULLI, quien en el año 1600 también desarrollo la teoría de las Permutaciones) se aplica solo cuando hay dos resultados posibles. Por ejemplo: en un test verdadero – falso La distribución binomial se basan un una sucesión de ensayos de Bernaulli. Un proceso binomial cumple las siguientes condiciones. 1. Cada ensayo tiene sólo dos resultados posibles, denominados por éxitos “E” y fracasos “F” 2. La probabilidad de éxito denotado por “p”, permanece constante de ensayo a ensayo, por lo tanto la probabilidad de fracaso 1-p = q; también es constante. 3. Los ensayos sucesivos son independientes, es decir el resultado de un ensayo cualquiera es independiente de los resultados de los ensayos anteriores, se aplica a variables discretas La binomial es una distribución de gran aplicación. Esta distribución teórica, aplicada a los problemas de probabilidades, ayudan al Ingeniero de control de calidad a tomas la decisión de aceptar o rechazar un lote de transistores fundado en el descubrimiento de (digamos) dos transistores defectuosos en una muestra de 100 tomados al azar en el mencionado lote. Supóngase que una operación que llamaremos prueba, puede producir únicamente, uno de dos resultados posibles; a uno de estos resultados le llamaremos éxitos, al otro fracaso. El lanzamiento de una moneda, la siembre de una semilla, la investigación de un circuito eléctrico en cuanto a su funcionamiento y la inoculación de un paciente, son pruebas. La moneda puede mostrar “cara” ò “sello”; la semilla puede germinar o no; el circuito puede funcionar correctamente o ser defectuoso; y el paciente puede recuperarse ò morir. Sea p la probabilidad de éxito y q la probabilidad de fracaso de modo que p+q=1 Para la probabilidad binomial se extraen con remplazo para que no varíe, todos los experimentos son con reemplazo para que p no varíe. Una prueba binomial es un experimento que tiene dos posibles resultados “éxito” y fracaso” En una prueba Binomial S= e, f Si se realizan n pruebas independientes Binomial S = A1 x A2x ………… xAn Si ocurre exactamente x éxitos en las n pruebas ocurrirá también n-x fracasos Como: p = La probabilidad de éxitos q = La probabilidad de fracasos Se tiene para el caso e, e, e ….. e f f …...f x éxitos n-x fracasos su probabilidad será p pp …. p q q …… q = px.qn-x x veces n-x veces Luego ocurren ( n ) formas donde hay exactamente x éxitos. x Por lo tanto la probabilidad de exactamente P (x=x) = ( n ) pxqn-x x x P ( x=x) = C n pxqn-x FUNCION DE CUANTIA O DE PROBABILIDAD f (x) = P (x=x) Probabilidad de obtener x éxitos exactamente = n! . pxqn-x x! (n-x)! Numero de maneras de obtener éxitos x Probabilidad de una sucesión x = 0, 1, ……n cualquiera Ejem: La probabilidad de un estudiante que ingresa a la Universidad y logre graduarse es 0.4 ¿Cuál es la probabilidad que de5 estudiantes nuevos. Se gradúen 3. n=5 x = 3 graduados p = 0.4 graduarse q = 0.6 no graduarse 5! (0.4)3 (0.6)5-3 = 5! (0.4)3 (0.6)2 3! (5-3)! 3! 2! P (x =3) = P (x =3) = 10 (0.064) (0.36) = 0.2304 Se lanza un dado 10 veces ¿Calcular la probabilidad de obtener 4 veces seis? SOLUCION La v.a. esta definida así X = numero de veces que aparece el numero 6 en 10 lanzamientos X = (0, 1, 2 ………………10) Sea E = obtener un seis : P (E) = 1 = 0.1666 6 F = obtener un numero diferente de 6: P (F) = 5 6 Por lo tanto se tiene que: n = 10 p=1 6 q=5 6 Luego la función de probabilidad de X es P (x = x) 101 x 510-x x6 6 X = 0, 1, 2 ……….10 Estamos interesados en el calculo de p (x = 4) P (x = 4) = 101456 4 6 P (x = 4) = 6 10!1456 = 0.048 4! (10-4)! 6 6 P (x = 4) = 210 (0.0008352) (0.2713604) = 0.0475944 FUNCION DE DISTRIBUCION O ACUMULATIVA n P ( x ≥ x) = ∑ ( )pxqn-x x=0 Ejem: Un estudiante se presente a un examen de selección múltiple que contiene 8 preguntas cada una con tres respuestas opcionales, si el estudiante esta adivinando al responder cada pregunta y además se sabe que para aprobar el examen debe responder correctamente 6 ò mas preguntas ¿Cuál es la probabilidad de aprobar el examen? Defina la variable aleatoria x tal que x(w) = numero de respuestas concretas en las 8 preguntas Rx = (0, 1, 2, 3, 4, 5, 6, 7, 8 Puesto que cada pregunta consta de una respuesta correcta y 2 respuestas no correctas P(E) = 1 = p 3 y P(F) = 2 = q ( por estar adivinando) 3 Luego la distribución de probabilidad de x es, P(x) = P(x=x) = 81x28-x x 3 3 x = 0, 1, ……8 Sea A el evento “aprobar el examen” entonces P(A) = P( x>= 6) = ∑ ( ) ( ) ( ) X=6 8 x 8-x = ( )( )( ) + ( )( )( ) + ( ) = 6 2 7 8 = 0.02 = 0.01966 Se ha elaborado un examen de selección múltiple consistente en 10 preguntas. Hay cuatro respuestas posibles para cada pregunta. Suponga que ninguno de los estudiantes que van a rendir el examen concurrió a clases o que no estudio para el examen (cosa muy frecuente) el profesor que toma la prueba ha establecido que para aprobar debe contestar correctamente al menos 6 preguntas. Si hubiere 100 alumnos en la clase ¿Cuántos alumnos teóricamente aprobarían? SOLUCIÓN 1º Puesto que ninguno de los alumnos asistió a clase o no estudio para el examen, la elección de la respuesta en cada una de las 10 preguntas se hará al azar; por lo tanto la elección de la respuesta en cada pregunta se considera como un ensayo de Bernaulli, con P = Prob. deacertar la respuesta correcta 1 = 0.25 y q = 3 4 4 2º El experimento se repite 10 veces, es decir n = 10 3º Definimos la variable aleatoria X por X (w) = numero de respuestas correctas en las 10 preguntas Rx = 0, 1, 2, 3, ………, 10 4º La variable aleatoria X, así definida es un v.a.binomial Por lo tanto su distribución P (x = x) 101x310-x x 44 x = 0, 1, …….10 5º Para aprobar el examen debe contestar al menos 6 preguntas correctas, es decir, la probabilidad de aprobar el examen es P( x ≥ 6) = 10 X=6 6 4 7 3 8 2 9 1 P(x +( 10 10 ≥ 6) 6 10 0 =( ) ( ) + 10 ( 7 )( )( ) + 10 ( )( 8 )( ) + (10 ) 9 ( )( ) ) ( ) ( ) = 0.0197 Por lo tanto, aprobación teóricamente el examen 100 (0.0197) = 1.97 2, alumnos u = E (X) = np media X 2 Varianza = S = npq Desviación Estándar = √ DISTRIBUCION DE PROBABILIDADES DE UNA VARIABLE ALEATORIA Si para cada valor de la variable X, considerado como un evento, procedemos a calcular su respectiva probabilidad, obtenemos una función que se denomina FUNCION DE DISTRIBUCION DE PROBABILIDADES DE LA VARIABLE ALEATORIA X. En la práctica, para abreviar, se omite las palabras: Función de Es importante tener en cuenta que ∑ = 1, esta fórmula dice en palabras: La suma de las probabilidades de todos los eventos posibles es igual a 1. En el ejemplo 1, del rubro 5.2.2. hemos visto que la variable aleatoria X que designa el número de caras en cada posible resultado del experimento puede tomar los valores: 0, 1, 2, 3. Las probabilidades de los respectivos eventos son: P {X = 0} = P {sss} ………… = 1/8 = 0.125 P {X = 1} = P {css, scs, ssc} = 3/8 = 0.375 P {X = 2} = P {ccs, csc, scc} = 3/8 = 0.375 P {X = 3} = P {ccc} ………… = 1/8 = 0.125 La distribución de probabilidades es la que se presenta en el cuadro CUADRO X P (X) O 0.125 1 0.375 2 0.375 3 0.125 ∑ 𝑃 𝑋 = 1 LA ESPERANZA MATEMATICA Las dos características importantes de la distribución de una variable aleatoria, son su tendencia central y su variabilidad. En esta parte introduciremos el concepto de la esperanza, que es una medida de Tendencia Central de una variable aleatoria. La esperanza es designada de muchas (otras) formas; como esperanza matemática, valor esperado, o simplemente la media de una variable aleatoria. Este concepto se relaciona íntimamente con la noción familiar de la media aritmética “La esperanza matemática de una variable aleatoria es la suma de los productos que se obtiene multiplicando todos los posibles valores de la variable aleatoria por su correspondiente probabilidad”. Ejem: La Probabilidad de que una casa de cierto tipo sea destruida por un incendio en un periodo (cualquiera) de doce meses es de 0.005. Una Compañía de Seguros ofrece en venta al dueño de esa casa una póliza de seguros contra incendio por el término de un año en 20,000 Soles, con una prima de 150 soles ¿Cuál es la ganancia esperada de la Compañía? La “ganancia” G, para la Compañía es una variable aleatoria con posibles valores de 150 soles, si la casa no sufreun accidente de incendio y de 19,850 soles, si la casa se quema durante el año que cubre la póliza. La función de probabilidad de G es entonces. VALORES DE G, g 150 PROBABILIDAD f (g) -19850 0.995 0.005 Con la información anterior vemos que: E (G) = Ug = (150) (0.995) + (-19850) (0.005) = S/. 50 149.25 -99,25 = S/. 50.00 La ganancia esperada para una Compañía de Seguros debe ser positiva para permitir a la Compañía pagar los costos administrativos y acumular reservas para pagar a sus beneficiarios y tenedores de pólizas. Sin embargo en todos los casos de juego de azar, en donde se juega por dinero, el valor esperado es negativo, como se v en el ejemplo siguiente. En general si X es una variable aleatoria discreta que toma los valores X 1, X2, Xn y tiene una función de densidad de probabilidad f(x) su esperanza matemática se define como: E (X) = ∑ Si X es una variable aleatoria continua con una función de densidad de probabilidad f(x), entonces. E(X) = ∫ 1P(X) dx La varianza G2de una variable aleatoria X con función de probabilidad f(x) se define como el valor esperando del cuadrado de la desviación de la media aritmética u esto es: Donde u = E(X) Var (X) = ∑ Var (X) = ∑ 2 P(Xi) – u2 2 P(Xi) ESPERANZA MATEMATICA DE UNA VARIABLE ALEATORIA Es la media ponderada de las posibles valores de la v.a..x para ponderar cada valor de X se multiplica por su respetiva probabilidad. La Esperanza Matemática se representa por el símbolo E(X) también se le designa u E(X) = u E(X) = ∑ i P(Xi) En la distribución de Probabilidades X P(X) O 0.125 1 0.375 2 0.375 3 0.125 Calcular la E(X) E (X) = 0. (0.125) + 1. (0.375) + 2 (0.375) + 3 (0.125) E (X) = 0 E (X) = 1.5 + 0.375 + 0.750 + 0.375 VARIANZA DE UNA VARIABLE ALEATORIA 2 =Var (X) = (Xi – u)2 P (Xi) La varianza de la v.a. X es la esperanza matemática del cuadrado de la diferencia que se obtiene, restando a la variable por su valor esperando u. Vemos que el cuadrado de cada diferencia se pondera multiplicándolo por cada valor de P(x) Ejem: Calcular la Var (X) de la distribución de probabilidades del experimento de lanzar 3 monedas, en donde la v.a. X designa el número de caras en cada posible resultado. X P(X) O 1 2 3 E(X) = 1.5 Var (X) = (0-1.5)2 ( ) + (1-1.5)2 ( ) + (2 – 1.5)2 ( + (3-1.5)2 ( Var (X) = (2.25) ( ) + (0.25) ( ) + (0.25) ( ) + (2.25) ( ) = 0.28125 + 0.09375 + 0.09375 + 0.28125 = 0.75 Utilizando la formula 2 = Var (X) = ∑ 2 P(Xi) – u2 Una lotería vende 10,000 boletos de 1 sol por boleto; se dará un premio de 5,000 soles al ganador de la primera jugada. Suponiendo que hemos comprado un boleto ¿Cuánto debemos esperar ganar? A que la variable aleatoria “ganancia” G, tiene dos posibles valores: 4,999 soles y – 1 sol. VALORES DE G PROBABILIDAD f (g) Xi Pi 4999 1 10,000 -1 9999 10,000 E (G) = 4,999 ( - ) + (-1) ( ) = 0.4999 – 0.9999 = -0.50 Esta cantidad 50 centavos negativos, es la cantidad que esperamos ganar (perder) cada vez, si jugamos repetidas veces. APLICACIÓN DEL CONCEPTO DE ESPERANZA MATEMATICA a) Una lotería con 1,000 numero, consta de las siguientes premios 1 premio de S/. 100.000 2 premios de S/. 10,000 5 premios de S/. 1,000 A cuanto debe venderse el billete, para que no se gane ni se pierda? Solución: Los posibles valores de la variable son: (posibles premios) Xi = 100,000 10,000 1,000 Y las probabilidades de ganar dichos premios son: Pi = Luego en promedio, se espera ganar: E(X) = 100,000 + 10,000 + 1,000 = S/. 125 Si se venden los 1,000 numero a S/. 125 c/u, se recaudan S/. 125,000. Pero se distribuyen S/. 125.000 en premios, luego: No se gana ni se pierde Por otra parte participan 1,000 personas que pagan c/u S/. 125 y esperan ganar, en promedio S/. 125,000 = S/. 125 1,000 También se ve que en promedio no gana ni pierden TEOREMA QUE IMPLICA PARTICIONES PROBABILIDAD TOTAL Sea {A1, A2….An} evento Entonces P(A) = = ∑ particiones del espacio muestral S y sea A cualquier (Ai) P(A/Ai) i = 1, 2, ……n Siempre que P (Ai) = 0 La demostración de este teorema se facilita con la figura en todo lo que sigue i = 1, 2 …..n A esta representada por la región sombreada dentro de S S = A1 U A2U …. U An A=A ∩ S A = A ∩ (A1 U A2U ….U An) A = (A A1) U ( A ∩ A2) U………..U (A ∩ An) P (A) = P (A ∩ A1) + P (A ∩ A2) + ……….+ P (A ∩ An) P (A) = P (A1) P (A/ A1) + P (A2) P (A/ A2) + ……. + P (An) P (A/An) P (A) = (Ai) P (A/Ai) Ejm. PROBABILIDAD TOTAL En un laboratorio hay tres jaulas. En la jaula I hay 2 conejos pardos y tres blancos, en la jaula II tiene 4 conejos pardos y 2 blancos, en la jaula tres contiene 5 conejos pardos y 5 blancos. Se selecciona al azar una jaula y se saca un conejo aleatoriamente de esta jaula. ¿Cuál es la probabilidad que el conejo escogido sea blanco? Sea el evento B: salga un conejo blanco. I P(B/I) = P(I) = B ----B ----- I 2P 3B II 4P 2B III P(II) = II P(B/II) = B ----B ---- P(III) = III P(B/III) = B ----- 5P 5B B ----- P(B) = P(I) P(B/I) + P (II) P(B/II) + P (III) P (B/III) = . + . + . + = = + + = = + = 0.477777 = 0.478 PROBABILIDAD DE LAS CAUSAS – TEOREMA DE BAYES Teorema Bayes, se refiere a la asociación de dos acontecimientos, cuando ellos están ligadas de tal manera, que la realización de un acontecimiento, supone también, la realización de algunas de las posibilidades del segundo. Consideremos un acontecimiento A, y supongamos, por hipótesis, que para que se produzca A, es indispensable, que se haya producido también, un y solo uno de los acontecimientos excluyentes digamos: B1, B2, …Bn El Teorema de Bayes, trata de responder la siguiente pregunta: Suponiendo que se ha realizado el evento A ¿Qué probabilidad existe que haya sido conjuntamente con un determinado B por ejemplo con Bi? A continuación demostremos la formula que responde a la pregunta del Teorema de Bayes Este Teorema fue propuesto por el clérigo Ingles Thomas Bayes (1761) DEMOSTRACION TEOREMA Si conozco P(A) y P(Ai/A) P(A ∩ Ai) Por el Teorema de la multiplicación P(A ∩ Ai) = P(A) P(Ai/A) P(A) ≠ 0 P (A ∩ Ai) = P (A) P(Ai/A) P(A) P (A) P (Ai/A) = P ( A ∩ Ai) P(A) Sustituyendo: P(A) = P(A1) P(A/A1) + P (A2) P(A/A2) + - - - + P(An) P(A/An) Resulta: P (Ai/A) = P (A ∩ Ai) P(A1) P(A/A1) + P(A2) P(A/A2) + - - - + P(An) P(A/An) Remplazando P( A ∩ Ai) por su equivalente P(Ai) P(A/Ai), resulta finalmente P(Ai/A) = P (Ai) P (A/Ai) P(A1) P(A/A1) + P(A2) P(A/A2) + - - - + P(An) P(A/An) En una fábrica de pernos las maquinas A, B y C fabrican 25, 35, 40 por ciento de la producción total representativamente. De lo que producen 5, 4 y 2 por ciento respectivamente son pernos defectuosas. Se escoge un perno al azar y se encuentra que es defectuoso ¿Cuál es la probabilidad que el perno provenga de la maquina A, B, C SOLUCION Este problema, es una aplicación del teorema de Bayes P(D/A) = 0.05 P(A) = 0.25 P(B) = 0.35 P(C) = 0.40 C A P(D/B) = 0.04 B P(D/C) = 0.02 D D D ………………D ∩ C D D ………………D ∩ B D ………………D ∩ A P(D) = P (D ∩ A) + P (D ∩ B) + P ( D ∩ C) P(D) = P (A) P (D/A) + P (B) P (D/B) + P (C) P (D/C) P(D) = (0.25) (0.05) + (0.35) (0.04) + (0.40) (0.02) P(D) = 0.0125 + 0.0140 + 0.0080 = 0.0345 a) P (A/D) = P(D ∩ A) = P (A) P (D/A) P(D) P(D) P (A/D) = (0.25) (0.05) (0.25) (0.05) + (0.35) (0.04) + (0.40) (0.02) P (A/D) = 0.0125 0.0345 = 0.362 b) P (B/D) = P (B) P (D/B) = (0.35) (0.04) = P(D) 0.0345 P (B/D) = 0.0140= 0.406 0.0345 c) P (C/D) = P (C) P (D/C) = (0.40) (0.02) = 0.008 = P (D) 0.0345 0.0345 0.232 PERMUTACIONES FACTORIAL DE UN NÚMERO Sea n un entero positivo, definimos el factorial de n, denotado por n! Como el producto de todos los enteros consecutivos desde 1 hasta n inclusive, es decir. n! = n (n-1) (n-2) ------- 3 x 2 x 1 Así por ejemplo: 5! = 5 x 4 x 3 x 2 x 1 = 120 10! = 10 x 9 x 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1 = 3`628,800 Observe que n! = n (n-1)! De esto si n =1, tenemos 1! = 1 (0!) y definimos convencionalmente que 0! = 1 Definición.- Una permutación es un arreglo de todos ò parte de un conjunto de objetos Suponga que tenemos un conjunto de tres objetos A = (a, b, c), estamos interesados en el numero de arreglos con los elementos del conjunto A las posibles permutaciones son: abc, acb, bac, bca, cab, cba, hay 6 permutaciones distintas. Se puede llegar a la misma respuesta sin tener que escribir todas las anotaciones posibles, de la siguiente manera, los arreglos de los 3 objetos es equivalente a disponerlas en celdas, así: 3 2 1 Hay 3 formas posibles de llenar la primera celda, con cualquiera de los tres objetos a, b y c, para la segunda celda hay 2 formas posibles, cualquiera de los dos objetos restantes después de haber llenado la primera y solamente queda una forma de llenar la tercera. Aplicando el principio de multiplicación da un total de 3 x 2x 1 = 6 formas (o permutaciones). Teorema.- El número de permutaciones de n objetos diferentes es: P n = n! n Ejm: Un inspector visita 6 maquinas diferentes, durante el día. A fin de impedir que los operadores sepan cuando inspeccionará, varía el orden de las visitas ¿De cuantas maneras puede hacerlo? Solución: Puesto que tiene que inspeccionar las 6 maquinas diferentes, entonces el número de manera es una permutas de las 6 maquinas. Es decir: P 6 6 = 6! = 6 x 5 x 4 x 3 x 2 x 1 = 720 formas. Ejm: En una competencia automovilística intervienen 40 participantes. De cuantas formas distintas se pueden adjudicar los lugares de llegada a los 40 competidores de la competencia Solución: Se desea saber de cuantas formas posibles se pueden ordenar los 40 competidores. El numero de todos los ordenados posibles es: 40P40 = 40! Supongamos que tenemos un conjunto de n objetos diferentes y deseamos permutar r de estos n objetos Teorema.- El numero de permutaciones de n objetos diferentes tomadas r a r P(n,r)= P r = n! n (n-r)! NOTA: Hemos visto que una permutación es un arreglo de todas parte de los elementos de un conjunto que tiene objetos diferentes Así si A = (a, b, c) se vio que las diferentes permutaciones son: abc, acb, bac, bca, cab, cba es decir el orden de los elementos es importante observe que estaselementos son comparables con las termas ordenados sin repetición de sus elementos o sea no están las termas (a,a,a) (b,b,b) (c,c,c) Ejem: Un grupo esta formado por5 personas y desean formar una comisión integradapor Presidente, Secretario ¿De cuantas maneras puede nombrarse esta comisión? El numero de permutaciones de 5 personas tomadas 2 a 2. P 2 = 5 5! = (5-2)! 5x4x3x2x1 = 5 x 4 = 20 maneras. 3x2x1x El cargo de Presidente puede ser ocupadas de5 maneras diferentes. Y una vez ocupado el cargo de Presidente, el cargo de Secretario puede ser ocupadode4 maneras diferentes; entonces la elección de la comisión se puede hacer de 5x4 = 20 forma diferentes 5 4 El lector puede dar nombre a las personas, digamos A, B, C, D, E; entonces, se busca todos los pares ordenados que se puedan formar con dichas letras, sin repetición. (A,B) (A,C) (A,D) (A,E) (B,A) (B,C) (B,D) (B,E) (C,A) (C,B) (C,D) (C,E) (D,A) (D,B) (D,C) (D,E) (E,A) (E,B) (E,C) (E,D) Donde cada letra de la primera componente, indica la persona que ocupa el cargo de Presidente, la segunda indica la persona que ocupa el cargo de Secretario. Así (C,B) indica que C resulto elegido Presidente y B Secretario y es sin repetición, ya que el par (A,A) no esta en la permutación, pues si estuviera significaría que la persona A ocupa el cargo de Presidente y Secretario, lo cual no puede ser. Permutaciones Circulares La permutaciones que ocurren por arregles de objetos formadas (o alrededor de un circulo) un circulo se llama permutaciones circulares. En estas agrupaciones no hay primero ni último elemento, por hallarse todas en una línea cerrada para determinar el número de permutaciones circulares que puedan formarse con los n objetos distintos de un conjunto. Basta considerar fija la posición de unocualquiera de ellas, las n-1 restantes podrán cambiar de lugar de (n-1)! Formas diferentes tomando todas las posiciones sobre la circunferencia relativa al primer punto. Si cambiamos (ahora) la posición de este, las delos demás respecto de el, será seguro un de las ya consideradas. Por lo tanto el número de permutaciones circulares será. (n – 1)! La permutación circular se denota por Pcn Teorema.- El número de permutaciones de n objetos distintos alrededor de un círculo es Pcn= (n – 1)! Ejem.: ¿De cuantas formas diferentes pudieron sentarse en la ultima cena, alrededor dela mesa Jesucristo y los 12 Apóstoles? Solución: a) Si la mesa fuera circular, tendremos la permutación circular. El numero de forma es: Pc13 = (13 – 1)! =12! = 479’, 001, 600 b) Si la mesa no es circular, se tendrá una permutación de las 13 personas. El numero de formas es: 13P13 = 13! 6,227’020,800 PERMUTACIONES CON REPETICION Hasta ahora hemos permutado objetos diferentes, (sin embargo) no siempre es el caso. Teorema El numero de permutaciones (distintas) de n objetos de las cuales n1 son una clase, n2 de una segunda clase………. nk de una k-esimoclase todos los demás objetos de clase 1), anotado por P n1, n2…..nk n! = n n! n2! ……nk! Ejem: Un estante de una librería tiene capacidad para 10 libros de Matemáticas que tienen pasta verde, 8 de Física de pasta roja y 7 de Química de pasta azul ¿Cuántas maneras pueden colocarse los libros según los colores? Solución Como solo interés los colores entonces n1 = 10, n2 = 8, n3 = 7 Luego el número de permutaciones es ( )= = 21,034.600 COMBINACIONES En muchas cosas estaremos interesados en el número de formas de seleccionar r objetos de n, sin importar el orden Estas selecciones se llamas combinaciones DEFINICION.- Un sub conjunto de r elementos, de un conjunto que tiene n elementos diferentes se llaman combinaciones de n elementos tomados r a r El numero de combinaciones de r elementos, que se pueden forma, con los n objetos diferentes de un conjunto, se denota por C r n Este número en matemática tiene un símbolo especial r n C n = (r ) = f Ejem: Se extrae dos cartas de una baraja de 52 ¿De cuantas maneras se puede hacer esto? Solución Se necesitan solo sub conjuntos dedos cartas, sin importar el orden Entonces el número de forma de seleccionar estas dos cartas es: C(52,2) = = = = 26 x 51 = 1326 DISTRIBUCION HIPERGOMETRICA Supongamos una muestra den unidades obtenida de un lote de N unidades, en el cual a unidades son defectuosas. Esta muestra se ha obtenido del lote extrayendo sucesivamente las unidades de tal forma que, después de cada extradición, cualquiera delas unidades que permanecen en el lote tiene la misma posibilidad de quedas incluidas en la muestra. Para la distribución binomial será valida únicamente si después de cada extracción se repone la unidad en el lote, por lo que tendremos que buscar una nueva distribución de probabilidad, llamada distribución hipergeometrica. Para resolver (este) problemas de “muestreo sin templazamiento”, que nos dice que un subconjunto de x objetos se pueden seleccionar de ( )= Modos diferentes, partiendo de un conjunto de n objetos. En el problema de encontrar la probabilidad de obtener x unidades defectuosas en una muestra de n, tomadas sin remplazamiento, notemos, en primer lugar, que el espacio muestral de este experimento tiene N casos posibles, que son las formas en que un n subconjunto de n objetos. Además las x partes defectuosas se a pueden seleccionar delas a partes defectuosas de x maneras. las n – x unidades no defectuosas de la muestra Como ejemplo de distribución hipergeomètrica, calcularemos la probabilidad de obtener dos unidades defectuosas en una muestra de tamaño diez, tomada sin remplazamiento de un lote de 20 unidades que contiene 5 defectuosas, sustituyendo x =2, n =10, a = 5 y N =20, obtenemos: 15 ( ) (5 ) 2 8 h (2; 10, 5, 20) = (10) 20 = 64350 184.765 = 0.348 para simplificar el calculo de probabilidades de este tipo, se pueden usar tablas de coeficientes binomiales o tablas de los logaritmos de los factoriales, que se pueden encontrar en cualquier manual de tablas matemáticos. Nótese que, si hubiésemos cometido el error de usar una distribución binomial con n = 10 y p = 5/20 = 0.25 para calcular la probabilidad de encontrar dos unidades defectuosas, el resultado habría sido 0.282, considerablemente menor que la probabilidad encontrada. Se pueden seleccionar, a su vez, de las N – a unidades no - a (N n - x) a N - a x ( n - x) tiene maneras, el total de la muestra se maneras. Suponiendo que cada lamisma probabilidad de ser defectuosas del lote, de podrá seleccionar de una de las N muestras n seleccionada, la probabilidad de obtener x casos “favorables” en n tentativas sin remplazamiento es a x h(x;n,a,N) = (N n - a - x ) para x = 0, 1, ……., n (N n) (Según teorema). La distribución de probabilidad definida por esta ecuación recibe el nombre de distribución hipergeometica; los parámetros de esta familia de distribuciones son el tamaño de la muestra n, el tamaño del lote (o tamaño de la población), N y el numero a de casos “favorables” en el lote, que en nuestro ejemplo especial es el numero total de unidades defectuosas del lote (o población) DISTRIBUCION DE POISSON La distribución de Poisson es otra distribución teórica de probabilidades discreta y que tiene muchos usos en la economía y el comercio, en el control de calidad industrial, en las líneas de espera o teoría de colas, llamadas telefónicas. El nombre de esta distribución es en honor el matemático francés Simeón Poisson, quien la describió en 1837 como un límite de la distribución binomial cuando hay un gran numero de pruebas y la probabilidad de éxito es muy pequeña en cada una de las pruebas. Supuestos de la Distribución de Poisson.1. Existe un gran numero de pruebas posibles para la verificación de un suceso dado dentro de cada unidad de medida, y de la probabilidad de una ocurrencia en cualquiera de esas pruebas es muy pequeña, además, la variable aleatoria debe ser un numero entero dentro de la unidad de medida. 2. Independencia, cualquier numero de ocurrencia puede acontecer en una sola unidad de medida, y esto no afecta al numero de ocurrencias en cualquier otra unidad de medida. 3. Estabilidad, constante DISTRIBUCION DE POISSON Función de Cuantía o de Probabilidad F(x) = P [ ]= e x! el valor de גּ (promedio) debe permanecer גּ גּx x: 0, 1, 2, 3 ……. = גּnp Función de Distribución o Acumulativa F(x) = P [ x ]=∑ x=0 e -גּ גּ x! x Por una propiedad de la función de Distribución, tenemos: f (0) = F (0) F (x) = F (x – 1) + f (x) Entonces, la probabilidad de un punto será f (x) =F (x) – F (x – 1) Ejemplo: Sea Tabla =2 ] ]–P[ ] גּ גּ x 0 1 2 3 Calcular P [ P[ Donde: P[ P[ Luego: P[ ]=P[ 2.0 ] = 0.406 ]= 0.135 0.135 0.406 0.677 0.857 ] = 0.406 – 0.135 = 0.271 n = 1 000 p = 0,002 x=3 p(x=x) = e- גּ x! גּx = np = 1 000 (0.002) = 2 e-2 = 0.13534 e-2 (2)3 = 0.13534 (8) = 1.08276 = 0.18045 3! 6 6 TABLA P (x=3) = P(x=3) – P (x=2) P(x=3) = 0.857 P(x=2) = 0.677 P(x=3) = 0.857 – 0.677 = 0.18 ** PROBLEMA: Un deposito esta compuesto de 1000 elementos que trabajan independiente uno del otro. La probabilidad de fallo de cualquier elemento durante eltiempo t es igual a 0.002. Hallar la probabilidad elementos. PROBLEMA: La razón de mortalidad para cierta enfermedad es de 7 por 1000 ¡Cual es la probabilidad de que exactamente 5 decesos por esta enfermedad de un grupo de 400? de que durante eltiempo tfallen exactamente 3 P (X=5) = C-2.8 (2.8)5 5! C-2.8 n = 400 P= 7 = 0.007 1000 400 (0,007) = 2.8 גּ = np Multiplicando e-2 = 0.135034 e0.8 = 0.449 3 0.060808262 Chequear (2.8)5 = 172.10368 = 0.060808262 = 10.46532566 120 = 0.087127 = 0.0872 p(x2 x) = e- גּx x! en la tabla f(x) = F(x) – F (x-1) = 0.935 – 0.848 = 0.087 LA PRUEBA DE LA CHI –CUADRADA O JI – CUADRADA Esta prueba es utilizada para el análisis de la relación entre dos variables categóricas, es decir, para aquellas cuyos criterios de agrupación son eminentemente cualitativos, y se representa por el símbolo X2. Esta prueba se calcula mediante la utilización de una tabla de contingencia o tabulación cruzada, la cual se caracteriza porque consta de dos dimensiones; cada una correspondiente a una variable, las cuales, a su vez pueden tener dos o más categorías o valores. Las categorías corresponden a las frecuencias observadas de cada variable. De la cantidad de categorías de cada variable pueden resultar matrices de diferente dimensión: 2x2, 3x2, 2x3, etc. La prueba consiste en la comparación de la tabla de frecuencias realmente observadas con la tabla de frecuencias esperadas, si n hubiese ninguna relación entre las variables. Se parte de la hipótesis de la ausencia de relación, de manera que, si ésta verdaderamente existe, la diferencia entre ambas tablas debe ser significativa. Ejemplo tabla de contingencia 2x2: Análisis del hábito de fumar, por sexo, en una población “X” Variables: Sexo y Hábito Objetivo: Determinar la relación entre el sexo y el hábito de fumar. TABLA DE FRECUENCIAS REALMENTE OBSERVADAS SEXO/HABITO Masculino Femenino TOTAL FUMA 1 520 723 2 243 NO FUMA 8 744 9 584 28 328 TOTAL 10 264 10 307 20 571 Los valores de cada celda de la tabla de frecuencias esperadas se calcula mediante la siguiente formula, tomando los datos de la tabla de frecuencias observadas: fe = (Total frecuencias de la fila) * (Total frecuencias de la columna) Total Genera de frecuencias Aplicando la fórmula para cada celda resultaría: Fe11 =2243*10264 = 1119,2 20571 Fe12 = 18328*10264 = 9144,8 20571 Fe21 = 2243*10307 = 1123,8 20571 Fe22 = 18328*10307 = 9183,2 20571 De aquí resulta la tabla de frecuencias esperadas: TABLA DE FRECUENCIAS ESPERADAS. SEXO/HABITO M F TOTAL FUMA 1119,2 1123,8 2243,0 NO FUMA 9144,8 9183,2 18328,0 TOTAL 20,264 10,307 20,571 Por ultimo, la Chi – Cuadrada(X2) se calcula mediante la siguiente formula: X2∑ En la que: fo = frecuencia observada en cada celda fe = frecuencia esperada en cada celda Es decir, para cada celda se calcula la diferencia entre las frecuencias observadas y esperadas, se eleva al cuadrado y se divide entre las frecuencias esperadas. La suma de todas las celdas es la C2. Para el cálculo podemos apoyarnos en una tabla tal como se presenta a continuación. CELDA fo 1520 8744 723 9584 TOTAL fe 1119,2 9144,8 1123,8 9183,2 fo fe 400,8 -400,8 -400,8 400,8 (fo fe)2 160676,1 160676,1 160676,1 160676,1 143,6 17,6 143,0 17,5 921,6 Tal como se puede apreciaren la tabla, el valor de X2 es de321,6 Para interpretar el resultado obtenido debemos utilizar el concepto de ”grados de libertad” (G), el cual se calcula mediante la siguiente formula: G = (r-1) (c-1) En la que: R = numero de filas C = numero de columnas Por lo que: G= (2-1) (2-1) = 1 Luego de realizados los cálculos, debemos comparar en la tabla de distribución de la X2, eligiendo el nivel de confianza 0.05 ò 0.01, el valor correspondiente a los grados de libertad obtenidos. Si el valor calculado es igual o mayor al de la tabla, esto quiere decir que las variables están relacionadas. En nuestro caso, el valor correspondiente a un nivel de confianza de 0,05 para 1 grado de libertad es de 3.841, como el valor calculado es de 321,6, esto quiere decir que las variables tienen una relación significativa. REGRESION LINEAL SIMPLE REGRESION LINEAL SIMPLE Al comenzar a estudiarlas técnicas de correlación afirmamos que estudiaríamos dos variables y no solamente una. Llamamos en esa ocasión X auna de las variables y Y a la otra. En el tema que nos ocuparemos ahora, estudiaremos la forma de predecir valores de Y conociendo primero los valores de X. Es así que viendo la tabla similar a la que utilizamos cuando estudiamos correlación, conociendo elpuntaje en la prueba de habilidad mental (Variable X) para alumno deadmisión (Variable Y) delmismo alumno. Consideremos la relación lineal expresada por el Cuadro. Si un determinado, podemos anticipar elpuntaje del examen dibujamos esa relación, obtenemos el grafico. Como podemos observar todos los puntos se alinean “exactamente” en una sola línea recta, la que recibe el nombre de línea de regresión. Teniendo en cuenta esta línea, podemos predecir cualquiera delos valores de Y conociendo el valor de X. para X = 25, según la recta, correspondiente Y = 35, para X 0 20 corresponde Y = 30, Etc. En este caso se trata de una correlación positiva perfecta cuyo coeficiente de correlación es +1 Prueba de Habilidad Mental X Susana Iván Lourdes Aldo Juan María Cesar Olga 5 10 15 20 25 30 35 40 Examen de Admisión Y 15 20 25 30 35 40 45 50 Recordemos ahora el Grafico que dibujamos cuando estudiamos correlación, en este grafico observamos el diagrama de dispersión “aproximado” por una línea recta, la recta que mejor se “ajuste” a los puntos del diagrama de dispersión, es decir, en la mejor medida procure dejar igual numero de puntos del diagrama de dispersión por encima de ella que igual numero de puntos debajo, se llama línea de regresión. ECUACION DE LA REGRESION RECTILINEA La ecuación que describe la línea de regresión es: Yr = Y + r En donde: Sy X – r SxSx SyX – r Sx SyX 4.2.1 Y = media de la variable Y en la muestra. 50 45 40 35 30 25 20 15 10 5 X 5 10 15 20 25 30 35 40 _ X = media de la variable X en la muestra X = un valor de la variable X r = coeficiente de Pearson, de la correlación lineal entre las variables XyY Sy = desviación estándar de Y en la muestra Sx = desviación estándar de X en la muestra Yr = valor Y resultante del calculo de la formula. Veamos cómo podemos predecir los valores de Y a partir de los valores de X. Estudiamos el Cuadro Nº 4.2.1. Como el gráfico de este cuadro es una línea recta ascendente sabemos que su coeficiente de correlación de Pearson r = +1. Además tenemos los siguientes resultados: _ X = 22.5, Sx = 11.46, _ Y = 32.5 Sy = 11.46 Estos resultados se pueden calcular a partir de los datos del cuadro Nº 4.2.1. Apliquemos estos datos a la formula Nº 4.2.1., obtenemos la siguiente expresión: 11.46 X – (1) 11.46 11.46 11.46 Simplificando términos obtenemos: YR = 32.5 + (1) YR = 32.5 + x – 22.5 YR = 10 + x (b) 22.5 (a) escojamos cualquier valor de X del Cuadro Nº 4.2.1., por ejemplo por María X = 30, reemplazamos este valor en (b) YR = 10 + 30 = 40 Vemos en el Cuadro Nº (c) 4.2.1. El valor que corresponde a María efectivamente es 40. Es decir, podemos usar la ecuación Nº 4.2.1 para predecir los valores de Y conociendo los valores de X. Esta formula de regresion se puede aplicar para dos variables X y Y, entre las cuales no es obligatorio que exista una correlación lineal perfecta, es decir, no es obligatorio que el r para la correlación entre X y Y se a siempre igual a 1. Este valor de r para otras aplicaciones de la regresión, puede tomar cualquier valor distinto de 1. Ejercicios Resueltos de Regresión Lineal Simple Al aplicar un test de inteligencia a una muestra representativa constituida por 800 alumnos, se obtuvo la puntuación media de 30.4 puntos, con la desviación estándar de 12.6 puntos. La edad media de la muestra fue de 14.5 años, con la desviación estándar de 3.2 años. El coeficiente de correlación lineal de Pearson entre la variable Y, edad delos sujetos estudiados y la variable X, rendimiento mental de los mismos sujetos, fue de r = 0.89. Con estos datos se pide determinar la ecuación de regresión rectilínea de la edad en base del puntaje del rendimiento mental. ¿Qué edad corresponde a los sujetos que alcanzan puntuaciones de: X1 = 18 puntos X2 = 25 puntos X3 = 45 puntos Datos: _ Y = 14.5 _ X = 30.4 SY = 3.2 SX = 12.6 r = 0.89 X4 = 50 puntos X5 = 60 puntos X6 = 80 puntos? Aplicando estos datos en la formula Nº 4.2.1 se tiene: YR = 14.5 + 0.89 3.2 12.6 3.2 30.4 12.6 X – 0.89 YR = 14.5 + 0.226X – 6.87 YR = 7.63 + 0.226X. Es la ecuación de regresión buscada Respuesta de la 1ra pregunta X1 = 18 YR = 7.63 + 0.226(18) = 7.63 + 4.07 YR = 11.7 años Segunda pregunta X2 = 25 YR = 7.63 + 0.226(25) = 7.63 + 5.65 YR = 13.28 años Tercera pregunta X3 = 45 YR = 7.63 + 0.226(45) = 7.63 + 10.17 YR = 17.8 años Cuarta pregunta X4 = 50 YR = 7.63 + 0.226(50) = 7.63 + 11.3 YR = 18.93 años Quinta pregunta X5 = 60 YR = 7.63 + 0.226(60) = 7.63 + 13.56 YR = 21.19 años Sexta pregunta X6 = 80 YR = 7.63 + 0.226(80) = 7.63 + 18.08 YR = 25.71 años Pruebas Estadísticas I II III Chi Cuadrado T de studet r de Pearson X2 Chi Cuadrado Def. Que podemos probar con el X2 a) Independiente b) Bondad de ajuste c) Estimar a partir de S S = universo S = muestra Las hipótesis se pueden probar por Chi – Cuadrado T de studet y r de Pearson. a) Independencia: Def. Si tenemos 2 variables sexo femenino y masculina si existe independencia de una variable a otra Independencia n es rechazar la hipótesis de unidad. En que consiste la independencia. 2 = ∑ Fo = Frecuencia observada Fe = Frecuencia esperada Ejemplo: Se administra un sociograma a estudiantes de diversas edades. El examinador encuentra que los estudiantes mas frecuentemente elegido, como es el que elegiría como amigo son de más edad Si se dividen los estudiantes por la medida de la edad obtendremos los siguientes resultados. ESTUDIANTES MENOR EDAD 9 ELEGIDOS MAYOR EDAD 20 29 TOTAL ¿Se puede decir para un nivel de significación del 5% que los estudiantes de más edad elegidos constituyen una mayoría? ESTUDIANTES MENOR EDAD 9 (14.50) ELEGIDOS MAYOR EDAD 20 (14.50) TOTAL K _ X = 14.5 R Hay que ver filas y columnas Fila = h C O L U M N A S K 1) Ho = Hipótesis de nulidad Fo 9 20 Fe (Fo – Fe)2 Fe h=1 14.50 14.50 k=2 La elección es independiente dela edad cada uno ha elegido sin tener en cuenta la edad. 2) H1 = Hipótesis Alternativa Las de mas edad hay son una mayoría. Las de mas edad son mayoría han elegido las de mayor edad 3) Nivel de significación ( 4) La Prueba 2=∑ 2 ) = 0.05 Fo Fe 9 20 (Fo – Fe)2 Fe 14.50 14.50 (9 = 14.50)2= 2.09 14.50 (20 = 14.50)2= 2.09 14.50 X2 = 4.18 5) Toma de Decisión Para la toma de decisión hay que tener en cuenta la tabla del X2. V X2 0.995 X2 0.95 3.84 m = parámetro X y DE V = Grado de Libertad hay un parámetro solo la X hxk–m V=1X2=1=1 Grado de libertad = 1 el X2 0.95 = 3.84 Para toma de decisión hay que tomar el valor crítico 3.84 = es el valor critico Toma de decisión Como X2 0.95 es igual a 3.84 y X2 = 4.18 Entonces 3.84 < 4.18 Esta en la zona de rechazo No es independiente rechazamos X -3.84 Rechazo 3.84 4.18 Aceptación Rechazo Ejemplo: Como resultado de una elección se han obtenido los siguientes datos: CLASES SOCIALES IDEOLOGÍA h IZQUIERDA CENTRO DERECHA C. Popular 126 71 19 C. Media 61 93 14 C. Alta 38 69 27 k ¿Puede decirse que existe asociación entre ideología y clase sociales a un nivel de significación de 1% h=3 k=3 V = (h=1) (k=1) – m Elaboramos otro cuadro Resultados de nuestras observaciones Resultados experimentales CLASES SOCIALES C. POPULAR IZQUIERDA CENTRO DERECHA TOTAL C. POPULAR 126 (93.82) 71 (97.16) 19 (25.02) 216 C. MEDIA 61 (72.97) 93 (75.57) 14 (19.46) 168 C. MEDIA C. ALTA 38 (58.20) 69 (60.27) 27 (15.52) 134 518 60 233 TOTAL 225 216 x 225 = 93.82 168 x 225 = 72.97 518 518 216 x 233 = 97.16 518 216 x 60 = 25.02 518 CLASE ALTA 134 x 225= 58.20 518 134 x 233 = 60.27 134 x 60 518 = 15.52 168 x 233 = 75.57 518 168 x 60 518 = 19.46 518 Las frecuencias esperadas ( ) las que están en el paréntesis 1) Ho = Las ideologías son independientes de las clases sociales 2) H1 = Las ideologías están íntimamente vinculadas a las clases sociales 3) Nivel de significación 4) La prueba2 = ∑ 2 0.01, 99% de certeza 5) Toma de decisión ( si son independiente o no son independientes) PRUEBA Fo 126 71 19 61 93 14 38 69 27 Fe 93.82 97.16 25.02 72.97 75.57 19.46 58.20 60.27 15.52 (Fo – Fe)2 Fe 11.04 7.04 1.45 1.96 4.12 1.53 7.01 1.26 8.49 2 = 43.80 Toma de decisión Como V = (h-1) (k-1) – m (2) (2) – 0 = 4 no hemos empleado un parámetro (X o –DE) 1) Grado de libertad = 4 2) 2 = 43.80 y 2 0.99 = 13.30 (se busca en la tabla) Zona de Rechazo 2 = 13.30 2 = 43.80