logit y probit.docx

June 13, 2018 | Author: AlvaroHerreraJimenez | Category: Applied Mathematics, Physics & Mathematics, Mathematics, Statistics, Science
Report this link


Description

MODELOS LOGIT DE RESPUESTAS BINARIASEl modelo de probabilidad lineal es sencillo de estimar y de aplicar, pero posee ciertos inconvenientes. Las dos desventajas más importantes son las probabilidades ajustadas pueden ser menores a cero o mayores que uno y que el efecto parcial de cualquier variable explicativa (que aparezca a su nivel) es constante. Estas limitaciones del Modelo de Probabilidad Lineal (MPL) se superan mediante modelos de respuesta binaria más complejos. En un modelo de respuesta binaria, el interés descansa principalmente en la probabilidad de respuesta. ( ⁄ ) ⁄ Donde utilizamos x para denotar el conjunto completo de variables explicativas. Especificaciones de los modelos logit En el MPL, suponemos que la probabilidad de respuesta es lineal en el conjunto de parámetros . Para evitar las limitaciones del MPL, considere una clase de modelos de respuesta binaria de la forma: ( ⁄ ) = Donde G es una función que asume valores que se hallan estrictamente entre cero y uno: 0<G (z) < 1, para todos los números reales z. Esto asegura que las probabilidades de respuesta estimadas se hallen estrictamente entre cero y uno. En el modelo logit G es la función logística: [ ] Los datos utilizados son de corte transversal. “Un conjunto de datos de corte transversal consta de una muestra de individuos, hogares, empresas, ciudades, estados, países u otras diversas unidades, tomada en un momento determinado. A veces, los datos de todas las unidades no corresponden con exactitud al mismo período. Una particularidad importante de los datos de corte transversal es que, a menudo, damos por sentado que se obtuvieron mediante muestreo aleatorio de la población de origen. Otro rasgo característico es que el ordenamiento de los datos no importa en el análisis econométrico. Se tomó este tipo de estructura de datos porque los individuos acceden a la Universidad en años determinados y no se repiten en el tiempo” (Wooldrige, 2001). Para el logro de esta investigación las variables del modelo econométrico se definieron de la siguiente manera: : Es una variable dummy que toma el valor de 1 si es desertor, 0 si no lo es : Es una variable cuantitativa que se refiere a la edad de cada estudiante : Es una variable cuantitativa que se refiere a la edad al cuadrado de cada estudiante : Es una variable dummy que toma el valor de 1 si el estudiante es hombre y 0 si es mujer : Es una variable cuantitativa que se refiere al estrato que pertenece cada estudiante Es una variable dummy que toma el valor de 1 si el estudiante en el momento de la encuesta se encuentra trabajando y 0 si no lo está Es una variable dummy que toma el valor de 1 si la madre del estudiante en el momento de la encuesta se encuentra trabajando y 0 si no lo está Es una variable cuantitativa que se refiere al número de hermano que tiene el estudiante al momento de la encuesta Es una variable cuantitativa que se refiere al promedio acumulado que tenia el estudiante en su estancia en la Universidad : Es una variable dummy que toma el valor de 1 si el estudiante proviene de colegio público y 0 si es su origen de colegio privado Es una variable cuantitativa que se refiere al número de hijos que tiene el estudiante al momento de la encuesta Es una variable cuantitativa que se refiere al promedio del último semestre cursado por el estudiante : Perturbación estocástica asociada al rendimiento general del estudiante. Logistic regression Number of obs = 236 Wald chi2(11) = 57.28 Prob > chi2 = 0.0000 Log pseudolikelihood = -91.253101 Pseudo R2 = 0.4346 ------------------------------------------------------------------------------ | Robust situacion | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- edad | .7720663 1.269004 0.61 0.543 -1.715135 3.259268 edad2 | -.0116711 .0225833 -0.52 0.605 -.0559335 .0325913 sexo | .5925653 .5229356 1.13 0.257 -.4323697 1.6175 estrato | .6825089 .2299206 2.97 0.003 .2318729 1.133145 trabaja | -.1543972 .5388561 -0.29 0.774 -1.210536 .9017413 lab_madre | .4284827 .3778477 1.13 0.257 -.3120852 1.169051 n_hermanos | .0558802 .1680641 0.33 0.740 -.2735193 .3852797 pro1 | -5.477956 1.111774 -4.93 0.000 -7.656994 -3.298919 colegio | .8482426 .392927 2.16 0.031 .0781198 1.618365 n_hijos | .0084985 .3719461 0.02 0.982 -.7205025 .7374995 prom_acum | -.07394 .0400547 -1.85 0.065 -.1524459 .0045658 _cons | -7.416347 17.868 -0.42 0.678 -42.43698 27.60429 ------------------------------------------------------------------------------ RESULTADOS ECONOMÉTRICOS Cuadro. Estimación del Modelo Econométrico Variable Dependiente Desertados Edad 0. 777 (1.26) Edad 2 -0.011 (0.022) Genero 0.592 (0.522) Estrato socio económico de la familia del estudiante 0.682* (0.229) El estudiante trabaja -0.154 (0.538) Madre Labora 0.428 (0.377) Número de hermanos 0.0558 (0.168) Promedio acumulado -5.477* (1.111) Colegio de procedencia 0.8482* (0.392) Número de hijo del estudiante 0.008 (0.392) Promedio último semestre cursado -0.073* (0.040) Observaciones 236 Fuente: Calculo del autor. Valor Absoluto del estadístico t en paréntesis. (*)Significativos al 95%. Los resultados de la estimación del modelo se presentan en la tabla anterior. La estimación infiere que las variables de edad, género, situación laboral y el tamaño de su familia no son estadísticamente significativas. Se concluye que está situación es atípica frente a otros estudios del ámbito nacional en dónde las variables género y edad son fundamentales para explicar la probabilidad de que un estudiante deserte de una institución educativa. Para el caso de la muestra que se tiene la probabilidad de desertar disminuye cuando el estudiante proviene de colegio privado. Este resultado es similar a los de otros estudios que utilizan esta misma metodología con diferentes muestras. En consecuencia, la calidad de los niveles precedentes es fundamental para determinar la suerte de un estudiante en la Universidad. De igual manera, la probabilidad de deserción de un estudiante aumenta significativamente por el promedio Semestral y El promedio Acumulado. Por el contrario el signo del nivel socio económico es positivo, lo que implica que los estudiantes de mayores ingresos tienen mayor probabilidad de desertar que los que tienen bajos ingresos. Esta situación hay que explorarla con mayor detenimiento, dado que contradice la intuición y los resultados de los estudios realizados en Colombia. Por lo tanto los estudiantes que provienen de Colegios Públicos y que provienen de estratos socioeconómico altos tienen más probabilidades de desertar, de la misma manera aquellos que tengan promedio acumulado y semestral alto tienen menor riesgo de desertar que quienes lo tengan menor.


Comments

Copyright © 2024 UPDOCS Inc.