La separación en regresión logística, una solución y aplicación

Autores: Correa Morales Juan Carlos, Valencia C Marisol

Resumen

La regresión logística es una de las técnicas estadísticas más aplicadas cuando se busca explicar el comportamiento probabilístico de algún fenómeno. Un problema que aparece con frecuencia en estos modelos es la separación en los datos, mostrando los grupos de éxitos separados de los fracasos, lo que impide hallar los estimadores de máxima verosimilitud. Objetivo: Presentar una revisión y solución del problema, comparando con otras existentes. Metodología: Simulación del modelo logístico y estimación del sesgo de los parámetros, usando la solución propuesta con el método clásico. Bayesiano y observaciones ficticias y con el método de Firth. Resultados: Los sesgos encontrados son menores al generar el par de observaciones ficticias con el método Bayesiano. Se muestra un ejemplo sobre la edad de la menarquia. Discusión: Se aporta una solución adecuada al problema de la separación usando simulación en un esquema de modelo logístico sencillo. Conclusiones: La generación de observaciones ficticias se recomienda dentro de la región de separación y el mejor método de solución está basado en la teoría bayesiana, donde se logra una convergencia en los parámetros del modelo logístico.

Palabras clave: Modelo logístico estimación de máxima verosimilitud menarquia.

2012-03-02   |   787 visitas   |   Evalua este artículo 0 valoraciones

Vol. 29 Núm.3. Julio-Septiembre 2011 Pags. 281-288 Rev. Fac. Nac. Salud Pública 2011; 29(3)