Revista Española de Salud Pública (Jan 2008)

Datos anómalos y regresión logística robusta en Ciencias de la Salud

  • Francisco Cutanda Henríquez

Journal volume & issue
Vol. 82, no. 6
pp. 617 – 625

Abstract

Read online

La regresión logística tiene numerosas aplicaciones en Ciencias de la Salud. Existe una amplia literatura respecto a los métodos a seguir y al modo de hallar los estimadores de los parámetros a partir de las observaciones. Estos métodos están incorporados en todos los paquetes estadísticos usuales. Los estimadores son los llamados de "máxima verosimilitud", es decir, son aquéllos que hacen que las observaciones obtenidas sean las más probables entre todos los posibles modelos que pudiéramos utilizar. Las buenas propiedades de los estimadores de máxima verosimilitud están ampliamente demostradas. Sin embargo, en la práctica existe una serie de circunstancias que pueden ocasionar la aparición de "datos anómalos", es decir, observaciones que no corresponden al modelo logístico que utilizamos como hipótesis. En ocasiones, estas observaciones anómalas pueden tener un fuerte efecto sobre el ajuste y, por tanto, llevarnos a una conclusión equivocada. Las causas de estos datos anómalos dependen mucho del estudio en cuestión, pero pueden señalarse errores de clasificación, observaciones (sujetos) con características especiales que se han pasado por alto, incertidumbres en la medida de algunos parámetros, etc. El problema de los estimadores de máxima verosimilitud es que no son "robustos", es decir, su sensibilidad a datos anómalos puede ser arbitrariamente grande, y una minoría de datos anómalos puede dar lugar a un modelo logístico erróneo. En este trabajo expondremos dos casos que ilustran las posibles consecuencias, y discutiremos la aplicación de métodos robustos.