Acta Agriculturae Slovenica (Oct 2024)
Ločenost v logistični regresiji
Abstract
Logistična regresija se uporablja za preučevanje povezanosti med binarno odzivno spremenljivko (nek dogodek se zgodi ali pa ne) in množico neodvisnih spremenljivk. Z modelom lahko natančno napovemo verjetnosti dogodka za nove enote, pogojno na vrednosti neodvisnih spremenljivk. Poleg tega ocene parametrov modela, ki jih dobimo z metodo največjega verjetja, lahko interpretiramo kot logaritem razmerja obetov. Kadar so vzorci majhni ali dogodki v kateri od skupin, ki določajo neodvisno spremenljivko, redki, se lahko zgodi, da algoritem po metodi največjega verjetja ne konvergira, ocene parametrov modela pa so posledično nesmiselne. Pojav se v statistiki imenuje »ločenost«. Ker programska oprema problema pogosto ne identificira, raziskovalci ločenost v praksi lahko prezrejo. Dobljeni rezultati raziskovalce lahko begajo ali pa jih napačno interpretirajo. S člankom zato želimo: motivirati uporabo logistične regresije za preučevanje povezanosti binarne odzivne spremenljivke z množico neodvisnih spremenljivk; bralcem predstaviti problem ločenosti na konkretnem primeru; pokazati, kako problem ločenosti premostiti.
Keywords