Cadernos de Saúde Pública (Feb 2008)
Alternatives in modeling of body mass index as a continuous response variable and relevance of residual analysis Alternativas para modelagem do índice de massa corporal como variável contínua e relevância da análise de resíduos
Abstract
This article presents alternatives for modeling body mass index (BMI) as a continuous variable and the role of residual analysis. We sought strategies for the application of generalized linear models with appropriate statistical adjustment and easy interpretation of results. The analysis included 2,060 participants in Phase 1 of a longitudinal study (Pró-Saúde Study) with complete data on weight, height, age, race, family income, and schooling. In our study, the residual analysis of models estimated by maximum likelihood methods yielded inadequate adjustment. The transformed response variable resulted in a good fit but did not lead to estimates with straightforward interpretation. The best alternative was to apply quasi-likelihood as the estimation method, presenting a better adjustment and constant variance. In epidemiological data modeling, researchers should always take trade-offs into account between adequate statistical techniques and interpretability of results.Neste artigo, discutem-se alternativas de modelagem do índice de massa corporal (IMC), analisado como variável contínua, e a análise de resíduos. Buscaram-se estratégias de aplicação dos modelos lineares generalizados adequadas tanto do ponto de vista do ajuste estatístico quanto da facilidade de interpretação dos resultados. Nestas análises, foram incluídos dados relativos a 2.060 participantes da Fase 1 de estudo longitudinal (Estudo Pró-Saúde), com informação completa de peso, estatura, idade, raça/cor, renda familiar e escolaridade. Em nosso estudo, a análise de resíduos dos modelos estimados pelo método da máxima verossimilhança, amplamente utilizado, não possibilitou ajuste adequado dos modelos aos dados. A transformação da variável resposta, apesar de resultar em um bom ajuste, não conduziu a estimativas de fácil interpretação. Considerou-se como melhor alternativa a mudança do método de estimação para quase-verossimilhança. Assim, melhor ajuste foi alcançado e a variância permaneceu constante. Na modelagem de dados epidemiológicos, cabe aos pesquisadores buscarem o melhor equilíbrio entre a aplicação adequada de técnicas estatísticas e a facilidade de interpretação dos dados.
Keywords