Revista Colombiana de Estadística (Jan 2009)
Regression Models with Heteroscedasticity using Bayesian Approach Modelos de regresión heterocedásticos usando aproximación bayesiana
Abstract
In this paper, we compare the performance of two statistical approaches for the analysis of data obtained from the social research area. In the first approach, we use normal models with joint regression modelling for the mean and for the variance heterogeneity. In the second approach, we use hierarchical models. In the first case, individual and social variables are included in the regression modelling for the mean and for the variance, as explanatory variables, while in the second case, the variance at level 1 of the hierarchical model depends on the individuals (age of the individuals), and in the level 2 of the hierarchical model, the variance is assumed to change according to socioeconomic stratum. Applying these methodologies, we analyze a Colombian tallness data set to find differences that can be explained by socioeconomic conditions. We also present some theoretical and empirical results concerning the two models. From this comparative study, we conclude that it is better to jointly modelling the mean and variance heterogeneity in all cases. We also observe that the convergence of the Gibbs sampling chain used in the Markov Chain Monte Carlo method for the jointly modeling the mean and variance heterogeneity is quickly achieved.En este artículo, comparamos el desempeño de dos aproximaciones estadísticas para el análisis de datos obtenidos en el área de investigación social. En la primera, utilizamos modelos normales con modelación conjunta de media y de heterogeneidad de varianza. En la segunda, utilizamos modelos jerárquicos. En el primer caso, se incluyen variables del individuo y de su entorno social en los modelos de media y varianza, como variables explicativas, mientras que, en el segundo, la variación en nivel 1 del modelo jerárquico depende de los individuos (edad de los individuos). En el nivel 2 del modelo jerárquico, se asume que la variación depende del estrato socioeconómico. Aplicando estas metodologías, analizamos un conjunto de datos de talla de los colombianos, para encontrar diferencias que pueden explicarse por sus condiciones socioeconómicas. También presentamos resultados teóricos y empíricos relacionados con los dos modelos considerados. A partir de este estudio comparativo concluimos que, en todos los casos, es "mejor" la modelación conjunta de media y varianza. Además de una interpretación muy sencilla, observamos una rápida convergencia de las cadenas generadas con la metodología propuesta para el ajuste de estos modelos.