Revista Colombiana de Estadística (Jan 2011)

On the Student-t Mixture Inverse Gaussian Modelwith an Application to Protein Production Sobre el modelo gaussiano inverso mezclado t-Student y una aplicaci'{o}n a producci'{o}n de prote'{i}nas

  • ANTONIO SANHUEZA,
  • VÍCTOR LEIVA,
  • LILIANA LÓPEZ-KLEINE

Journal volume & issue
Vol. 34, no. 1
pp. 177 – 195

Abstract

Read online

In this article, we introduce a mixture inverse Gaussian (MIG) model based on the Student-t distribution and apply it to bacterium-based protein production for food industry. This model is mainly useful to describe data that follow positively skewed distributions and accommodate atypical observations in a better way than its classical version. Specifically, we present a characterization of the MIG-t distribution. In addition, we carry out a hazard analysis of this distribution centered mainly on its hazard rate. Furthermore, we discuss the maximum likelihood method, which produces--in this case--robust parameter estimates. Moreover, to evaluate the potential influence of atypical observations, we produce a diagnostic analysis for the model. Finally, we apply the obtained results to novel bacterium-based protein production data and statistically compare two types of protein producers using the likelihood ratio test based on the MIG-t model as an alternative methodology to the procedures available until now. This fact is very important, since the evaluation of protein production using both constructions allows practitioners to choose the most productive one before the bacterial culture is scaled to an industrial level.En este articulo, introducimos un modelo Gaussiano inverso (MIG) mezclado basado en la distribucion t-Student y lo aplicamos a la produccion de proteinas basada en bacterias para la industria de alimentos. Este modelo es especialmente util para describir datos que siguen una distribucion con sesgo positivo ya que permite acomodar observaciones atipicas de mejor forma que su versión clasica. Espec{i}ficamente, presentamos una caracterizacion de la distribución MIG-t y realizamos un analisis de confiabilidad de esta distribucion centrado principalmente en la tasa de fallas. También, discutimos el metodo de verosimilitud maxima, el cual proporciona en este caso estimaciones robustas de los parametros del modelo. Con el fin de evaluar la influencia potencial de observaciones atipicas, proponemos un analisis de diagnostico para la distribucion. Finalmente, aplicamos los resultados obtenidos al análisis de datos nuevos de produccion de proteina basada en bacterias utilizada en la industria de alimentos y comparamos estadísticamente dos tipos de bacterias productoras usando la prueba de razon de verosimilitudes basada en el modelo MIG-t como una metodologia alternativa a los procedimientos disponibles a la fecha. Este punto es muy importante, ya que la evaluacion de produccion de proteinas usando dos construcciones distintas permite a los investigadores escoger el tipo mas productivo antes de proceder al cultivo industrial a gran escala.

Keywords