Ciencia, Tecnología y Salud (Dec 2017)
Aplicación de rutinas en lenguaje R para análisis de componentes principales
Abstract
Cuando se diposne de una gran cantidad de observaciones para cada individuo, los análisis univariados tienen la limitación de no contemplar las interrelaciones entre todas las variables, ni cómo esas interrelaciones afectan al conjunto de individuos. Como alternativa fueron desarrolladas las técnicas multivariadas, que brindan descripciones de estas interrelaciones, tomando las variables en su conjunto. El análisis de componentes principales (ACP) es la esencia del análisis estadístico multivariado y tiene como objetivo reducir el número de variables, a través de la generación de nuevas variables, que son combinaciones lineales de las variables originales. El objetivo de este trabajo es presentar una serie de rutinas computacionales en el lenguaje R v. 3.10 para el ACP. Este lenguaje es de uso mundial, por ser libre, flexible y con soporte de estadísticos de reconocido prestigio. Para ilustrar su aplicación, se tomó una base de datos referente a los precios de cinco tipos de alimentos (en centavos de dólar): pan, hamburguesa, leche, naranjas y tomates en 23 ciudades de los Estados Unidos. Los datos fueron analizados exploratoriamente seguido del análisis de correlación entre pares de variables. Utilizando la función PRINCOMP y el paquete RCOMMANDER se realizó el ACP y la construcción del biplot. Además fueron utilizadas las bibliotecas: Hmisc, Plotrix, Ellipse, Corrplot, Ggplot2, Devtools y Vqv/ggbiplot. Los resultados fueron comparados con los obtenidos en otros programas, no encontrando diferencias. Se concluye que el lenguaje R es una herramienta poderosa, debiendo divulgar su uso en la docencia de la estadística a nivel universitario.