Interfases (Jul 2022)

Clasificación de Organismos en Reinos utilizando Frecuencia de Codones de ADN

  • Luis Beltrán Palma Ttito

DOI
https://doi.org/10.26439/interfases2022.n015.5896
Journal volume & issue
no. 015
pp. 131 – 143

Abstract

Read online

Este estudio de tiene por objetivo utilizar clasificadores de machine learning para predecir el reino al que pertenece un organismo por la frecuencia de uso de codones de ADN. Para ello se ha tomado 13 028 datos de organismos del GenBank distribuidos en once reinos y se los redujo a seis reinos (arqueas, bacterias, invertebrados, plantas, virus y vertebrados) con 9027 datos reagrupados. El proceso requirió la, depuración de atributos irrelevantes, el empleo de métricas de medición de clasificadores de exactitud, precisión, sensibilidad y puntuación, así como el ajuste de hiperparámetros de los modelos. Los algoritmos de clasificación fueron voting, bagging, boosting y stacking, usando KNN, AD, MLP, SVC y RF. La selección de atributos se hizo con random forest. El ensamble stacking, con sus modelos, predice mejor la clasificación de organismos en el presente estudio.

Keywords