Acta Agronómica (Sep 2010)
Evidencias empíricas de regularidades estadísticas y leyes de potencia en los genomas de Arabidopsis thaliana, Oriza sativa y Mus musculus
Abstract
La masiva cantidad de datos biológicos provenientes de las disciplinas "ómicas" y su aprovechamiento en el mejoramiento genético vegetal requiere de nuevos abordajes teóricos y estadísticos que describan de forma satisfactoria principios generales en los genomas. El total de secuencias de los genes de los genomas vegetales de <em>Arabidopsis thaliana</em> y <em>Oriza sativa</em> y del genoma animal <em>Mus musculus</em> fueron extraídas y depuradas de la base de datos pública del Genebank mediante el diseño de algoritmos en lenguaje de programación Python. Se analizaron las distribuciones de las variables frecuencia de uso y tamaño de los genes, exones e intrones por cromosoma y entre genomas. Los resultados señalaron que las variables presentan patrones de comportamiento no lineales en forma de ley de potencia que difieren estadísticamente entre los genomas pero no entre los cromosomas de un mismo genoma. Además, el análisis aportó evidencias respecto al tamaño promedio constante de las secuencias de exones y de los genes simples por cromosoma y entre genomas. Los hallazgos sugieren: primero, que el genoma se auto-organiza de la misma manera en los cromosomas independientemente del tamaño o número de genes que estos contengan, y, segundo, que tanto los cromosomas como sus elementos constituyentes: genes, exones e intrones han evolucionado conjuntamente. El estudio señala que las leyes de potencia cumplen un papel amortiguador en las leyes de variación biológica y proporcionan medidas cuantitativas de la organización de las secuencias de ADN que definen la identidad de un genoma. La regularidad estadística de estas medidas genéticas tiene potenciales aplicaciones en el incremento del valor predictivo de los actuales modelos de mejoramiento genético vegetal.