Revista Brasileira de Fruticultura (Sep 2008)
Identificação de microssatélites para o mamoeiro por meio da exploração do banco de dados de DNA Identification of microsatellites for papaya by DNA data bank exploration
Abstract
Os marcadores microssatélites são ferramentas úteis em diversas análises genéticas em plantas. No caso do mamoeiro (Carica papaya L.), poucos locos de microssatélites foram descritos até o momento. Assim, o objetivo deste trabalho foi explorar a base de dados do GenBank / NCBI (National Center of Biotechnoloy Information) à procura de microssatélites de mamoeiro, visando a seu futuro uso em estudos genéticos e moleculares aplicados ao melhoramento genético. As seqüências foram obtidas no GenBank / NCBI, no formato FASTA, e analisadas para a presença de microssatélites com um mínimo de 20; 7 e 5 repetições dos motivos de mono-, di- e trinucleotídeos, respectivamente, e acima de 4 repetições para tetra- e pentanucleotídeos. Seqüências com mais de 90% de similaridade foram consideradas redundantes e, portanto, eliminadas das análises. Foram analisadas 44.591 seqüências, das quais 3.180 foram não-redundantes e apresentaram 3.947 microssatélites. Desse total, 3.587 foram classificados como microssatélites perfeitos, 8 imperfeitos, 65 interrompidos, 239 compostos-perfeitos, 8 compostos-imperfeitos e 40 compostos-interrompidos. As repetições de di- e trinucleotídeos representaram 65,7 e 14,4% do total de seqüências analisadas, respectivamente. Somente os motivos do tipo AT/TA representaram 44,1% dos microssatélites encontrados. Os motivos mais comuns de tri-, tetra- e pentanucleotídeos foram AAT, AATT e TTTAA, respectivamente. Observou-se que, nas seqüências disponíveis, o genoma do mamoeiro apresenta, em média, um microssatélite a cada 5,65 kb.Microsatellites markers are a useful tool in much plant genetic analysis. Currently, few microsatellites loci have been reported in Carica papaya L.. Therefore, the objective of this study was accomplishing a search for microsatellites in the public available - GenBank / NCBI (National Center of Biotechnology Information), aiming the future use in molecular and genetic studies applied to genetic breeding. The sequences were collected from GenBank / NCBI in FASTA-formatted files and analyzed for the presence of microsatellites with a minimum of 20, 7 and 5 repetitions of mono-, di- and trinucleotides, respectively, and above of 4 repetitions for tetra- and pentanucleotides. The sequences with over 90% of similarity, were considered redundant and, therefore, eliminated of the analyses. A total of 44,591 sequences had been analyzed, of which 3,180 were not redundant, showing 3,947 microsatellites. Out of those, 3,587 were classified as perfect, 8 imperfects, 65 interrupted, 239 perfect-compounds, 8 imperfect-compounds and 40 interrupted-compounds. The dinucleotides and trinucleotides repetitions represented 65.7 and 14.4% of the whole analyzed sequences, respectively. Only the AT/TA motif represented 44.1% of the microsatellites sequences. The most common motifs of tri-, tetra- and pentanucleotides were AAT, AATT and TTTAA, respectively. In the available sequences it can be observed that the papaya genome has an average one microsatellite for every 5,65 kb.
Keywords