Genetics and Molecular Biology (Dec 2001)
Dissecting the sugarcane expressed sequence tag (SUCEST) database: unraveling flower-specific genes
Abstract
There are almost 260,000 independent clones sequenced from the 5’ end in the Sugarcane Expressed Sequence Tag (SUCEST) database, which have been obtained from 37 cDNA libraries prepared from different tissues. This large number of expressed sequence tags (ESTs) provides an opportunity, unprecedented in plants, to perform ‘digital differential screening’ on selected cDNA libraries. In general, the frequency of a particular EST correlates with transcript accumulation in the tissues from which the cDNA libraries were constructed, so it is possible to compare the whole transcriptome from different tissues using computer-assisted analysis of an EST database. In our research we analyzed sugarcane ESTs according to tissue expression and identified more than 1,000 putative flower-specific genes. The fact that using this technique we were able to identify sugarcane homologues of several genes previously described as pollen-specific justifies this method of assessing tissue specificity. In addition, ESTs similar to genes specific to reproductive organs were detected e.g. a sugarcane gene encoding a meiotic protein essential for assembly of the synaptonemal complex and normal synapsis. This approach also allowed the identification of many flower-specific anonymous sequences that are good candidates for being novel genes involved in plant reproduction. This paper describes the analysis of the gene expression levels of 24 EST clusters during flower development using a ‘digital northern blot’ constructed from direct EST counts made on the non-normalized sugarcane cDNA libraries.Existem quase 260.000 clones independentes, seqüenciados a partir da extremidade 5’, no banco de dados do SUCEST (Sugarcane Expressed Sequence Tag), os quais foram obtidos a partir de 37 bibliotecas de cDNA preparadas de diferentes tecidos. Este grande número de etiquetas de sequências expressas (ESTs) fornece uma oportunidade, sem precedentes em plantas, de realizar um ‘digital differential screening’ em bibliotecas de cDNA selecionadas. Geralmente, a frequência de um determinado EST está correlacionada ao acúmulo de transcritos nos tecidos dos quais as bibliotecas de cDNA foram construídas, e desta forma, é possível comparar o transcriptoma completo de diferentes tecidos, usando uma análise computacional de um banco de dados de ESTs. Em nossa pesquisa, analisamos os ESTs de cana-de-açúcar de acordo com sua expressão tecidual e identificamos mais de 1.000 putativos genes específicos de flor. O fato de que usando esta técnica fomos capazes de identificar homológos em cana-de-açúcar, de vários genes previamente descritos como específicos de pólen, sustenta este método de estimar especificidade tecidual. Além disto, ESTs com similaridade a genes específicos de órgãos reprodutivos foram revelados, como por exemplo, o gene que codifica uma proteína meiótica essencial para a montagem do complexo sinaptonêmico e sinapse normal. Esta abordagem também permitiu a identificação de muitas sequências anônimas, específicas de flor, que são boas candidatas para novos genes envolvidos com a reprodução de plantas. Este trabalho descreve a análise dos níveis de expressão gênica de 24 clusters de ESTs, durante o desenvolvimento floral, usando um ‘northern blot digital’ construído a partir da contagem direta dos ESTs das bibliotecas não-normalizadas de cDNAs de cana-de-açúcar.