O termo Transcriptômica refere-se ao estudo do conjunto de RNAs de um organismo. Os RNAs são ácidos nucleicos como o DNA, porém, possuem características e funções diversas. Existem dois grupos de RNAs: não-codificantes e codificantes. Os RNAs codificantes refere-se ao RNA mensageiro, formado a partir da transcrição do DNA e que será traduzido em proteína.
Tipos de RNA
RNA ribossomal (rRNA)
RNA transportar (tRNA)
RNAs longos não-codificantes (IncRNA)
Outros RNAs não codificantes (ncRNAs)
RNA codificante (mensageiro ou mRNA)
Perspectivas gerais e processos históricos:
Um dos principais objetivos no estudo da transcriptômica é a avaliação da expressão gênica.
Inicialmente, a análise da expressão gênica podia apenas ser realizada gene a gene, ou seja, a partir de estratégias de gene candidato. As principais técnicas utilizadas foram o Northern Blot (inicialmente) e o RT-qPCR.
As primeiras tentativas da análise global da expressão gênica incluíram técnicas como EST e SAGE, porém elas eram de baixa escala, custo elevado e trabalhosas. Assim como em outros ramos, a tecnologia de nano e microchips revolucionou a biologia molecular, com o advento de técnicas em larga escala. Iniciava, portanto, a era das ômicas.
As técnicas de larga escala permitem obter o conjunto completo da expressão gênica de uma célula, sendo depois necessária a mineração dos dados relevantes para o pesquisador. São fatores que devem ser considerados:
● A expressão gênica é um processo dinâmico, portanto, quando se avalia o transcriptoma de uma célula, ele é como uma foto daquela célula, naquele momento.
● A tradução (síntese) de proteínas é uma etapa energeticamente muito custosa para a célula. Por isso, regulações pré e pós-transcricionais auxiliam a controlar o conjunto de mRNAs transcritos. Dessa forma, alterações na expressão gênica não necessariamente implicam em alterações na expressão proteica.
● Há diferentes técnicas que permitem a avaliação dos RNAs, mas todas elas incluem uma etapa inicial de conversão do RNA em cDNA, uma vez que o RNA é uma molécula muito instável. Essa reação é realizada com o auxílio de uma enzima transcriptase reversa.
Importante!
Como comentado anteriormente, a avaliação do transcriptoma é uma foto do momento da célula. Por isso os dados de um estudo de transcriptômica nem sempre são replicáveis. Mesmo fazendo os mesmos protocolos, o resultado final pode ser diferente! Isso não significa que o pesquisador está fraudando os dados, pois trata-se de uma limitação técnica que se resume em uma frase: dados de transcriptômica geram muitos falsos positivos!
Em artigos científicos, portanto, é comum ser solicitada uma validação dos dados de transcriptômica. Normalmente se faz a validação por RT-qPCR, aquela técnica de genes candidatos descrita acima. Assim, os genes mais interessantes do transcriptoma são reanalisados por RT-qPCR para confirmação do resultado.
Referências:
Conesa, A., Madrigal, P., Tarazona, S., Gomez-Cabrero, D., Cervera, A., McPherson, A., Szcześniak, M. W., Gaffney, D. J., Elo, L. L., Zhang, X., & Mortazavi, A. (2016). A survey of best practices for RNA-seq data analysis. Genome biology, 17, 13. https://doi.org/10.1186/s13059-016-0881-8
Palazzo, A. F., & Lee, E. S. (2015). Non-coding RNA: what is functional and what is junk?. Frontiers in genetics, 6, 2. https://doi.org/10.3389/fgene.2015.00002
Stark, R., Grzelak, M., & Hadfield, J. (2019). RNA sequencing: the teenage years. Nature reviews. Genetics, 20(11), 631–656. https://doi.org/10.1038/s41576-019-0150-2
Por que gerar dados de transcriptomas?
O estudo dos transcriptomas pode ter vários objetivos, mas duas avaliações são as mais corriqueiras: expressão gênica basal e expressão gênica diferencial. Análises de co-expressão também são bastante realizadas, vamos comentar sobre elas um pouco mais adiante.
MICROARRANJOS:
Os microarranjos são uma técnica de hibridização, ou seja, o cDNA criado a partir do RNA precisa se hibridizar com sondas presentes em uma matriz sólida, tal como um chip. Um microarranjo tem milhares de sondas que realizam pareamentos com as sequências nucleotídicas dos genes de interesse do genoma. Havendo hibridização entre a sonda e o material genético, há emissão de fluorescência que será medida por um feixe de lasers e traduzida para um dado quantitativo, a ser analisado por bioinformática. No caso dos microarranjos de transcriptoma, quanto maior a emissão de fluorescência, maior a expressão do gene.
RNA-seq:
O RNA-seq é um tipo de sequenciamento de nova geração, que realizará o sequenciamento direto do conjunto completo de cDNAs (biblioteca de cDNA). O RNA-Seq inicia com etapas de bancada, na qual o tipo de RNA de interesse será enriquecido (mRNA, rRNA, lncRNA, etc). É realizado o sequenciamento por síntese, ou seja, a amostra de interesse é amplificada, também em um chip. Segue-se as etapas de bioinformática nas quais os fragmentos sequenciados precisarão ser alinhados contra um genoma de interesse, seguido da contagem do número de vezes que cada fragmento foi sequenciado. Dessa forma, um gene que foi sequenciado 100 vezes tem expressão maior do que um gene que foi sequenciado 20 vezes. Em virtude das diferenças entre os princípios das técnicas, diz-se que o RNA-Seq é uma medida absoluta da expressão gênica, enquanto os microarranjos apresentam uma medida relativa dessa expressão, pois está se medindo a fluorescência e não a expressão em si.
Você pode assistir ao vídeo da Illumina para entender melhor o RNA-Seq (legendas em português disponíveis):
https://www.youtube.com/watch?v=fCd6B5HRaZ8
Importante!
Os microarranjos tiveram início nos anos 2000 e tiveram seu apogeu em 2010, época que surgiram os primeiros sequenciamentos de nova geração. A cada ano, os microarranjos vêm perdendo espaço para os RNA-Seq, pois o mesmo apresenta vantagens como a mensuração da expressão absoluta e, especialmente, pelo custo ter caído ano a ano.
Simplificando:
Apesar de diferentes, tanto os microarranjos quanto os RNA-Seqs seguem um fluxo similar de processos:
Conversão em cDNA → Amplificação → Quantificação → Normalização → Análise
Referências
Lowe, R., Shirley, N., Bleackley, M., Dolan, S., & Shafee, T. (2017). Transcriptomics technologies. PLoS computational biology, 13(5), e1005457. https://doi.org/10.1371/journal.pcbi.1005457