Portafolio del laboratorio de bioquímica I

Práctica 6. Bases de datos: Obtención de secuencia de ADN, ARN y proteínas

Introducción

El desarrollo de la bioinformática ha generado técnicas de análisis de secuencias de ácidos nucleicos y proteínas con múltiples objetivos: determinación de homologías, alineamiento de secuencias homólogas, predicción de estructuras, filogenias, evolución molecular, diseño de fármacos, etc. Algunas de estas técnicas han dado lugar a productos comerciales y otras herramientas de uso público libremente disponibles en Internet.

Objetivo

Desarrollar la capacidad de búsqueda en base de datos, para analizar y comparar secuencias de ADN, ARN y proteínas, a través de uso de herramientas bioinformáticas, apoyándose de la bibliografía de base y de las instrucciones dadas.

Resultados

Ejercicio 1: búsqueda de información de un gen específico

En este apartado debe buscar información para el gen que codifica a la proteína precursora de amiloide (APP) en humanos.

Para ello, ingrese a la página: https://www.ncbi.nlm.nih.gov/pubmed/

En la pestaña desplegable de la izquierda, selecciona “Gene”, y en el cuadro de búsqueda escribe “amyloid protein precursor”.

De los resultados obtenidos, seleccione el gen que se ajusta a los requisitos descritos previamente. ¿Qué número de identificación o gene ID tiene? 351

Una vez seleccione el gen correspondiente, encontrará toda la información que la comunidad científica conoce sobre ese gen.

Discuta en grupo la información que contiene la página y conteste a las siguientes preguntas acerca de tu hallazgo:

¿Qué función tiene este gen?

Este gen codifica un receptor de la superficie celular y una proteína precursora transmembrana que las secretasas escinden para formar varios péptidos.

¿Qué localización cromosómica tiene ese gen?

Cromosoma 21

Nombre 5 tejidos donde se exprese el gen. ¿En cuál tejido se expresa en mayor cantidad?

Cerebro (mayor cantidad), riñón, adrenal, tiroides y colon.

¿Se conocen variantes en el gen que resulten patogénicas?

Sí, y estas pueden causar alzheimer.

Ejercicio 2: comparación de secuencia de ADN con otras secuencias de ADN registradas en bases de datos

Imagine que está trabajando en un laboratorio y ha clonado y secuenciado el fragmento de ADN que aparece a continuación:

ACTGTTTAAGGAAAAATAAAAGTGCTGCCAGAACCTAAGAAAAACATTAATATCTAAAA GGTCATTTAGATGATTTCCATGAGAGACTTTTTGATGTTCTTTACCTGTTAGGATTATT ATTGATAATCCTTTTCAGATTATCAATAAACAGTTTGCCCTCAAGTATTTATTCATGCT AATATTTACTTTGTAAAATGTGCTTCTTACAGGAATATAAATAGTTTCTGGAAAGGACA CTGACAACTTCAAAGCAAAATGAAGTTCTTTCTGTTGCTTTTCACCATTGGGTTCTGCT GGGCTCAGTATTCCCCAAATACACAACAAGGACGGACATCTATTGTTCATCTGTTTGAA TGGCGATGGGTTGATATTGCTCTTGAATGTGAGCGATATTTAGCTCCGAAGGGATTTGG AGGGGTTCAGGTGGGTATGATTCATAGTATCAATTGCGAAT

¿Existe la secuencia que has secuenciado en el laboratorio en la base de datos?

Sí.

En caso afirmativo, ¿qué codifica tu secuencia?

Amilasa pancreatica.

¿A qué especie pertenece tu secuencia?

Homo sapiens

¿Existen otras especies que tengan una secuencia parecida en su genoma?

Sí, existen varias especies que tienen una secuencia parecida en su genoma.

¿Podrás publicar en una revista científica u otros investigadores se te han adelantado?

No se puede publicar, ya que existen articulos previas de otros investigadores.

Ejercicio 3: comparación entre múltiples secuencias de ADN y proteína

¿Cuántos resultados obtiene?

Obtuvimos 2 resultados.

¿Qué posibles explicaciones le da al hecho de que se haya obtenido más de una secuencia para el mismo gen a partir del ADN de un solo hueso de mamut?

Porque se obtuvo una secuencia del padre y una de la madre.

Compare las secuencias obtenidas entre sí utilizando el programa ClustalW. Específicamente, las secuencias de proteínas que se obtienen al traducir los genes resultantes de tu búsqueda. Para ello:

Acceda al primer resultado que haya obtenido.

En la columna de la derecha, dentro del panel “Related information” acceda a “Protein”.

Una vez haya accedido a la secuencia de proteína, consígala en formato FASTA, accediendo a la siguiente pestaña.

Copie el resultado a un archivo de texto (.txt).

>DQ648860.1 Mammuthus primigenius haplotype 1 melanocortin-1 receptor gene, complete cds

CCCCCTAAGCAGCCTCGCCACGACGGCAGAGGTGAGAAGGTGGGCTGAGGACGCAGAGGACTGAGGCCAC

AGAGTACGGAGTGTGCTCCGGGCTCAGGGAGCCCAGACACCAGGGCCATGTGTGGGCCAGCCTCTGGCTG

GCCGGGAAGGTGGTAAGCGTGAGGGCCCACAAGCTCCTGTGGCCACAATGCACTGACCAGAGTGCTGGAG

AGTGGGGACCAGGCTGGAATTGGAGGCCCCCATTGGACACCTCTGTGACCCTGTTCCAGCTCGCGGGGGG

CTATGCCCATGCAGGGAGCCCAAGGGAGGCTGCGAGGCTCCCTCAATGCCACACCCCCCACAACACCCCA

CTCGGGACTGGCTGGCAACCAGACAGGCCCCTGGTGCTTGGAGGTATCCATCCCGGATGAGCTCTTCCTC

TCACTGGGGCTGGTGAGCCTGGTGGAGAATATGCTGGTGGTGGCTGCCATTGCCAAGAACCGCAACCTGC

ACTCGCCCATGTACTACTTCATCTGCTGCCTGGCCGTGTCCGACCTGCTGGTGAGTGTGAGCAACGTGCT

GGAGACAGCTGTCATGCTGCTGCTGGAGGCAGGCGTGCTGGCTGCATGGGCAGGTGTAGTGCAGCAGCTG

GACAATGCCATCGACGTGTTCATCTGCGGCTCCATGGTGTCCAGCCTCTGCTTCCTGGGCGCCATTGCAG

TGGACCGCTACATCACCATCTTCTATGCGCTTCGCTACCACAGCATTGTGACACTGCCCCGGGCACGCTG

GGCCATTGCCACCATCTGGGCGGCCAGTGTGGTCTGCAGCACCCTCTTCATTGCCTACTATGACTGCACA

GCCGTGCTGCTCTGCCTTGTCAGCTTCTTCCTGGCCCTGGTGGTGCTCATGGCGGTGCTGTATATGCACA

TGCTGGCCCGGGCCTGCCTCCACGCCCGCAGCATCGCCCGGCTGCACAAGCGTTGGCGCCCAGTCCACCA

GGGCCTCGGCCTCAAGGGTGCCGCCACACTCTCCATCCTGCTGGGCTCCTTCTTTCTCTGCTGGGGCCCC

TTCTTCCTGCACCTCACACTCATCGTCCTCTGCCCCCAGCATCCCACCTGCAGCTGCGTCTTCAAAAACT

TCAAACTCTTTCTCACCCTCATCATCTGCAACTCCATCGTGGACCCTCTCATCTATGCCTTTCGTAGCCA

GGAGCTCCGCAAGACACTCAAAGAGGTGCTGCTGTGCTCCTGGTAG

>DQ648859.1 Mammuthus primigenius haplotype 2 melanocortin-1 receptor gene, complete cds

CCCCCTAAGCAGCCTCGCCACGACGGCAGAGGTGAGAAGGTGGGCTGAGGACGCAGAGGACTGAGGCCAC

AGAGTACGGAGTGTGCTCCGGGCTCAGGGAGCCCAGACACCAGGGCCATGTGTGGGCCAGCCTCTGGCTG

GCCGGGAAGGTGGTAAGCGTGAGGGCCCACAAGCTCCTGTGGCCACAATGCACTGACCAGAGTGCTGGAG

AGTGGGGACCAGGCTGGAATTGGAGGCCCCCATTGGACACCTCTGTGACCCTGTTCCAGCTCGCGGGGGG

CTATGCCCATGCAGGGAGCCCAAGGGAGGCTGCGAGGCTCCCTCAATGCCACACCCCCCACAGCACCCCA

CTCGGGACTGGCTGGCAACCAGACAGGCCCCTGGTGCTTGGAGGTATCCATCCCGGATGAGCTCTTCCTC

TCACTGGGGCTGGTGAGCCTGGTGGAGAATATGCTGGTGGTGGCTGCCATTGCCAAGAACTGCAACCTGC