Formato FASTA

En bioinformática, el formato FASTA es un formato basado en texto para representar secuencias de nucleótidos o amino acidos mediante códigos que emplean letras. El formato permite describir nombres de secuencias y comentarios de dichas secuencias. El formato tiene su origen del software FASTA, pero que ahora se ha convertido en un estándar en bioinformática.

La simplicidad del formato permite una fácil manipulación y parseo de las secuencias usando herramientas de procesamiento de texto y lenguajes de scripting como Python, Ruby o Perl.

Página de WIkipedia sobre formato FASTA: http://en.wikipedia.org/wiki/FASTA_format

Estos son algunos ejemplos de la representación genómica de FASTA:

>MCHU - Calmodulin - Human, rabbit, bovine, rat, and chicken

ADQLTEEQIAEFKEAFSLFDKDGDGTITTKELGTVMRSLGQNPTEAELQDMINEVDADGNGTID

FPEFLTMMARKMKDTDSEEEIREAFRVFDKDGNGYISAAELRHVMTNLGEKLTDEEVDEMIREA

DIDGDGQVNYEEFVQMMTAK*

>gi|5524211|gb|AAD44166.1| cytochrome b [Elephas maximus maximus] LCLYTHIGRNIYYGSYLYSETWNTGIMLLLITMATAFMGYVLPWGQMSFWGATVITNLFSAIPYIGTNLV EWIWGGFSVDKATLNRFFAFHFILPFTMVALAGVHLTFLHETGSNNPLGLTSDSDKIPFHPYYTIKDFLG LLILILLLLLLALLSPDMLGDPDNHMPADPLNTPLHIKPEWYFLFAYAILRSVPNKLGGVLALFLSIVIL GLMPFLHTSKHRSMMLRPLSQALFWTLTMDLLTLTWIGSQPVEYPYTIIGQMASILYFSIILAFLPIAGX

IENY

Transcribir y traducir un gen

En el siguiente enlace se encuentra un ejercicio interactivo que muestra el proceso de transcribir y traducir un gen, que emplea la notación FASTA para describir los nucleótidos (A, C, T, G, U) (es el mismo ejercicio que se revisó en la sesión de laboratorio):

Transcribe and Translate a Gene

Este ejercicio hace uso del Código Genético Universal (Universal Genetic Code), del cual podemos encontrar una explicación breve pero detallada en el siguiente enlace:

An explanation of the Genetic Code

Python para Bioinformática

Los ejercicios visto en laboratorio fueron una introducción a Python para Bioinformática:

Beginning Python for Bioinformatics

La página contiene un conjunto de ejemplos para mostrar la manipulación de cadenas con representación genómica mediante Python y algunas operaciones y funciones comunes para dichas cadenas de texto.