Formato FASTA
En bioinformática, el formato FASTA es un formato basado en texto para representar secuencias de nucleótidos o amino acidos mediante códigos que emplean letras. El formato permite describir nombres de secuencias y comentarios de dichas secuencias. El formato tiene su origen del software FASTA, pero que ahora se ha convertido en un estándar en bioinformática.
La simplicidad del formato permite una fácil manipulación y parseo de las secuencias usando herramientas de procesamiento de texto y lenguajes de scripting como Python, Ruby o Perl.
Página de WIkipedia sobre formato FASTA: http://en.wikipedia.org/wiki/FASTA_format
Estos son algunos ejemplos de la representación genómica de FASTA:
>MCHU - Calmodulin - Human, rabbit, bovine, rat, and chicken
ADQLTEEQIAEFKEAFSLFDKDGDGTITTKELGTVMRSLGQNPTEAELQDMINEVDADGNGTID
FPEFLTMMARKMKDTDSEEEIREAFRVFDKDGNGYISAAELRHVMTNLGEKLTDEEVDEMIREA
DIDGDGQVNYEEFVQMMTAK*
>gi|5524211|gb|AAD44166.1| cytochrome b [Elephas maximus maximus] LCLYTHIGRNIYYGSYLYSETWNTGIMLLLITMATAFMGYVLPWGQMSFWGATVITNLFSAIPYIGTNLV EWIWGGFSVDKATLNRFFAFHFILPFTMVALAGVHLTFLHETGSNNPLGLTSDSDKIPFHPYYTIKDFLG LLILILLLLLLALLSPDMLGDPDNHMPADPLNTPLHIKPEWYFLFAYAILRSVPNKLGGVLALFLSIVIL GLMPFLHTSKHRSMMLRPLSQALFWTLTMDLLTLTWIGSQPVEYPYTIIGQMASILYFSIILAFLPIAGX
IENY
Transcribir y traducir un gen
En el siguiente enlace se encuentra un ejercicio interactivo que muestra el proceso de transcribir y traducir un gen, que emplea la notación FASTA para describir los nucleótidos (A, C, T, G, U) (es el mismo ejercicio que se revisó en la sesión de laboratorio):
Este ejercicio hace uso del Código Genético Universal (Universal Genetic Code), del cual podemos encontrar una explicación breve pero detallada en el siguiente enlace:
An explanation of the Genetic Code
Python para Bioinformática
Los ejercicios visto en laboratorio fueron una introducción a Python para Bioinformática:
Beginning Python for Bioinformatics
La página contiene un conjunto de ejemplos para mostrar la manipulación de cadenas con representación genómica mediante Python y algunas operaciones y funciones comunes para dichas cadenas de texto.