A lo largo del curso vamos a usar diferentes bases de datos para recuperar secuencias, pero nuestra fuente primaria será Genbank a través de la página web del NCBI (http://www.ncbi.nih.gov/).
Genbank es una base de datos primaria. Esto quiere decir que es un repositorio de todas las secuencias de proteínas y nucleótidos disponibles. Genbank está administrada por el NCBI (National Center for Biotechnology Information) que depende del NIH (National Institutes of Health). A su vez el NCBI es parte de la International Nucleotide Sequence Collaboration, que es un consorcio que también incluye al DNA Data Bank of Japan (DDBJ, http://www.ddbj.nig.ac.jp/index-e.html) y al European Bioinformatics Institute (EBI, http://www.ebi.ac.uk/). Un laboratorio puede depositar secuencias en cualquiera de los tres centros y la información está disponible para todos, porque las bases de datos se sincronizan cada dia.
Otra base de datos primaria es el Protein Data Bank (PDB, http://www.rcsb.org/pdb/), que es el lugar donde se deposita informaci'on estructural de proteínas.
Búsquedas en el NCBI
La parte superior de la primera página del NCBI tiene una lista desplegable y una casilla donde entrar los términos de la búsqueda:
Por ejemplo, en la casilla de bases de datos seleccionamos proteínas y en la casilla de texto escribimos:
"fungal disease wheat" (sin las comillas)
Al hacer click en "Go" y después de unos segundos obtenemos una salida, por ahora, la parte que nos interesa de esta salida es el listado de proteínas:
¿Qué es lo que acabamos de hacer?
Seleccionamos la base de datos de proteínas del NCBI, y como criterio de búsqueda establecemos que en alguna de las descripciones de las proteínas aparezcan los términos "wheat", "fungal" y "disease". Esto está bien para una búsqueda preliminar, pero al refinar la búsqueda podemos querer acotar a genes de virulencia en un patógeno (p. ej. Phaeosphaeria nodorum), o al hospedador, trigo -wheat en inglés-, o Triticum aestivum. También nos va a interesar guardar las secuencias.
Entonces, nuestros próximos pasos van a ser:
Analizar la salida para una secuencia y ver algunos formatos de secuencias
Descargar los resultados o guardarlos en una cuenta en el NCBI
Refinar una búsqueda para obtener resultados más específicos
Volver a la página principal del sitio [Home]