El DNA 4 letras muy informativas (II) Definiendo y Estudiando los Retrones
Francisco Martínez (EEZ-CSIC) & Javier Julián (IES Juanot Martorell)

Martes, 19 de abril de 2022
Terminando tareas en paralelo...

El pasado Lunes 18 de Abril, se apuntalaron y determinaron varias cosas, fundamentalmente referente a la presentación en el congreso… .

Y es que pusimos en contexto adecuado la investigación que hemos llevado a cabo y que titulábamos “Identifying novel retrons by bioinformatic analysis”



https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjj1BcBBP-rPnPeKF0X00-SSTA_9r4gzmLet55WMnFe2A8-afw3Pa8IXZ2pLVamB_WjAGet-PZy44GqILBr0KS_aZV4DtTiq3c9mruP9el4BqXEHLSA9vjJRUMPDm2rFTH2PyLRKzrkvZcA7L7Vbnab6lnJJyIZ9WFRnNNI3i3oec0BukLL3_eqXz2ojg/w640-h350/Imagen%201(2).jpg

Imagen 1: Resumen de los distintos mecanismos que poseen las bacterias para su defensa frente a la infección viral (Tal and Sorek 2022, Cell 185).


Y es que el estudio de los retrones, es un punto caliente en la investigación en Microbiología en la actualidad. Y es cierto que el estudio de muchos de estos sistemas ha terminado dando lugar a herramientas muy poderosas en la Biotecnología y Biomedicina actuales (la posibilidad de trabajar con el DNA recombinante, la tecnología CRISPR, etc…).


Y como debe de quedar claro en nuestra exposición, el estudio sobre retrones arrojará luz a uno de los sistemas de defensa frente a fagos más desconocidos hasta ahora, los sistemas Abortivos (Abi). Las células de alguna manera sensan la presencia de virus y disparan todo un proceso de muerte celular que evita su replicación y la posterior infección de toda la población.

Los mecanismos de ello, parecen ser muy variados y dependen entre otras cosas del tipo de retrones del que estemos hablando:


https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgM1nguu0tQK2kNRQGv_pK3L4ffmX2ij5ly1i-ePpp-IrRqpUCmD0AVBpvzESWP1FQqAqkVIq5aQfAPWt6avi71FDIF1NISpvmyY2-99XlICRQD33uPJwmjEDEVYaABPMheXvhWretBaAdKz_pd2FobfBPuDkaH0Bj8nmWR2pOpbHG9t5o6v4oZv3cSWw/w640-h364/Imagen%202(2).jpg

Imagen 2: Distintos tipos de retrones clasificados según el gen efector al que parecen estar asociados


Este es el contexto en el que nos planteábamos nuestro objetivo.


https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj8i6Z9d63L3druZqOrPtc6wI4MrW1N4uMSAAH4YDykXWJgqq3g_A9e9gf8RHpGj57kalTOCEjyG3FjMZ0yPA1V7Gy2-HItoDZ_WJ72-oAbkjbZpLFYreLIm_AlsztsTpLjg40daoJ2xnFFK2EAzKvh-vhKxMph-bA_tuuBAv2yEti85QJP7h8sAF0nrQ/w640-h460/Imagen%203(1).jpg

Imagen 3: Objetivo de nuestro trabajo.


Objetivo que hemos cumplido con creces y que nos permite obtener 4 conclusiones desde mi punto de vista bastante importantes:


https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEi0q10_s2n3tyQWdIfmNKz_4h5K-7zz8pnqljf6itUPPe0MERCA1v9O9ISgjPyz3iiqUFRMSPAZQCag3C0QrucxSmc4__glkEDIZdvvwE-Ka2ZQ8r186dfbuMZX_ElK9XVw6ncbUglJoaH9Rxje5FcZntsbWx-04mxruB6yvFnik7g3cw1Jx4N2W4aPAQ/w640-h502/Imagen%204(1).jpg


Y por supuesto, esta presentación influye en el manuscrito que llevaremos a la Revista HSSASR. En nuestro poster que elaboraremos para el receso del congreso y vuestro trabajo para exponerlo a vuestro instituto.


Ya empezamos a estar nerviosos!!!!!

A que sí!!!!

Lunes, 11 de abril de 2022
Ya tenemos un primer título para nuestros trabajo

El pasado Viernes 08 de Abril, se tomaron decisiones importantes.

Tras comprobar y definir en detalle una nueva estructura, la del retrón correspondiente a la secuencia 1337, quedó claro que entendemos cómo se forman y porqué se propone esta estructura.

https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEg0egGE9xB3LdM0Dbm-nSgXBzksX83Bu3dfWKh3zyQi7DGLuxuhpm_fJEDc51grKFSSECip14I7XZX5zwy0l0ylyVif-duJJNvF1wLb_wfMU59-YTWOj_0G71w8U9EdN9Ce0Q3buxtuHZ8hedL1Og2It9R5ufjmsytbV5QoRflXHkpLQwrEfIYMuunTHw/w640-h436/Imagen%201(1).jpg

Imagen 1: Momentos de la sesión del pasado Viernes donde se aprecia el trabajo hecho por las alumnas. Han reconstruido la estructura probable del retron 1337 denominado msDNA-Pa95.

Este dibujo, resume y detalla lo que hemos entendido. Cómo se generan estas moléculas y la importancia de definir la estructura secundaria /RNA folding” de una secuencia de nucleótidos donde se infieren las famosas dos Gs: G branching y G Opposing. La primera donde se une físicamente el comienzo del cDNA y la segunda donde comienza el molde de ese cDNA.

Ahora se trata de resumir y ordenar lo que hemos aprendido/descubierto y preparar la exposición que seguro se nos dará bien.

Por el momento ya practicamos un poco lo que va a ser el próximo 5 de Mayo observando la presentación del año pasado. https://www.youtube.com/watch?v=l80QV4JLDyQ.

Y que es lo que hemos hecho?? Y por tanto que título le podemos poner de manera inicial a nuestro trabajo y en concreto para la presentación del próximo 5 de Mayo.

Creemos que el título:

“Identifying novel retrons by bioinformatic analysis”.

Refleja de manera adecuada lo que hemos hecho a lo largo de estos tres meses. Que lo podemos vislumbrar simplemente echando un vistazo a nuestro Blog.

Nos queda, terminar de realizar de forma precisa la estructura de la molécula 1337 y de entender el tamaño de todos y cada uno de los msDNAs del grupo D.

Paco ha quedado en enviarnos y que discutamos el orden y el cómo de la presentación. Lo que decidamos, influirá en:

El póster que tenemos que tener realizado para entonces.

Un primer borrador del manuscrito que formará parte del 11 volumen de la revista HSSASR.

Las primeras ideas para el trabajo de 20 páginas resumen de vuestro proyecto en el Instituto para el año que viene.

Todavía nos queda dar empaque al trabajo, pero ya estamos muy cerca. Verdad!!!!!

Lunes, 28 de marzo de 2022
Nuestras primeras "churri-estructuras"

En nuestra última sesión entendimos cómo contar lo que estamos haciendo. Vamos!!! Lo que hemos hecho.

Y es que, si analizamos nuestro recorrido, vemos que hemos ido reduciendo (afinando) nuestra mirada.

Empezamos con …

1) Vamos a trabajar con “retrones”, identificarlos… Pero…

https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEg8QhsQ4fzB1FzEGt0fLeNd-wk5OU2rbsG9X1aCc02rsiT-OLtyHw15SYNpvitwQnERVHAEves4Zc3-Di1L7VAGLqqSSv12qKgxfbdai8zKBSqQe0sIkQB81xkIpkeiYeO9pu725Zq_f9lryab-7mn-wEMXpWx2x9_ST0GS3PKrt5C_Hltl8I40iZLbQw/w640-h626/Imagen%201.jpg

no todos, ya que hay grupos donde no hay descrito ningún ejemplo. Por tanto nos hemos centrado en un grupo nuevo muy concreto:

https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjuT7PHSzeNcy62gNpO_aTF3KNNX9UXj91fGLFRzyg6i3IRuGyFFv9sjCMh9OSAHSB4MJs34TJh3sPKr345ucnw2Rxz-twt0L4mHoT0HPabxGUpi5AJUA1ndjkNeoTiu2FDIvhn-Dy_nSPbJY1sA-SKWDZIj9dtkumDuq5K3sjjMrWHnBmKI6mzBA7aqg/w640-h458/Imagen%202.jpg

2) los III-A3 que se caracterizan por tener esta estructura de dos genes:

La RT y una proteína efectora la PRTase-WH.

https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjlbjECipYgQrest_OcNzlvsJib9HA-FODPy0wlBkEvcdeyjRs5bcrYY8CHc98WmAnaC5UlxzPN16BzgX-Whh9b6rgVDPgOYET_pXuKMSXV6WrGn35A3sAA-tr99hUqF18BVPjA_xKmW4pomtj40g8um4AJ0GjSM7JtnIZOlFHLbX0_wULF1CZhIxOe4g/w640-h450/Imagen%203.jpg

3) Tenemos inicialmente 143 candidatos, pero … ¿¿vamos a trabajar en todos???, no. Solo en 4 grupos (A-D) semejantes entre sí pero suficientemente distintos. Grupos que nos permiten entender el grado de conservación entre los dos genes y observar que evolucionan de manera paralela: las distancias entre ellos son semejantes… (nuestras matrices…).

https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjH5NSOv5APaSKLqzpykIgykts1rVdfG524YWLsq_yUCNk7yj_n2Gk1NrT3XCvqCXOZuTPGryPezXqgkfnfGL1qdvLhMaCuerBSF3g-r0YtUxeRqOVY71eQtbx2qGh1-R53unkXai2t6OI2BC-Gfrk3e9jJow0uOrkSssA01idcpL3MiVcgFRANx1D7IQ/w640-h422/Imagen%204.jpg

Y por último nos hemos metido en la tarea de describir la estructura del msDNA que se encuentra en la región intergénica de cada locus…

Tras varias comparativas nos hemos quedado con el grupo D que ejemplifica mejor la búsqueda del retrón característico del grupo III-A3.

https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgNr_JJIEk5PwT53rQxX4AmLGD1K59EQB--FA8nwQZPvxvxcucSCh8HsJav1h_Yh_2WGBYxvydSKBeICwk3RlGJ2pogChOHU9wINwW0OQj9I35hvPq4DPjZYKLLlwlHHkL9K_zFzT6XdHYFLYAW9LJllu0hr2vat7VFfJRjHjkY44YhaHKdB6idGnmU3A/w640-h320/Imagen%205.jpg

Y, Ya tenemos nuestra primera churriestructura, la del retrón 1340 encontrado en el genoma de un aislado de la especie Pseudomonas aeruginosa.

https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgxyFrrfS10j95hITRI0kIAoXwFqnYccbBCHJTVN5vlc_RhLQ0LJnqCMmkRa2teB_rZXA5hsWpDS219XcwHd-V8LInfEClXkzIBaYhyAzB30q07tVlGIQt1N2f9Nl_0eiLpVl3eF4SxTmFo7hZZUrKgd5r8ozC3EpOMYEKMnDpWiQAp7Oe97osdk-uKNg/w640-h404/Imagen%206.jpg

Se trata de que al final dibujemos la estructura del retrón 1340 y le pongamos nombre!!!!

Importante ya entendemos la direccionalidad de cada una de las hebras del retrón (la direccionalidad 5’ y 3’).

Vamos que ya sí se ve nuestro final!!!!

Martes, 22 de marzo de 2022
Enfrentándonos a "nuestros" retrones

Ya estamos viendo que identificar retrones no es una tarea sencilla, verdad???

Efectivamente, si miráis en detalle lo que se ha querido decir en la figura 1 de la entrada del Martes 22 de Febrero del blog se observa que la identificación de un retrón no es sólo obtener la estructura predicha en el RNA fold, sino que es todo un conjunto de evidencias. A saber:


• Debe existir una interacción a modo de cremallera: principio y final, a2-a1

• Debe existir un cierto grado de conservación de nuestras secuencias (alrededor del 80% o superior).

• Debe existir tras la cremallera a1-a2 las famosas dos Gs, generalmente desapareadas y críticas en la formación del cDNA del retrón.

• El cDNA del retrón (principalmente b1 y b2) se debe de formar en una región muy estructurada (un brazo largo).

Por todo ello, a la hora de enfrentarse a la estructura del retron de un locus concreto se debe de actuar de la siguiente manera:

La estructura que manda es la de la secuencia consenso. Por tanto:

a. sale parecida al consenso. Lo usamos de estrategia para definir las distintas partes del retrón.

b. No sale como el consenso, pues usamos los alineamientos para definir las distintas partes del retrón. Y una vez identificadas, subdividimos las distintas partes para saber si interaccionan… .

Para que todo sea más sencillo, conviene que alineemos las 7 secuencias de los retrones usando la consenso como referencia. (en el documento de texto adjunto os envio las secuencias para que las alineis). Y uséis el formato viena de la consenso para definir la estructura.

Os propongo que identifiquéis en base a esta figura todas las partes del retrón en cada locus (y lo anotéis en el clone manager).

https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiyQsM-3ugq_b0GkK4WAR_FhtXtUdfTHlmIRGBidbeSyfSpzDBySxkQ8KT-4XdSZm1CZLxgAEI1w4MEMVRzS9u7f9rQgNwS7Imies8vZpDCzr-xKiLMSx4vUs5xep0NyujA9nhs1lcWoic9hrLgN5OLp-S4REjK4ZhMHLnPcF3Uid1jqVxo5Tcpgwj36A/w640-h510/figura%201.jpg

Figura 1: Alineamiento de los 7 locus del grupo D. El formato viena está basado en la consenso y define los distintos dominios de interacción. Donde están las Gs?, donde está la cremallera a2 y a1, donde la b2 y b1. Donde empieza y donde presumiblemente acaba el retron cDNA??? – echad un vistazo a las entradas previas.

Y ese final que parece que nunca llega!!!!, llegará, llegará ya veréis.

Lunes, 14 de marzo de 2022
Primeras metas. Nuestro guion/dando forma al trabajo

Otra de las cosas que se comentaron en la última reunión era que ya tenemos una primera fecha “límite:

En ella deberemos de ser capaces de contar todo nuestro trabajo en 10 min y en Inglés. En este magnífico congreso. Para ello contaremos tb con una presentación (powerpoint) que resumirá todo nuestro trabajo. Tb deberemos realizar un poster para esas fechas…

Pero…, para contar nuestro trabajo, primero debemos de ordenarlo de manera escrita. Os recomiendo que le echéis un vistazo en recursos a los trabajos previos, sobre todo al del año pasado que se titulaba: “Bioinformatic analysis of specific groups of prokaryotic reverse-transcriptases”.

Debemos de ser capaces, de momento de escribir algo parecido… Pero, este año hemos llegado más lejos… . De hecho ya podemos ir pensando en un posible título, aunque esto lo tendremos que discutir en una reunión…

Todo trabajo debe de tener:

Resumen, Introducción, Material y Métodos, Resultados, Discusión y Conclusiones. A su vez estos trabajos tienen un apartado de “my own ideas” donde tendréis que hacer una lectura más personal de lo que habéis hecho. Sabiendo además que lo que tenéis que escribir forma parte tb de vuestro “proyecto” en el Instituto para el curso que viene (40 pgs o así), podemos plantear en él también una estructura similar.

Por el momento deberéis centraros en los apartados M y Métodos y Resultados. Saber qué vamos a contar en estos apartados definirá posteriormente la Introducción. Para la Introducción tendré que ayudaros y guiaros más en detalle. Podéis ir viendo las primeras presentaciones; son la verdadera introducción de donde nos hemos metido. Estos tres apartados definirán subsiguientemente los Objetivos del trabajo que no son necesariamente iguales a los que teníamos planteados “Definiendo y estudiando ‘retrones’” pero que no andarán muy lejos. El Resumen y la Discusión se abordarán cuando estos apartados estén ya definidos y casi completos.

A modo de ejemplo y para empezar, en Mat y Meth. Debemos de explicar:

Como Material: Las secuencias con las que hemos trabajado (de donde provienen. Habrá que añadir una tabla).

Como Métodos:

-El programa clone manager. Que hace, que interpreta, como trabaja…

-los programas de busqueda, blast… creo que los hemos usado tb…

-los programas de la universidad de Viena RNA web services (RNA fold y RNAalifold).

-Si terminamos usando el varna, habrá que ponerlo tb (de momento no es seguro)

Por supuesto, en todo momento hay que tener en cuenta la bibliografía… Dos trabajos van a ser sin duda referidos:

- Simon AJ, Ellington AD, Finkelstein IJ. Retrons and their applications in genome engineering. Nucleic Acids Res. 2019. 47:11007-11019. Donde describen de una manera muy actual qué es un retron.

- Mestre MR, González-Delgado A, Gutiérrez-Rus LI, Martínez-Abarca F, Toro N. Systematic prediction of genes functionally associated with bacterial retrons and classification of the encoded tripartite systems. Nucleic Acids Res. 2020. 48:12632-12647. Donde se describe el sistema de retrones tipo III-A3 en el que hemos trabajado.

Os recomiendo de nuevo que le hagáis un buen vistazo al blog desde el principio hasta hoy y os daréis cuenta de todo el camino recorrido y será una buena manera de ver como lo resumimos y contamos!!!! Y como siempre soy todo oídos, bien por aquí, bien por el mail, bien a través de vuestro profesor Javier.

Ánimo!! Ya se vislumbra el fin de nuestro trabajazo!!!!!

Lunes, 14 de marzo de 2022
Y nos vamos de fallas!!!

El pasado lunes tuvimos una reunión…. Cómo diría… una reunión de despropósitos…

El pasado Viernes tuvimos una nueva sesión de trabajo. Confiemos en que sea ya de las últimas. De hecho se tomaron decisiones importantes.

Tras varios intentos de determinar distintas estructuras en los 4 grupos de genes correspondientes a ejemplos de sistemas III-A3 de retrones: A-D, hemos comprobado que el que mejor ejemplifica las estructuras de este grupo son los 7 representantes del grupo D:

Tabla 1: representando los locus que vamos a mostrar completos y sus microorganismos de procedencia

En resumen, tenemos que identificar para cada uno de los locus del tipo D su “retron”, Para ello debemos de hacer dos cosas:

(i) estructura en el clon manager, (para hacerlo debemos tener en cuenta el formato viena para cada locus y el consenso tb. Una vez teniendo claro el RNA estructurado que se forma debemos de deducir donde empieza y acaba el cDNA del retrón.

Figura 2: Ejemplo Anotación en el clon manager de algunas de las distintas partes del retrón (msRNA ó ncRNA, a2, a1, b2, b1, cDNA (retrón propiamente dicho).

Que mirado en esquema sería algo así:

Figura 3: Esquema lineal de las distintas partes anotadas

Que recuerda y mucho a lo publicado en el artículo ejemplo de recursos… (https://drive.google.com/file/d/1daXnOuomfPEV8rVBwfp7FAIe0seOmUZf/view).

(ii) Por otro lado y como os dije se trataría de realizar la figura de cómo queda el retrón completo y estructurado, que finalmente debemos de ponerle nombre.

Para ello, necesitamos la secuencia intergénica específica de cada locus, el formato viena estructurado (consenso) y particular. Si no coinciden tendremos que hacer caso del consenso… .

Figura 4: Formato viena de la estrctura que resulta del alineamiento general (consenso) y del retrón 1337. Hay que observar que aunque las estructuras se parecen mucho no son idénticas.


Ya tenemos un norte sobre el que definir y terminar nuestro trabajo que no era otro que definir y caracterizar los retrones de los sistemas III-A3.

Figura 5: Fijándonos en la secuencia específica y girando las estructuras debemos de “dibujar” el retrón resultante de los locus: 1337-1342.


Ánimo, que hasta nos da tiempo a ir de fallas!!!

Martes, 22 de febrero de 2022
Vaya porra de reunión!!!

El pasado lunes tuvimos una reunión…. Cómo diría… una reunión de despropósitos…

Lo que tenía que ser una “clase” aclaratoria de conceptos, resultó debido a problemas varios (de Internet pero no sólo) “todo confusión”… Todo???

No, todo no. Descubrimos lo complejo de la labor en la que andamos embarcados… Y es que los programas de plegamiento de los ácidos nucléicos (RNA-fold) no siempre aciertan… . Y es que Paco nos explicó que el plegamiento final de un ARN depende tb de interacciones con otras proteínas, presencia de iones, conocimiento de otras estructuras parecidas, etc. Sin embargo, los “algoritmos” de plegamiento de los ordenadores se basan exclusivamente en encontrar el plegamiento “energéticamente más estable” para una determinada secuencia. Y por tanto a veces hay que corregirlo…

Pero corregirlo … cómo???

Para que entendamos a lo que me refiero debemos de adentrarnos en todas las estructuras de las secuencias del grupo D. Debemos de analizar… cual es la estructura que sale con cada una de las secuencias y compararla con la estructura que muestra cuando subimos el alineamiento (examinad vuestras notas) y enviadme los pantallazos correspondientes.

Que nos sale??? Que estructura nos da la secuencia 1341?? Que nos da cuando subimos todo el alineamiento 1342-1336 ¿?. (mirad la figura 1).

https://blogger.googleusercontent.com/img/a/AVvXsEjPDwHL57t_0epOS6pHnnJAwj4Db1TSJADh6vVJe7R5pdoQSyVOjw8-d3ySq4gsNzIKjlsDcYBe3fd2dICO0vmyVyWcbvdUiNVeaNh03YToOzHC-QOfZYUVy3RpnF7uUSF2wQYgIJT2AZLTXqCAxa0F0c_NJCltJzUWzS4G0RyWPym_eVzRqiKbrRT47A=w640-h482

Figura 1: A estructura de la secuencia 1341 frente a B la de todo el alineamiento 1336-1342. Las flechas rojas indican la posición - probable en B, mal predicha en A - de las famosas dos “G”s que definen el comienzo del cDNA (ADN complementario del retrón).

Si logramos entender lo que sucede … ya estamos muy cerca de nuestro objetivo!!!

Para ello os aconsejo que miréis la nomenclatura viena de ambas secuencias… Observareis que en el caso B es fácil encontrar las Gs de nuestro retron y menos fácil (imposible) en el caso de la 1341 aislada

Esta es la base de nuestra manera de enfrentarnos al problema de corregir los plegamientos. Y entender lo que pretendemos en nuestro trabajo.

Para corregirlo es super importante que entendamos la “nomenclatura Viena”. Que no es otra que una nomenclatura que predice las interacciones de bases en una molécula de RNA a base de “.” : no interacción y paréntesis”( )” : interacción.

https://blogger.googleusercontent.com/img/a/AVvXsEhrV-XD_jhuW7TZXc4thSedUqwjTYOWrYpNK-3u5eUQXX5dkEq7HdKcLVsX7gYbGU8CviClEUx6OegrKzCaCtrQY0RXDwnFiAS9QyiZvsUzPiilvN-UqKypBmoEK2039ZcxKrihtSPbSd8-i_DgcoXIPM6TDeR1wGnK48dXZiob6Z3gmv1YqkbvZer02g=w400-h51

Figura 2: Nomenclatura Viena ejemplo.

Y usar un programa (gratuito) para visualizar de estructuras. El programa es VARNAv3-93.jar nos lo podemos descargar desde: http://varna.lri.fr/index.php?lang=en&page=downloads&css=varna

https://blogger.googleusercontent.com/img/a/AVvXsEiTgNV5eHP6vLH_9hAC7fW02KKNfKBnDHBoDU9v_oAA0pAhJhEWVDArbdblaJFrjI9HRqXXT3egyhfgUeWgWXomNjiCShqipwM0qMzSzj5wwx6-MTn8ii_FbIz5K1V4-NRPOnnFvU1H3wrgbnKJsq4Pqd0_U4gLL80kMvJ957vCMqCRGPLaQjrmyhtEXw=w640-h576

Este programa nos permite proponer una determinada interacción, aunque ésta no haya sido predicha por los algoritmos de RNAfold.

https://blogger.googleusercontent.com/img/a/AVvXsEjkSjJQzRh51Veuos92mjNJIzL46XSBkmu5MvWSaDLMPA1nBq_N86h3Q7XatS3y5N1NcE24AGn4eokYrSpoCxGjspMsNMaFftT8lxZcd2TMhcMz7vHClnvMhfpdsCKRLRtOt_tQtzt79S6Ff1Ltt8TFduVqvZMEy8lX5cdCqLM39xb2ErFLkwLqZZ_2qw=w572-h640

Figura 4: Visualización de estructuras con el programa VARNAv3-93

El próximo día entenderemos como manejarla… . Aunque a lo mejor ya podeis ir haciendo probatinas… .

Aunque no lo parezca estamos ya muy cerca de alcanzar nuestro objetivo…

Jo!!!! Que dura es la ciencia!!!

Lunes, 14 de febrero de 2022
Ya aparecen estructuras!!!

En la última sesión (el pasado Viernes 11 Febrero), descubrimos como se puede inferir la presencia de los retrones en nuestras secuencias de Clone Manager.

Claro que para ello, tenemos que tener claro cómo se forman este tipo de estructuras (Figura 1).

https://blogger.googleusercontent.com/img/a/AVvXsEhKN3RBGcDQp0PVjAqXaMy_852lVw0bIlzIaIUNCAWP2hPnf9kjlP2IhwJzYpVfYMWgC5-JMxVc5TiX5L0ObG9bTyqKuIKF5G8skZi5COF3ZTiYczf2On8U60RLx3N8bYkP687O2qAfadgQR20AeSkVBWXj81K8psve4lp20xMSaWYXj5EBOb3P-m7CQg=w640-h438

Figura 1: Esquema de los distintos pasos que tienen lugar para la formación de la molécula hibrida DNA-RNA que constituye el retrón.

Paco (nuestro investigador) nos puso que analizáramos el ejemplo del Grupo D.

https://blogger.googleusercontent.com/img/a/AVvXsEgfsngMKvA8xm1PWpOPcT5DlhkNuUyIeLxTB-tSEVDVFSR-P-0f9VyxHwTy-Yw7-BT6HoKriXhTxiPKYTbaV0WAWhbAndmMhFxB4Ud6bf5P1XPD4T4m3Lk8h1AHIus6SNcEb2qQbkATXkY6yHwCTVJ7pmaMmYe9kVa52IJZfHWSVunqmDXnSGNjVsvOkA=w640-h456

Figura 2: El grupo D consistía en 7 locus (1336-1342) ordenadas según la matriz comparativa elaborada por las alumnas.

El alineamiento de las zonas intergénicas de las 7 secuencias ordenado de mayor a menor resultó ser muy informativo para determinar el grado de conservación de esta zona.

https://blogger.googleusercontent.com/img/a/AVvXsEhWj3zPZnMUHRwoBM7MhsPob1UrYQbeuoXIiCuJnHDLx3DAt_fkwYb69-bHINa4tpyUkru4SeXJWFu23LYWQtuR1Jf1YlQl7mmvES1kmxpBH5SmjADXwn0NNhF36oYoLx1Z2gVYccDlsdlnEyyV9GMlSLy_c8lA8wso6RVYYYsNVrAg7nYcYWjztPbwrw=w640-h464

Figura 3: Alineamiento de las regiones intergenicas entre los genes efector y RTs de las secuencias 1337-1342 del grupo D

Guardando este alineamiento desde el clone-manager como documento “.align” conseguimos disponer de la secuencia consenso de todos los alineamientos que nos permitirá obtener una posible estructura secundaria común a los 7 loci usando la aplicación http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAalifold.cgi .

El resultado es una estructura que recuerda y mucho a la esperada:

https://blogger.googleusercontent.com/img/a/AVvXsEirmr7sctQO6g1J25uhQmzLlieJ_8CrLDqRnG0RsRP1WYqyGHtZDqZc8_ZWqXpNqzza0ejLYnHxuc71rZG_tSMgp8hZRlUtDENdb2R_lhHp1ExM8IhV-Q2ukO1vPtxAP9Dmj87Bh5C8t_idejRiW1t1SBmFCx6zF5GA4OsOUzHkknU1vJNoSXiNN4bYvQ=w640-h374

Figura 4: (A) la estructura consenso esperada (B) la estructura determinada para el msRNA codificante del retrón del grupo D de nuestras secuencias.

Esta estructura tiene a su vez el formato Viena; formato lineal donde se señalan las interacciones mediante códigos de paréntesis sobre la secuencia.

https://blogger.googleusercontent.com/img/a/AVvXsEjMZdnM1UGbsnwo72ADsHdMNgeO0r-_IER4mtilFMrGliOdE45oxIgefVKiMlW5gl033bZRhXZEEsXazNzk8SE4pI9FWuZJd4bnTmk5mjXhgE738CzJKcsEq79p4l_s0W4KNlik27tVd8sS0wNhWJQqUctvpf_t6Dr8az8M1N490O6GgPznGRdy1itebg=w640-h226

Figura 5: La nomenclatura Viena de nuestra secuencia es indicativa de las interacciones del RNA “escondidas” en nuestra estructura.

Esa nomenclatura nos permitirá encontrar “inicialmente las dos Guaninas (‘G’s, branching y opposing) como base primera de determinar la estructura de nuestro retrón…

https://blogger.googleusercontent.com/img/a/AVvXsEjdTgzVhWv3s2fwgyJRsjTyAXfJVn7mh0bPZu260txkMEdq00be5vn0N_3yIDIDqYztu8ipdv8JY8_UvVRMsegLz_QiEBfsHYgJOSjBKa8zQg07bzHx1o-jIC67Fxl4zD6z8QjCkk5MSRIm7NJQpaUFpnHY7BjSI-moFk7LIyz3AKclIAIYGOfjxS6jJQ=w640-h392

Figura 6: Localización de las Gs críticas en el grupo D de secuencias.

Y claro, Paco quiere que para cada uno de los grupos seamos capaces de realizar una figura tal que así:

https://blogger.googleusercontent.com/img/a/AVvXsEg-MRV2UO--9FbSOKKxguxGUL3mViIERO5DRXuGIl01LjimGnG6lQyMCjofr-NV17ssPwG4BuitQPBqW8lPn-XgmOKTL0w8nn0OZB2K8tP7QfnHcXCBPTvMBpIcAxabHryplOZmTwKnPv_vmYGhhropcHwXbmkfHcUSkg8ElPnmdDoIceC3SsDMOUkdYA=w640-h286

Que será nuestro primer paso para habiendo deducido la estructura secundaria (folding) de nuestro msRNA describir con todo detalle cada uno de nuestros retrones, que ya sabemos que son moléculas híbridas DNA-RNA.


¡¡¡¡¡¡Ya tenemos nuestro trabajo casi finalizado!!!!!



Jueves, 27 de enero de 2022
Enfrentándonos a la descripción de "nuestros retrones"

La sesión del pasado Miércoles 26 no dejó de ser una reunión “extraña”. Paco, nuestro investigador se empeñó en que entendiéramos la Biología escondida que hay detrás de lo que estamos haciendo y lo que nos queda por hacer…

De nuevo ha hecho hincapié en que debemos de tener muy bien identificados la proteína efectora (PrtAse-WH) y la Reverso Transcriptasa (RT) de cada uno de nuestros sistemas. Esa identificación nos debe permitir ordenarlas en una “matriz de distancias” que nos va a permitir ponernos en la tarea de encontrar el “retrón escondido” en nuestras secuencias.

Lo habíamos hecho pero incluyendo en todas las comparaciones la 1352 (ver Figura 1). Esto lo que hacía era perder información entre la distancia y/o parecido de nuestras secuencias en cada grupo.

https://blogger.googleusercontent.com/img/a/AVvXsEgSCa3IEBCrfnc85Ik54Shmtf9XaN7zYqbLHHjC6xrVzPQqVserlgCdUzediBCqZE8gNN-sLGb6Clh9aOka-VAOP2zFu9Bvqsf51tEjCKXIOOuqc8Q1dhDFdr2Ei5TMMl1GQuN-K44gOhp_-L7HuscZX-m4U72FtR7kCAne5Ug6kxxdSnGFtnKynh4cLQ=s1314

Figura 1: Ejemplo de la comparativa del grupo B realizada por las alumnas, en la que se ha incluido nuestra secuencia “modelo” la 1352.


Lo debemos de repetir y ordenar todos contra todos cada uno de los grupos con objeto de tener la “mejor comparativa ordenada”. Esto es una matriz de distancias.

https://blogger.googleusercontent.com/img/a/AVvXsEhUva059EEPGXhwf4-FGc9Rl6vaNkZELinJsdaDPb8UXOup4au3iwnPCI_sXejVyLKuY8lXW02fLTZ18RWUXGt2bhpP0kiQlG4iqaLdeRQqb1p1SY_4KsFzjfXr-LSs2Q2HNvOzX7DLvJBYFLcv3qg1l40-LzMlbsAfLnB2GbBSwTfV9ar2DWio3A78Ow=s1379

Figura 2: Ejemplo de la matriz de distancias a llevar a cabo en cada grupo. Debe de haber cierto paralelismo entra ambas comparativas la de la RT y la de la proteína efectora (la PRTase_WH).

Esto nos pondrá un orden preferente para alinear de cada una de las entradas la región intergénica entre nuestros dos marcos abiertos de lectura (donde presumiblemente debemos de encontrar la estructura del retrón… .

https://blogger.googleusercontent.com/img/a/AVvXsEhP7cSgsJmxBIsOdVyqJQr_vS3NiRc2_X2XaZM8xk_B37ovhVFBISmABOVp1JpiHYdnj2_k2dqnbOqRXCJ7wm3p1EoetYxiDuGKdDFYxKqairVZ2hqTvsXuURX3VTCe95qr165YELsXhv8iGKZLonH04RJm7u9xmgEyzzODw_3w0pkgFaIoVCTQpE2SdA=w640-h184

Figura 3: Esa estructura deberá estar “escondida” en la secuencia de nucleótidos entre los dos marcos abiertos de lectura.


Para ello debemos seleccionar en cada entrada (1325, 1326, ….) Una sección de secuencia que contenga sólo 25 nt del final de la ORF (correspondiente al efector y 25 nucleótidos del principio de la RT. Y llevar a cabo los alineamientos que nos permitirán inferir la existencia de una estructura secundaria que definirá el retrón (Figura 4).

https://blogger.googleusercontent.com/img/a/AVvXsEgJaGOYFbYy6FH3G5qyyGdH2lukEFjp2REqCr3OGfp17YAaxvxYP7GjtZWE2wG9yrotDe15Fc9Ahy-MLgod42J6r99YcjX8wk9P9XHgNjQuVqN9r_TWIbJvJnKFJ6fSewUkNAB06gsX5K9gW3hsbws30oYk47UM5UneWTXh0xCoX3Guaq9GYTKm3IVZxg=w640-h412

Figura 4: Ejemplo de los alineamientos que deberemos de llevar a cabo para empezar a definir el retrón en cada uno de los subgrupos (A-D).

Quizás, un buen comienzo podría ser el encontrar inicialmente las dos ‘G’ críticas en la función de todo retrón.

https://blogger.googleusercontent.com/img/a/AVvXsEjUlUzyF5VmG8n6KVHuPC19qYxLRg5hFkobJg1fSLBH2DLv90P-R3Kbu1v_PBPBeVOzZkaCwUBL0Q4BpfTWHMZ3Gwt21ySZOZLySkJh1L0lsmYhi_7TRrUNHm1RQ8PgJu6gRyCb6K_50P0Rny6CtV9x9KHDS9Gjisjn-cN-pcvChd4WT6ScrYw1MY4VAA=s1454

Figura 5: Ejemplo de lo que debemos encontrar, primeramente.

Que como vemos no es como buscar una aguja en un pajar pero se parece bastante.

Para ello, vamos a utilizar una herramienta online desarrollada por la Universidad de Viena en Austria (http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi) que nos dará la estructura “secundaria” de todo ácido Nucleico.

https://blogger.googleusercontent.com/img/a/AVvXsEg0hZ6OP2eIAhKgB2LX2xvxjPzkzhvPpt1TGcYvT-nOpao-QtOvetKEvZjN4n15j51oFYR5VFJpBOhAv1afpS8fi2gWpXy9hgtrK9H7XRx2BKbuKhi1npU4otL2HqxAAXA56ptpnfpcjllcd1zcCCk9UJItdxArnj0UTI9npv5TdaR7NPYVhUmkZ4J2_Q=w640-h382

Figura 6: El plegamiento de los acidos nucleicos está en la base de la función de todo retrón.

Ánimo!!!!!

que ya estamos en la tarea de describir al completo el nuevo sistema de retrones!!!!

Hip, Hip, Hurra!!!


Miércoles, 19 de enero de 2022
El pasado lunes 17 (II)

La herramienta Blast,

de donde provienen nuestras secuencias

Otra de las tareas que descubrimos el pasado lunes 17 fue entender el origen de nuestras secuencias … que no es otro que la base de datos del NCBI donde se encuentra depositado todo (o casi todo) lo secuenciado hasta la fecha… (y anotado): https://www.ncbi.nlm.nih.gov/

Interfaz de la web del NCBI y su herramienta comparativa y de búsqueda “Blast” que puede utilizar secuencias de nucleótidos y de proteínas para la búsqueda…

https://blogger.googleusercontent.com/img/a/AVvXsEjvzvzpFtKJ6EkBrJzhgIq4pDf6H8jNkkgDq0kUQL4ciir4j0ydVQKP0aexxztdshpKGWIzzemn9SQjwLz8yKqfCQzeYoKy_jnzg6S6AeTMrDL7KzbFZQ4YdKDJluJmSFrkxYnGWetsBiUjIzrvrrZRSZR7F6H1TQGGi7lNZ39cj5P3wb8AAIvnjPFRww=w640-h266

Tras introducir la secuencia de la proteína RT de nuestro locus modelo el 1352 de Salmonella enterica.


https://blogger.googleusercontent.com/img/a/AVvXsEgqeKuSXcgUS1BfgXR0iDBNHtFazbqB0fBYd7lTq0ZuppFaWJVGxHoTGWf4gmua3mRDAbL0mzijsl32z-nTlkwAxVD-f0HYAtKhH3BPFq-IIr_ga9rFuIdKcBens1VLDb8SfNvT48chNNvh02LbRE6ccc-sLUKAOHjybnjVMPacgUzgO5girNgLvWa5Nw=w640-h518

Obtuvimos este resultado:

Donde analizando “grafic summary”, alignment results, “distance tree results” podemos entender lo conservado y el número de genes que hay como el nuestro (que son muchos)… . Y entre ellas, está por supuesto la primera que es nuestro gen (nuestra proteína).

Por tanto, es tb una buena herramienta de chequeo del tamaño de genes adecuado que estamos “anotando”.

Una vez identificados los genes debemos de ordenarlos de mayor a menor parecido y confirmar el paralelismo en distancia entre el gen efector y el gen RT… Algo parecido se ha realizado en el artículo del año anterior (fijaros en la figura 5 del artículo del año pasado en recursos: Nidame-Rodriguez y col 2021). Para ello hemos aprendido a utilizar dentro de la herramienta “align del clone manager cómo ordenar nuestras comparaciones (de mayor a menor parecido con nuestro locus modelo (la entrada 1352)

https://blogger.googleusercontent.com/img/a/AVvXsEj9_f05BjbYjH0u7eKEglngKsCFJAPlEOH8mbCseQN_YDOjEg70T2K6GBcHneJ7UwIEmDwBunhQahO73CvtfC-STpmgy1V03V3WkbO29Tl-VaGpzBcUkRPpH5f2aKr8JEepf95ZVJUy5tu1XGdnGi77rACfzlmyNGQ4qwMK3yDlb19w8-upxW_ZTL0jyg=w614-h640

Comparativa de las proteínas estudiadas el año pasado y ordenadas de mayor a menor parecido… Se observa el paralelismo entre dos grupos de genes. Resultado que esperamos obtener tb en nuestro sistema de retrones.

Nuevas tareas nos esperan: terminar de ordenar toda la comparativa del grupo A y anotar e identificar los otros 3 grupos: B, C y D.

Esta labor va a ser importante ya que nos centrará en:

la identificación de la estructura del retrón de este sistema, que como ya hemos visto

nadie ha descrito todavía!!!!

Nos vamos a cercando a nuestra meta!!

Martes, 18 de enero de 2022
La primera sesión del año

El pasado Lunes 17 de Enero, tuvimos una jornada “rápida” en la que ya vislumbramos la importancia biológica de lo que va a ser nuestra tarea: la descripción completa de un sistema de retrones no descrito hasta la fecha: el sistema III-A3.

https://blogger.googleusercontent.com/img/a/AVvXsEhOaF3SdImkr8Q-gkhkUZ7v5yCq2t9Sehc2MbwOXW4Q2EtRwQXiEfAh8PqWAtP0RoTCdFL9JJctOzb9_F5Lp7C4_oE3h0k1AUVsG5jAB1Wx2zmWj30dlVrx-_w9E0O_tymEHocmghUj58_KiV0sqQyegz-Pu5wiJ1302YakstOg24c3HIi9Q53UOQljMA=w400-h76

Figura 1: Esquema del sistema de retrones tipo III-A3.

Para ello, nos vamos a servir de 4 “subgrupos” de ejemplos (A-D) que tendremos que analizar “conjuntamente y por separado …

https://blogger.googleusercontent.com/img/a/AVvXsEjc-pvmMV-Pr7bIFp79LmaZF5jI-pB13g0_k11nbgrfKI1I5iugYPa3pX1EWzaYl8zususJkZnZ1ZRdo8YaraQjRCkSPuIMDfE809fY1SVx9VSo_shDkAafZNL7Q1oaUjC9Pf-CdIcd2N0sxdyaFCuhCcgNNtNw8AdBGS9Lp7R0gYT1OBIJKp7bXfOfBw=w640-h286

Figura 2: Grupos que vamos a estudiar según la filogenia de las RTs. Son grupos de genes relacionados entre sí de manera significativa (valor de relación muy cercano al 1).

En este sentido Celia se preguntaba el porqué de esta selección. Si tenemos unos 143 candidatos por que hemos seleccionado sólo estos subgrupos?? El motivo no es otro que intentar encontrar un patrón de parecidos y divergencias que nos ayuden a establecer las características especiales que pueden tener los retrones de este tipo y por tanto describirlos… .

De hecho, ya hemos realizado un primer análisis y la anotación de los locus genéticos de los sistemas del tipo A-modelo.

https://blogger.googleusercontent.com/img/a/AVvXsEii-6R09pI-tOaLy6zukr2HHuVJ3s0Yu8iQEH6ZBZ5z5x1zulY45FKZl8wwl9PZluTNzCZSiPWQJhsYgSQXl_UqJaMtmoO8YXZCsZ_yj_Z2jGxFPY7SZSNhN_xRHKr4uUahKxWknQbKLDU1s1r-v8Zniii2DQoJ_KN1CYdYcESr3ivqrd4L1pXLVCcBXA=w640-h122


Y hemos realizado las comparaciones de los dos genes: el efector (PRTaseWH) y la propia reverso transcriptasa (RT). Observando algunas peculiaridades (Figura 3)


https://blogger.googleusercontent.com/img/a/AVvXsEhzAe-JFsvvoPPZVZ4Y7HQSFNf6XD06MPi6N2qCuyerjFn8STBFOhcQyTYD6JZqTk41MegzvsldnAg4cVMWmGQ5W3dSmCVbMDQ6sENVXF86zVtnkAXN2jGSI8JGvInnSN2BWyPit6cSNlerLxvP722DDMNmVF166P8AfddhDuc2gbu2C4eh5JUR0l29JQ=s1022

Figura 3: Comparativa de las 5 proteínas más relacionadas con nuestro locus modelo (1352 de Salmonella enterica).

Así, observamos que una de las proteínas efectoras parece de menor tamaño que las otras (sólo 171 aa).

En realidad, se debe a un error en nuestra interpretación, la proteína (el gen) efectora del locus 155 tiene un tamaño semejante a las otras. Entonces, ¿por qué el clone manager nos la identifica más pequeña?

https://blogger.googleusercontent.com/img/a/AVvXsEhC8-ORZvGDJBOINh9G6D-Tr4W_ejKws1VWkyB7QwklrRHoHffnKYQzcAg0CcChZY-RFF8JTNqXk74xNaZkVqKNImWs2Zmh1tP7etiBbuwN-562MslDikRZ_XFJIK99QA3ySnJsiMOyFEaqJWgFMUe56LgXGYoacWYQGcbGDbrXL8NnKCpD2-3FtL3irg=w640-h490

Figura 4: la herramienta “find ORFs” (búsqueda de marcos abiertos de lectura) del clone manager.


Como podemos observar en el programa la búsqueda de marcos abiertos de lectura no comienza siempre con el triplete ATG… . De hecho, aunque es el mayoritario y más eficiente, no es el único.

Os recomiendo que le echemos un vistazo a este trabajo:

Hecht A, Glasgow J, Jaschke PR, Bawazer LA, Munson MS, Cochran JR, Endy D, Salit M. Measurements of translation initiation from all 64 codons in E. coli. Nucleic Acids Res. 2017 Apr 20;45(7):3615-3626. doi: 10.1093/nar/gkx070. PMID: 28334756; PMCID: PMC5397182.

Que nos lo hemos descargado en recursos (enlace).

En él miden y comparan la eficiencia de comienzo de la traducción de todos y cada uno de los tripletes de nucleótidos (que son 64) (Figura 5).

https://blogger.googleusercontent.com/img/a/AVvXsEh7RyJApg0OAUsG06AJ-e0Qbpp27fRfccd0XTCVLR-i0pX8XcJJZgtCcNIAW6_RIK-Lq-iaj8w7eAshY2S0wtjX72oFK3l13fbRbmcPVmFZOMZ__yvFhZpy8o21NVZUp8AwZYOhibygKKS35kyH5w168Rsoz1DJfFGjufty0GEyddqkL50h2zHZ4EK7YA=w640-h638

Figura 5: la traducción puede comenzar por tres tripletes: AUG, GUG y UUG, aunque destaca mayoritariamente AUG.

En resumen, el gen efector de nuestro locus 1355, parece comenzar en TTG (UUG) en vez de en ATG (AUG), lo cual aunque no es frecuente, parece suceder en la naturaleza… .

Nuevos subgrupos nos quedan por analizar… esta semana debemos anotarlos todos y “ordenarlos” según su parecido a nuestro sistema modelo: el 1352 de Salmonella entérica.

Primero, los 9 representantes del grupo B (1325-1333), continuaremos por los del C y el D.

¡Confío en que los tengamos todos identificados para la próxima reunión!!!!

Hip, hip hurra

Aupa DNA team!!!!

Jueves, 23 de diciembre de 2021
Nuestra reunión antes de navidad

El pasado 20 de Diciembre tuvimos nuestra última reunión del año (que no la última del proyecto… jejeje).

En ella, vuestros padres conocieron donde andáis ya metidas. Creo que será bueno que también nos sigan en nuestro blog, verdad???

Tras una breve introducción de nuestro centro de investigación y los distintos proyectos caos de este año, de una manera somera les expliqué hasta donde queríamos llegar…

https://blogger.googleusercontent.com/img/a/AVvXsEjPkzW5KxwStvDNb-BvWGd3x9--zo5ruR359KI3SvZ57wL-NmnePvA1RYN8sxrR_06VtXBYbJhm9alhxgqdOlTIngSPtH53ieT62pi1bHADl0dUEdomTTKzMc8AdqRtVJ0mkL6v1Bdbu5OkCXfSH7Y9ilE1SyI1kI5zlJ0Dv3qjtA434_5zqlpKPRu7aw=w640-h502

Figura resumen del artículo que nos servirá como modelo a seguir en el análisis de nuestras secuencias…

Y es que el proyecto ya va cobrando forma. Es más ya sabemos que vamos a estudiar un grupo particular de retrones para los que todavía no hay una forma de RNA identificada (en recursos se ha subido la presentación correspondiente a este día). Y por tanto nuestro análisis permitirá validar su posible función biológica.

https://blogger.googleusercontent.com/img/a/AVvXsEiIPUUFsRFJms5s03DeiQhgBVSnSCHATQLVgrqnm3pVl7Rd3OtxVZobCjyhih922JJd6bYmaWwe_LsDL26bZTpS_U-KXw6l_jzrzt-nJHGcm4fskL1DAs5EkiBFVh9I7Hf8DZHGDg0KqLPO_Eb5r77VWokV_TPawLxqXk8gC6DL_aiGBIJAV_CSh3AgCw=w640-h462

Figura 2: Arbol filogenético con todos los tipos de retrones que existen en la naturaleza. Se señalan las 143 secuencias sobre las que echaremos un ojo que representan a los retrones del tipo III-A3.

De momento tenemos como tarea el análisis de un subgrupo muy particular de retrones que hemos denominado como subgrupo A, correspondiente a 5 regiones del genoma de estas 5 bacterias (species strain en la tabla)

https://blogger.googleusercontent.com/img/a/AVvXsEhAPtgqwD6R05zRk93kJwn2A7HsZry_AHpMF0EvlBlJrn87TQQNOBXRtYvB6Jbl23SeqXEwxHJ_BmoTwcL-ZZdoMr08_W8BGej2PQi6YBkMViqtCDmG6qVN0xeQrUtcu1RLfHm2ljIBSzgqWA_CCMCDy5V3U5yg7Zw1y-AnEK3IVY_2mRPXC5oEPH65nw=w640-h102


Tabla I de trabajo: entradas de secuencias correspondientes al subgrupo A.


En estas entradas deberemos ser capaces de:

-Identificar la unidad y conocer en lo que estamos trabajando.

-Usar nuestro sistema modelo (la referencia en rojo de la tabla) como referencia de identificación.

-Aprenderemos a Anotar los genes

-Identificar todos los locis…, de momento 5.

Y me consta que ya le habéis echado un ojo!!!!!

Lunes, 13 de diciembre de 2021
Noticias que nos afectan

El pasado 2 de diciembre salió publicado en la prensa un análisis de la importancia de la secuenciación masiva en la pandemia que venimos sufriendo.

https://elpais.com/tecnologia/2021-12-02/las-nuevas-armas-genomicas-contra-la-variante-omicron-eso-tambien-es-tecnologia.html

Si podéis acceder a la noticia os recomiendo su lectura en detalle. Está llena de guiños sobre lo que pretendemos hacer y que deriva entre otras cosas de la cantidad de secuencias de DNA (las famosas letras GATC) vertidas a las bases de datos que es nuestra fuente de trabajo.

La secuenciación del ADN actual está en la base del conocimiento y desarrollo de herramientas frente a este virus. Como ejemplo en Dinamarca – uno de los países de referencia en el COVID- se analizan semanalmente 10.000 secuencias nuevas del virus. Esto sí que es un seguimiento a tiempo real, verdad??

La facilidad de la secuenciación actual ha sido la base de la detección (PCR) de la generación de vacunas (RNA), etc…

Hasta sería interesante que pudiéramos comentar un día de este tipo de noticias, aunque, a lo mejor ya lo haceis en clase…

Saludos

DNA team!!!!

Viernes, 3 de diciembre de 2021
El manejo de clone manager (II)

El Jueves 2 de Diciembre recordamos donde estábamos y conocimos nuevas herramientas del clone manager, a saber:

(1) La herramienta Open Reading Frame – ORF search que busca bajo una serie de premisas todos los marcos abiertos de lectura que se encuentran en una molécula de ADN dada.

https://blogger.googleusercontent.com/img/a/AVvXsEiWrH3xOvw0lKoLhdlaL45cLeXZoTEtfDpKbQjn98qrGEu6Dg8UQM_2Lsrp5oGDDGrIik-Lj2-yoqdQadMp4TOgCTw2r2eEcnd_Gp1izGbNasO2cChv_lyugUFzZlkWSJ2l8uRKU-aUUJnRXAf4fqjLYbXr5fC6KGTybimeOHM44SL4pEg4n6mCFNrBTA=w640-h376

Figura 1: La herramienta ORFsearch encuentra y “anota” cada una de las posibles proteínas (ristras de aminoácidos: m,t,h,l, … hasta 20 letras) presentes en una secuencia de ADN (g,a,t,c, …).

(2) La herramienta “translate”, nos permite obtener la secuencia de esas “ristras de aminoácidos”, o sea la secuencia de una proteína, o sea la secuencia de un determinado gen.

https://blogger.googleusercontent.com/img/a/AVvXsEhX1BZfX_x3XENPVq7JeDDq6_CJz5WTzGzBNLEIiEUrq4ZLOk69AIXcGNejDrE2u7k5qKeT0KxpomTN5Kv_X2jkupbr27JhYa8_xICCKtPj25xeqZ1OSE-pjsbhwVZC_kaCU2irjm4sLRETxJBFkD0fywcNzEXMuTbqFYhQc-qhJpiEezSyHpcgLEYaGw=w640-h332

Figura 2: La herramienta translate nos “traduce” el DNA a proteína.

Y como ya sabemos, los marcos abiertos de lectura - ORFs (las proteínas ) pueden tener dos orientaciones en el DNA: dirección izda a derecha (en la cadena de arriba) y dirección de derecha a izda (en la cadena de abajo).

Fig. 3 El gen 1 (amarillo) codifica una proteína dirección aguas abajo del DNA (ATG….) y el gen 2 (azul) codifica la proteína en dirección aguas arriba (…CAT).

https://blogger.googleusercontent.com/img/a/AVvXsEgMOILAiksIVRR6GUtwXjVB6KMQmoftbc7iw-e0E0ee7DiCGdQwbyEcu8vxhYHrT0FgSqi9EMWlKVUK5jmCLflx0o1KiK3Y2vJGBqeoZ8iFdDhUvjuAcSljT1qAphLHf6qmhfeL5S3OOqIR4NSXl5lvFgr3NrljXysZ6hoQhb_vS9bhh7XgyI_xX-r3VA=w640-h458

(3) La herramienta align. Y las diferencias entre alinear una secuencia de nucleótidos y una secuencia de proteínas:

https://blogger.googleusercontent.com/img/a/AVvXsEjzRKJ6fCr9dwhja9y7JWH53Jj2lTky-tpavvsDgn144HHb5LMxCS6IRkFs61L1zneDAQBUF1iZv_YSDd_xYJopgCqSn2ijJfyuOt74Poe6JoLeyu0zNaqHQZS_0mDkLwfElI21TfH8-ctbOgULg90FpgVjBhKC2UkxzzafDegeda3SF9ZgRp7ZQMZzdQ=w640-h488

Fig. 4: El alineamiento con las 20 letras de los aminoácidos es siempre más informativo que cuando se comparan las 4 letras de toda secuencia de DNA.

Y por último también vislumbramos que características van a tener los DNAs que vamos a analizar, un grupo muy particular de ‘retrones’, que ya sabemos lo que son ¿¿¿ o no????

https://blogger.googleusercontent.com/img/a/AVvXsEjRDkraG_rueiOrZUowjJKzkPs2afn4ZSOg9jlYGBTbfFcnLDob-UZ1kV0seXiS248rpR0wARGx_A4Z3EHK2Pzuxy_fwgM4z0s4yHvGh8D5ECutW_xaFPUvk8xFBB_sa6DwJr3EkWhjfF1KdaZtrfqvTDbtd-q-x4gf1SEXcg3_17QkEKoRzzvFD8a1Ow=w640-h404

Figura 5: Aprendiendo cómo vamos a identificar las proteínas presentes en los retrones del tipo III_A3.

¡¡¡¡Ya conocemos la base de nuestro trabajo!!!!

¡¡¡¡Sin prisa pero sin pausa !!!!

*En el correo tenéis un enlace con la grabación correspondiente a este día.

¡¡¡¡Ánimo chicas!!! Nos estamos convirtiendo en expertas rastreadores de secuencias de DNA!!!!

Lunes, 22 de noviembre de 2021
Introduciéndonos en el manejo del clone manager!!!

El pasado Viernes comenzamos a vislumbrar en lo que va a consistir nuestro proyecto:

“Analizar y entender la información que “esconde” una secuencia de ADN”.

Para ello hemos aprendido que el DNA está constituido por dos hebras… esto lo hemos puesto de manifiesto con diversas herramientas del programa…

https://blogger.googleusercontent.com/img/a/AVvXsEiBFzGVWSOYGkKidbNtmFFc9WFm_tOZIITn0I9zuV5UgiF_ry2t8chdmjnUMCS621PALJNL2BQ44-MHwuasGBMNN3AfKv6a9SgvUpjy3B24y4mlkuCf8lsS2se1L1Fi9fzmtcrhhtfWNb6f5U8woqHTOtobBox-LAXV5HGzVLqGtHAB1mVehfW_3NRC7A=w640-h318

Fig. 1 Una cadena, versus dos cadenas


https://blogger.googleusercontent.com/img/a/AVvXsEguYLmqQAjNesHFMGLGFtXqA4XW4Hc3OU0APsOA6G8gZCfaB3zR9rsSDfvLbUoGsK6lDpzOZPtcL4PsMAQdTFI5whRYjiVqYdDyzSmLRP9FxLwlEw8luXX0WItPsmM8y1zcMle_0ifOE2KpzvHQCGj6U1bi7eKazUyDVgFmBFvl2Hpk99cDc7AGAFHl-w=w640-h362

Fig. 2 Sentido y antisentido en toda cadena de DNA. EL ADN tiene una dirección 5’ - - - - > 3’



https://blogger.googleusercontent.com/img/a/AVvXsEhTyac2N5aDUZEbYQmwF_LXcLEh8MVL-p3voN2p697-MsV-5b9cj4r82SreZFrlMvX5IB7iy9E89rRim9RuciG1BMp0vMFdjB-ubzpe6FdOELFRwzVmj1GH7p_44A50cC-yUXuqq359LwU4BnbJplS4uWJMxzSHaQ1cixA-8Q4dBVeyv9mJnJ-pLaGKTQ=w640-h390

Fig 3. La herramienta ‘compare’


Y su diferencia con la herramienta ‘align’; La herramienta ORFsearch ….

Ufffffffff!!!! Qué rápido va nuestro investigador!!!!!

Pero … tranquilas… tenemos todo el tiempo del mundo para practicar …. .

Tendremos nuevas sesiones donde afianzar este manejo… y poco a poco empezar con el análisis de “nuestras secuencias”…

Hip, hip hurra DNA team!!!

De nuevo sería bueno revisar los tutoriales del programa en el blog del año pasado: https://sites.google.com/view/caosdna/recursos/Recursos?authuser=0

Seguro que ahora los entendemos mejor!!!

Lunes, 15 de noviembre de 2021
Ya nos conocemos

Hola a todos:

El pasado Jueves 11 de Noviembre tuvimos nuestro “pistoletazo de salida” del proyecto en el que nos vamos a embarcar.

En recursos he subido las dos presentaciones ( 1st day I y 1st day II) que estuvimos debatiendo. Echadles un vistazo para recordar lo que vimos.

Fue sólo una hora, pero que hora más intensa…

Ya estamos preparados para enfrentarnos al clonemanager y empezar a conocer las herramientas que vamos a usar para encontrar la información escondida en toda secuencia de DNA…

Nos queda entre otras cosas entender las preguntas planteadas…

Ya estamos en camino!!!!!

Miércoles, 10 de noviembre de 2021
Bienvenida

Estimados participantes en una nueva edición del Proyecto Bioinformático “El ADN, 4 letras muy informativas”. En esta ocasión dedicado a un grupo de lo que se han venido a llamar “Retrones”.

En primer lugar, daros la bienvenida a este nuevo proyecto “on line” en el que se plantean nuevos desafíos. Desafíos que entroncan directamente con una nueva línea de investigación que venimos desarrollando en el grupo desde hace ya unos años (Caracterización de nuevos sistemas de defensa en bacterias asociados a unos genes denominados Reverso transcriptasas; los sistemas DRT (del inglés Defense Reverse Transcriptases Systems) cuenta de Twitter: @TORO_LAB).

Al final de este proyecto deberíamos convertirnos en unos expertos en el manejo de bases de datos e interpretación de la información escondida en las letras ‘GATC’ de toda secuencia de DNA. El objetivo planteado en este proyecto, aún por definir del todo, se entronca en Proyectos de Investigación actuales llevados en el grupo y financiados por el Ministerio de Ciencia e Innovación.

Todos nuestros avances y resultados los iremos plasmando en este blog en el cual también tendremos recursos, enlaces, etc. Todo aquello que nos permita hacer de este proyecto una experiencia de la que nos sintamos muy orgullosos y de la que hagamos partícipes a todo nuestro entorno: nuestros padres, nuestros compañeros de clase, profesores, amigos... Esta forma de dar a conocer nuestros resultados no es nueva; ejemplo de ello lo tenéis en los blog de proyectos anteriores, que podéis visitar en estos enlaces:

https://sites.google.com/view/caosdna/home El DNA 4 letras muy informativas;

https://eez-crispr.blogspot.com ¿El genoma de mi bacteria posee elementos CRISPR?;

http://eezbioinformatica.blogspot.com/ Descubriendo nuevas especies a través de la bioinformática;

En la sección de recursos se encuentran los artículos correspondientes a los trabajos realizados en las ediciones precedentes. En ellos se puede comprobar como nuestros proyectos anteriores han sido todos factibles y llevados a buen puerto, como así ha de ser en este nuevo.

Y ya nada más que pedir vuestra colaboración también en este, nuestro blog. Pero no solo con vuestras aportaciones, sino con las de todos aquellos a los que podamos hacer partícipes de nuestras investigaciones. Seguro que ellos también pueden añadir comentarios interesantes que dinamicen nuestro blog.

Y por ahora nada más. Ánimo, entre todos vamos a hacer un gran proyecto.