Distancia genética y árboles filogenéticos

Distancia genética

La distancia genética es una medida de la divergencia genética entre especies o entre poblaciones. Las poblaciones con muchas genes similares tienen distancias genéticas pequeñas. Esto indica que son cercanos y tienen un ancestro común reciente.

Dos de los métodos revisados en laboratorio incluyen el modelo Jukes y Cantor (JC69) y el modelo Kimura de 2 parámetros (K80). Adicionalmente se requiere calcular la p-distancia para el modelo JC89 y el cálculo de transiciones y transversiones para el modelo K80.

Árboles filogenéticos

(Método de inferencia de árbol basado en distancias genéticas)

Los métodos principales para la creación de árboles basados en distancias son análisis de cluster y mínima evolución. Ambos tienen diferentes conjuntos de suposiciones y su éxito o fracaso para obtener el árbol filogenético correcto depende de qué tan bien se encuentren los datos ante dichas suposiciones.

Análisis de cluster

Estos métodos fueron originalmente desarrollados para construir fenogramas taxonómicos, es decir, árboles basados en similaridades fenotipicas. Después fueron aplicados a filogenética para construir árboles ultramétricos. Los árboles ultramétricos son árboles enraizados en el que todos los nodos son equidistantes desde la raiz del árbol, lo cuál solo es posible asumiendo un reloj molecular.

Los método de cluster como el método de agrupamiento de pares sin peso y con media aritmética (UPGMA por sus siglas en inglés) o el método de agrupamiento de pares con peso y con media aritmética (WPGMA por sus siglas en inglés) utilizan un algoritmo secuencial al agrupar secuencias o grupos de secuencias --usualmente referidos como unidades taxonómicas operacionales (OTUs por sus siglas en inglés)-- que son más similares entre ellos, esto es, para los que la distancia genética es la menor. Cuando dos OTUs son agrupadas, son tratadas como una nueva unidad OTU de manera recursiva para inferir la estructura del árbol filogético.

Se adjunta el script de python que realiza un cálculo básico de distancias genéticas y una presentación que incluye un ejemplo de cálculo de estas distancias.

Un ejemplo concreto de análisis de cluster para arboles filogenéticos se encuentra en el libro The Phylogenetic Handbook, sección 5.2.1, pág. 145