Similitudes genéticas dentro y entre las poblaciones humanas

Similitudes genéticas dentro y entre las poblaciones humanas

D. J. Witherspoon,* S. Wooding,† A. R. Rogers,‡ E. E. Marchani,* W. S. Watkins,* M. A. Batzer,§ and L. B. Jorde*,1

La proporción de la variación genética humana debido a las diferencias entre las poblaciones es modesta, los individuos de diferentes poblaciones pueden ser genéticamente más similares que los individuos de la misma población. Aun así suficientes datos genéticos pueden permitir una clasificación precisa de los individuos en las poblaciones. Ambos hallazgos pueden obtenerse del mismo conjunto de datos, utilizando el mismo número de loci polimórficos. Este artículo explica por qué. El análisis se centra en la frecuencia, ω, con la que un par de individuos aleatorios de dos poblaciones diferentes es genéticamente más similar que un par de individuos seleccionados al azar de cualquier población única. Se compara ω con las tasas de error de varios métodos de clasificación, utilizando conjuntos de datos que varían en el número de loci, la frecuencia alelo promedio, las poblaciones muestreadas y la estrategia de determinación del polimorfismo. Se demuestra que los métodos de clasificación alcanzan mayor fuerza discriminatoria que ω debido al uso de las propiedades agregadas de las poblaciones. El número de loci analizados es la variable más crítica: con 100 polimorfismos, es posible una clasificación exacta, pero ω sigue siendo considerable, incluso cuando se utilizan poblaciones tan distintas como los africanos subsaharianos y los europeos. Por lo tanto, se puede esperar que los fenotipos controlados por una docena o menos de loci muestren una superposición sustancial entre las poblaciones humanas. Esto proporciona una justificación empírica de precaución cuando se utilizan etiquetas de población en entornos biomédicos, con amplias implicaciones para la medicina personalizada, la farmacogenética y el significado de raza.

LAS DISCUSIONES de las diferencias genéticas entre las principales poblaciones humanas han estado dominadas por dos hechos: (a) Estas diferencias representan sólo una pequeña fracción de la varianza en las frecuencias de los alelos, pero sin embargo (b) las estadísticas multilocus asignan la mayoría de los individuos a la población correcta. Esto se entiende ampliamente como reflejo del aumento del poder discriminatorio de las estadísticas multilocus. Sin embargo, Bamshad et al. (2004) demostraron, utilizando estadística multilocus y cerca de 400 loci polimórficos, que (c) parejas de individuos de diferentes poblaciones son a menudo más parecidas que parejas de la misma población. Si las estadísticas multilocus son tan poderosas, ¿cómo podemos entender este hallazgo?

Las tres afirmaciones enumeradas anteriormente aparecen en disputas sobre la importancia de la variación de la población humana y la "raza". En particular, la Asociación Americana de Antropología (1997, p.1) afirmó que "los datos también muestran que dos individuos dentro de una población en particular son tan diferentes genéticamente como dos personas seleccionadas al azar de cualquier par de poblaciones en el mundo" (después corrigió a "casi tan diferente "). Del mismo modo, el material educativo distribuido por el Human Genome Project (2001, pág 812) establece que "dos individuos seleccionados al azar de cualquier grupo son casi tan diferentes [genéticamente] como dos individuos en todo el mundo". Anteriormente, se podría haber juzgado que estas afirmaciones eran esencialmente correctas para los caracteres de locus único, pero no para los multilocus. Sin embargo, el hallazgo de Bamshad et al. (2004) sugiere que una investigación empírica de estas afirmaciones está justificada.

En lo que sigue, se utilizan varias colecciones de loci genotipados en varias poblaciones humanas para examinar la relación entre las afirmaciones a, b y c anteriores. Estos conjuntos de datos varían en el número de loci polimórficos genotipados, las estrategias de muestreo de la población, los métodos de determinación de polimorfismo, y las frecuencias alelo promedio. Para evaluar la afirmación c, definimos ω como la frecuencia con la que un par de individuos de diferentes poblaciones es genéticamente más similar que un par de la misma población. Se demuestra que la afirmación c, la observación de ω alto, se mantiene con pequeñas colecciones de loci. Se mantiene incluso con cientos de loci, especialmente si las poblaciones muestreadas no han estado aisladas unas de otras durante mucho tiempo. Se descompone, sin embargo, con conjuntos de datos que comprenden miles de loci genotipados en poblaciones geográficamente distintas: En tales casos, ω pasa a ser cero. Los métodos de clasificación también producen altas tasas de error con pocos loci y casi sin errores con miles de loci. Sin embargo, a diferencia de ω, las estadísticas de clasificación hacen uso de las propiedades agregadas de las poblaciones, de modo que pueden acercarse al 100% de precisión con tan sólo 100 loci.

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1893020/