IC-DRUGS

Inteligencia Computacional en descubrimiento de fármacos.

P18-RT-1193

Entidad Financiadora: Junta de Andalucia. Proyectos de excelencia.Investigador Principal: Pilar Martinez Ortigosa./ Juana López RedondoFinanciación: 95342,00 EurosNúmero de Investigadores:12Desde 14/01/2020 a 14/01/2023.

Resumen

En este proyecto se propone el estudio y diseño de algoritmos inteligencia computacional aplicados a problemas de bioinformática, principalmente relacionados con el descubrimiento de nuevos fármacos o compuestos bioactivos con relevancia biológica en biomedicina. Estos problemas se caracterizan por su elevado coste computacional, por lo que se analizarán e incluirán técnicas eficientes de computación de alto rendimiento sobre arquitecturas heterogéneas.

En concreto, el problema que se pretende abordar es el descubrimiento y mejora de fármacos mediante Cribado Virtual basado en compuestos bioactivos ya conocidos (ligandos).

Existen dos metodologías para realizar un proceso de Cribado Virtual: (i) Si se dispone de la estructura tridimensional de la diana terapéutica, bien obtenida por métodos experimentales (cristalografía de rayos X o RMN) o bien a través de la construcción de modelos por homología estructural, se sigue la metodología de diseño de ligandos basada en su estructura. Se incluyen aquí las técnicas de docking (intento de encontrar el "mejor” acoplamiento entre dos moléculas: una proteína y un ligando). (ii) En caso contrario, el Cribado Virtual se puede realizar mediante búsquedas "ligand-based", basadas en el análisis y comparación de diversos descriptores moleculares y datos de afinidad con respecto a ligandos conocidos, sin tener en cuenta la estructura de dicho receptor. Aquí se incluyen, entre otras, las técnicas de búsqueda de similitud mediante descriptores 2D/3D, QSAR (Quantitative Structure-Activity) y técnicas de shape matching (comparación de la forma global o parcial entre moléculas).

En este proyecto nos centraremos en el Cribado Virtual basado en ligandos (Ligand Based Virtual Screening, LBVS), en el que dado un conjunto de ligandos de referencia, habrá que identificar las conformaciones candidatas más similares o afines, de entre los millones existentes en una quimioteca virtual. Para ello, los algoritmos de Cribado Virtual, asocian una puntuación (calculada mediante una función de scoring) a cada una de las conformaciones incluidas en esa base de datos. En una fase posterior a este proyecto, las predicciones obtenidas con un valor de scoring elevado (las más afines) pasarán a una fase de refinamiento estructural molecular y posibles estudios in-vitro, en animales y finalmente se podría llegar a en ensayos clínicos en humanos. En este proyecto no se realizará la simplificación ampliamente utilizada de considerar los ligandos como moléculas rígidas, sino que se tendrán en cuenta que son flexibles debido a que tienen varios enlaces rotables. Esta consideración implica que la complejidad del problema a resolver se incremente considerablemente, si bien los resultados obtenidos serán mucho más eficaces. Para resolver problemas tan complejos se diseñarán los diferentes algoritmos para poder ser ejecutados eficientemente sobre arquitecturas de alto rendimiento.

Los métodos de inteligencia computacional que se van a utilizar para resolver este problema son por un lado algoritmos evolutivos en los que optimizará una o varias funciones de scoring, y por otro lado redes de aprendizaje profundo (en adelante Deep Learning) que aprenderán las características del ligando de referencia con el fin de poder reconocer proteínas similares dentro de bases de datos con millones de compuestos.

No existe una única función de scoring que obtenga por sí sola resultados de manera satisfactoria. Por este motivo se hace uso de varias funciones o descriptores.

Finalmente es importante destacar que para poder procesar grandes librerías con millones de conformaciones, los algoritmos de cribado deben ser lo suficientemente rápidos como para poder identificar las soluciones en un espacio de tiempo razonable. Para acelerar el proceso, se utilizan aproximaciones de las funciones objetivo. Durante el desarrollo de este proyecto, se desarrollarán y analizarán modelos de computación de altas prestaciones (balanceo dinámico de la carga, paradigmas de computación mixtos (GPU-CPU, threads-paso de mensajes, etc.)), así como otros mecanismos aceleradores de código, que resuelvan el problema sin renunciar a la calidad de la solución proporcionada.

Estos algoritmos se integrarán en una única herramienta (VSLB-flexible), disponible para toda la comunidad científica, así como una versión con características avanzadas.