El incremento exponencial en la generación de datos con un alto grado de variedad y complejidad, ha motivado el desarrollo de métodos, estrategias y herramientas para formular y resolver problemas de gran dimensionalidad, que requieren una enorme cantidad de recursos de cómputo tanto en memoria como en procesamiento. De esta manera, la ciencia de datos ha tenido un gran impulso para la extracción de conocimiento de los datos, con el apoyo de las áreas de inteligencia artificial como son el aprendizaje automático y el aprendizaje profundo. Además, la ciencia de datos se apoya en el cómputo de alto rendimiento para solventar los requerimientos de memoria y procesamiento.
En la plática se explicarán algunos métodos y herramientas que se aplican en las diferentes etapas en el procesamiento de datos masivos para extraer conocimiento, así como la aplicación de cómputo de alto rendimiento basado en procesadores gráficos.