Grupo de Inteligencia Artificial - PUCP
Grupo de Inteligencia Artificial - PUCP
WAIMLAp 2025
30 y 31 de Octubre 2025, Lima-Perú
Profesor asociado en la Facultad de Ingeniería de la Universidad de La Sabana. Es experto en Ciencia de Datos e Inteligencia Artificial. Sus enfoques de investigación son la eficiencia en procesos de selección de modelos de machine learning (AutoML) y la inferencia de relaciones causales. Es autor principal de la biblioteca Naive AutoML, una biblioteca competetiva para la selección de modelos de ML, y co-autor de la biblioteca de Causality Game. Obtuvo su doctorado en 2016 de la Universidad de Paderborn, Alemania
Tema: Agentes de Inferencia Causal
Los agentes de inferencia causal son sistemas inteligentes diseñados para descubrir y razonar sobre relaciones de causa y efecto mediante la interacción activa con su entorno. A diferencia de los modelos puramente predictivos, estos agentes no se limitan a detectar relaciones estadísticas en datos observacionales, sino que ejecutan intervenciones y experimentos para identificar cómo las variables se influyen entre sí. Un desafío central en su desarrollo es la validación del desempeño, ya que esta requiere intervenciones reales en el entorno, las cuales pueden resultar costosas o incluso inviables. Por ello, resulta fundamental contar con entornos sintéticos de evaluación que permitan probar sus capacidades de manera controlada. Esta charla presenta The Causality Game, un entorno diseñado para medir la capacidad de los agentes de descubrir relaciones causales y analizar los costos asociados a dicho proceso.
Ingeniero Electrónico por la URP-Perú (1981), con maestría (1992) y doctorado (1998) por la Universidad Federal de Minas Gerais (UFMG), Brasil. Desde 1992, ha ocupado cargos de investigación y docencia en la PUC Minas.
Los intereses de investigación del profesor Zárate incluyen el descubrimiento de conocimiento a partir de datos. Sus principales áreas de aplicación han sido la industria siderúrgica, las finanzas, la salud, la educación y el cambio climático. Actualmente, está interesado en la investigación de metodologías asertivas para el descubrimiento de conocimiento válido a partir de bases de datos, descubrimiento de causalidad, bi y tri clusterización, outliers extremos y la explicabilidad de modelos. Es autor de más de 250 artículos publicados en revistas y congresos. Ha coordinado y participado en más de 50 proyectos de investigación. Es supervisor de tesis doctorales y de maestría, así como supervisor de estudiantes de investigación de pregrado. Fue coordinador del Programa de Posgrado en Ciencia de la Computación de la PUC Minas Gerais y, en 1999, fundó el Laboratorio de Inteligencia Computacional Aplicada (LICAP), cuyo principal objetivo es desarrollar teorías y métodos para el avance de la ciencia de datos y su aplicación a problemas del mundo real.
Tema: ¿Cómo obtener modelos representativos de aprendizaje automático en diferentes dominios?
La ciencia de datos es un campo interdisciplinario que integra el método científico, la estadística, los algoritmos y el análisis de datos estructurados y no estructurados para encontrar soluciones en una amplia variedad de contextos y dominios. Su objetivo principal es obtener conocimiento preciso a partir de hechos y evidencias expresados en datos.
En la práctica profesional, se observa que los responsables de proyectos de ciencia de datos a menudo se apresuran a encontrar patrones y construir modelos computacionales mediante herramientas comerciales. Sin embargo, en la práctica, no se dedica suficiente tiempo a comprender el dominio del problema y, en consecuencia, el conocimiento extraído puede ser incorrecto o irrelevante.
Esto ha llevado a muchos principiantes en el campo a creer que la ciencia de datos y el aprendizaje automático son capaces de realizar "alquimia de datos", transformando cualquier conjunto de datos en conocimiento preciso, útil y no obvio.
En esta charla, además de las aplicaciones del aprendizaje automático en diversos dominios de problemas, abordaremos los aspectos relevantes para la obtención de modelos representativos.
Silvio J. F. Guimarães holds a Ph.D. in Computer Science from the Federal University of Minas Gerais (2003) and a joint Ph.D. in Informatique - Université de Marne-la-Vallée (2003). He is currently Associate Professor IV at the Pontifical Catholic University of Minas Gerais (PUC Minas). He has experience in Computer Science, working mainly in digital video analysis and processing, mathematical morphology, digital image processing and information retrieval. He is the head of Special Commission for Computer Graphics, Image Processing and Pattern Recognition of the Brazilian Computer Society and Senior Editor of the Journal of the Brazilian Computer Society.
Tema: Recent Advances in Optical Microscopy Image Analysis: Detecting parasites and classifying cells
Salient Object Detection (SOD) methods can locate objects that stand out in an image, assign higher values to their pixels in a saliency map, and binarize the map outputting a predicted segmentation mask. The necessity of abundant annotated data and complex network architectures presents a significant challenge in deep-learning Salient Object Detection (deep SOD) and across the broader deep-learning landscape. This challenge is particularly acute in medical applications in developing countries with limited computational resources. Recent findings demonstrate that coupling a FLIM encoder with an adaptive decoder creates a flyweight network suitable for SOD, requiring significantly fewer parameters than lightweight models and eliminating the need for backpropagation. A recent tendency is to investigate pre-trained lightweight models rather than deep neural networks in SOD tasks, coping with applications under limited computational resources. In this context, we have investigated lightweight networks using a methodology named Feature Learning from Image Markers (FLIM), which assumes that the encoder's kernels can be estimated from marker pixels on discriminative regions of a few representative images. Moreover, we Cellular Automata (CA) methods have proven successful in data-scarce scenarios but require proper initialization --- typically through user input, priors, or randomness. We propose a practical intersection of these approaches: using FLIM networks to initialize CA states with expert knowledge without requiring user interaction for each image. By decoding features from each level of a FLIM network, we can initialize multiple CAs simultaneously, creating a multi-level framework. For instance, we have used FLIM for detecting parasites in images. Another very important application regarding microscopy image analysis is related to Oral Epithelial Dysplasia (OED), which is a histopathological diagnosis for potentially malignant lesions with a variable risk of malignant transformation. The conventional grading of OED relies on morphological assessment, a process known for significant inter-observer variability, which limits its prognostic reliability. For coping with this problem, we have used transport-based morphometry applied to a superpixel image.