21 de Noviembre
Una presentación de la Ley de Benford desde su descubrimiento como ley natural por Newcomb a fines del SXIX, su interpretación en términos de invariancia de escala y sus aplicaciones en la detección de fraudes.
7 de Noviembre
En esta charla presentaré un modelo matemático para estudiar el comportamiento celular conocido como quimiotaxis y que tiene en consideración el comportamiento de sustancias químicas tanto en la membrana celular como en el exterior/interior de esta. El resultado es un sistema de ecuaciones con derivadas parciales considerado en un dominio que evoluciona con el tiempo, lo que complica enormemente el analisis de la solución, tanto a nivel analítico como numérico. El hecho que el dominio evolucione con el tiempo obliga a formular el problema en un contexto funcional distinto del clásico. Mostraré cuál es entonces la noción correcta de solución así como resultados de existencia y unicidad de solución para el problema original. Dichos resultados se obtuvieron en un trabajo conjunto con A. Alphonse y C. Elliott. Este método de interpretar la solución también permite analizar numericamente el sistema. Haré referencias a algunos trabajos donde se implementa este proceso, aunque a modelos simplificados.
24 de Octubre
Gradient Boosting Machines (GBM) is a general purpose supervised learning method that achieves the highest accuracy on a wide range of datasets in practical applications. Deep learning is all the hype now, but apart from specific domains such as images or speech, it is usually outperformed by Gradient Boosting in a majority of general business domains and supervised learning applications.
In the past few years, Gradient boosting Machines are present in most of winner solutions for Machine Learning contests, like a new "default" technique. This talk will introduce the main ideas about this technique, in an incremental way, starting from a simple decision tree. Also we will discuss about some available libraries who implement it, applied to a "real life" use case.
10 de Octubre
El problema de Coulomb de pocos cuerpos es útil para realizar simulaciones en física atómica, el cual requiere resolver ecuaciones en derivadas parciales (EDP) multidimensionales. Para ésto, es necesario obtener la solución numérica de una secuencia de sistemas lineales densos de gran tamaño y el principal desafío en éste tipo de problemas es conseguir una dimensión para la cual los errores numéricos sean “aceptables”, sin realizar muchos cálculos innecesarios. En esta charla voy a introducir el concepto de matrices latentes: matrices con una estructura en bloques que pueden ser factorizadas a medida que van siendo generadas, ahorrando mucho tiempo en la creación y resolución de nuestros sistemas lineales. Presentaré una aplicación paralela desarrollada en los frameworks OmpSs y OpenMP y voy a mostrar algunos resultados de performance.
26 de Septiembre
En esta charla presentaremos los Weighted Finite Automata (WFAs) y los métodos espectrales para inducirlos a partir de ejemplos positivos. Los WFAs (que incluyen a los HMMs y a los PNFAs) permiten modelar procesos secuenciales y son usados en aplicaciones como reconocimiento del habla, language modeling, POS tagging, etc. Los métodos espectrales se presentan como una alternativa más eficiente a algoritmos clásicos como Expectation Maximization (EM) [1,2]. Presentaremos la intuición detrás del algoritmo espectral, y algunos experimentos aplicados al análisis sintáctico de lenguaje natural.
Referencias:
[1] Daniel Hsu, Sham M. Kakade, and Tong Zhang. A spectral algorithm for learning hidden markov models.
https://arxiv.org/abs/0811.4413
[2] Borja Balle, Xavier Carreras, Franco M. Luque, and Ariadna Quattoni.
Spectral learning of weighted automata. Machine Learning , 96(1-2):33-63, 2014.
12 de Septiembre
En la actualidad las imágenes satelitales son herramientas fundamentales para caracterizar los ecosistemas y detectar los cambios que en ellos ocurren. Esto se debe a que los sensores remotos monitorean en forma sistemática la superficie terrestre, a partir de lo cual es posible generar series de tiempo estacionales con información sobre el estado de actividad de la vegetación. Dichas series pueden ser traducidas a funciones matemáticas lo cual permite parametrizar los flujos de materia y energía en los ecosistemas.
Tópicos
29 de Agosto
El aprendizaje online puede llegar a ser una de las revoluciones más importantes en la educación en los últimos años . Ahora tenemos acceso a una vasta cantidad de recursos educativos de alta calidad, a distancia y muchas veces de forma gratuita. Pero el nuevo alcance de la educación tiene un costo: en cursos masivos es muy difícil para los docentes hacer un seguimiento personalizado y comprender la relación de los alumnos con los materiales del curso.
Utilizando machine learning podemos ayudar a docentes en la tarea de modelar el aprendizaje de cientos de estudiantes automáticamente. En esta charla trataremos los principales desafíos de la minería de datos educacionales y veremos dos tipo de clasificadores para estimar el conocimiento de un estudiante luego de interactuar con un curso online. Con redes neuronales recurrentes representaremos estudiantes y lecciones de un curso en un mismo espacio de embeddings para poder visualizar las trayectorias de aprendizaje a lo largo del tiempo.
29 de Junio
Existen diversos modelos de programación entera mixta que permiten resolver problemas de secuenciación (scheduling), pero sólo aplican a problemas de scheduling clásicos donde lo que se busca optimizar es el tiempo final de ejecución del schedule, o algún otro funcional relacionado a los tiempos de ejecución de las tareas.
En muchos dominios, la mayoría provenientes de la industria aero-espacial, el tipo de problema de scheduling que se presenta es sobre-requerido o sobre-dimensionado (planificación de adquisiciones de imágenes de satélites, planificación de servicios de antenas de estaciones terrenas, etc). En este tipo de problemas, lo que se desea optimizar es la cantidad de tareas que se puede incluir en el schedule. Además, presentan varias particularidades con respecto a los problemas clásicos.
En esta charla expondremos dos modelos de programación entera mixta para resolver problemas de scheduling clásicos, y mostraremos cómo es posible adaptarlos al caso de scheduling sobre-requerido (oversubscribed scheduling), tanto para el caso de recursos discretos como para el caso de recursos contínuos.
15 de Junio
Plants evolved a huge and diverse weaponery against herbivory, like toxic chemicals and mechanical defenses. Although such defenses do hinder herbivory, top-down control by predators is also very important to keep the population of many herbivores in check. Oddly enough, it is well documented that plant defenses can attenuate the predation pressure on herbivorous insects. In this talk we give some ideas about the relationship between each populations (plant-prey-predator) and propose a simple but realistic mathematical model to describe the coupled dynamics of populations of protected and unprotected plants, herbivores and predators. Among other things, this analysis has important consequences for developing a more effective way to control crop pests.
18 de Mayo
En un vehículo eléctrico híbrido con celdas de hidrógeno y baterías, el uso del recurso energético es importante si se desea maximizar la autonomía. Una administración adecuada de estos recursos es fundamental. En esta charla comentaré los detalles (matemáticos) de este trabajo en conjunto con ingenieros de la FCEFyN. Plantearé el problema inicial, los inconvenientes encontrados, las modificaciones y los resultados obtenidos.
18 de Mayo
PLN tiene como objetivo lograr una forma mas "natural" en la comunicación persona-máquina. Se busca esto mediante el procesamiento automático del lenguaje humano, i.e. cualquier idioma (oral o escrito) utilizado por los humanos para la comunicación. En las tareas que abarca PLN (desde cosas simples como correctores ortográficos hasta tareas de alta complejidad como traducción automática), el denominador común es la palabra y como representarla cuando se busca modelar el lenguaje humano mediante una máquina. Es importante que dichas representaciones tengan alguna noción de similaridad para poder medir distancia entre palabras. Para esto, se estudian distintas formas de representación mediante vectores que cumplan con este requisito a la hora de modelar lenguajes.
20 de Abril
En este trabajo se propone desarrollar un método para obtener topologías óptimas de mecanismos flexibles aplicados al diseño de nanoposicionadores piezoeléctricos. El método se fundamenta en el uso de la derivada topológica como indicador de la sensibilidad del problema ante un cambio topológico. El algoritmo desarrollado está basado en la representación geométrica del dominio mediante el uso de funciones de level-set. Esta metodología permite determinar la distribución de material óptima dentro de un dominio con el objetivo de conformar mecanismos flexibles accionados mediante materiales piezoeléctricos. Para la formulación del problema de optimización, se utiliza una función costo multiobjetivo con el fin de lograr una topología que maximice desplazamientos de un punto del dominio en múltiples direcciones.
30 de Marzo
Many caterpillar species have hairs that help them defend against predators (Sugiura and Yamazaki 2014) and parasitoids (Kageyama and Sugiura 2016). Both interactions strongly increase mortality, so why aren't all caterpillars hairy? Curiously, hairy caterpillars may be more attacked by parasitoids. One possible explanation for that is that hairy caterpillars may be preferred by parasitoids precisely because they are less susceptible to predation (Stireman and Singer 2003). Caterpillars more prone to predation would not sustain many parasitoid species, so they could, in fact, suffer less from parasitism than experiments indicate. Here we develop a model to analyze this system and try to proof that parasitoids specialists on their hosts could justify the proposed explanation.