Investigación

Optimización

En general mi área de interés es la Investigación de Operaciones y sus aplicaciones para la Ingeniería, la Gestión de Producción y la Toma de Decisiones, con un fuerte énfasis hacia la optimización.

Al referirme a optimización, quiero referirme específicamente a la tarea de encontrar valores para variables de un sistema complejo, que permitan que el desempeño del sistema sea el mejor posible. La forma en que se realiza esto, es mediante la maximización o minimización de una o varias funciones matemáticas, mientras se satisfacen ciertas restricciones que son impuestas por la naturaleza, estructura y funcionamiento del sistema estudiado, así como políticas que deban estar consideradas al encontrar una solución óptima para el sistema.

Tanto las restricciones como las funciones a maximizar o minimizar, son producto de un proceso creativo de modelar matemáticamente la realidad, o traducir sus características reales, en términos de elementos matemáticos. Esa representación o modelo de la realidad se convierte en el terreno en donde el optimizador, mediante métodos matemáticos adecuados a cada caso, logra encontrar esa combinación de variables que representa la mejor solución posible para el problema en ese sistema.



Minería de Datos / Aprendizaje Automático

YouTube Video


En el presente estoy investigando sobre el uso de la optimización, para el
aprendizaje artificial o automático (Machine Learning), con orientación a que ese
aprendizaje permita la minería de datos (Data Mining). El problema a tratar es el siguiente:


Se tiene una "Montaña de Datos", en el sentido de que se hace inmanejable para ser estudiada por un ser humano, en cuanto a examinación de los datos que se tienen. Sólo se visualizan y entienden, a la vez, una cantidad pequeña de datos. Pero en problemas de todo tipo, entre ellos problemas de bases de datos gerenciales (cómo se comporta un consumidor, en un módulo de CRM, por ejemplo), la cantidad de datos es inmensa, y con frecuencia la estadística descriptiva se queda corta para describir lo que ocurre en los datos.










Se quiere encontrar, en esa "montaña", algo de valor, llamémoslo "conocimiento", que es un "diamante" difícil de encontrar entre tanto "mineral" sin significado aparente. Se dispone entonces de modelos matemáticos que se diseñan con la intención de que tengan la capacidad de, luego de "recibir" esa montaña de información, conformar por si mismo una "idea" o "hipótesis" de cómo se comportan los datos. Ese proceso se denomina aprendizaje. En particular, el tipo de modelos que he estado trabajando, son "entrenados" de forma "supervisada", es decir, que se necesita de las respuestas correctas a las hipótesis que se plantea el modelo, para que éste, al "percibir" su equivocación, cambia su idea o hipótesis, para lograr dar la respuesta correcta.

Puede pensarse como un niño pequeño al que se le van señalando muchos objetos
en la casa, diciéndole "se toca" o "no se toca". Luego de acertar y equivocarse numerosas veces, el niño aprende, y la idea o hipótesis que se forma el niño le permitirá darse una idea sobre si un nuevo objeto que nunca antes había visto, efectivamente "se toca" o "no se toca". En los datos de comportamiento que se generan con las acciones del día a día en la sociedad humana, al aplicar minería de datos, se encuentra uno con patrones que difícilmente uno podría imaginarse de otra forma.


La optimización en mi investigación, está dirigida a minimizar los errores de aprendizaje de este niño. Muchos métodos existen para resolver este tipo de situaciones , pero mi énfasis están en aquellas cuya representación emula a las redes neuronales, y mi premisa de trabajo es buscar que la aplicación de mis métodos sea de fácil implementación, requiriendo de pocas decisiones arbitrarias por parte de quien desee utilizar los métodos. Este tipo de criterio, facilitará la masificación del uso de este tipo de herramientas, por profesionales no especializados en ésta área del conocimiento, en instituciones y organizaciones de diferente índole, ayudando a la toma de decisiones. Información histórica sobre las investigaciones en las que se ha basado mi trabajo puede encontrarse acá http://pages.cs.wisc.edu/~olvi/uwmp/pat_sep.html (sólo actualizado hasta 1995).


Proyectos

  1. Algoritmos para la construcción de clasificadores binarios (redes neurales artificiales y árboles de decisión) mediante el uso de modelos de optimización matemática (lineales, cuadráticos y enteros) que minimicen errores de clasificación de forma asimétrica. Estoy trabajando en esto con el Prof. Ubaldo García Palomares (PhD). Como característica novedosa, los algoritmos que estamos desarrollando tienen la propiedad de que el usuario puede escoger el máximo error que desea que el clasificador produzca, sobre la data de entrenamiento. Esto es de suma utilidad para aplicaciones en las que hay poca probabilidad de incurrir en over-fitting. La estructura del clasificador se va haciendo compleja según la estructura de los datos lo requiera. Adicionalmente, los modelos de optimización se pueden descomponer en varios, de tal forma que se puede decidir sobre número de variables y restricciones a ser resueltas. Para ver la versión preliminar de un artículo que ha sido aceptado ya en la revista Decision Support Systems, haga clic acá.
  2. Se desarrollaron con la Ing. Ana Serra, formas para implementar la metodología de AdaBoost o Apalancamiento, basándose en algoritmos Multi-superficie (MSM) como los definidos por O.Mangasarian y por García Palomares y mi persona.
  3.  Estoy tutoreando a la Ing. Adriana Torres, estudiante de la Maestría en Ing. de Sistemas, en un trabajo de este tipo. Introducirá el manejo de clasificación multicategoría, mediante el entrenamiento simultáneo de "n" redes neurales tipo perceptrón, donde "n" es el número de categorías a intentar predecir. Parte del trabajo implica el desarrollo de una metodología para facilitar el diseño de políticas públicas y estrategias de mercadeo, sobre la base de las superficies lineales generadas por este tipo de algoritmos, cuando son aplicadas sobre bases de datos que recogen el comportamiento de consumo de cierta población.
  4. Estoy trabajando en el uso de clasificadores binarios en casos aplicados para apoyar en el tratamiento de heridas crónicas, en la gestión de la producción, en diseño de políticas públicas, y en el diseño de estrategias de mercadeo.

También he trabajado en el desarrollo de metodologías para la sistematización de la elaboración de Mapas de Proceso (Diagramas de Definición de Procesos), sobre la base de documentación procedimental estandarizada, y su uso para el desarrollo de modelos dinámicos de procesos organizacionales, cumplimiento de estándares de calidad, y gestión orientada a procesos.

Actualmente tengo interés en aprender sobre:
  1. Optimización o Inteligencia por Enjambres de Partículas
  2. Modelaje de Cadenas de Valor
  3. Optimización Multi-Objetivo
  4. Clasificación Multi-Categoría

A continuación una presentación sobre las técnicas desarrolladas en mi proyecto:


Enfoques basados en programación lineal y entera mixta para la clasificación de patrones
ć
Orestes Manzanilla,
Jul 7, 2012, 9:33 AM
Ċ
Orestes Manzanilla,
Jul 7, 2012, 9:24 AM
Comments