El core de WIH está basado en un conjunto de memorias internas, cada una de las cuales modela un aspecto del conocimiento recolectado de los diálogos establecidos. Su combinación da una representación de la información intercambiada y de sus datos redundantes.
Las memorias que componen a WIH son: Memoria de Estructuras Parseada- EP-, Memoria de Estructura de Respuestas –ER- y la Memoria de Composición Transitoria-MCT-.
Los registros almacenados en la Memoria EP, contienen un conjunto de categorías lingüísticas secuenciadas. Las categorías son ordenadas una a continuación de otra de acuerdo al contenido de la frase procesada. El resultado de todo este proceso da como resultado una estructura parseada –EP- y un indicador que representa, el uso en los diálogos, de dicha estructura. Si por ejemplo establecemos una conversación con la palabra “Hola”, en la memoria EP se generará un registro como el siguiente:
En (1) se puede ver la estructura general de una EP, en donde: representa la ponderación, indicador de uso de dicha estructura y a continuación se concatenan, que representan las Categorías Léxicas con las que se encuentra implicada esta EP.
La Memoria ER funciona en base a los contenidos anteriormente aprendidos. Cada conversación establecida con WIH es almacenada internamente y transformada primero en una serie de EP’s, organizadas y vinculadas entre sí, dentro de una misma ER (ver figura 2). Si la ocurrencia de esta EP, dentro de la ER no existe, se genera una nueva EP y se la memoriza.
Debido a que puede existir más de una EP asociada a una misma ER, las EP relacionadas, se organizan cronológicamente dentro de la memoria ER acompañadas de un peso, el cual representa su frecuencia de uso. Dicho peso es actualizado a medida que se repite el uso de una misma estructura.
En la figura 2 se observa la forma de almacenamiento dentro de la memoria ER. Cada ER almacenada se la asocia a n EP’s, a las cuales denominaremos EPj. Las EPj están compuestas por una cadena de “Casos de Uso” -case1, case2…casen- los cuales representan las oraciones extraídas de las conversaciones mantenidas con WIH.
La variable yt representa el peso de la frecuencia de uso de dicha EP. El procedimiento de actualización de yt es realizado a través de la formula (3), en la cual el parámetro a es utilizado para regular el grado de aprendizaje, b controla la velocidad de aprendizaje y t representa la secuencia de eventos.
La memoria MCT, registra todas las EP, ER y su valor de ponderación. Esta memoria se utiliza como copia de seguridad de los diálogos originales. Una vez asimilado el conocimiento, esta memoria se borra.
López De Luise M.D. Morphosyntactic Linguistic Wavelets for Knowledge Management. In-Tech Open book “Intelligent Systems”, ISBN 979-953-307-593-7. Project WIH. 2011.
Hisgen D., López De Luise D., Rodríguez. P., 2010. Dialog Structure Automatic Modeling. MICAI 2010. 9th Mexican International Conference on Artificial Intelligence.
López De Luise M.D, Hisgen D, Soffer M, 2009. Automatically Modeling Linguistic Categories in Spanish. CISSE 2009.