Sobre FASTPARSE
La popularización de la tecnología de la información e Internet ha resultado en un crecimiento sin precedentes de la escala a la que individuos e instituciones generan, comunican y acceden a la información. En este contexto, el uso efectivo de la vasta cantidad de datos disponibles para descubrir y responder a las necesidades de la gente es un problema fundamental de las sociedades modernas.
Puesto que la mayoría de esta información circulante está en forma de lenguaje humano escrito o hablado, las tecnologías de procesamiento de lenguajes naturales (PLN) son un recurso clave para este objetivo crucial. Este PLN puede ser usado para romper barreras del lenguaje (traducción automática), encontrar la información requerida (motor de búsqueda, búsqueda de respuestas), monitorizar la opinión pública (minería de datos) o convertir largas cantidades de texto no estructurado en un formato más conveniente (extracción de la información, recapitulación), entre otras aplicaciones.
Estas y otras tecnologías PLN dependen de la exactitud del análisis sintáctico para extraer o analizar el significado de las oraciones. Desafortunadamente, los algoritmos para el análisis sintáctico más avanzados tienen en la actualidad altos costes computacionales, procesando menos de cien oraciones por segundo en hardware estándar. Mientras esto es algo aceptable para trabajar con conjuntos pequeños de documentos, es claramente prohibitivo para el procesamiento a gran escala, lo que constituye una gran barrera para la aplicación generalizada del PLN.
El objetivo de este proyecto es eliminar este cuello de botella a través del desarrollo de analizadores sintácticos veloces que resulten adecuados para el procesamiento a escala de web. Para ello, FASTPARSE mejorará la velocidad de los analizadores en varios frentes: evitando cálculos redundantes a través de la reutilización de resultados intermedios de oraciones previas; aplicando un modelo inspirado en los procesos cognitivos para comprimir y recodificar información lingüística; y explorando regularidades en el lenguaje humano para encontrar modelos que los analizadores sintácticos puedan dar por supuesto, evitando su cálculo explícito. La aplicación conjunta de estas técnicas resultará en analizadores sintácticos mucho más rápidos que pueden impulsar toda clase de aplicaciones de las técnicas PLN a escala web.