Predicción automática de la dificultad de una tarea de búsqueda web mediante dinámicas de comportamiento en la formulación de consultas. 

Resumen: El uso de motores de búsqueda web se ha vuelto esencial para gran parte de la población mundial como parte de la resolución de tareas de búsqueda de información. En un motor de búsqueda web estándar, los usuarios expresan su consulta a realizar a través de una verbalización de ésta en una caja de búsqueda y si bien esta tarea puede parecer sencilla en un principio, el gran número de resultados que puede arrojar un motor de búsqueda y las dificultades que pueda experimentar el usuario a la hora de formular la consulta puede hacer que los resultados obtenidos de este proceso no sean relevantes a su necesidad de información, lo que podría traer frustración y al abandono de la tarea de búsqueda por parte del usuario.

Debido a lo anteriormente detallado, nace dentro del campo de recuperación de la información (IR) la necesidad de predecir automáticamente la dificultad de una tarea de búsqueda de información en contextos web, lo cual permitiría al motor de búsqueda ofrecer herramientas de ayuda, visualizaciones alternativas y reordenamiento de los resultados de búsqueda al identificar que el usuario está teniendo dificultades a la hora de formular su consulta.

El problema de la predicción de la dificultad de una tarea de búsqueda es un problema abierto y contingente, el cual ha sido abordado en trabajos anteriores utilizando técnicas de aprendizaje de máquina (conocido como Machine Learning) sobre el historial de acciones realizado durante la sesión de búsqueda. Este trabajo ofrece un acercamiento novedoso al utilizar los comportamientos durante la formulación de consulta (ej.: velocidad de escritura, cantidad de palabras escritas, cantidad de reformulaciones, cantidad de pausas, entre otras) además de la detección de patrones de teclado (conocida como Keystroke Dynamics) con el fin de predecir la dificultad de la tarea en el momento de terminar la formulación de la consulta en vez de al haber terminado la sesión de búsqueda (o una parte significativa de ésta).

El objetivo de este trabajo es generar un modelo que permite determinar de manera automática si una tarea de búsqueda es difícil (o no) para un usuario, considerando sus patrones de comportamiento durante la formulación de la consulta, sus características demográficas y otras variables asociadas.

Este trabajo se considera de carácter exploratorio, y para la construcción del modelo recién planteado se propone utilizar modelos de aprendizaje de máquina con datos capturados a través de un estudio de usuario en condiciones cuasiexperimentales. En dicho estudio de usuario, los participantes deberán realizar tareas de búsqueda simuladas, al mismo tiempo que se captura su historial de acciones sobre el sistema (entre ellas sus acciones durante la formulación de la consulta).

El aporte de este trabajo es ofrecer una mirada innovadora al proceso de predicción de la dificultad de una tarea de búsqueda web, permitiendo a los sistemas de búsqueda identificar las dificultades del usuario y desplegando sistemas de ayuda, lo que eventualmente permitiría la mejora de la experiencia de búsqueda por parte de los usuarios.