Predicción de ausentismo de pacientes en turnos clínicos

Nahuel Almeira

Descripción

En esta mentoría trabajaremos con datos de una institución de salud de la Ciudad de Córdoba y la problemática que abordaremos será el ausentismo de los pacientes.

El ausentismo de los pacientes genera pérdidas económicas en la institución, ya que los turnos asignados que no se efectivizan suponen una distribución ineficiente de recursos. La relevancia económica es tal, que la problemática es ampliamente estudiada en todo el mundo.


El sistema de salud de Argentina presenta características que lo diferencian del resto de los países, particularmente de los sistemas europeos y norteamericanos, donde se realiza la mayor cantidad de investigación. Por eso, es importante estudiar datos de instituciones locales. En ese sentido, utilizaremos como referencia una tesis realizada con datos similares, correspondientes a una institución de la provincia de Buenos Aires.


Referencias:


D. H. Giunta, Ausentismo de pacientes a consultas programadas en un sistema de salud: estimación de tasas, identificación de factores asociados, causas y predicción. Tesis de Doctorado en Ciencias de la Salud (2019), Instituto Universitario y Hospital Italiano de Buenos Aires.

Trataremos de responder algunas de las siguientes preguntas:

Buscaremos identificar las variables que conllevan al ausentismo, y construir modelos que permitan predecir la probabilidad de que los turnos no sean atendidos. Evaluaremos la relevancia de cada conjunto de variables (administrativas, de pacientes, meteorológicas).

Con esta información, la institución podría implementar medidas específicas para intentar reducir la tasa de ausentismo, como por ejemplo, enviar recordatorios a los pacientes, redistribuir los horarios según los servicios, etc.


Dado que contaremos con comunicación con personal de la institución de salud, existe la posibilidad de obtener datos adicionales a los iniciales, en función de la necesidad. Además de la problemática propuesta, se pueden abordar otras, de acuerdo con la curiosidad de les estudiantes.

Los datos

Algunos datos serán entregados directamente a les estudiantes, para evitar hacerlos públicos. Si bien todos los datos personales estarán debidamente anonimizados y toda información potencialmente sensible será removida, tomaremos esa precaución. Otros datos estarán disponibles en el repositorio https://github.com/nahuelalmeira/ausentismo.

Hitos de la mentoría

22/6 práctico de análisis y visualización

Comenzaremos con un dataset reducido y curado, correspondiente al año 2019. Haremos un análisis exploratorio de las variables, usando estadística descriptiva. Luego intentaremos ver correlaciones entre variables, sobre todo, correlaciones con la variable objetivo.

19/7 práctico de análisis y visualización

Aquí trabajaremos con tres datasets diferentes. Uno de ellos con información de turnos (de carácter administrativa), otro con información de pacientes, y otro con información meteorológica. Extenderemos también el rango temporal de manera de cubrir varios años. Uniremos los tres conjuntos de datos en uno único y verificaremos que no haya inconsistencias. Discutiremos también sobre prácticas para el trabajo con datos sensibles.

16/8 práctico de introducción al aprendizaje automático

Haremos un modelo de clasificación básico, usando en principio todas las variables disponibles. Estudiaremos las métricas adecuadas para medir la performance de los modelos. Luego intentaremos evaluar el poder predictivo de cada variable.

13/9 práctico de aprendizaje supervisado.

Ampliaremos el práctico anterior utilizando técnicas un poco más avanzadas de machine learning (feature selection, feature engineering, cross-validation, y otros términos piolas en inglés)

27/9 práctico de aprendizaje no supervisado

Intentaremos ver si los turnos o los pacientes se agrupan en clusters distintivos, y si eso nos permite mejorar los modelos predictivos.

6/11/2020 – 7/11/2020 presentación de mentorías