Predicción de probabilidad de tipo de accidente por día, hora, Km. y calzada en 2021 del Km. 19 al 28 de Calle 30.
A continuación se describen los distintos pasos del modelo para llegar a las predicciones.
Dada la complejidad de Calle 30 (entradas, salidas, ramales, zonas soterradas, etc.), se ha seleccionado un tramo concreto para poder aplicar el modelo a una muestra. En concreto, se ha escogido el tramo comprendido entre el Km. 19 y el Km. 28 de Calle 30.
Para determinar el número de coches que pasan entre el Km. 19 y el Km. 28, se ha extraído la información de la ubicación de los puntos de medida del tráfico del Ayuntamiento de Madrid, que se puede descargar en la siguiente página:
De los medidores del archivo, en primer lugar, se han selecciondao los de vía interior o exterior (XC, PM1, PM2) entre los Km. 19 y 28. Cuando había 4 o más medidores en un kilómetro, se ha excogido solo dos para evitar duplicidades, tal y como se puede ver en el archivo.
En la tabla izquierda se pueden consultar los medidores finales seleccionados entre los Km 19 y 28. Ver archivo: UBICACIONES.
En el archivo de intensidad de tráfico original de 2016 a 2020, se detalla el número de coches que pasa por cada medidor cada 15 min. Para poder trabajar los datos por hora, se cogen los datos de los medidores entre el Km. 19 - 28 y se agrupan por hora, en lugar de cada 15 minutos.
Los datos de intensidad se han extraído de la información disponible en el siguiente link:
Ver archivo: INTENSIDADES_2016_2020
Se ha obtenido el detalle de los accidentes de tráfico de 2016 a 2020 en la siguiente fuente del Ayuntamiento de Madrid con el Histórico de incidencias y accidentes:
Para poder cruzar los datos de intensidad de tráfico con los accidentes, se han selecciondado los accidentes de 2016 a 2020 entre los Km.19 y 28 agrupados por hora, tal y como se puede ver en la imagen izquierda. Ver rchivo: ACCIDENTES_2016_2020.
Una vez cruzados los datos, de 2016 a 2020 tenemos unos 900 accidentes de un total de más de 800.000 mediciones del Km 19 al Km. 28.
Ver archivo: CRUCE_INTENSIDADES_ACCIDENTES_2016_2020
Por una parte, en el archivo anterior se agruparon los accidentes según los seis tipos que se han detectado entre 2016 y 2020:
Atropello
Colisión de vehículos
Otros
Salida de vía
Sin accidente
Vuelco
Ver archivo: CRUCE_INTENSIDADES_ACCIDENTES_2016_2020
Por otra parte, se ha elaborado otro fichero para la predicción de 2021 con la combinación de:
Todas las fechas de 2021 y horas
Kms.
Calzada interna y externa
Tipos de accidente
Ver archivo: M30_2021_PARA_PREDECIR
Los pasos que hemos seguido para crear el modelo en la herramienta de Machine Learnig BigML, han sido los siguientes:
Creación de los datasets dentro de BigML
Aplicación de OptiML para determinar cuál es el mejor modelo. El modelo recomendado por BigML es un ensemble/ random decision forest.
Evaluación del modelo.
(20% de test)
Con el modelo recomendado por BigML, se ha realizado un batch prediction para obtener las probabilidades de tipo de accidente por día, hora, calzada y Km. en 2021.
En la imagen izquierda aparece una muestra de los resultados numéricos. Ver archivo: Resultados_Prediccion_accidentes_2021.