Predicción Univariante y Multivariante de los Principales Índices Financieros del Mundo

Sergio Martín Buzzi

Descripción

El objetivo central de esta mentoría es implementar modelos predictivos univariantes y multivariantes de series temporales y de aprendizaje automático (y combinaciones de ambos). Por medio de dichos modelos se intentará anticipar los movimientos de los los principales índices financieros del Mundo y si los mismos están interrelacionados. Además se buscará conocer si hay mercados líderes y seguidores.

Este tema es interesante porque…

Uno de los desafíos más interesantes de la mentoría consiste en que, al no ser demasiado grande la cantidad de observaciones, cabe preguntarse qué tipo de algoritmo funcionará mejor. Por una parte, los modelos de aprendizaje profundo poseen la capacidad de capturar patrones complejos y no linealidades, pero alcanzan a desplegar toda su potencialidad en datasets grandes. Por la otra parte, los modelos estadísticos de series temporales no requieren tanta información pero presentan cierta dificultad para modelar no linealidades o quiebres estructurales. De esto surge la posibilidad de combinar ambos metodologías y probablemente de mejorar los resultados por medio de ingeniería de features y transformaciones basadas en el conocimiento del área específica.

Trataremos de responder algunas de las siguientes preguntas:

¿Con qué nivel de precisión se pueden predecir los valores futuros de los valores de los índices financieros?

En el dataset bajo estudio, ¿cuál metodología funciona mejor?

¿Hay mercados que tienen comportamientos similares?

¿Están interrelacionados los mercados? Si es así, ¿Dicha interrelación es estable en el tiempo?

¿Existen mercados líderes?

Los datos

Si querés inspeccionar el conjunto de datos, lo encontrarás en: https://github.com/sergiobuzzi/MentoriaDiplodatos2020

En el archivo dataset.csv se proveen datos sobre los valores de cierre diario de 11 índices bursátiles (aproximadamente 20 años), y series de tipos de cambio para efectuar el análisis en una moneda común. Dicho dataset también contiene una serie de dólar "blue" para ajustar el tipo de cambio de Argentina en épocas de cepo cambiario.

Hitos de la mentoría

22/6 práctico de análisis y visualización, en cual se realizará una exploración de la base de datos, por medio del cálculo de medidas de estadística descriptiva; gráficos de evolución temporal y cálculo de correlaciones. También se tocarán temas como identificación de outliers "comunes" vs. identificación de outliers temporales y una intuición básica del concepto de raíz unitaria.

19/7 práctico de análisis y curación, que consistirá en la curación de la base de datos; imputación de faltantes; reconstrucción de serie de tipo de cambio de Argentina; expresión de los índices en moneda común y transformaciones de los datos.

16/8 práctico de introducción al aprendizaje automático, en el que se trabajará en la separación de datos en entrenamiento, validación y test; aplicación de métodos simples de machine learning para regresión univariante; selección de métricas y determinación de valores óptimos de los hiperparámetros.

13/9 práctico de aprendizaje supervisado, que consistirá en la estimación de modelos de serie temporales univariados y multivariados (ARMA, VAR, etc.) y la estimación empleado modelos de aprendizaje profundo para series temporales (ejm: LSTM). Comparación de resultados.

27/9 práctico de aprendizaje no supervisado, en el cual se aplicarán algoritmos de clustering de series de tiempo.

6/11/2020 – 7/11/2020 presentación de mentorías.