Otimização de Carteira de Ações com Aprendizado por Reforço

Projeto de Formatura 2023

 Aluno: Caio de Souza Barbosa Costa

Orientadora: Anna Helena Reali Costa

Contexto

Devido a alta volatilidade do mercado de ações, investidores estão constantemente fazendo uso de ferramentas que analisem as características do mercado e indiquem quais ações devem ser compradas ou vendidas. Entre essas ferramentas, o aprendizado de máquina se mostra extremamente promissor pelo fato de conseguir encontrar padrões complexos, algo que tem sido cada vez mais presente no cotidiano principalmente desde o advento do aprendizado profundo e dos seus bons resultados.

Entre essas possíveis ferramentas, tem-se a utilização de sistemas baseados em aprendizado por reforço. Esse tipo de paradigma se mostra muito apropriado para mercados financeiros pois, assim como um investidor tem o objetivo de alcançar lucro a longo prazo, um agente treinado com aprendizado por reforço tenta maximizar sua recompensa ao longo prazo (que, no caso do mercado financeiro, pode estar ligada ao lucro).

Entre as possíveis aplicações financeiras de sistemas baseados em aprendizado por reforço, há a possibilidade de utilizá-lo para otimizar carteiras de ações. Nesse problema, um agente deve, a cada instante de tempo, avaliar os principais indicadores do mercado relacionados a um certo portfólio de ações e definir a alocação percentual ideal de modo a obter maior lucro. Alguns trabalhos já estão aplicando aprendizado por reforço nesse problema e alcançando bons resultados.

Apesar dos bons resultados, poucas ferramentas open source existem para permitir que desenvolvedores e pesquisadores consigam reproduzir trabalhos e comparar suas novas arquiteturas com anteriores e este projeto explora essa lacuna, introduzindo alguns recursos para serem utilizados por entusiastas na área.

Objetivo

Este projeto tem o objetivo de  prover todas as ferramentas necessárias para que um pesquisador consiga compreender e se inserir na área de otimização de carteiras de ações com aprendizado por reforço por meio de 4 iniciativas.

Catalogação e classificação dos trabalhos relacionados à otimização de carteira de ações com aprendizado por reforço.

Desenvolvimento de um ambiente de simulação open source que simula as interações de agentes otimizadores de carteiras com o mercado.


Reprodução de arquiteturas relevantes para a área e de um algoritmo específico para treinar agentes otimizadores de portfólio. 


Análise da efetividade das arquiteturas em dois diferentes mercados: o americano e o brasileiro.


Dúvidas?

Entre em contato pelo e-mail caio326@usp.br para saber mais sobre o projeto.