Automação de infraestrutura de simulação para geração de datasets orientados a situações de condução críticas

Gabriel Kenji Godoy Shimanuki - C16

Esse site se destina à apresentação do projeto de formatura para graduação em Engenharia de Computação na Escola Politécnica da USP

Esse TCC foi desenvolvido no âmbito do programa de pré-mestrado do módulo de Pesquisa em Engenharia de Computação, desempenhando um papel fundamental para o aperfeiçoamento da futura tese de mestrado a ser desenvolvida no próximo ano.

Introdução

A pesquisa em Inteligência Artificial (IA) vem sendo desenvolvida nas últimas décadas, possibilitando a sua aplicação em diversos campos, incluindo a automação do processo de condução veicular a partir de algoritmos de controles inteligentes - embarcados no próprio veículo - que possibilitam a criação de Veículos Autônomos (VAs). O principal objetivo desse tipo de veículo é a redução das taxas de acidentes e riscos relacionados à condução insegura, que têm, em grande parte, associação às falhas humanas.

A aplicação de algoritmos de aprendizado de máquina, especialmente redes neurais, é um dos métodos mais frequentemente empregados na condução automatizada. Essa técnica é marcada pela necessidade de vastos conjuntos de dados e pela demanda significativa de capacidade computacional para treinar a rede com um propósito específico. Como VAs são sistemas de segurança crítica - ou seja, falhas podem levar a consequências graves, que incluem perda de vida, danos ao meio ambiente ou perdas financeiras significativas - é fundamental que a confiabilidade do algoritmo de controle seja garantida a partir de treinamento e testes adequados compatíveis com os níveis da importância desses sistemas.



Motivação

O desenvolvimento de VAs é um desafio complexo e desafiador, sobretudo na garantia da qualidade do sistema de controle. Isso decorre da disparidade entre o ambiente utilizado para o treinamento e o ambiente real em que esses veículos operam, podendo ocasionar comportamentos não confiáveis e comprometer a segurança física desses sistemas.

Para garantir a segurança desses veículos durante a condução, é necessário que seus controles tenham acesso a grandes quantidades de dados e cobertura abrangente para treinamento e avaliação de segurança. A coleta de dados é essencial para garantir que os controles dos veículos autônomos sejam capazes de lidar com situações críticas de alto risco de acidentes. Existem duas alternativas mais comumente utilizadas para a obtenção desses dados:  condução de veículos instrumentalizados com sensores e câmeras por diferentes cenários e situações, ou a utilização de simuladores que emulam essa atividade. Apesar da existência de campos de teste como o MCity da Michigan University (2015), ou da Waymo, localizado em uma antiga base da força aérea no estado da americano da Califórnia (2018), a utilização apenas da geração de dados física tende a apresentar uma cobertura insuficiente, pois os casos de quase acidentes, incluindo as manobras evasivas que as evitaram são proporcionalmente raros. Além disso, a coleta forçada dessas situações críticas em ambientes reais e urbanos é contraprodutiva, custosa e perigosa, tendo em vista os potenciais riscos envolvidos. A virtualização desse processo, mediante utilização de simuladores de tráfego de ambiente controlado tem se mostrado uma alternativa promissora, possibilitando maior segurança, economia e escalabilidade, sendo a grande maioria dos estudos da área suportadas por simuladores de tráfego.

Objetivo

O objetivo principal deste projeto é desenvolver uma metodologia para gerar automaticamente casos críticos, ou corner cases, com o intuito de contribuir para pesquisas futuras no desenvolvimento de sistemas de controle veicular mais robustos, baseados em cenários de condução de maior risco. Utilizando uma estrutura que extrai casos de condução arriscada de situações de tráfego comumente referenciadas na literatura, o projeto visa incrementar a geração de dados que representem situações de risco elevado, sendo desenvolvido em ambiente simulado. A principal abordagem utilizada envolve o emprego do Algoritmo Genético (AG) para otimizar a busca por cenários de risco. Juntamente com a implementação da infraestrutura de simulação, a pergunta de interesse a ser respondida por esse trabalho é:

Justificativa

A proposta de trabalho tem por objetivo explorar a utilização de algumas técnicas baseadas em heurísticas para a geração de dados sintéticos, particularmente aqueles de difícil obtenção. O intuito é contribuir para o aprimoramento do desenvolvimento de controles de veículos autônomos. O foco da pesquisa está em investigar a relevância dessas técnicas sob o ponto de vista da construção de um ambiente que consiga gerar dados sintéticos de maneira simplificada, aplicável a diversos domínios da robótica autônoma.

A importância dessa pesquisa reside no fato de que treinamentos e testes baseados em simulações virtuais exigem um grande número de casos críticos, que raramente ocorrem em ambientes naturais de condução. Vale ressaltar que esses casos são raros em ambientes convencionais de condução. O uso de casos críticos pode ajudar a mitigar ou prevenir potenciais riscos de colisão, possibilitando a construção de datasets enriquecidos para treinamento de controles de veículos autônomos mais robustos, reduzindo, assim, a incidência de conduções com algum grau de risco que resultam em acidentes ou quase-acidentes. A diminuição de acidentes em escala mundial não apenas possui um impacto econômico significativo, mas também repercute de maneira relevante no âmbito social, contribuindo para a preservação da vida. A proposta de trabalho, por fim, é pertinente para a área de desenvolvimento de sistemas de segurança crítica aplicada em veículos autônomos.

Para saber mais como o projeto foi desenvolvido, clique no link acima.

APOIO

Este trabalho foi realizado com o apoio do Itaú Unibanco S.A., por meio do Programa de Bolsas Itaú (PBI), vinculado ao Centro de Ciência de Dados da Escola Politécnica da Universidade de São Paulo