O estudo de caso consiste na realização de experimentos envolvendo seis abordagens diferentes de cruzamento. A hipótese desses experimentos é que a utilização de AG como heurística para otimização de parâmetros é significativamente efetiva quando comparado com a geração aleatória de cenários. Dessa forma, em todos os cenários de teste, foram executados 6000 simulações de cruzamento, das quais 3000 são gerados de maneira aleatória, enquanto as restantes foram geradas a partir do AG. No total, foram executados aproximadamente, 40.000 simulações válidas, exigindo cerca de 150 horas de execuções contínuas de experimentos.
Como critério de parada padrão para a execução do Algoritmo Genético (AG), estabeleceu-se a realização de 30 gerações de populações, cada uma composta por 100 indivíduos distintos. Para simplificar a comparação, optou-se por empregar a mesma estrutura de execução de simulações no caso da geração de parâmetros de forma aleatória. Assim, tornou-se viável realizar uma comparação padronizada, utilizando dois conjuntos de 100 cenários: um gerado de maneira aleatória e o outro direcionado pelo AG.
A apresentação dos resultados é dividida em quatro partes pelas métricas de nível de risco, quantidade de acidentes, distância mínima entre veículos e quantidade de cenários inválidos.
Avaliação do Grau de Risco
Com base na função de risco que atribui um grau de risco no intervalo \([-1, 22]\) a cada cenário gerado, foi elaborada a Figura abaixo. Cada ponto das Figuras representam uma geração de 100 indivíduos do passo evolutivo do AG, sendo comparado com um conjunto de 100 cenários correspondentes que utilizam a heurística aleatória na geração dos parâmetros.
Como a métrica de risco é a própria função objetivo utilizada no AG. os diagrama das Figura ao lado evidenciam uma característica da otimização via AG, que é a não monotonicidade da função objetivo. Analisando o resultado do cenário B, é possível observar no intervalo das 10 primeiras gerações uma oscilação do resultado, tendo a quinta, sétima e oitava gerações do AG um ganho positivo em relação aos experimentos aleatórios, com as demais gerações com ganhos negativos. Esse mesmo comportamento é visto no cenário F, com a ligeira diferença que esse comportamento se estendeu até a geração 16.
Um resultado importante para todos os cenários é que a partir de alguns ciclos de otimização, a busca consistentemente revela ganhos significativos do AG em comparação com a abordagem aleatória. Nesses casos, foi constatado que para todos os cenários, as últimas 10 gerações, em geral, o AG apresenta um resultado superior no que diz respeito ao nível de risco, tendo a grande maioria dos casos significância estatística relevante. Nos cenários A, B, C e D, a convergência ocorre pelo menos até a metade do experimento, enquanto nos cenários E e F, a convergência é mais evidente nas gerações finais. Para essas situações, pode ser indicado a execução de gerações adicionais para validar a hipótese de melhora da convergência. Notavelmente, nos experimentos, a utilização do AG nos cenários A e D apresentam os melhores desempenhos em termos de velocidade de convergência, enquanto que os cenários C e E apresentam maior resistência, possivelmente associado à inicialização dos parâmetros de busca.
Quantidade de Colisões
Essa métrica visa simplificar a avaliação do nível de risco das simulações, uma vez que, no ambiente de controle desenvolvido, existe uma correlação positiva entre as simulações que ocorrem colisões e aquelas que quase as experimentam. Nesse contexto, a Figura ao lado mostra, para cada geração, a quantidade de colisões observadas. Um padrão notável é que, no caso aleatório, a média de todos os cenários permanece semelhando ao longo de todas as gerações, enquanto nos casos de AG, as gerações iniciais apresentam quantidades de colisões inferiores à média, sendo seguidas por aumentos consideráveis nas gerações finais.
Apesar desse padrão de comportamento dos resultados de cenários via AG, nota-se que não há diferença significativa na quantidade de colisões totais entre os cenários de teste A, D e E Nesse sentido, a Tabela \ref{tab:colisoes_fracoes} foi elaborada para facilitar a análise do efeito evolutivo nos experimentos. Essa tabela fraciona a quantidade de colisões das 30 gerações em apenas três grupos equitativos - primeiro, segundo e último terço do total de gerações. Como a inicialização do AG utiliza a heurística aleatória, a dificuldade de convergência nas primeiras gerações é um resultado aceitável, observável nos cenários A, D, E e F. Entretanto, para todos os cenários, nota-se que os casos gerados pelo AG no último terço de gerações apresentam consistentemente um grau de risco mais elevado, em conformidade com a hipótese proposta.
Vale notar que dependendo do modelo gerado para função objetivo, as colisões podem não exercer um impacto substancial no grau de risco. Os experimentos apresentados têm uma alta correlação, porque, no intervalo do score de risco [-1, 22], a ocorrência de colisão adiciona um valor 10 no nível de risco.
Distância Mínima de Aproximação
Comparação da distância mínima considerando todas as simulações válidas nos 6 cenários
Comparação da distância mínima excluindo as simulações com colisões nos 6 cenários
A distância mínima é uma métrica que tem por objetivo avaliar a proximidade entre os veículos para mensurar de forma indireta o nível de risco das simulações. A atribuição de risco para a distância mínima depende do contexto da ação dos veículos, posto que em condições normais de tráfego, os veículos se aproximam, mas não necessariamente de forma arriscada ou agressiva. Uma vez que o contexto dos experimentos forçam o confronto entre veículos na zona de conflito em ações de cruzamento e conversão, a distância mínima é uma forma de aferir a agressividade de aproximação entre eles. Nesse sentido, as Figuras acima mostram curvas médias das distâncias mínimas de aproximação entre os dois veículos avaliados, sendo a Figura esquerda a média considerando todos os cenários válidos dos experimentos, enquanto a Figura direita desconsidera as simulações que resultaram em colisões. O objetivo dessa diferenciação é conseguir avaliar as situações de quase acidentes, já que a ocorrência de colisão já são situações de aproximação mínima entre os veículos.
Como apresentado nas subseções anteriores, o padrão de comportamento de todos os cenários que utilizam AG evoluem para o aumento do risco, com a redução da distância mínima à medida que mais gerações são executadas. Em comparação, as médias de gerações que utilizam a heurística aleatória orbitam ao redor da média global de seus respectivos experimentos completos. Das Figuras, observa-se um resultado não tão positivo do ponto de vista de aumento de risco, em que, principalmente para o caso de distância mínima sem colisão, a média dos cenários D e F apresentam um aumento da distância mínima no grupo das gerações finais. Esse resultado pode ser consequência da abordagem evolutiva de busca AG, em que conjuntos de indivíduos menos aptos podem ser criados. Finalmente, os cenários A, B, C e E apresentam um comportamento mais aderente com o objetivo do projeto.
Quantidade de Inválidos
Devido às particularidades da técnica de geração de cenários, existe uma parcela significativa de cenários gerados que não resultam em uma simulação executável. Como uma medida adicional para avaliar a eficiência do AG, também foi construída uma análise que destaca a eficácia da heurística. Para esse trabalho, define-se eficácia como uma taxa de aproveitamento dos cenários testados, ou seja, quanto maior a quantidade de simulações válidas em relação a um número fixo de testes, maior é a eficácia.
Assim como nas análises de colisões, a Figura ao lado resume a quantidade de cenários inválidos por simulação. De maneira análoga, a heurística aleatória apresenta um comportamento próximo tanto de uma distribuição uniforme ao longo das gerações, quanto da média global. Todavia, existe uma tendência dos experimentos que utilizam AG de reduzir significativamente a quantidade de cenários inválidos conforme o avanço das gerações. Vale notar que no cenário de teste F não houve um ganho significativo, sugerindo que, potencialmente, a descrição formal desse cenário é mais restrita em relação ao mapa utilizado para a geração dos experimentos. A confirmação dessa hipótese requer a realização de mais experimentos com a mesma descrição, tanto no mapa utilizado para esse estudo de caso, quanto em outros mapas.
A utilização do AG por todas as formas de avaliação, portanto, se mostrou efetiva na melhora da eficácia no processo de geração de cenários com maior grau de risco.
Para saber mais sobre as conlusões as possibilidades de trabalhos futuros, clique no link acima