O TCC de Marília foi apresentado em 2018 e o projeto foi uma parceria com o professor Leandro Pernambuco, da Fonoaudiologia e está explicado aí embaixo.
A Inteligência Artificial cada vez mais colabora com outras disciplinas, como as de saúde, e tende a ser bem mais utilizada como ferramenta por profissionais da área.
O deslocamento do osso hióide é um dos principais componentes no estudo da deglutição, pois durante a realização do movimento deve ser observada sua integridade geral. Os especialistas detectam visualmente o osso hióide nos exames, como os de ultrasom, e traçam manualmente a sua posição. Sendo um trabalho minucioso, torna-se demorado e exaustivo.
O TCC de Marília, como uma parte do projeto, teve como objetivo desenvolver um método automático para localizar o osso hióide no exame de ultrassom. Para tanto, foi proposta a utilização de Deep Learning utilizando o método YOLOv3 , atual estado da arte para detecção, no formato mini (que tenta realizar a detecção em tempo real).
O estudo foi direcionado para dois tipos de exames de ultrassom, onde o primeiro acontece com o paciente em repouso, sem que haja de fato a deglutição, ou seja, o osso permanece estático, e o segundo tipo consiste no movimento de deglutição, onde os pacientes foram submetidos a ingestão de três tipos de líquidos: saliva, água e líquido pastoso, deslocando assim o osso hióide.
Desses dois tipos de exames que são gravados em vídeos, foram extraídos quadros (frames) de cada vídeo para que pudesse ser construída a base de dados a ser estudada. O estudo contou com 19 pacientes, e obteve uma base de dados de 420 imagens para o estudo dos casos em repouso e 429 imagens para o estudo do osso em movimento.
Em termos de comparação, a taxa de aprendizagem foi alterada para três valores: 0,0001, 0,001 e 0,01, para que pudesse ser observada como a rede se comporta com tal mudança. Foi possível notar que com a taxa de aprendizagem 0,0001, a rede não conseguiu aprender, quando a taxa de precisão encontrou-se menor que 50%, não sendo possível a exibição da caixa delimitadora do osso nas imagens.
Em contrapartida, ao aumentar a taxa de aprendizagem em 10 vezes em comparação à taxa padrão da YOLOv3 que é 0,001, pôde-se obter os melhores resultados, onde a precisão variou entre 97% e 100%.
A taxa de aprendizagem padrão da YOLOv3 mini também possibilitou a detecção do osso demarcado nas imagens de teste.
A ideia agora é estudar o problema em outras arquiteturas, para termos uma comparação de desempenho e resultado. Além disso é possível adotar a metodologia utilizada neste trabalho para solucionar outros problemas de detecção que utilizam exames de ultrassom, ou mesmo nesse, localizando outras estruturas envolvidas no processo de deglutição, permitindo que automatizemos o acompanhamento de todo o movimento criado.
O trabalho foi apresentado no WIML 2018 (https://wimlworkshop.org/2018/) e BRACIS 2019 (http://www.bracis2019.ufba.br/)