Karina Mayumi Johansson
Projeto no LALIC
Título do projeto: Investigação do uso de word embeddings para cálculo de similaridade em memórias de tradução
Nível: Iniciação Científica
Breve descrição: A estratégia tradicionalmente utilizada pelas ferramentas CAT para casamento (do inglês, matching) entre os segmentos da sentença sendo traduzida e os segmentos presentes na memória de tradução consideram a intersecção (ou sobreposição) nas sequências de palavras (n-gramas) presentes nos segmentos de texto em comparação. Contudo, essa estratégia não é capaz de capturar similaridade semântica além do nível trivial. Deste modo, este projeto tem como objetivo investigar a aplicabilidade de word embeddings mono e bilíngues para implementar o casamento. Deste modo, este trabalho surge como a primeira iniciativa de investigação neste contexto.
Orientadora: Profa. Dra. Helena de Medeiros Caseli
Contato
karina dot mayumi at estudante dot ufscar dot br