Fernando Tadao Ito

Formação

  • (2010-2015) Bacharelado em Ciência da Computação
    • Universidade Federal de São Carlos (UFSCar)
  • (2015-2018) Mestrado em Ciência da Computação
    • Universidade Federal de São Carlos (UFSCar)

Projetos no LALIC

  • 2015-2018
    • Título do projeto: Representação multimodal para classificação de informação
    • Nível: Mestrado
    • Resumo da Dissertação: O significado mais básico de "multimodalidade'' é a utilização de múltiplos meios de informação para compor um "artefato'', um objeto criado pelo homem que expressa um conceito. Em nosso dia-a-dia, diversos meios de comunicação expressam conceitos a partir de multimídia: notícias com narração, vídeos e textos auxiliares; peças de teatro que contam uma história a partir de atores, gestos e músicas; jogos eletrônicos que utilizam os gestos físicos do jogador como ações, e respondem com sinais visuais ou musicais. Para interpretar tais "artefatos'', temos que extrair informações de múltiplos meios de informação e combiná-los matematicamente. A extração de características é feita a partir de modelos matemáticos que recebem um dado bruto (textos, imagens, sinais de áudio) e o transforma em um vetor numérico, onde a distância entre instâncias denota a sua relação: dados próximos codificam significados similares. Para criar um espaço semântico multimodal, utilizamos modelos que "fundem'' as informações de múltiplos tipos de dados. Neste trabalho, investigamos a interação entre diferentes modos de representação de informação na formação de representações multimodais, apresentando alguns dos algoritmos mais usados para a representação vetorial de textos e imagens e como fundi-los. Para medir a performance relativa de cada combinação de métodos, utilizamos tarefas de classificação e similaridade em bancos de dados com imagens e textos pareados. Verificamos que, em nossos conjuntos de dados, diferentes métodos de representação unimodal podem levar a resultados vastamente diferentes. Também notamos que a performance de uma representação na tarefa de classificação de dados não significa que tal representação não codifique o conceito de um objeto, tendo diferentes resultados em tarefas de similaridade.
    • Agência financiadora: Esse projeto foi parcialmente financiado pelo CNPq e faz parte do projeto MMeaning (2016/13002-0) financiado pela FAPESP
    • Orientadora e Co-orientador: Profa. Dra. Helena de Medeiros Caseli e Prof. Dr. Jander Moreira
    • Link para a Dissertação: https://repositorio.ufscar.br/handle/ufscar/10365
  • 2015
  • Título do projeto: Desenvolvimento e aplicação de Deep Learning para classificação de imagens
  • Nível: Estágio
  • Breve descrição: Projeto consistiu em utilizar algoritmos de Aprendizado Profundo (Deep Learning), obtendo características de dados por meios automáticos, em classificação de imagens de produtos encontrados em e-commerces brasileiros. Estudos foram feitos em relação a métodos para pré-processamento de imagens para subsequente uso em uma Rede Neural Convolucional, pra classificá-los em categorias (eletrodomésticos, celulares, jogos, livros, etc).
  • Empresa financiadora: BooLabs
  • Orientador: Prof. Dr. Jander Moreira

Contato

  • f.tadaoito @ gmail.com

Currículo Lattes