Fernando Tadao Ito

Formação

(2010-2015) Bacharelado em Ciência da Computação
- Universidade Federal de São Carlos (UFSCar)
(2015-2018) Mestrado em Ciência da Computação
- Universidade Federal de São Carlos (UFSCar)

Projetos no LALIC

2015-2018
- Título do projeto: Representação multimodal para classificação de informação
- Nível: Mestrado
- Resumo da Dissertação: O significado mais básico de "multimodalidade'' é a utilização de múltiplos meios de informação para compor um "artefato'', um objeto criado pelo homem que expressa um conceito. Em nosso dia-a-dia, diversos meios de comunicação expressam conceitos a partir de multimídia: notícias com narração, vídeos e textos auxiliares; peças de teatro que contam uma história a partir de atores, gestos e músicas; jogos eletrônicos que utilizam os gestos físicos do jogador como ações, e respondem com sinais visuais ou musicais. Para interpretar tais "artefatos'', temos que extrair informações de múltiplos meios de informação e combiná-los matematicamente. A extração de características é feita a partir de modelos matemáticos que recebem um dado bruto (textos, imagens, sinais de áudio) e o transforma em um vetor numérico, onde a distância entre instâncias denota a sua relação: dados próximos codificam significados similares. Para criar um espaço semântico multimodal, utilizamos modelos que "fundem'' as informações de múltiplos tipos de dados. Neste trabalho, investigamos a interação entre diferentes modos de representação de informação na formação de representações multimodais, apresentando alguns dos algoritmos mais usados para a representação vetorial de textos e imagens e como fundi-los. Para medir a performance relativa de cada combinação de métodos, utilizamos tarefas de classificação e similaridade em bancos de dados com imagens e textos pareados. Verificamos que, em nossos conjuntos de dados, diferentes métodos de representação unimodal podem levar a resultados vastamente diferentes. Também notamos que a performance de uma representação na tarefa de classificação de dados não significa que tal representação não codifique o conceito de um objeto, tendo diferentes resultados em tarefas de similaridade.
- Agência financiadora: Esse projeto foi parcialmente financiado pelo CNPq e faz parte do projeto MMeaning (2016/13002-0) financiado pela FAPESP
- Orientadora e Co-orientador: Profa. Dra. Helena de Medeiros Caseli e Prof. Dr. Jander Moreira
- Link para a Dissertação: https://repositorio.ufscar.br/handle/ufscar/10365
2015
Título do projeto: Desenvolvimento e aplicação de Deep Learning para classificação de imagens
Nível: Estágio
Breve descrição: Projeto consistiu em utilizar algoritmos de Aprendizado Profundo (Deep Learning), obtendo características de dados por meios automáticos, em classificação de imagens de produtos encontrados em e-commerces brasileiros. Estudos foram feitos em relação a métodos para pré-processamento de imagens para subsequente uso em uma Rede Neural Convolucional, pra classificá-los em categorias (eletrodomésticos, celulares, jogos, livros, etc).
Empresa financiadora: BooLabs
Orientador: Prof. Dr. Jander Moreira

Contato

f.tadaoito @ gmail.com

Currículo Lattes