2024 - Inteligência Artificial na Pesquisa: Exemplos de Aplicação (in Portuguese)
Esta palestra apresenta exemplos de aplicações da Inteligência Artificial no processamento de linguagem natural, no processamento digital de imagens, bem como aplicações híbridas. São aplicações envolvendo Redes Neurais Convolucionais, Transformers e os Modelos de Linguagem de Larga Escala (LLMs).
Apresentação: Vídeo da Palestra
Slides: Palestra
2023 - Modelos de Linguagem para Processamento de Linguagem Natural (in Portuguese)
Processamento de Linguagem Natural (PLN) é um campo da Linguística e da Aprendizagem de Máquina focado no entendimento da linguagem humana. Tem como objetivo entender o contexto das palavras. O estado-da-arte em PLN está focado no desenvolvimento de modelos de linguagem gerados por Redes Neurais Artificiais. Esta palestra apresenta os conceitos e fundamentos sobre essa tecnologia, bem como exemplos de aplicações. Exemplos de modelos de linguagem são o GPT, o BERT e o LaMDA e ferramentas, como o ChatGPT, o Copilot e o BARD. Exemplos de aplicações são: busca semântica em máquinas de busca, extração de respostas para perguntas, chatbots, classificação de documentos, reconhecimento de entidades nomeadas, tradução de textos, sumarização de documentos e sistemas de recomendação.
Apresentação: Vídeo da Palestra
Slides: Palestra
2021 - Redes Neurais Artificiais: Conceitos Básicos e Aplicações (in Portuguese)
A Inteligência Artificial e as aplicações de suas técnicas de aprendizagem de máquina estão presentes em nosso dia-a-dia. Dentre elas, aquelas baseadas em redes neurais artificiais se popularizaram nas últimas duas décadas, devido ao grande volume de dados disponível e à maior capacidade de processamentos de nossos computadores. Tarefas antes difíceis de serem resolvidas de forma automática, agora estão presentes em nossos aplicativos, tais como detecção de objetos em imagens, reconhecimento de voz, tradução de idiomas e veículos autônomos. Nesta palestra, serão abordados os conceitos básicos para um melhor entendimento do que está por trás das redes neurais, bem como o princípio de funcionamento de algumas de suas aplicações.
Slides: Palestra
2019 - Pint of Science - Do Google às Redes Sociais: Como Recuperar Informação na Web (in Portuguese)
O festival internacional Pint of Science (Chope da Ciência) visa proporcionar debates científicos fora do ambiente acadêmico, em locais descontraídos, como bares e restaurantes. Participei da edição de 2019 em Lavras, com um debate sobre recuperação de informação na Web, explicando e respondendo perguntas como: O que acontece quando você faz uma busca no Google? Como os sites de venda online comparam preços dos produtos? Como um vídeo é recomendado pra você no YouTube? O que as empresas fazem com as suas avaliações de hotéis? Na apresentação, foram discutidos como os programas de inteligência artificial influenciam na sua vida e como eles atuam para recuperar informação na Web.
Apresentação: Vídeo (a partir dos 42 minutos)
Slides: Palestra
2018 - Analise de Sentimentos (in Portuguese)
Análise de Sentimentos (ou Mineração de Opinião) é o estudo computacional sobre opiniões pessoais, avaliações, atitudes e emoções em relação a entidades tais como produtos, serviços, organizações, indivíduos, eventos e seus diferentes aspectos. Conhecer as opiniões de consumidores tem grande valor comercial. Elas auxiliam outros consumidores em processos de compra e são úteis às empresas na monitoração de seus produtos/serviços. Na palestra, serão abordados conceitos gerais sobre o tema análise de sentimentos, discutidas as principais abordagens computacionais para análise de dados e apresentados alguns projetos de pesquisa do alestrante sobre o assunto.
Apresentação: Vídeo da Palestra
Slides: Palestra
2018 - PVAF - Um Ambiente para Desambiguação de Veículos de Publicação Científica (in Portuguese)
O ambiente PVAF é composto por um arquivo de autoridade de veículos de publicação científica, métodos para desambiguação de seus dados e um conjunto de ferramentas de acesso a esses dados. O arquivo de autoridade consiste de um conjunto de registros com informações sobre variações de nomes e siglas usadas correntemente, nomes e siglas antigos, ı́ndices bibliométricos (Qualis Capes e Fator de Impacto), dentre outras informações sobre veı́culos de publicação.
As seguintes ferramentas fazem parte do PVAF:
PVAF-Search (http://pvaf.dcc.ufla.br/): Ferramenta de busca no arquivo de autoridade.
PVAF-API (http://pvaf.dcc.ufla.br/api/): Web Service para acesso remoto aos dados. Possui também uma biblioteca para acesso local.
PVAF-QualiCit (http://pvaf.dcc.ufla.br/qualicit/): Ferramenta que retorna o Índice Qualis e o Fator de Impacto de um conjunto de referências bibliográficas fornecidas como entrada.
PVAF-Compare (http://pvaf.dcc.ufla.br/compare/): Ferramenta para comparação de grupos de pesquisa com base no Índice Qualis e no Fator de Impacto de suas publicações. Gera várias estatísticas para comparação.
PVAF-Manager: Ferramenta para manutenção do PVAF. Restrito a uso por administradores internos.
Apresentação: Vídeo explicativo
2017 - Resolução de Entidades em Dados Textuais Curtos (in Portuguese)
Em repositórios de dados de grande escala, muitas vezes é difícil reconhecer referências distintas a uma mesma entidade do mundo real. Por exemplo, espera-se que os catálogos de produtos on-line gerem informações relacionadas a produtos de interesse do usuário. No entanto, como rótulos semelhantes podem ser usados para fazer referência a produtos distintos em diferentes páginas da Web, os produtos que não estão relacionados à intenção do usuário podem aparecer no conjunto de respostas. Dado um conjunto de referências de entidades, como rótulos de produtos, a resolução de entidades é o processo de identificar quais delas correspondem a uma mesma entidade do mundo real. Nesta apresentação curta, descreverei nossos esforços para melhorar as soluções para o problema de resolução de entidades. Primeiro, descreverei o problema e apresentarei alguns exemplos práticos nos quais ele se aplica. Depois, descreverei um método que desenvolvemos para tratar o problema. Usamos um método de aprendizado supervisionado com base em regras de associação, implementadas na estrutura do Apache Spark.
Apresentação: Projeto FAPEMIG
2016 - An Associative Classifier for Entity Resolution
In large-scale data repositories, it is often hard to recognize distinct references to a same real-world entity. For instance, online product catalogs are expected to generate information related to products of the user interest. However, given that similar labels can be used to refer to distinct products in different Web pages, products that are not related to the user intention might appear in the answer set. Given a set of entity references, such as product labels, entity resolution is the process of identifying which of them correspond to a same real-world entity. In this talk, I will describe our efforts to improve the solutions for the entity resolution problem. First, I will describe the problem, present some practical examples of applications in which it applies, and describe the traditional approach for solve it. Second, I will describe a method we developed to treat the problem. We use a supervised learning method based on association rules, implemented on the Apache Spark framework. Finally, I conclude the talk by highlighting the future plans for developing an incremental version for our method.
Slides: Seminar
2016 - Research Projects
In this talk, I present my main research projects, which are: (i) Publication Venue Authority File, (ii) Incremental Entity Resolution on Short Textual Data, and (iii) Distributed Algorithms for Entity Resolution on Hadoop.
Slides: Seminar
2013 - Extração e Desambiguação de Citações Bibliográficas (in Portuguese)
Nessa palestra, eu apresento detalhes do meu projeto de pesquisa envolvendo a extração e a desambiguação de citações bibliográficas. O projeto é composto pelas seguintes etapas: (i) coleta de documentos contendo citações de pesquisadores (currículos, home pages), (ii) extração de citações dos documentos coletados, (iii) extração de metadados de citações, (iv) identificação de citações replicadas e (v) desambiguação de entidades (autor, veículo publicação).
Slides: Palestra
2012 - Recuperação de Informação (in Portuguese)
Nessa palestra, eu apresento uma visão geral sobre a área de Recuperação de Informação. Destaco os seguintes tópicos: (i) o conceito de Recuperação de Informação (RI), (ii) a coleta de páginas da Web, (iii) a indexação de dados, (iv) o processamento de consultas e (v) RI além das máquinas de busca.
Slides: Palestra