PORTIFÓLIO

Lattes Linkedin Github

claudiovaliense@gmail.com

Artigo: Stroke Outcome Measurements From Electronic Medical Records: Cross-sectional Study on the Effectiveness of Neural and Nonneural Classifiers

Problema alvo: Classificação de doenças a partir de características textuais

Link do artigo:

https://medinform.jmir.org/2021/11/e29120

Artigo: Profiling Hate Speech Spreaders on Twitter: Exploiting Textual Analysis of Tweets and Combinations of Multiple Textual Representations

Problema alvo: Identificar perfil de propagadores de ódio no twitter.

Link do artigo:

http://ceur-ws.org/Vol-2936/paper-195.pdf

1º Lugar na competição internacional sobre classificação do contexto de uma citação (WOSP 2020)

Problema alvo: Classificação do contexto de uma citação

Link da competição:

https://www.kaggle.com/c/3c-shared-task-purpose/leaderboard

Link da solução que foi proposta:

https://github.com/claudiovaliense/wosp_2020_3c-shared-task-purpose

Link do artigo:

https://www.aclweb.org/anthology/volumes/2020.wosp-1/

https://www.aclweb.org/anthology/2020.wosp-1.8/

Artigo "Fixing the curse of the bad product descriptions” – Search-boosted tag recommendation for E-commerce products

Problema alvo: Recomendação de tags para produtos em e-commerce.

Link do artigo:

https://www.sciencedirect.com/science/article/abs/pii/S0306457320307846

Artigo Bot and Gender Identification: Textual Analysis of Tweets

Problema alvo: Identificar bot ou humano (e gênero) a partir de mensagens do twitter.

Competição promovida pelo PANCLEF 2019

https://pan.webis.de/clef19/pan19-web/author-profiling.html

Link do artigo:

http://ceur-ws.org/Vol-2380/paper_224.pdf

Encontrando os locais de interesse com maior concentração de objetos relevantes para um conjunto de palavras-chave

Dados espaciais estão cada vez mais presentes em nosso dia a dia. Usamos diversas aplicações que utilizam esses dados, como o Google Maps e Uber. Há um grande número de perguntas interessantes que podem ser realizadas com base nestes dados. Por exemplo, um turista talvez esteja interessado em hotéis que têm muitos restaurantes na sua vizinhança. Este projeto propõe um novo tipo de consulta denominada Consulta Espaço-Textual Preferencial por Popularidade (CETPP), cuja principal contribuição, pode selecionar os objetos espaciais com maior escore levando em conta o número de objetos espaço-textuais relevantes, para um determinado conjunto de palavras-chave de consulta, em sua vizinhança. Apresentamos algoritmos para processar essa consulta de forma eficiente e avaliar os algoritmos propostos em conjuntos de dados reais. Nossos experimentos mostram que tem melhor desempenho utilizar índices espaciais (e.g. R-Tree) para distâncias menores de 5 km em relação a índices textuais (e.g. Inverted File). Em nossos experimentos, o índice híbrido processou com melhor desempenho a consulta CETPP. A consulta CETPP tem como diferencial levar em consideração a quantidade de objetos de referência na vizinhança espacial, além de selecionar os objetos de referência à partir da descrição textual.

Artigo sobre a proposta (1º lugar entre os artigos do WPOS no ERBASE 2018):

https://sol.sbc.org.br/index.php/erbase/article/view/8565

Artigo inicial gerado a partir da proposta:

https://revistas.unifacs.br/index.php/rsc/article/view/5926

Artigo mais completo (WEBMEDIA 2019):

https://dl.acm.org/doi/abs/10.1145/3323503.3349560

Aplicação exemplificando a consulta:

http://querypopularity.herokuapp.com/

IA para conversas

O objetivo deste trabalho é construir uma inteligência artificial (IA) para conversar com o usuário. Funciona da seguinte forma, um usuário faz uma pergunta a IA, está realiza uma pesquisa em um banco de dados que retorna a resposta mais respondida para aquela questão, após isso, faz a seguinte pergunta, “Como poderia ter respondido?”, caso o usuário responda e se for uma resposta que já existe no banco de dados, o campo de ocorrência daquela resposta é aumentado em 1. Caso não exista é criada uma nova resposta para aquela questão e definido o valor 1 na ocorrência daquela resposta. Outra possibilidade do sistema é não conhecer sobre o assunto, respondendo da seguinte forma, “Não sei, me ensine. Qual a resposta para essa pergunta?”, neste caso tanto a pergunta e a resposta é cadastrada.

Link da aplicação:

https://conversarcomia.herokuapp.com/

Sistema de Backup Distribuído

Em sistemas computacionais, um problema potencial e recorrente é lidar com falhas de hardware ou software que eventualmente acarretem perdas de dados. Existe diversas ferramentas para realizar backup de dados, algumas ferramentas oferecem a funcionalidade de agendamento de backup, facilitando e criando uma rotina de backup. É interessante distribuir os dados com a maior quantidade de computadores na rede, de uma forma que garanta que os dados estejam protegidos. Além disso, é preciso garantir redundância dos dados, porque caso ocorra algum eventual problema de perda de dados, seja por hardware ou software, ainda é possível recuperar os dados. Adicionalmente, necessário a descentralização do índice dos dados para remover a possibilidade de um ponto crítico do sistema. Idealmente, deseja-se que funcione inicialmente no SO Windows e Linux para possibilitar que a rede formada com as máquinas tenha a maior quantidade de espaço possível. Através de uma interface gráfica, o usuário seleciona o diretório que desejar realizar o backup e o sistema de forma automática realiza as tarefas de compactação, criptografia, particionamento e divisão entre os computadores da rede. Posteriormente quando o usuário desejar restaurar seus dados, o sistema realiza a busca das partes através do índice executa a agregação das partes, descriptografia, descompactação e a restauração da hierarquia do diretório. Cada computador é responsável por guardar o índice de dados de outra máquina quando for sua responsabilidade. Na entrada de um novo computador na rede a responsabilidade de guardar os índices será dividida com o mesmo. Na operação de backup e restore o registro será atualizado no computador que solicitou e no computador responsável por guardar o registro.

Sistema Siex

O sistema siex tem como principal objetivo planejarm desenvolber e acompanhar as ações extensionista da Universidade Estadual de Santa Cruz. Funciona também como assessoria à Administração Superior da Universidade nas questões referentes à Extensão. Este sistema funciona na rede interna da UESC.

Uso excessivo do computador

O objetivo desse sistema é diminuir problemas de saúde causados pelo uso excessivo do computador. Depois de uma determinada quantidade de tempo é exibida uma mensagem alertando do uso excessivo do computador.

Jogo da velha

Este programa serve como lazer e para testar a sua jogabilidade no jogo da velha. É possível escolher entre as dificuldades Fácil, Médio, Difícil e Impossível.

Agendador de comandos

Executa diversos comandos depois de certa quantidade de tempo. Funciona como um agendador de comandos para o computador realizar.

Google Sites

Report abuse