PORTIFÓLIO
Lattes Linkedin Github
claudiovaliense@gmail.com
Problema alvo: Classificação de doenças a partir de características textuais
Link do artigo:
https://medinform.jmir.org/2021/11/e29120
Problema alvo: Identificar perfil de propagadores de ódio no twitter.
Link do artigo:
http://ceur-ws.org/Vol-2936/paper-195.pdf
Problema alvo: Classificação do contexto de uma citação
Link da competição:
https://www.kaggle.com/c/3c-shared-task-purpose/leaderboard
Link da solução que foi proposta:
https://github.com/claudiovaliense/wosp_2020_3c-shared-task-purpose
Link do artigo:
https://www.aclweb.org/anthology/volumes/2020.wosp-1/
https://www.aclweb.org/anthology/2020.wosp-1.8/
Problema alvo: Recomendação de tags para produtos em e-commerce.
Link do artigo:
https://www.sciencedirect.com/science/article/abs/pii/S0306457320307846
Problema alvo: Identificar bot ou humano (e gênero) a partir de mensagens do twitter.
Competição promovida pelo PANCLEF 2019
https://pan.webis.de/clef19/pan19-web/author-profiling.html
Link do artigo:
Dados espaciais estão cada vez mais presentes em nosso dia a dia. Usamos diversas aplicações que utilizam esses dados, como o Google Maps e Uber. Há um grande número de perguntas interessantes que podem ser realizadas com base nestes dados. Por exemplo, um turista talvez esteja interessado em hotéis que têm muitos restaurantes na sua vizinhança. Este projeto propõe um novo tipo de consulta denominada Consulta Espaço-Textual Preferencial por Popularidade (CETPP), cuja principal contribuição, pode selecionar os objetos espaciais com maior escore levando em conta o número de objetos espaço-textuais relevantes, para um determinado conjunto de palavras-chave de consulta, em sua vizinhança. Apresentamos algoritmos para processar essa consulta de forma eficiente e avaliar os algoritmos propostos em conjuntos de dados reais. Nossos experimentos mostram que tem melhor desempenho utilizar índices espaciais (e.g. R-Tree) para distâncias menores de 5 km em relação a índices textuais (e.g. Inverted File). Em nossos experimentos, o índice híbrido processou com melhor desempenho a consulta CETPP. A consulta CETPP tem como diferencial levar em consideração a quantidade de objetos de referência na vizinhança espacial, além de selecionar os objetos de referência à partir da descrição textual.
Artigo sobre a proposta (1º lugar entre os artigos do WPOS no ERBASE 2018):
https://sol.sbc.org.br/index.php/erbase/article/view/8565
Artigo inicial gerado a partir da proposta:
https://revistas.unifacs.br/index.php/rsc/article/view/5926
Artigo mais completo (WEBMEDIA 2019):
https://dl.acm.org/doi/abs/10.1145/3323503.3349560
Aplicação exemplificando a consulta:
O objetivo deste trabalho é construir uma inteligência artificial (IA) para conversar com o usuário. Funciona da seguinte forma, um usuário faz uma pergunta a IA, está realiza uma pesquisa em um banco de dados que retorna a resposta mais respondida para aquela questão, após isso, faz a seguinte pergunta, “Como poderia ter respondido?”, caso o usuário responda e se for uma resposta que já existe no banco de dados, o campo de ocorrência daquela resposta é aumentado em 1. Caso não exista é criada uma nova resposta para aquela questão e definido o valor 1 na ocorrência daquela resposta. Outra possibilidade do sistema é não conhecer sobre o assunto, respondendo da seguinte forma, “Não sei, me ensine. Qual a resposta para essa pergunta?”, neste caso tanto a pergunta e a resposta é cadastrada.
Link da aplicação:
Em sistemas computacionais, um problema potencial e recorrente é lidar com falhas de hardware ou software que eventualmente acarretem perdas de dados. Existe diversas ferramentas para realizar backup de dados, algumas ferramentas oferecem a funcionalidade de agendamento de backup, facilitando e criando uma rotina de backup. É interessante distribuir os dados com a maior quantidade de computadores na rede, de uma forma que garanta que os dados estejam protegidos. Além disso, é preciso garantir redundância dos dados, porque caso ocorra algum eventual problema de perda de dados, seja por hardware ou software, ainda é possível recuperar os dados. Adicionalmente, necessário a descentralização do índice dos dados para remover a possibilidade de um ponto crítico do sistema. Idealmente, deseja-se que funcione inicialmente no SO Windows e Linux para possibilitar que a rede formada com as máquinas tenha a maior quantidade de espaço possível. Através de uma interface gráfica, o usuário seleciona o diretório que desejar realizar o backup e o sistema de forma automática realiza as tarefas de compactação, criptografia, particionamento e divisão entre os computadores da rede. Posteriormente quando o usuário desejar restaurar seus dados, o sistema realiza a busca das partes através do índice executa a agregação das partes, descriptografia, descompactação e a restauração da hierarquia do diretório. Cada computador é responsável por guardar o índice de dados de outra máquina quando for sua responsabilidade. Na entrada de um novo computador na rede a responsabilidade de guardar os índices será dividida com o mesmo. Na operação de backup e restore o registro será atualizado no computador que solicitou e no computador responsável por guardar o registro.
O sistema siex tem como principal objetivo planejarm desenvolber e acompanhar as ações extensionista da Universidade Estadual de Santa Cruz. Funciona também como assessoria à Administração Superior da Universidade nas questões referentes à Extensão. Este sistema funciona na rede interna da UESC.
O objetivo desse sistema é diminuir problemas de saúde causados pelo uso excessivo do computador. Depois de uma determinada quantidade de tempo é exibida uma mensagem alertando do uso excessivo do computador.
Este programa serve como lazer e para testar a sua jogabilidade no jogo da velha. É possível escolher entre as dificuldades Fácil, Médio, Difícil e Impossível.
Executa diversos comandos depois de certa quantidade de tempo. Funciona como um agendador de comandos para o computador realizar.