Introdução

O propósito do SBBD DSW é prover um fórum para compartilhar e discutir as formas de construção e organização de conjuntos de dados que servem como base para os trabalhos de Ciência da Computação e demais Ciências.

Edições

Atualmente, o SBBD Dataset Showcase Workshop está em sua sexta edição, a ser realizada em outubro de 2024. 

Esta edição está sendo coordenada por Michele A. Brandão (IFMG), Carina F. Dorneles (UFSC) e Mirella M. Moro (UFMG). 

As edições anteriores foram coordenadas por

Para conferir os artigos publicados na edições anteriores, clique na aba Artigos.

Motivação

A publicação e a disponibilização de conjuntos de dados (abertos ou não) têm se tornado altamente relevante devido à grande atenção dada por vários segmentos, como a mídia, indústria, academia e governo. A tarefa de disponibilização de dados é importante por inúmeros motivos, que vão desde sua reutilização em aplicativos digitais desenvolvidos pela sociedade, até a possibilidade de reprodução de experimentos desenvolvimentos pela comunidade científica. Portanto, no contexto da comunidade brasileira de bancos de dados, tornar conjuntos de dados disponíveis é intrinsecamente importante devido ao fomento para novas questões de pesquisa e desenvolvimento que tal tarefa pode atingir. 

Como exemplos de casos de sucesso de disponibilização pública (e organizada) de dados citam-se:

Porém, mesmo com tanta publicidade, as tarefas de criar, coletar, tratar e disponibilizar dados publicamente continuam apresentando muitos desafios técnicos. Na verdade, a simples tarefa de encontrar uma boa fonte de dados e extraí-los podem ser atividades tecnicamente complexas. Talvez, mais complexo ainda, seja tratar os dados de modo a apresentá-los através de uma representação coerente e cujas informações obtidas sejam úteis e semanticamente corretas. Da mesma forma, a coleta e o tratamento dos dados para o relato de experimentos científicos para uma comunidade de banco de dados pode ser considerada uma tarefa exaustiva, trabalhosa e muito desafiadora — por outro lado, se o conjunto de dados estiver bem organizado, com uma metodologia de execução bem elaborada, a implementação e comparação de algoritmos pode ser altamente facilitada.