CIDEHUSDigital: criar e desenvolver uma equipa de anotação
O projeto CD_Nota tem em vista usar os textos e outros artefactos digitais disponíveis para gerar dados, processáveis por máquinas e pessoas. Para isso, faz-se a preparação dos dados em duas vertentes, ortográfica (normalização) e semântica (entidades nomeadas). Desta forma, poder-se-ão ligar os dados a outros repositórios.
As Memórias Paroquiais são o ponto de partida e constituem um laboratório de ensaio desta proposta. São realizadas tarefas de normalização da ortografia e anotação manual relativas às entidades nomeadas. Utiliza-se a plataforma de anotação (INCEpTION). Estes dados irão depois alimentar estudos diversificados sobre o Sul e também o Gazetteer, no que respeita a topónimos portugueses, num pipeline de extração, processamento e disponibilização de dados textuais.