O Glossário da Dublin Core Metadata Initiative (DCMI) define perfil de aplicação de metadados como “(...) uma especificação de projeto de metadados que utiliza uma seleção de termos provenientes de vários vocabulários de metadados, com restrições adicionais, para atender a requisitos específicos de uma aplicação” (DCMI Usage Board, 2009, tradução nossa).
O papel de um perfil de aplicação é documentar como os elementos são codificados ou interpretados para propósito de aplicações específicas, com objetivo de harmonizar o uso de metadados entre comunidades, de forma a possibilitar interoperabilidade entre metadados de forma automatizada (Baker, 2011).
Neste contexto e considerando a Arquitetura de Dados da avaliação da pós-graduação brasileira, que visa favorecer o acionamento de dados por máquinas, a documentação dos metadados é importante para que fornecedores e consumidores de dados possam compreendê-los. Têm-se assim, o desenvolvimento de um Perfil de Aplicação para a Plataforma Sucupira. Este guia disponibiliza o Perfil de Aplicação da Plataforma Sucupira da Capes, especificamente para dissertações e teses.
A criação de um perfil de aplicação para os dados da avaliação da pós-graduação brasileira deve permitir que as instituições de ensino superior que objetivem enviar dados de forma automática para a Plataforma Sucupira possam compreender a estrutura dos dados.
Assim, o Perfil de Aplicação de Metadados da Avaliação da Pós-Graduação brasileira, apresenta:
Nome do Metadado.
Descrição.
Vocabulário semântico.
Termo do vocabulário semântico.
Obrigatoriedade.
Repetível.
Regra de Negócio.
Entrada Padronizada.
Regra de Formato.
Metadados são constituídos por atributos codificados e campos de valor. Neste contexto, atributos são “Aspectos da informação sobre um objeto de conteúdo. Os atributos podem ser campos, tags e meta-tags.” (Hagedorn, 2000, p. 2, tradução nossa) e valores de atributos consistem em “Dados descritivos sobre o objeto de conteúdo. Os valores dos atributos podem ser controlados (de acordo com um vocabulário) ou não controlados. Os valores dos atributos podem ser metainformação.”(Hagedorn, 2000, p. 2, tradução nossa).
Quando aplicados a um contexto ou processo de trabalho, os metadados podem ser compreendidos como metadados de negócio, que são estruturas que contextualizam dados do negócio, possibilitando aos gestores e outros atores que interagem com o negócio um entendimento unificado do dado (Brandt et al., 2019), o que é essencial para o reuso do dado para os diversos fins: “Metadados de negócios bem definidos são reutilizáveis de um projeto para outro e podem promover uma compreensão consistente de como os conceitos de negócio são representados em diferentes conjuntos de dados”. (DAMA, 2017, tradução nossa, não paginado). Esse tipo de metadado representa as informações produzidas nos processos de trabalho das instituições, as quais devem ser mapeadas, registradas e gerenciadas para serem utilizadas de forma consistente pela instituição. O gerenciamento de metadados viabiliza a gestão da informação institucional (Brandt et al., 2019).
Os metadados podem ser disponibilizados em uma espécie de catálogo no qual há a descrição das suas características, possibilitando otimizar a compreensão e gestão. Tem-se assim, a necessidade de um ambiente de armazenamento e disponibilização dessas estruturas, de forma a permitir que o dado seja gerenciado em todo seu ciclo de vida. O repositório de metadados é um sistema que possibilita esse gerenciamento dos metadados de negócio em uma instituição.
Brandt (2020, p. 82) afirma que o Repositório de Metadados: “Constitui-se de um sistema que armazena representações dos metadados de negócio, juntamente com sua descrição e demais atributos pertinentes ao negócio, além de fornecer sua localização e elementos para sua gestão [...]”.
Torino (2023, p. 236) indica a necessidade de um repositório de metadados para documentar a arquitetura de dados: "Na Arquitetura de Dados, os elementos sintáticos estabelecem a estrutura dos metadados, ao passo que os elementos semânticos atuam no significado. Essas estruturas são refletidas na documentação dos dados e expressas no repositório digital de metadados, o que auxilia na compreensão por humanos e máquinas." (Torino, 2023, p. 236)
Assim, para a Arquitetura de Dados, o Repositório de Metadados é um entregável de singular importância, utilizado para armazenar a documentação dos dados e dos metadados, o que auxilia na compreensão por humanos e máquinas.
A configuração dos metadados no Repositório de Metadados da DAV/CAPES possibilita compreender a forma de preenchimento de cada atributo dos metadados descritos, bem como a sua forma de aplicação na estrutura de dados da Plataforma Sucupira.
O Repositório de Metadados da DAV/CAPES foi lançado publicamente em maio de 2025, como forma de subsidiar a comunidade acadêmico-científica da pós-graduação stricto sensu brasileira na compreensão da estrutura de dados da avaliação da pós-graduação. Neste contexto, à medida que a Plataforma Sucupira for disponibilizada para uso, os dados que compõem a sua estrutura serão exibidos no Repositório de Metadados da DAV/CAPES.
O Perfil de Aplicação de Metadados utilizado pela Capes para a Plataforma Sucupira foi desenvolvido considerando as necessidades da Diretoria de Avaliação (DAV) da Capes para o processo de avaliação da pós-graduação stricto sensu brasileira, em um processo de negócio específico.
Considerando o objetivo deste Guia, são apresentados a seguir os metadados que fazem parte do Perfil de Aplicação de Metadados da Plataforma Sucupira, especificamente para dissertações e teses.
Descrição: Categoria específica da obra acadêmica, científica, artística, técnica ou tecnológica produzida. Esse termo classifica o formato e a finalidade do trabalho, diferenciando a profundidade, o alcance e os requisitos de cada tipo.
Termo adotado pela Capes: dcterms:type
Obrigatoriedade: Sim
Repetível: Não
Entrada Padronizada: masterThesis; doctoralThesis
Obrigatório para a coleta de repositórios: Sim
Descrição: Nome da pessoa física responsável intelectual pelo conteúdo de uma produção intelectual. Esse nome representa a identidade do pesquisador e é utilizado para atribuir reconhecimento e crédito pelo trabalho realizado, além de ser fundamental para rastrear a trajetória acadêmica e a produção científica do autor em bases de dados e repositórios digitais.
Termo adotado pela Capes: dcterms:creator
Obrigatoriedade: Sim
Repetível: Não
Entrada Padronizada: Não se aplica
Obrigatório para a coleta de repositórios: Sim
Nome do Orientador
Descrição: Nome do professor ou pesquisador responsável por guiar e supervisionar um discente durante seu curso de pós-graduação, sobretudo nas atividades relacionadas ao trabalho final de pesquisa (dissertação/tese).
Termo adotado pela Capes: dbo:academicAdvisor
Obrigatoriedade: Sim
Repetível: Sim
Entrada Padronizada: Não se aplica
Obrigatório para a coleta de repositórios: Sim
Nome do Coorientador
Descrição: Nome do professor ou pesquisador que, junto com o orientador principal, participa da orientação de um discente nas atividades relacionadas ao trabalho final de pesquisa (dissertação/tese) vinculado a um curso de pós-graduação.
Termo adotado pela Capes: dc.contributor.advisorco
Obrigatoriedade: Não
Repetível:Não
Entrada Padronizada: Não se aplica
Necessário para integração: Não
Obrigatório para a coleta de repositórios: Não
Descrição: Nome do indivíduo que integra uma comissão avaliadora em defesas de trabalhos de conclusão de curso (TCC), dissertações de mestrado ou teses de doutorado. Os membros da banca são responsáveis por avaliar, discutir e validar o trabalho apresentado, contribuindo com análises, críticas e sugestões. O nome do membro é registrado oficialmente em documentos acadêmicos e certificados, garantindo a transparência e a formalidade do processo avaliativo.
Termo adotado pela Capes: dcterms:contributor
Obrigatoriedade: Sim
Repetível: Sim
Entrada Padronizada: Não se aplica
Obrigatório para a coleta de repositórios: Desejável
Identificador Lattes da Pessoa (utlizado para autor, orientador, coorientador e membros da banca)
Descrição: Código utilizado para distinguir uma pessoa de maneira única no sistema de currículos Lattes-Cnpq.
Termo adotado pela Capes:
Obrigatoriedade: Sim
Repetível: Não
Entrada Padronizada: Não se aplica
Obrigatório para a coleta de repositórios: É imprescindível que haja ao menos um identificador persistente de pessoa, seja ele Lattes ou Orcid.
Identificador Orcid da Pessoa (utlizado para autor, orientador, coorientador e membros da banca)
Descrição: Código utilizado para distinguir uma pessoa de maneira única no sistema ORCID.
Termo adotado pela Capes:
Obrigatoriedade: Sim
Repetível: Não
Entrada Padronizada: Não se aplica
Obrigatório para a coleta de repositórios: É imprescindível que haja ao menos um identificador persistente de pessoa, seja ele Lattes ou Orcid.
Descrição: Nome ou designação que identifica e descreve o conteúdo principal de uma produção intelectual, no idioma principal da obra.
Termo adotado pela Capes: dcterms:title
Obrigatoriedade: Sim
Repetível: Não
Entrada Padronizada: Não se aplica
Obrigatório para a coleta de repositórios: Sim
Descrição: Título equivalente da produção intelectual em um idioma diferente do idioma principal.
Termo adotado pela Capes: dcterms:alternative
Obrigatoriedade: Não
Repetível: Sim
Entrada Padronizada: Não se aplica
Obrigatório para a coleta de repositórios: Desejável
Descrição: Apresentação concisa dos pontos relevantes da produção intelectual no idioma principal da obra.
Termo adotado pela Capes: dcterms:abstract
Obrigatoriedade: Sim
Repetível: Não
Entrada Padronizada: Não se aplica
Obrigatório para a coleta de repositórios: Sim
Descrição: Apresentação concisa dos pontos relevantes da produção intelectual em um idioma diferente do idioma principal.
Termo adotado pela Capes: dcterms:abstract
Obrigatoriedade: Não
Repetível: Não
Entrada Padronizada: Não se aplica
Obrigatório para a coleta de repositórios: Desejável
Descrição: Termo constituído por uma ou mais palavras representativas do conteúdo da produção intelectual, preferencialmente escolhida em vocabulário controlado, grafado no idioma principal.
Termo adotado pela Capes: dcterms:subject
Obrigatoriedade: Sim
Repetível: Sim
Entrada Padronizada: Não se aplica
Obrigatório para a coleta de repositórios: Sim
Descrição: Termo constituído por uma ou mais palavras representativas do conteúdo da produção intelectual, preferencialmente escolhida em vocabulário controlado, grafado em idioma diferente do idioma principal.
Termo adotado pela Capes: dcterms:subject
Obrigatoriedade: Não
Repetível: Sim
Entrada Padronizada: Não se aplica
Obrigatório para a coleta de repositórios: Desejável
Descrição: Refere-se à língua utilizada predominantemente na produção intelectual.
Termo adotado pela Capes: dcterms:language
Obrigatoriedade: Sim
Repetível: Sim
Entrada Padronizada: Lista de idiomas ISO 639
Obrigatório para a coleta de repositórios: Não
Descrição: Refere-se ao Uniform Resource Identifier (URI) do identificador único associado a uma produção intelectual, que fornece um endereço padronizado e único para acesso ou referência a essa produção em um ambiente digital.
Termo adotado pela Capes: dcterms:identifier
Obrigatoriedade: Não
Repetível: Não
Entrada Padronizada: Não se aplica
Obrigatório para a coleta de repositórios: Sim
Descrição: Refere-se à categorização oficial da produção intelectual em uma estrutura hierárquica estabelecida pelo Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq). Essa estrutura organiza o conhecimento em grandes áreas, áreas e subáreas, permitindo a classificação de temas de pesquisa, publicações e projetos conforme o campo específico do saber.
Termo adotado pela Capes: capes:CNPQsubject (subpropriedade de dc:subject)
Obrigatoriedade: Não
Repetível: Sim
Entrada Padronizada: Tabela de áreas CNPq
Obrigatório para a coleta de repositórios: Não
Descrição: Instituição, geralmente vinculada a governos, organizações internacionais ou entidades privadas, responsável por promover o desenvolvimento científico, tecnológico, cultural, social ou econômico por meio de financiamento, apoio técnico e incentivos a projetos, iniciativas ou pesquisas. Essas agências oferecem recursos financeiros, bolsas, subvenções ou linhas de crédito com o objetivo de impulsionar a inovação, fortalecer capacidades locais, fomentar a produção intelectual e contribuir para o progresso em áreas estratégicas.
Termo adotado pela Capes: schema:sponsor
Obrigatoriedade: Não
Repetível: Sim
Entrada Padronizada: Tabela de Financiador na Capes
Obrigatório para a coleta de repositórios: Sim
Descrição: Informações descritivas úteis que não puderam ser incluídas em outras áreas da descrição. Podem ser relativas a qualquer aspecto da apresentação do item ou do seu conteúdo. As notas devem ser claras e concisas e na língua oficial do país.
Termo adotado pela Capes: dcterms:description
Obrigatoriedade: Não
Repetível: Sim
Entrada Padronizada: Não se aplica
Obrigatório para a coleta de repositórios: Não
Descrição: Condições ou restrições definidas para que se possa acessar determinada produção intelectual.
Termo adotado pela Capes: dcterms:rights
Obrigatoriedade: Sim
Repetível: Não
Entrada Padronizada: Acesso aberto; Acesso restrito; Acesso embargado
Obrigatório para a coleta de repositórios: Desejável
Descrição: Refere-se ao Uniform Resource Identifier (URI) que direciona para a página de acesso às informações da licença que define os direitos, restrições e condições de uso de uma produção intelectual. Essa URI permite que os usuários consultem diretamente os termos legais aplicáveis à obra, como licenças Creative Commons ou outras específicas, garantindo transparência e facilitando o cumprimento das condições de uso.
Termo adotado pela Capes: dcterms:rights
Obrigatoriedade: Não
Repetível: Não
Entrada Padronizada: Não se aplica
Obrigatório para a coleta de repositórios: Não
Descrição: Dia, mês e ano em que o texto completo de uma produção intelectual inicialmente restrita ou embargada se torna disponível para consulta integral pelo público ou por um grupo autorizado.
Termo adotado pela Capes: dcterms:available
Obrigatoriedade: Não
Repetível: Não
Entrada Padronizada: Não se aplica
Obrigatório para a coleta de repositórios: Não
Descrição: Denominação dada ao conjunto formado pelos cursos de mestrado e/ou doutorado, nas Modalidades Acadêmico ou Profissional de uma Instituição de Ensino Superior (IES) atuante numa mesma área do conhecimento - sua área básica - que compartilha essencialmente o mesmo corpo docente e tem uma estrutura administrativa comum.
Termo adotado pela Capes: vivo:hasProgram
Obrigatoriedade: Não
Repetível: Sim
Entrada Padronizada: Lista de nomes de PPG - Plataforma Sucupira
Obrigatório para a coleta de repositórios: Desejável
Descrição: Denominação dada a cada um dos cursos de pós-graduação de uma Instituição de Ensino Superior (IES), nas modalidades acadêmico ou profissional e nos níveis de mestrado ou doutorado
Termo adotado pela Capes: capes:courseName
Obrigatoriedade: Sim
Repetível: Não
Entrada Padronizada: Lista de nomes de curso - Plataforma Sucupira
Obrigatório para a coleta de repositórios: Não
Descrição: Refere-se ao Uniform Resource Identifier (URI) que aponta para o endereço on-line no qual a produção intelectual foi originalmente publicada ou disponibilizada. Essa URI permite acessar diretamente o local oficial da obra, como o site do periódico, repositório institucional, editora ou plataforma digital, assegurando autenticidade e confiabilidade na consulta.
Termo adotado pela Capes: dcterms:identifier
Obrigatoriedade: Não
Repetível: Não
Entrada Padronizada: Não se aplica
Obrigatório para a coleta de repositórios: Não
Descrição: Utilizado para informar o Uniform Resource Identifier (URI) de acesso a outro registro relacionado à produção intelectual descrita, a exemplo de obras, projetos, estudos ou produtos.
Termo adotado pela Capes: dcterms:relation
Obrigatoriedade: Não
Repetível: Sim
Entrada Padronizada: Não se aplica
Obrigatório para a coleta de repositórios: Não
Descrição: Refere-se à data em que a produção intelectual foi publicada. Quando disponível, indicar, no formato AAAA-MM-DD. No caso de publicações que não indiquem o dia ou o mês, omitir a informação.
Termo adotado pela Capes: dcterms:issued
Obrigatoriedade: Sim
Repetível: Não
Entrada Padronizada: Não se aplica
Obrigatório para a coleta de repositórios: Sim
Descrição: Dia, o mês e o ano em que ocorreu a defesa do trabalho final obrigatório para a obtenção do título junto ao curso de pós-graduação com o qual o discente possui vínculo.
Termo adotado pela Capes: dcterms:date
Obrigatoriedade: Sim
Repetível: Não
Entrada Padronizada: Não se aplica
Obrigatório para a coleta de repositórios: Não
Descrição: Contagem total de páginas de uma produção intelectual, como um artigo, livro, relatório ou tese, indicando sua extensão física ou digital.
Termo adotado pela Capes: dcterms:SizeOrDuration
Obrigatoriedade: Não
Repetível: Não
Entrada Padronizada: Não se aplica
Obrigatório para a coleta de repositórios: Não
Descrição: Projeto de pesquisa vinculado à Linha de Pesquisa do Programa de Pós-Graduação, coordenado por docente do PPG e que podem possuir outros participantes, ao qual a produção intelectual está vinculada.
Termo adotado pela Capes: vivo:ResearchProposal
Obrigatoriedade: Não
Repetível: Não
Entrada Padronizada: Não se aplica
Obrigatório para a coleta de repositórios: Não
Descrição: Eixo temático ou área de investigação contínua dentro de um programa de pós-graduação.
Termo adotado pela Capes: capes:researchLine
Obrigatoriedade: Sim
Repetível: Sim
Entrada Padronizada: Não se aplica
Obrigatório para a coleta de repositórios: Não
Descrição: Domínios restritos mais especificados, relativos à área básica, nos quais o Programa de Pós-Graduação atua e para os quais estão direcionadas suas atividades.
Termo adotado pela Capes:
Obrigatoriedade: Não
Repetível: Não
Entrada Padronizada: Tabela de área de concentração
Obrigatório para a coleta de repositórios: Não