Perfil institucional de metadatos SOCIOECOLÓGICOS

Introducción

Los metadatos son componentes clave para los sistemas de administración de datos, porque describen aspectos como el “quién, qué, cómo, cuándo y dónde” de un conjunto de datos. Los metadatos permiten principalmente identificar y descubrir la existencia de un conjunto de datos y entender el uso de la información y el cómo acceder a esta.

En el marco de las ciencias sociales y humanas, el Inter-university Consortium for Political and Social Research (ICPSR) lidera, junto a varias organizaciones académicas y de investigación, el Data Documentation Initiative (DDI): https://www.ddialliance.org/, estándar internacional de metadatos usado para describir datos producidos por métodos de las ciencias sociales, conductuales, económicas y de salud, con el cual se documenta y administra el ciclo de vida de los datos de una investigación, incluyendo su conceptualización, recolección, procesamiento, archivo, distribución, descubrimiento y análisis. Para describir los materiales de referencia asociados a la investigación tales como manuales, cartillas, informes, etc., se adoptó también el estándar Dublin Core (DC): http://dublincore.org/ de la Dublin Core Metadata Initiative (DCMI), organización dedicada a promover vocabularios especializados de metadatos.

Ambos estándares: DDI + DC, son los que adopta el Departamento Administrativo Nacional de Estadística (DANE), entidad que regula el Sistema Estadístico Nacional (SEN) y administra el Archivo Nacional de Datos (ANDA); plataformas nacionales que rigen la institucionalidad pública y con las cuales es necesario garantizar interoperabilidad. De esta manera, con la implementación de los citados estándares, se busca facilitar la comprensión, interpretación y uso de los datos socioecológicos por parte diferentes personas, sistemas de software y redes informáticas.

En el Instituto Humboldt, la implementación de estos estándares de metadatos se realizó en la plataforma Dataverse, software de código abierto desarrollado por la Universidad de Harvard y el cual permite publicar, referenciar, descargar y analizar datos de investigación siguiendo los esquemas DDI + DC. Además, Dataverse ofrece la posibilidad de publicar datos de investigación asignando identificadores persistentes (DOI), lo que contribuye a fortalecer la visibilidad web y recibir crédito académico: reconocimiento de autor, cita persistente, descubrimiento y preservación de datos.

El perfil Institucional que aquí se describe, hace una revisión de la obligatoriedad de los campos de metadato que deben documentarse y otorga una guía para entender fácilmente el diligenciamiento de cada elemento. Sobre esta base, se trabajó en mejorar las herramientas para atender las necesidades institucionales y crear roles de edición y administración en procura garantizar la calidad y seguridad de los datos generados. Adicionalmente, se personalizó la interfaz, se tradujo a español y se preconfiguró una plantilla de metadato Socioecológico equivalente al esquema DDI+DC. Este Dataverse personalizado es el que usamos como Catálogo de datos Socioecológicos del IAvH - BioCultural.

Adaptaciones institucionales de los estándares DDI+DC

La I2D, dentro de su propósito de integrar, asegurar y disponer la información generada o custodiada por el Instituto, adoptó los estándares DDI+DC para la documentación de metadatos socioecológicos con algunas adaptaciones institucionales que no afectan la naturaleza del estándar. Las variaciones se enfocan principalmente en: 1. Descripciones más específicas de los campos y secciones, 2. Diferencias en la condicionalidad (más campos obligatorios), 3. Ejemplos que se ajustan mejor a las necesidades institucionales, 4. Ajuste del vocabulario técnico estadístico para dar más claridad temática desde el enfoque socioecológico (operación estadística = estudio, los objetivos se incluyeron dentro del resumen), 5. las clases de datos se ajustaron a técnicas cualitativas y cuantitativas usadas en el IAvH) y 6. La descripción de los archivos se unifico para datos, código y documentos (materiales de referencia externos) como parte de un mismo metadato y cita de archivo.

¿Cómo documentar las secciones del metadato DDI+DC?

A continuación encontrará cinco secciones (cinco tipos de metadato), donde se describen sus respectivas definiciones, ejemplos y condicionalidad. Cada campo tiene un código de colores para determinar la condicionalidad del mismo según las siguientes categorías:

Campo obligatorio

Campo opcional pero recomendado

Última actualización: 10 noviembre 2022