Glosario de Gestión de Datos de Investigación y Publicaciones

PROYECTO VULE CIENCIA ABIERTA

VERSIÓN 1.0


Presentación

A continuación, se presenta el Glosario de Gestión de Datos de Investigación y Publicaciones desarrollado para el Proyecto VULE Ciencia Abierta, con el objetivo de dar a conocer y socializar conceptos esenciales vinculados a la gestión de datos de investigación y publicación científica. El glosario comprende 17 conceptos ordenados alfabéticamente.

Conceptos


Acceso abierto (open access): Significa el acceso libre a la información y uso sin restricciones de recursos electrónicos para todos. Cualquier tipo de contenido puede ser open access, desde texto, datos de software, audio, vídeo y multimedia. Específicamente, se refiere al depósito en repositorios de acceso universal de copias digitales de dichos contenidos. Una publicación es considerada de acceso abierto si:

  • Su contenido accesible de forma universal y gratuita, sin costo para el lector, vía internet, o de lo contrario;

  • El autor o el propietario del derecho de autor irrevocablemente concede a todos los usuarios, por un periodo ilimitado, el derecho a usar, copiar o distribuir un artículo, bajo la condición de proporcionar la atribución correspondiente;

  • Es depositada, inmediatamente, en formato completo y electrónico, en al menos un repositorio de acceso abierto (adaptado de UNESCO y ANID).


Administración de datos (data stewardship): Se refiere al conocimiento y habilidades requeridas para gestionar los activos de datos de forma efectiva. La administración de datos es a menudo descrita como la gobernanza de datos en acción. Esto incluye la supervisión de los datos para asegurar la adecuación al uso, la accesibilidad de los datos y el cumplimiento de las políticas, directrices y regulaciones (adaptado de Tri-Agency Research Data Management, Canadá).


Article publishing charge (APC): Son pagos solicitados por una editorial de acceso abierto que efectúa el autor o su institución para cubrir diversos costos de publicación.


Ciclo de vida de los datos: se refiere a todas las etapas de existencia de datos, desde su creación hasta su destrucción. El ciclo de vida de los datos provee una visión de alto nivel de las etapas involucradas en la gestión exitosa y en la preservación de datos para su uso y reutilización. De manera amplia, estas etapas son: planeación, creación, procesamiento, análisis, diseminación, preservación y reutilización.


Ciencia abierta (open science): Es un movimiento que pretende hacer la ciencia más abierta, accesible, eficiente, transparente y beneficiosa para todas y todos. Impulsado por los avances sin precedentes del mundo digital, la transición hacia la ciencia abierta permite que la información, los datos y los productos científicos sean más accesibles y más fácilmente compartidos con la participación activa de todas las partes interesadas. Se caracteriza por la apertura no sólo de las publicaciones (lo que tradicionalmente se conoce como open access), sino también de los datos de investigación, las metodologías, los procesos, así como la vinculación de la ciudadanía en un entorno de investigación e innovación responsable. De forma sencilla, los procedimientos de ciencia abierta pretenden hacer accesibles, en formato digital, los resultados de la investigación financiada con fondos públicos, no sólo para la comunidad científica que los produce, sino para la sociedad en general que la financia, potenciando al tiempo la reproducibilidad y la reutilización de los resultados (UNESCO).


Dataset (conjunto de datos): Es una colección de datos relacionados y codificados en una estructura definida. Los datasets pueden contener datos experimentales, datos geoespaciales, notas de laboratorio, datos genómicos, entre muchos otros.


Datos de investigación: Son mediciones, grabaciones, registros u observaciones que son recolectadas por investigadores u otros, y se generan a lo largo del desarrollo del proyecto de investigación. Presentan un mínimo de contexto para su interpretación. Los datos pueden tomar la forma de texto, números, símbolos, imágenes, grabaciones, grabaciones sonoras, reproducciones pictóricas, dibujos, diseños y otras representaciones gráficas, manuales de procedimiento, formas, diagramas, flujos de trabajo, descripciones de equipos, archivos de datos, algoritmos para el procesamiento de datos, software, lenguajes de programación, código o registros estadísticos. Sirven de soporte a los resultados de un proyecto de investigación (adaptado de Tri-Agency Research Data Management, Canadá).


Digital Object Identifier (DOI): Es un identificador persistente que es usualmente asignado a ítems digitales, como por ejemplo, a artículos o a un dataset con el fin de que pueda ser encontrado o citado. Los DOIs pueden ser incorporados a una URL de manera tal que los usuarios siempre puedan acceder al contenido digital, incluso si estos han sido movidos de su ubicación en línea (adaptado de Research Data Oxford, Reino Unido).


FAIR (Findable, Accesible, Interoperable, Reusable): Los principios FAIR se utilizan para indican que los datos cumplen con los requisitos de encontrabilidad, accesibilidad, interoperabilidad y reutilización Los Principios FAIR ofrecen un conjunto de cualidades precisas y medibles que una publicación de datos. De forma general, estos son:


  • Findable (Encontrables): Los datos y metadatos pueden ser encontrados por la comunidad después de su publicación, mediante herramientas de búsqueda.

  • Accessible (Accesibles): Los datos y metadatos están accesibles y por ello pueden ser descargados por otros investigadores utilizando sus identificadores.

  • Interoperable (Interoperables): Tanto los datos como los metadatos deben de estar descritos siguiendo las reglas de la comunidad, utilizando estándares abiertos, para permitir su intercambio y su reutilización.

  • Reusable (Reutilizables): Los datos y los metadatos pueden ser reutilizados por otros investigadores, al quedar clara su procedencia y las condiciones de reutilización.


Gestión de datos de investigación: Se refiere a los procesos aplicados al ciclo de vida de un proyecto de investigación para guiar la recolección, documentación, almacenamiento, intercambio y preservación de los datos de investigación. Una buena gestión de datos de investigación es un elemento crítico para la investigación de todas las disciplinas, particularmente en los casos donde las entidades financiadoras requieren de los investigadores que gestionen sus datos de investigación (adaptado de Tri-Agency Research Data Management, Canadá).


Metadatos: Consisten en información que caracteriza los datos. Describen el contenido, calidad,

condiciones, historia, disponibilidad y otras características de los datos (ANID).


ORCID iD (Open Researcher and Contributor IDentifier): Es un identificador digital persistente que permite distinguir a los investigadores de forma unívoca. Resuelve el problema de identificar a autores a pesar de existir nombres idénticos o similares, cambios de nombre a lo largo de la vida, diferentes convenciones al escribir nombres, etc. Permite conectar de forma automática este iD con la información profesional, tales como la afiliación institucional, publicaciones, adjudicaciones y otros. El ORCID iD es administrado por el propio investigador y es de uso gratuito.


Plan de gestión de datos de investigación (PGDI): Es un documento donde se establece cómo se gestionarán los datos (incluyendo códigos) durante la investigación y una vez finalizada la misma. El plan de GDI es un documento que debe ser actualizado durante la investigación.


Publicaciones: La producción científico-tecnológica plasmada en artículos de revistas, capítulos de libros, libros, trabajos técnico-científicos, tesis académicas, entre otros que sean el resultado de la realización de actividades de investigación, que hayan atravesado un proceso formal de evaluación y que hayan sido estos publicados o no (ANID).


Ruta verde al acceso abierto (green open access): El proceso mediante el cual el autor que ha publicado su artículo en una revista de suscripción deposita la versión aceptada del mismo en un sitio web o en un repositorio institucional o temático después de un periodo de embargo que se contabiliza desde la fecha en que el artículo se ha publicado en una revista, y que suele durar entre 6 y 24 meses (ANID).


Ruta dorada al acceso abierto (gold open Access): Implica el acceso público, inmediato, permanente y gratuito al artículo final por medio de un canal de publicación de acceso abierto de alta calidad, es decir una revista de acceso abierto. Ello se consigue mediante el pago al editor de una tarifa variable conocida como APC (Article Publishing Charge), que son los costos derivados del proceso de revisión, producción y publicación del artículo (adaptado de ANID).


Revistas híbridas: Una revista de acceso abierto híbrida es una publicación que combina la publicación basada en suscripción y la publicación libre de pagos. Esto significa que el autor paga un monto (APC) determinado por el editor para dejar el artículo disponible de forma libre. De otra forma, la revista queda disponible a los lectores mediante el pago de una suscripción por el acceso.