Una base de datos es un programa que permite guardar, ordenar, mantener, procesar y presentar los datos, está sistematizada en tablas con un orden establecido, por lo que acumula mucha información en poco espacio, permite realizar búsquedas a partir de diferentes criterios, procesar datos de forma cuantitativa y cualitativa, interrelacionar los resultados utilizando distintas variables y actualizar la información fácil y rápidamente. Las bases de datos son compatibles con otras bases de datos, efectúan diversos cálculos por medio de consultas (‘queries’), se extienden por módulos, y se pueden diseñar, almacenar, manejar y analizar en una computadora personal. Las bases de datos relacionales son las más utilizadas, presentan los datos en dos o más tablas (constituidas por registros o renglones y columnas) que están relacionadas entre sí por medio de la repetición de un atributo.
La producción de bases de datos, particularmente las de texto que se pueden consultar en línea fue, sin dudas, el fenómeno más importante en la industria de la información a finales del siglo XX. En 1951 el U.S Bureau of Census diseñó la primera base de datos formal. Favorecidas por el desarrollo tecnológico, las bases de datos se han convertido en una herramienta de trabajo esencial en la recuperación de información necesaria para la investigación bibliográfica y la toma de decisiones estratégicas en las instituciones, organizaciones y empresas científicas, de ahí que haya tanta variedad; por estas mismas razones es importante seleccionar cuidadosamente la o las bases de datos a utilizar, pues de ello depende la calidad de los resultados obtenidos.
Dado que el término base de datos hace referencia al programa que permite sistematizar y manejar los datos (generalmente llamado manejador de base de datos), y que además comúnmente se refiere también a la información que contiene, en este documento nos referiremos a ambas de manera distintiva, base de datos para el programa y colección para la información o datos. Entre los manejadores de bases de datos más comunes para diseñar bases de datos están: Microsoft Access (con costo y de escritorio, nivel básico), Airtable (plan libre y con costo, en línea, nivel básico), MySQL (libre, en línea y de escritorio, nivel avanzado).
Las colecciones contienen registros constituidos por la información, literatura o datos indexados y sus metadatos asociados, estos últimos proporcionan información descriptiva (contenido, el contexto, la calidad, la estructura y accesibilidad). En nuestra especialidad las bases de datos que utilizamos principalmente son las de literatura, recursos, entidades biológicas y médicas, y de datos que comúnmente se liguen a la literatura, en ciencias biológicas y de la salud es común que a la bibliografía se asocie información sobre datos, especies, sustancias químicas, genes, proteínas, etc...
Algunas colecciones que utilizamos frecuentemente clasificadas por el objeto digital que contienen son:
Literatura: Scopus, Web of Science y PubMed
Entidades biológicas y médicas: Genbank, GBIF, NCBI taxonomy
Recursos: Github, Bioinfovestigacion.edu
Con base en su producción durante el ciclo de la investigación científica podemos clasificar las bases de datos en insumo o producto del proceso investigativo, generalmente se utilizan gran cantidad de bases de datos para reunir información que constituirá la entrada para un proyecto y el producto de la práctica científica por excelencia es una colección, ya sea de datos o de literatura, por ejemplo en cualquier proyecto siempre se producen dos colecciones bibliográficas: la biblioteca en la que se reúnen los registros y los documentos completos de la bibliografía revisada y las referencias en donde se agrupan todos los documentos citados. Es importante que la colección de las referencias estén curadas correctamente para asegurar la calidad de la información y que las citas sean correctas, siempre utilizando como autoridad el documento al que se refiere, un ejemplo de esto se puede consultar en el ejercicio de generación una biblioteca personal en la sección de curación.
Para el caso de las colecciones de datos producto de investigación constituyen el sustento empírico de la ciencia y deben cumplir con las siguientes características: Reproductibilidad, Interoperabilidad, Acceso, Licencias, Créditos y Calidad.
No importa cual sea el proceso de manejo de información que se lleve a cabo o la naturaleza del proyecto, siempre, sin excepción incluye el uso de una colección bibliográfica, esta puede ser una gran base de datos en línea como PubMed, Web of Science, Scopus o Google Scholar o una biblioteca personal gestionada en alguno de los manejadores de bibliografía o incluso, mantenida en un archivo dentro de la computadora, no importa si la base de datos, es pequeña o inmensa, lo que define su calidad es los metadatos que contiene y el documento al que se refiere, a continuación algunos detalles sobre esto.
Las bases de datos se pueden definir como un sistema informático de registros guardados en tablas, con un arreglo establecido, y con un objetivo en particular, el cual permite ordenar, preservar, procesar, recuperar y obtener nuevo conocimiento. Se conocen también con nombres como índices o catálogos, repositorios, bibliotecas virtuales, bases de datos y sistemas de información. Es importante mencionar que existen diferentes tipos de colecciones de datos que se pueden clasificar según su propósito, características y temas, por ejemplo según su propósito pueden ser colecciones dedicadas a la difusión, publicación, edición, etc., por sus características pueden clasificarse en cobertura tipológica (tipo de objetos como texto, imágenes, sonidos, software, localización geográfica), cobertura temática, cantidad de registros, o formato, cobertura regional, etc.
En los 60 se crearon bases de datos bibliográficas como Medical Literature Analysis and Retrieval System (MEDLARS), producida en 1960 por The National Library of Medicine (NLM); Chemical Registry System y Chemical and Biological Activities (CBAS), editadas en 1965 por la Chemical Abstracts Service (CAS) en forma impresa y cinta magnética para computadora; Machine Readable Catalog (MARC), emitida en 1969 por The Library of Congress; Engineering Information en 1967, y BioSciences Information Service (BIOSIS), producida en 1969.
Se calcula que en 1965 existían de 12 a 20 bases de datos aproximadamente, y antes de 1970 ya había cerca de 55; otro cálculo estimaba que en 1968 habían 25 y que para 1970 el número promedio de bases de datos era 75. En la actualidad existen cientos de bases de datos bibliográficos en la Internet, las cuales se distinguen por su propósito, diseño, lenguaje de programación, tamaño, características de la información, clase de usuarios, mecanismo, grado de acceso permitido y método de procesamiento de datos (software o hardware) y por el tipo de información (registros y campos) que contienen, entre otras cosas. Todas ellas contienen información sobre documentos ya sean éstos libros, artículos, revistas, folletos, revistas, etc.
El grado de sofisticación tecnológica de estos catálogos digitales permite que el usuario acceda a los registros de distintas formas y trabaje directamente con ellos, extraiga las referencias y el texto deseado en distintos formatos (http, texto o PDF), ya sea que hayan sido publicados o se encuentren en proceso de publicación (preprints).
Las colecciones bibliográficas son ubicuas en la práctica científica, pues siempre es indispensable su uso. Una base de datos bibliográfica o de literatura es aquella que contiene registros bibliográficos, esta es la unidad mínima de información es llamada también asiento, registro o ficha bibliográfica, la cual corresponde a los datos indispensables para localizar un documento : autor, año de publicación, título del trabajo, editorial o nombre de la revista, volumen, número y páginas.
Las colecciones bibliográficas son académicas si son producto de una actividad académica y son científicas si se refieren a información científica, nuestro interés se centra en las colecciones bibliográficas, académicas de información científica en ciencias biológicas y de la salud.
La producción de una colección bibliográfica debe hacerse siempre de una manera planeada, detallada y documentada, están disponibles en este portal los siguientes materiales a considera para la generación de colecciones bibliográficas:
Las bases de datos bibliográficas de interés biológico y médico son miles. Las características de cada una son difíciles de identificar pues están dispersas en los portales que las albergan, y no existe un catálogo que las reúna y clasifique a todas, conocer sus características es indispensable para elegir cuales podrán satisfacer nuestras necesidades informativas. Entre las características más importantes a considerar están: criterios de inclusión de documentos, contenido (tipo de registros), tipo de acceso, la cobertura (representación) tipológica, temática, geográfica y temporal de la colección.
Dado que las colecciones bibliográficas están presentes durante todo el ciclo de la investigación científica y que sirven a distintos propósitos es importante identificar algunos de sus funciones principales en la práctica biológica, médica y biomédica, con base en su propósito podemos identificar distintos tipos:
Índices o catálogos (etiqueta indice en bioinfovestigacion.edu) que permiten explorar grandes conjuntos de registros bibliográficos cuya finalidad es localizar un recurso bibliográfico. Dentro de estas están los índices de citas.
Librerías o editoriales (etiqueta editorial en bioinfovestigacion.edu), cuyo propósito es vender o distribuir literatura especializada.
Repositorios (etiqueta repositorio en bioinfovestigacion.edu), su función es reunir la literatura en acceso abierto y en texto completo producida por algún agente académico, un país, una institución de investigación o de enseñanza, una región etc...
Biblioteca personal, grupal, institucional o regional que alberga la literatura reunida para consulta.
Colección de referencias es un conjunto de referencias citadas en un documento específico.
Las tres primeras: los índices, las editoriales y los repositorios constituyen los principales tipos de bases de datos consultadas por los especialistas para recuperar literatura especializada, por su tamaño y calidad, por eso serán abordadas con más detalle a continuación.
Para utilizar las bases de datos bibliográficas de manera adecuada es indispensable conocer sus características, muchas de ellas están explicadas y ejemplificadas en la tabla de Airtable y en la colección de hypothes.is mb2dbs.
Características de las bases de datos bibliográficas
Las bases de datos bibliográficas se pueden clasificar con base en varios criterios, son de nuestro interés principal las siguientes:
Por su acceso: abierto, cerrado, unam (para personal universitario)
Por su cobertura regional: Mundial, América Latina, México
Por las disciplinas que contiene: Multidisciplinaria, Ciencias Biológicas (biodiversidad y biomedicina) y Ciencias Médicas.
Por el tipo de documentos que indexan principalmente: libros, revistas, artículos.
Frecuentemente un usuario consulta una base de datos para resolver los siguientes problemas:
Localizar un documento o su registro bibliográfico para verificar o encontrar información
Recuperar literatura sobre un tema determinado para contestar una cuestión o realizar un proyecto
Iniciar o actualizar una biblioteca
Generar un conjunto de documento para realizar un análisis y obtener frecuencias, tendencias, desarrollo, relaciones e indicadores
Obtener indicadores métricos como cantidad de descargas, factor de impacto, cantidad de citas o índice H
Identificar las principales características de las bases de datos
Saber si la base de datos es abierta o cerrada
Diferenciar entre el buscador y la colección
Identificar qué tipo de registros tiene la base de datos
Hacer búsquedas simples y complejas o sencillas y avanzadas, y generar consultas
Manejar y guardar historiales de búsqueda,
Configurar las opciones de búsqueda
Utilizar las diferentes herramientas de las base de datos
Extraer metadatos para análisis de literatura
Consultar análisis bibliométricos
Utilizar tesauros para realizar búsquedas
Utilizar los campos de búsqueda disponibles en cada base de datos
Identificar ventajas y desventajas de las bases de datos bibliográficas
Encontrar artículos y revistas indexadas