Al proceso formal mediante el cual se generan, curan y publican los datos y metadatos digitales de una colección se le denomina ciclo de vida de la información: consta de la definición, contextualización y categorización de los datos realizados por los curadores con tecnologías especialmente diseñadas para este fin, de manera que los metadatos iniciales o crudos resulten lo menos alterados posible, por una decisión idónea de los procesos analíticos humanos o instrumentales aplicados a través de la adición de los metadatos apropiados. Los metadatos procesados son obtenidos después de trabajar con ellos para hacerlos más significativos después de normalizarlos.
Todo el proceso de curación de una colección se representa como un modelo, el más usado es el de la DCC.
La curación de información digital, se define como la actividad de estructurar, organizar y representar la información para que sea accesible a los seres humanos y las computadoras mediante la integración de metadatos para formar conjuntos de información de calidad, precisa, pertinente, estructurada, interoperable, accesible, actualizada y reutilizable.
Se entiende a la normalización como uno de los subprocesos fundamentales de la curación porque permite establecer una serie de reglas que involucran análisis y transformación de las estructuras de los datos en relaciones que mantengan propiedades únicas permitiendo la consistencia, la mínima redundancia y la máxima estabilidad. Durante este proceso se confirma que los datos y metadatos sean completos, correctos, consistentes, homogéneos, íntegros, estandarizados y limpios. Consta de organizar de manera eficiente los metadatos dentro de una base de datos, los principales objetivos de la normalización son: la eliminación de los datos repetidos; evitar problemas de actualización de los datos en las tablas; garantizar que las dependencias entre ellos sean lógicas y transformar datos complejos a un conjunto de estructuras más pequeñas. Para la normalización de los metadatos es necesario considerar las prácticas implícitas y explícitas y las expectativas que determinan el destino de dichos metadatos, en relación a convencionalismos sociales de adquisición, curación, preservación, compartición y reuso de los datos. De tal manera que la curación de información, son todos aquellos procesos que se realizan durante el ciclo de vida de una colección para asegurar la pertinencia, calidad e interoperabilidad de los datos.
Para el proceso de curación es indispensable la implementación de sistemas de organización del conocimiento, protocolos y la documentación del proceso.
Si la información de la colección es biológica, el proceso de curación se llama biocuración y una de sus principales tareas es la anotación de bases de datos biológicas, una tarea medular de la informática biológica,mi interés se centra en la anotación de bibliografía.