Las 7v del Big Data
Las 7 V a las que se hace referencia en el entorno del tratamiento de los grandes datos son las siguientes:
Figura 3: Unidades de Medida de Almacenamiento
Fuente: https://i.ytimg.com/vi/yK9fvJ7Mmhg/maxresdefault.jpg
Volumen : Hace alusión a la gran producción de datos a nivel mundial. Esta gran cantidad de datos sirve para generar información que, a su vez, se utiliza para generar conocimiento. Los datos informáticos se miden en bits, que es la unidad mínima de información. Un bit almacena un cero o un uno. La siguiente unidad de medida es el byte que corresponden a 8 bits.
Velocidad: hace referencia a la rapidez con la que se dispone de los datos donde sea y cuando sea (anytime-anywhere). Se dispone de los datos en tiempo real, en el mismo momento en el que se están produciendo, por lo que es muy importante la velocidad del tratamiento de esos datos. A mayor velocidad mayor validez de la información que se pueda obtener.
Figura 5: Variedad de recopilación de datos
Fuente: vectorial-de-icono-variedad-la-recopilación-grandes-datos-ilustración-líneas-delgadas-símbolo-lineal-para-uso-en-web-y-166045308.jpg (800×800) (dreamstime.com)
Variedad: los datos provienen de diferentes fuentes y pueden ser estructurados o no estructurados.
Los estructurados son aquellos que están encorsetados en una estructura definida, se dispone de los mismos datos para todos los elementos, por ejemplo, en una base de datos de empleados (nombre, edad, titulación, años de servicio, etc.).
Los datos no estructurados son aquellos que no tienen una estructura definida, como pueden ser imágenes, vídeos o ficheros de sonido.
Figura 6: Veracidad
Fuente: https://cdn.pruebat.org/video/bNuQEvuSQwo/portada.png
Veracidad: los datos deben ser reales, deben corresponder con lo que señalan que son y no con datos falsos. La depuración de los datos y la limpieza de las bases de datos de las organizaciones o instituciones es un paso previo a la toma de decisiones sobre la base de los datos de los que dispone.
Figura 7:
Fuente: https://abdatum.com/media/images/base-datos-clave-valor-cluster.jpg
Valor: toda la producción y procesamiento de datos, los análisis y decisiones deben conducir a acciones que repercutan positivamente en la sociedad, en las organizaciones o instituciones que las procesan.
Figura 8:
Fuente: https://thumbs.dreamstime.com/z/iconos-grandes-de-los-datos-46625179.jpg
Variabilidad: la variabilidad de los datos se refiere a la variación que pueden tener los datos, los cambios que experimentan y que impactan en la homogeneización de los mismos, así como las posibilidades de predicción.
Figura 9: Visualización de datos
Fuente: https://www.tecnologias-informacion.com/visualizacion.html
Visualización : característica definitoria de los grandes datos. En este caso, toma mucho significado la expresión «una imagen vale más que mil palabras». Poder traducir la ingente cantidad de datos y los resultados de los análisis a esquemas, diagramas o gráficos que resuman o sinteticen la información obtenida de los análisis de los macrodatos o Big Data es otra de las necesidades que han surgido en este campo. Es mucha la información que se puede transmitir con las herramientas de visualización de datos, las cuales permiten percibir tendencias y facilitar la toma de decisiones.