Un dato digitale è un'informazione espressa in numeri sequenziali prodotti da un computer. Per sua natura, è considerato cifrato quindi non leggibile in assenza di una chiave di decodifica. Tuttavia, l'informazione, in funzione del suo trattamento può dare origine ad un dato personale e quindi leggibile.
La scienza dei dati o data science è una fusione multidisciplinare di tecnologia, sviluppo di algoritmi e inferenza di dati che ha il potenziale per risolvere problemi analiticamente complessi. Il nucleo di questa scienza sono dati in cui pile di informazioni sono archiviate nei data warehouse aziendali.
I big data sono dati informatici di grosse dimensioni che non possono essere analizzati e archiviati con strumenti tradizionali.
Il concetto di big data ha acquisito uno slancio all'inizio degli anni 2000, quando l'analista di mercato Doug Laney ha articolato l'attuale definizione di big data come "le tre V":
Volume: le organizzazioni raccolgono dati da diverse fonti.
Velocità: con la crescita dell'Internet delle Cose, i flussi di dati verso le imprese devono essere gestiti in modo tempestivo e a una velocità senza precedenti.
Varietà: I dati sono disponibili in tutti i tipi di formati
Proprio come ogni organismo vivente passa attraverso una serie di cambiamenti nel corso della sua vita, cosi come i dati.
Ecco come si evolvono le informazioni raccolte durante il ciclo di vita dei dati :
creazione dei dati
utilizzo dei dati
pubblicazione
archiviazione dei dati
distruzione dei dati