COURS
Découverte
Avec le développement technologique de nos sociétés, le besoin de récupération et de stockage de données a explosé. Le développement de l'informatique et des outils numérique ont permit d'organiser et de conserver ces données. Aujourd'hui, l'accès aux données, leur stockage et leur utilisation sont un enjeu économique, social et politique majeur.
1. Histoire des données
Travail à faire:
Quel est le premier support pour le stockage des données ? et en quelle année ?
En quelle année est apparu le disque dur ? Quelle était sa capacité de stockage en octets ?
En quelle année est apparu le premier tableur ? quel est son nom ?
En quelle année est apparue la mémoire Flash ?
En quelle année est apparu le Big Data (grands ensembles de données) ?
Qu'est-ce que l'Open Data ?
2. Comment manipuler des données
Travail à faire :
Qu'est ce qu'une donnée ? A quoi l’associe-t-on ?
Quels sont les différents types de données ?
Comment sont structurées les données ?
Qu'est ce qu'une base de données ?
Parmi les exemples suivants, lesquels sont des données, lesquels sont des supports de données ?
Carte Nationale d’Identité, nom, une clé USB, un agenda, adresse postale, tableau, mémoire Flash, la température de la salle.
Pour retrouver et traiter des données facilement, on les organise sous la forme de tables. On parle alors de données tabulaires.
Exemple : La table ci-dessous contient 9 données concernant 3 objets (ou enregistrements) et structurées avec 3 descripteurs (Nom, Prénom et Age).
Il existe trois formats de fichiers utilisés pour stocker des données tabulaires :
Le format CSV (.csv) : «comma-separated values» (valeurs séparées par des virgules) : Ce format est compatible avec (presque) tous les logiciels tableurs. Le séparateur (ici : la virgule) délimite les colonnes.
Le format JSON (.json) : «JavaScript object notation» (notation objet Javascript). Ce format est souvent utilisé par des applications web.
Le format XML (.xml) : «Extensible Markup Language» (langage de balisage extensible). Ce format flexible permet de faciliter les échanges de données entre systèmes hétérogènes.
Exemple de données tabulaires stockées sous les trois formats différents :
3. Les données à caractère personnel
Travail à faire : à l'aide d'une recherche sur internet :
Qu’est-ce que le R.G.P.D ? Qui concerne-t-il ? Qui protège-il ?
Que signifie C.N.I.L ? Quel est son rôle ?
Selon le site de la C.N.I.L., quels sont vos droits garantis par le RGPD ?
4. Le cloud (nuage)
Le cloud (nuage) consiste à stocker les données sur des machines (appelées serveurs) et regroupées dans de grands bâtiments (appelés datacenter).
Tous les sites internet utilisent un cloud pour stocker leurs données.
Il existe des plateformes permettant de stocker/dupliquer ses fichiers dans le cloud pour éviter de les perdre en cas de défaillance de son ordinateur personnel.
Exemple : Google Drive, OneDrive, Dropbox, OVH Cloud ...
Ces datacenters gèrent de plus en plus de données au niveau mondial et consomment un grande quantité d'énergie pour leur fonctionnement mais surtout pour leur refroidissement avec l'utilisation de climatisation. La délocalisation du stockage des données dans ces datacenters éloignés de l'usager ne demeure pas moins un enjeux écologique majeur pour le développement de nos sociétés.