formations/cesi/intro_big_data/presentation/slides.md

2.2 KiB
Raw Blame History

Introduction au "Big Data"

William Petit - S.C.O.P. Cadoles



Vocabulaire


Qu'est ce qu'une "donnée" ?

Une donnée est une description élémentaire dune réalité. Cest par exemple une observation ou une mesure. [...]

Elle est dépourvue de tout raisonnement, supposition, constatation, probabilité.

-- Wikipédia

Exemples

  • Température = 25°C
  • Total de personnes dans la salle = 10

Qu'est ce qu'une "information" ?

Une information est une interprétation contextualisée d'une donnée ou d'un ensemble de données. Elle est porteuse de "sens".

Exemple

  • Température = 25°C -> Il fait chaud
  • Total de personnes dans la salle = 10 -> C'est un petit groupe

Contexte et définitions


Historique

  • Première mention du terme en 1997
  • Issue des réflexions liées à l'explosion de la génération et l'usage des données
  • Une définition aux contours flous

3 caractéristiques de la problématique


Volume

Zaslavsky, Arkady & Perera, Charith & Georgakopoulos, Dimitrios. (2012). Sensing as a Service and Big Data. CoRR, abs/1301.0159.


Vitesse


Variété


Aperçu technique des solutions


Stockage des données


Présentation d'Apache Hadoop et HDFS


Traitement des données


Le modèle "MapReduce"


Présentation d'Apache Spark et Apache Storm


Bases de données "NoSQL"


Base de donnée orientée clé/valeur


Base de données orientée document


Base de données orientée colonne


Base de données orientée graphe


Exemple avec le projet Cayley


Exploitation des données et cadre légal


Qu'est ce qu'une données à caractère personnel ?


Le RGPD