# Introduction au "Big Data" William Petit - S.C.O.P. Cadoles --- --- ## Vocabulaire --- ### Qu'est ce qu'une "donnée" ? > Une donnée est une description élémentaire d’une réalité. C’est par exemple une observation ou une mesure. [...] > > Elle est dépourvue de tout raisonnement, supposition, constatation, probabilité. > > -- [Wikipédia](https://fr.wikipedia.org/wiki/Donn%C3%A9e) **Exemples** - Température = 25°C - Total de personnes dans la salle = 10 --- ### Qu'est ce qu'une "information" ? > Une information est une interprétation contextualisée d'une donnée ou d'un ensemble de données. Elle est porteuse de "sens". **Exemple** - Température = 25°C -> Il fait chaud - Total de personnes dans la salle = 10 -> C'est un petit groupe --- ## Contexte et définitions --- ### Historique - Première mention du terme en 1997 - Issue des réflexions liées à l'explosion de la génération et l'usage des données - Une définition aux contours flous --- ### 3 caractéristiques de la problématique --- ### Volume
[Zaslavsky, Arkady & Perera, Charith & Georgakopoulos, Dimitrios. (2012). Sensing as a Service and Big Data. CoRR, abs/1301.0159.](https://www.researchgate.net/publication/234017925_Sensing_as_a_Service_and_Big_Data) --- ### Vitesse --- ### Variété --- ## Aperçu technique des solutions --- ### Stockage des données --- ### Présentation d'Apache Hadoop et HDFS --- ### Traitement des données --- #### Le modèle "MapReduce" --- ### Présentation d'Apache Spark et Apache Storm --- ## Bases de données "NoSQL" --- ### Base de donnée orientée clé/valeur --- ### Base de données orientée document --- ### Base de données orientée colonne --- ### Base de données orientée graphe --- #### Le concept de "triplet" Un triplet est une structure de données pouvant être représenté sous la forme `(sujet, prédicat, objet)`. Un corpus de triplets permet de représenter un graphe orienté. Exemple: `