formations/cesi/intro_big_data/presentation/slides.md

133 lines
2.2 KiB
Markdown
Raw Normal View History

<!-- $theme: default -->
<style>pre, table { font-size: 0.6em !important; }</style>
# Introduction au "Big Data"
William Petit - S.C.O.P. Cadoles
---
<!-- page_number: true -->
---
## Vocabulaire
---
### Qu'est ce qu'une "donnée" ?
> Une donnée est une description élémentaire dune réalité. Cest par exemple une observation ou une mesure. [...]
>
> Elle est dépourvue de tout raisonnement, supposition, constatation, probabilité.
>
> -- [Wikipédia](https://fr.wikipedia.org/wiki/Donn%C3%A9e)
**Exemples**
- Température = 25°C
- Total de personnes dans la salle = 10
---
### Qu'est ce qu'une "information" ?
> Une information est une interprétation contextualisée d'une donnée ou d'un ensemble de données. Elle est porteuse de "sens".
**Exemple**
- Température = 25°C -> Il fait chaud
- Total de personnes dans la salle = 10 -> C'est un petit groupe
---
## Contexte et définitions
---
### Historique
- Première mention du terme en 1997
- Issue des réflexions liées à l'explosion de la génération et l'usage des données
- Une définition aux contours flous
---
### 3 caractéristiques de la problématique
---
### Volume
<p style="text-align:center">
<img style="width:80%" src="img/The-total-amount-of-data-generated-on-earth-exceeded-one-zettabyte-in-2010It-is.png">
</p>
[Zaslavsky, Arkady & Perera, Charith & Georgakopoulos, Dimitrios. (2012). Sensing as a Service and Big Data. CoRR, abs/1301.0159.](https://www.researchgate.net/publication/234017925_Sensing_as_a_Service_and_Big_Data)
---
### Vitesse
---
### Variété
---
## Aperçu technique des solutions
---
### Stockage des données
---
### Présentation d'Apache Hadoop et HDFS
---
### Traitement des données
---
#### Le modèle "MapReduce"
---
### Présentation d'Apache Spark et Apache Storm
---
## Bases de données "NoSQL"
---
### Base de donnée orientée clé/valeur
---
### Base de données orientée document
---
### Base de données orientée colonne
---
### Base de données orientée graphe
---
#### Exemple avec le projet Cayley
---
## Exploitation des données et cadre légal
---
### Qu'est ce qu'une données à caractère personnel ?
---
### Le RGPD