CESI: Intro Big Data, biblio + environnement démo Hadoop
This commit is contained in:
Binary file not shown.
After Width: | Height: | Size: 34 KiB |
@ -9,18 +9,124 @@ William Petit - S.C.O.P. Cadoles
|
||||
---
|
||||
<!-- page_number: true -->
|
||||
|
||||
## À la recherche d'une définition ?
|
||||
---
|
||||
|
||||
## Vocabulaire
|
||||
|
||||
---
|
||||
|
||||
## Historique
|
||||
### Qu'est ce qu'une "donnée" ?
|
||||
|
||||
> Une donnée est une description élémentaire d’une réalité. C’est par exemple une observation ou une mesure. [...]
|
||||
>
|
||||
> Elle est dépourvue de tout raisonnement, supposition, constatation, probabilité.
|
||||
>
|
||||
> -- [Wikipédia](https://fr.wikipedia.org/wiki/Donn%C3%A9e)
|
||||
|
||||
**Exemples**
|
||||
- Température = 25°C
|
||||
- Total de personnes dans la salle = 10
|
||||
|
||||
---
|
||||
|
||||
## Facettes
|
||||
### Qu'est ce qu'une "information" ?
|
||||
|
||||
> Une information est une interprétation contextualisée d'une donnée ou d'un ensemble de données. Elle est porteuse de "sens".
|
||||
|
||||
**Exemple**
|
||||
- Température = 25°C -> Il fait chaud
|
||||
- Total de personnes dans la salle = 10 -> C'est un petit groupe
|
||||
|
||||
---
|
||||
|
||||
## Contexte et définitions
|
||||
|
||||
---
|
||||
|
||||
### Historique
|
||||
|
||||
- Première mention du terme en 1997
|
||||
- Issue des réflexions liées à l'explosion de la génération et l'usage des données
|
||||
- Une définition aux contours flous
|
||||
|
||||
---
|
||||
|
||||
### 3 caractéristiques de la problématique
|
||||
|
||||
---
|
||||
|
||||
### Volume
|
||||
|
||||
<p style="text-align:center">
|
||||
<img style="width:80%" src="img/The-total-amount-of-data-generated-on-earth-exceeded-one-zettabyte-in-2010It-is.png">
|
||||
</p>
|
||||
|
||||
[Zaslavsky, Arkady & Perera, Charith & Georgakopoulos, Dimitrios. (2012). Sensing as a Service and Big Data. CoRR, abs/1301.0159.](https://www.researchgate.net/publication/234017925_Sensing_as_a_Service_and_Big_Data)
|
||||
|
||||
---
|
||||
|
||||
### Vitesse
|
||||
|
||||
---
|
||||
|
||||
### Variété
|
||||
|
||||
---
|
||||
|
||||
## Aperçu technique des solutions
|
||||
|
||||
---
|
||||
|
||||
### Stockage des données
|
||||
|
||||
---
|
||||
---
|
||||
|
||||
### Présentation d'Apache Hadoop et HDFS
|
||||
|
||||
---
|
||||
|
||||
### Traitement des données
|
||||
|
||||
---
|
||||
|
||||
#### Le modèle "MapReduce"
|
||||
|
||||
---
|
||||
|
||||
### Présentation d'Apache Spark et Apache Storm
|
||||
|
||||
---
|
||||
|
||||
## Bases de données "NoSQL"
|
||||
|
||||
---
|
||||
|
||||
### Base de donnée orientée clé/valeur
|
||||
|
||||
---
|
||||
|
||||
### Base de données orientée document
|
||||
|
||||
---
|
||||
|
||||
### Base de données orientée colonne
|
||||
|
||||
---
|
||||
|
||||
### Base de données orientée graphe
|
||||
|
||||
---
|
||||
|
||||
#### Exemple avec le projet Cayley
|
||||
|
||||
---
|
||||
|
||||
## Exploitation des données et cadre légal
|
||||
|
||||
---
|
||||
|
||||
### Qu'est ce qu'une données à caractère personnel ?
|
||||
|
||||
---
|
||||
|
||||
### Le RGPD
|
||||
|
Reference in New Issue
Block a user