Objectifs

  • Comprendre les origines et les défis du traitement des données massives.
  • Étudier les fondements de l’architecture HADOOP et de MapReduce.
  • Maitriser le concept des bases de données NoSQL.
  • Introduire les algorithmes du Big Data Analytics.

Contenu

Introduction au Big Data

  • Origines et Définitions
  • Enjeux du Big Data
  • Architecture Big Data

Analyse des Big Data

  • Moteur de traitement SPARK
  • Préparation des données (PreProcessing, Feature Selection)
  • Analyse des données (Regression, Clustering, …)
  • Indexation et recherche de données (Elasticsearch, Kibana)
  • Visualisation des données (DataViz)

Ecosystème Big Data

  • Architecture HADOOP et MapReduce
  • Modes de stockage (NoSQL, HDFS)
  • Collecte et transfert de données (SQOOP, FLUME)
  • Base et entrepôt de données (HBase, Hive)