Big Data, synthèse technique


Big Data, synthèse technique

Catalogue : Big Data, Intelligence Artificielle



Programme de la formation

Comprendre les concepts clés et les enjeux du Big Data

 

  • Les origines du Big Data.
  • La valeur de la donnée : un changement d'importance.
  • La donnée en tant que matière première.
  • Les chiffres clés du marché dans le monde et en France.
  • Les enjeux du Big Data : ROI, organisation, confidentialité des données.

Démonstration

 

Présentation d'une architecture Big Data.

Technologies du Big Data

 

  • Architecture et composants de la plateforme Hadoop 2.
  • Les modes de stockage (NoSQL, HDFS).
  • Fonctionnement de MapReduce et Yarn...
  • Principales distributions Hadoop : Hortonworks, Cloudera, MapR...
  • Les technologies émergentes : Spark, Storm, Machine Learning Azure...
  • Démarche d'installation d'une plateforme Hadoop.
  • Présentation des technologies spécifiques pour le Big Data (Talend, Tableau, Qlikview...).

Démonstration

 

Installation d'une plateforme Big Data complète.

Traitement des données Big Data

 

  • Fonctionnement de Hadoop Distributed File System (HDFS).
  • Importer des données vers HDFS.
  • Traitement des données avec PIG.
  • Requêtes SQL avec HIVE.
  • Création de flux de données massives avec un ETL.

Démonstration

 

Implémentation de flux de données massives.

Méthodes d'analyse et traitements des données pour le Big Data

 

  • Les méthodes d'exploration.
  • Segmentation et classification.
  • Machine Learning, estimation et prédiction.
  • Le temps réel, l'IA.
  • L'implémentation des modèles.

Démonstration

 

Présentation de l'environnement Spark, Jupyter Notebook, R Notebook et Shiny. Mise en place d'analyses de Machine Learning avec le langage R, Python et Scala.

Data Visualisation, représenter des données de façon visuelle

 

  • Principales solutions du marché.
  • Aller au-delà des rapports statiques.
  • La Data Visualisation et l'art de raconter des chiffres de manière créative et ludique.
  • Mesurer l'e-réputation, la notoriété d'une marque, l'expérience et la satisfaction clients...

Démonstration

 

Présentation et utilisation d'un outil de Data Visualisation pour constituer des analyses dynamiques.

Conclusion

 

  • Les conditions du succès.
  • Synthèse des meilleures pratiques.
  • Bibliographie.

Fiche de la formation



 Cible :

Dataminers, chargés d'études statistiques, développeurs, chefs de projet, consultants en informatique décisionnelle.


 Prérequis :

Connaissances de base des modèles relationnels, des statistiques et des langages de programmation. Connaissances de base des concepts de la Business Intelligence.


 Durée : 2 jours

 Type : Stage pratique


 Contactez-nous