Big data, synthèse


Big data, synthèse

Catalogue : Big Data, Intelligence Artificielle



Programme

Introduction

  • Les origines du Big Data : un monde de données numériques. 
  • Qu’est-ce que le Big Data ? Définitions, historique et enjeux
  • Les dimensions « en V » du Big Data 
  • Concepts fondamentaux et caractéristiques clés du Big Data
  • Différences et apports par rapport aux technologies traditionnelles
  • Exemples d’application et usages des technologies Big Data

Enjeux et perspectives Big Data pour les entreprises

  • L’avènement de la donnée en tant que ressource stratégique
  • Progrès et innovations de rupture (capacités de stockage, vitesses de traitement)
  • L’impact et les opportunités induites par le Big Data : nouveaux leviers de performance
  • BI et Big Data : concepts de Data Lake, Data Warehouse
  • Création de valeur : comment tirer profit des données ?
  • Les métiers de la data (Data Scientist, Data Analyst, Chief Data officer…)
  • Discussions sur les usages potentiels des solutions Big Data selon les secteurs d’activité.

Stockage et traitement du Big Data

  • Sources de données publiques, privées, la philosophie Open Data
  • Classifier les données selon leur structure
  • Vue d’ensemble des modes et architectures de stockage
  • Présentation de l’écosystème Hadoop 
  • Principes de fonctionnement du modèle MapReduce
  • Des SGBDR aux bases de données NoSQL : MongoDB, Cassandra, Neo4j…
  • Considérations matérielles, les solutions Big Data dans le Cloud

Outils et techniques pour l’analyse de données massives

  • Retour historique : de l’analyse statistique au Data Mining
  • Qu’est-ce que le Data Mining ? Relations avec la Business Intelligence
  • Sélectionner les bons outils suivant la structure de données
  • Analyse de données avec Pig et Hive, Apache Storm, Apache Spark 
  • Recherche et indexation des données avec ElasticSearch
  • Big Data et intelligence artificielle, une convergence révolutionnaire
  • Machine Learning : vue d’ensemble des technologies et algorithmes d’apprentissage automatique
  • Introduction aux réseaux neuronaux (deeplearning)

Visualisation des données

  • Principes fondamentaux et objectifs de la visualisation des données
  • Limites des outils et méthodes traditionnels (Excel, BusinessObjects, etc)
  • Panorama des solutions de la visualisation des données : Tableau, Qlik, Microstrategy, Microsoft Power BI…
  • Quels types de visualisation pour quels usages ? 
  • La visualisation interactive pour représenter les données complexes

Sécurité et Big Data

  • Retour sur les données personnelles et impact du Big Data sur la vie privée
  • Gouvernance et cycle de vie de la donnée dans une architecture Big Data
  • Obligations légales des organisations 
  • Fondamentaux et usages de la cryptographie
  • Les meilleures pratiques concernant la sécurité (pseudonymisation, anonymisation…)

Fiche de la formation



 Cible :

Direction informatique et fonctionnelle. Responsables informatique, chefs de projet, architectes, développeurs.


 Prérequis :

Connaissances de base des architectures techniques.


 Durée : 2 jours

 Type : Stage pratique


 Contactez-nous