Formation Data Mining, synthèse


Formation Data Mining, synthèse

Catalogue : Big Data, Intelligence Artificielle



Le Système d'Information Décisionnel (SID)
• Les enjeux du SID : besoins, domaines d'application.
• Architecture type d'un SID, état de l'art.
• Élaboration des informations décisionnelles.
• Conception d'un SID : étapes, optimisation, organisation des données, dictionnaires.
Comprendre le Data Mining (DM)
• Définition et finalité du Data Mining (DM).
• Quel lien entre le DM et les statistiques, quelle dépendance entre le DM et l'informatique ?
• Différence entre DM et OLAP ?
• Les attentes des entreprises, les réponses du DM.
Les techniques du Data Mining
• Les différentes familles du DM.
• Les méthodes prédictives et les méthodes descriptives.
• Analyse factorielle, typologique. La classification.
• Les arbres de décisions, les réseaux de neurones.
• Classification des techniques de DM.
La méthode descriptive du Clustering
• Définition et méthodologie.
• Les critères pour structurer les données à classer.
• Évaluation et validation des classes obtenues.
• Les différentes sous-familles du Clustering.
Exemple
Présentation d'applications du Clustering.
Exemples d'application du DM
• Le scoring : définition, finalité, méthodologie.
• Le géomarketing : définition, finalité, méthodologie.
Exemple
Mise en œuvre de la méthode de scoring. Cas pratique d'utilisation de géomarketing.
Les données de l'entreprise
• Rappel de la problématique des données du SI.
• Qualité des données et administration des données.
• Processus de collecte et d'exploration.
• Création d'agrégats et de nouvelles données.
• Transformation des données.
Méthodologie de projet Data Mining
• Définition du problème métier à résoudre et des objectifs à atteindre.
• Inventorier, décrire et classer les données.
• Concevoir et alimenter la base Data Mining.
• Explorer, segmenter des entités analysées.
• Établir et appliquer les modèles d'analyse.
• Itérer, déployer auprès des utilisateurs.
• Maintenir le modèle et le logiciel associé.
Panorama des outils
• Principaux outils du marché : SAS, R, IBM SPSS...
• Zoom sur l'outil SAS et sur l'ETL Powercenter.
• Quels critères de choix pour ce type d'outils ?

 

Fiche de la formation



 Cible :

Responsables Infocentre, responsables marketing, statisticiens, responsables informatiques, chefs de projets et experts décisionnels. Utilisateurs et gestionnaires métiers de bases de données.


 Prérequis :

Connaissances de base en analyse décisionnelle. Connaissances de base en statistiques.


 Durée : 2 jours

 Type : Séminaire


 Contactez-nous