Formation Talend Open Studio, mettre en œuvre l'intégration de données


Formation Talend Open Studio, mettre en œuvre l'intégration de données

Catalogue : Business Intelligence



Présentation
• L'intégration de données. Les solutions ETL.
• TOS : installation, préférences utilisateur. Documentation de référence.
• Philosophie du produit. Conception d'un job.
Travaux pratiques
Prise en main de l'outil. Présentation du cahier des charges du projet fil rouge.
Modéliser le besoin, concevoir un premier job
• Business Modeler. Job Designer.
• Principales connexions. Composants CSV et XML.
• Composants de transformation simples.
• Visualiser du code généré, exécuter un job.
Exercice
Développement d'un job assurant le tri d'une source CSV, le filtrage de données et le stockage du résultat dans un fichier XML.
Optimiser le développement des jobs
• Configurer des connexions réutilisables à l'aide des métadonnées.
• Mettre à jour les métadonnées et les propager sur les jobs, importer/exporter des métadonnées.
• Paramétrer les jobs par des contextes.
• Externaliser les variables de contexte dans des fichiers ".properties" et ".ini".
• Créer et gérer ses propres variables.
• Générer des jeux de données pour des tests.
Exercice
Refactorer un job en utilisant métadonnées et contextes. Générer un jeu de données de test pour ce job.
Travailler avec des bases de données
• Bases de données supportées et principaux composants.
• Paramétrages des opérations sur les tables.
• Métadonnées et contexte de connexion à un schéma de base de données.
• Partage de connexions et gestion des transactions.
• Créer des requêtes à l'aide de SQLBuilder.
Exercice
Lecture et mise à jour d'un référentiel de données hébergé sur un serveur MySQL.
Travailler sur des données multisources
• Présentation du composant tMap.
• Configuration des flux d'entrée, créations de jointures.
• Réaliser des transformations en utilisant variables, expressions et jointures.
• Qualifier les données à l'aide de filtres.
• Générer des sorties multiples, gérer les rejets.
Exercice
Consolidation de données multisources et génération d'un entrepôt.
Compléments
• Décomposer un job en sous-jobs, utilisation du tRunJob. Lancer les jobs en ligne de commande. Exécution périodique.
• Débogage d'un job, tracer les statistiques d'exécution.
• Reporting tJasperOutput.
Exercice
Génération d'un rapport Jasper Report à partir d'un entrepôt.

 

Fiche de la formation



 Cible :

Développeurs, chefs de projet, consultants en informatique décisionnelle, administrateurs de base de données.


 Prérequis :

Bonne connaissance des SGBDR et du SQL. La connaissance du langage Java est un plus.


 Durée : 3 jours

 Type : Stage pratique


 Contactez-nous