« Talend/L'intégration de données » : différence entre les versions

Contenu supprimé Contenu ajouté
m Robot : Remplacement de texte automatisé (-OLAP +{{Abréviation|OLAP|online analytical processing|en}})
m Robot : Remplacement de texte automatisé (-\n(==={0,3})(?: *)([^\n=]+)(?: *)\1(?: *)\n +\n\1 \2 \1\n)
Ligne 13 :
}}
 
== Définition ==
L''''''intégration de données''''' appelé ETL (Extraction Transfer Loading) regroupe les processus par lesquels les données provenant de différentes parties du système d'information sont déplacées, combinées et consolidées. Ces processus consistent habituellement à extraire des données de différentes sources (bases de données, fichiers, applications, Services Web, emails, etc.), à leur appliquer des transformations (jointures, lookups, déduplication, calculs, etc.), et à envoyer les données résultantes vers les systèmes cibles.
 
Ligne 25 :
[[File:Intégration de données.JPG|center|Add caption here]]
 
== Objectifs ==
Les principaux objectifs de l''''''intégration de données''''' sont les suivants :
* Un accès aux requêtes, éventuellement aux mises-à-jour.
Ligne 34 :
* Accélération de la conception, du développement, de la livraison et de la gestion des flux de données.
 
== Utilisation en entreprise de l'intégration de données Talend ==
 
L’intégration de données est bénéfique, mais l’intégration de données de haute qualité l’est encore plus. Talend combine des fonctions d’intégration et de qualité de données robustes en une architecture évolutive, afin que les entreprises puissent intégrer, nettoyer et profiler leurs informations en toute confiance. Avec Talend, les risques, les pertes et les coûts associés à des sources de données dupliquées sont considérablement réduits. Talend permet de créer des informations cohérentes via les processus de standardisation et l’implémentation de règles.
 
=== Élargissement de la connectivité ===
 
Talend se connecte habituellement à des bases de données, des applications compactes et dans le Cloud, des applications, des ordinateurs centraux, des fichiers, des services Web, des data warehouses, des data marts et des applications {{Abréviation|OLAP|online analytical processing|en}}. Talend fournit des composants intégrés avancés pour l’ETL et le chargement de masse. Les outils graphiques et les assistants simplifient la gestion de données, le monitoring, le développement, le test et le déploiement.
Ligne 44 :
Les trois principaux composants sont les '''Business Modeler''', '''Job Designer''' et '''Metadata Manager'''. Le Business Modeler est un outil graphique pour créer des logiques métier. Le Job Designer sert à créer des diagrammes, déterminer des développements de données et des séquençages de flux de manière visuelle. Le Metadata Manager stocke et gère toutes les métadonnées des projets, notamment les données contextuelles, comme les informations de connexion aux bases de données et les chemins d’accès aux fichiers.
 
=== Standardisation et enrichissement de données ===
 
Avec Talend, les utilisateurs peuvent profiler et analyser des données, puis créer et partager des rapports basés Web concernant la qualité des données. Avec ces informations, les équipes peuvent s’aligner sur l’usage des données et détecter de possibles améliorations. L’intégration de données Built-in et la technologie puissante de Parsing sont à la base des fonctionnalités de standardisation et d’enrichissement de données de Talend. Elles fournissent des moyens efficaces d’intégration de la plupart des sources de données externes de référence pour validation, identification d’entreprises et informations des risques-clients, entre autres.
 
=== Correspondance et Consolidation des données ===
 
Talend fournit une nouvelle génération de solutions de mise en correspondance de données, rendant ainsi accessible aux utilisateurs métier réels le processus très complexe à écran vert d’édition de règle de mise en correspondance. Les utilisateurs peuvent configurer la mise en correspondance des données dans l’environnement Talend, au lieu d’effectuer des modifications lourdes dans les fichiers de règles et d’utiliser différentes interfaces associées à la plupart des outils de qualité de données.