« Intégration de données/Consolidation » : différence entre les versions

Contenu supprimé Contenu ajouté
m Robot : Remplacement de texte automatisé (-\n(==={0,3})(?: *)([^\n=]+)(?: *)\1(?: *)\n +\n\1 \2 \1\n)
Ligne 7 :
}}
 
== Principe ==
 
 
Ligne 13 :
Cette consolidation peut s'effectuer avant l'intégration dans l'entrepôt de données par le biais d'intégrateurs comme l'ETL. On peut cependant avoir besoin de faire une consolidation avec l’extraction des différentes données que nous allons avoir dans l’entrepôt de données et d'autres sources de données hors système (Pour exemple, Excel) et ainsi faciliter l'analyse qui va en découler. On peut, par exemple, citer les reportings et les tableaux de bord à alimenter comme aide à la décision.
 
== Quelle méthodologie avoir pour effectuer la consolidation de données? ==
 
Pour effectuer une consolidation de données, il faut se poser les bonnes questions.
Ligne 25 :
*Déterminer la façon de gérer les exceptions
 
== Quelles sont les transformations à effectuer sur les données sources? ==
 
Pour permettre une consolidation de données, on doit retravailler les données sources pour pouvoir analyser l'ensemble et avoir une correspondance.
Ligne 60 :
Exemple : Profit dégagé des ventes et des coûts associés par ville
 
== Quelles sont les problèmes rencontrés? ==
 
On peut distinguer deux problèmes à la consolidation de données : '''Les problèmes de résolution d'entités et les problèmes de sources multiples'''.
 
=== Les problèmes de résolutions d'entités ===
 
Ils surviennent lorsqu'une seule et même entité se trouve sur des sources différentes sans qu'on ait la correspondance entre celles-ci.
Ligne 74 :
Exemple : Les entités doivent avoir au moins N champs identiques
 
=== Les problèmes de sources multiples ===
 
Ils surviennent lorsqu'une entité possède une représentation différente sur plusieurs sources. il faut avoir des approches de sélection :
Ligne 81 :
 
 
== Méthode de consolidation sur Excel ==
 
Les différentes données seront consolidées sur une feuille de calcul dite « '''maître''' ». Cette dernière peut se trouver dans le même classeur que les différentes feuilles de données ou dans un classeur Excel différent.
Ligne 93 :
Il existe deux méthodes de consolidation sur Excel :
 
=== Par position ===
 
Lorsque des données provenant des différentes feuilles et/ou classeur sont disposées de la même manière et possèdent les mêmes libellés de ligne et/ou colonnes.
Ligne 116 :
 
 
=== Par catégorie ===
 
Lorsque les données provenant des différentes feuilles ne sont pas disposées de la même manière mais qu’elles possèdent les mêmes libellés de ligne et/ou colonnes. Cette méthode est similaire à la création d’un tableau croisé dynamique mais les catégories sont moins faciles à organiser que sur ce dernier.
Ligne 137 :
 
 
==== Exemple 1 – Consolidation par catégorie ====