« Intégration de données/Consolidation » : différence entre les versions

Contenu supprimé Contenu ajouté
Ligne 29 :
*Déterminer comment gérer les exceptions
 
== Quelles sont les transformations à effectuer sur les données sources avant de les consolider? ==
 
Pour permettre une consolidation de données, on doit retravailler les données sources pour pouvoir analyser l'ensemble et avoir une correspondance entre les différentes sources.
 
On peut citer, pour une consolidation de données :
 
* '''Révision de format'''
Exemple : Mettre au même format dans un feuillet Excel afin de pouvoir faire des formules
 
*'''Décodage de champs'''
+Consolider les données de sources multiples
Exemple : ["Ouvriers", "Cadres"] vs ["O";"C"] vs [1;2]
+Traduire les valeurs cryptyques
Exemple : "Y","N" pour les réponses yes et no
 
+-''Consolider les données de sources multiples''
*Pré-calcul des valeurs dérivées
Exemple : ["Ouvriers", "Cadres"] vs ["O";"C"] vs [1;2]
 
+-''Traduire les valeurs cryptyques''
Exemple : "Y","N" pour les réponses yes et no
 
*'''Pré-calcul des valeurs dérivées'''
Exemple : Résultat dégagé du chiffres d'affaire et des dépenses
 
*'''Découpage des champs complexes'''
Exemple : Extraire l'immatricule et le nom de famille d'un individu d'une seule chaîne de caractèe RéférenceSalarié
 
*'''Fusion de plusieurs champs'''
Exemple : Faire une valeur référence, unique comme la référence d'un chantier avec le nom du chantier, le lieu et le conducteur de travaux.
 
*'''Conversion des unités de mesue'''
Exemple : Impérial à métrique
 
*'''Conversion des dates
'''Exemple : "01/01/20017" vs "01 janv 2017"
 
*'''Pré-calcul des agrégations
'''Exemple : Profit dégagé des ventes et des coûts associés par ville
 
== Quelles sont les problèmes rencontrés? sur la consolidation de données?==
 
On peut distinguer deux problèmes à la consolidation de données : '''Les problèmes de résolution d'entités et de sources multiples'''.
 
=== Les problèmes de résolutions d'entités ===
 
Ils survienent lorsqu'une même entité se retrouve sur des sources différentes, sans qu'on ait la correspondance entre ces sources.
Ces différentes données seront consolidées sur une feuille de calcul dite « '''maître''' ». Cette dernière peut se trouver dans le même classeur que les différentes feuilles de données ou dans un classeur à part.
Exemple : Fournisseurs ayant un identifiant différent sur les différentes sources
Si vous utilisez fréquemment la consolidation, il est conseillé d’utiliser une '''disposition cohérente pour vos feuilles de données''', un modèle qui vous servira pour toutes vos futures consolidations.
 
La consolidation de données va avoir son importance pour retrouver la correspondance exacte. Les approches basées sur des règles de résolutions.
Exemple : Les entités doivent avoir au moins N champs identiques
 
=== Les problèmes de sources multiples ===
Ex : Vous avez des coûts répartis dans plusieurs départements/services/thèmes…
 
Ils suviennent lorsqu'une entité possède une représentation différente sur plusieurs sources. il faut avoir des approches de sélection :
* Choisir la source la plus approprié
* CHoisir la source yan l'infomation la plus récente
 
 
== Méthode de consolidation sur Excel ==
 
CesLes différentes données seront consolidées sur une feuille de calcul dite « '''maître''' ». Cette dernière peut se trouver dans le même classeur que les différentes feuilles de données ou dans un classeur àExcel partdifférent.
 
ExExemple : Vous avez des coûts répartis dans plusieurs départements/services/thèmes…
 
Ils sont répartis dans plusieurs feuilles de données Excel, donc vous allez les rassembler dans la feuille de calcul « maître » de dépenses de la société/association…etc.
Cette feuille peut également contenir, par exemple, le total des ventes en moyenne, et le niveau des stocks…etcstocks.
 
 
Pour consolider avec des fonctionnalités d'Excel, il existe deux méthodes :
 
• '''Par catégorieposition''' : lorsqueLorsque lesdes données provenant des différentes feuilles de données ne sont pas disposées de la même manière mais qu’elleset possèdent les mêmes libellés de ligne et/ou colonnes. Cette méthode est similaire à la création d’un tableau croisé dynamique mais les catégories sont moins faciles à organiser que sur ce dernier.
Il existe deux sortes de façon de consolider des données :
 
• '''Par positioncatégorie''' : lorsque les données provenant des différentes feuilles de donnéesne sont pas disposées de la même manière etmais qu’elles possèdent les mêmes libellés de ligne et/ou colonnes. Cette méthode est similaire à la création d’un tableau croisé dynamique mais les catégories sont moins faciles à organiser que sur ce dernier.
 
• '''Par catégorie''' : lorsque les données provenant des différentes feuilles de données ne sont pas disposées de la même manière mais qu’elles possèdent les mêmes libellés de ligne et/ou colonnes. Cette méthode est similaire à la création d’un tableau croisé dynamique mais les catégories sont moins faciles à organiser que sur ce dernier.
 
 
 
'''=== Exemple 1 – consolidation par position''' :===
 
'''Exemple 1 – consolidation par position''' :
 
 
Ligne 182 ⟶ 200 :
 
 
'''=== Exemple 2 – consolidation par catégorie :'''===