« Intégration de données/Consolidation » : différence entre les versions

Contenu supprimé Contenu ajouté
Aucun résumé des modifications
m Correction des fautes d'orthographe et de syntaxe
Ligne 10 :
 
 
La '''consolidation de données''' permet de rassembler des données provenant de différentes sources de donnéessourcesd.
Cette consolidation peut s'effectuer avant l'intégration dans l'entrepôt de données par le biais d'intégrateurs comme l'ETL. Oon peutcepend nt aavoir besoin de faire une consolidation avec l’extraction des différentes données que nous allons avoir dans l'entrêpôt de données et d'autres sources de données hors système (Pour exempl, Excel) et ainsi faciliter l'analyse qui va en découler. Oon peutpar exemple citerles reportings et les tableaux de bord à alimenter comme aide à la décisior.
Cependant, on peut avoir besoin de faire une consolidation avec l’extraction des différentes données que nous allons avoir dans l'entrêpôt de données et d'autres sources de données hors système (Pour exemple, Excel) et ainsi faciliter l'analyse qui va en découler.
Par exemple, on peut citer comme aide à la décision les reportings ainsi que les tableaux de bord à alimenter.
 
== Quelle méthodologie avoir pour effectuer la consolidation de données? ==
Ligne 36 ⟶ 34 :
 
* '''Révision de format'''
Exemple : Mettre les données au même format dans unune feuilletfeuille Excel afin de pouvoir faireutiliser des formules
 
*'''Décodage de champs'''
Ligne 50 ⟶ 48 :
 
*'''Découpage des champs complexes'''
Exemple : Extraire l'immatricule et le nom de famille d'un individu d'une seule chaîne de caractère "RéférenceSalarié"
 
*'''Fusion de plusieurs champs'''
Exemple : Faire une valeur référence, unique comme la référence d'un chantier avec le nom du chantier, le lieu et le conducteur de travaux.
 
*'''Conversion des unités de mesue'''
Ligne 66 ⟶ 64 :
== Quelles sont les problèmes rencontrés? ==
 
On peut distinguer deux problèmes à la consolidation de données : '''Les problèmes de résolution d'entités et les problèmes de sources multiples'''.
 
=== Les problèmes de résolutions d'entités ===
 
Ils survienentsurviennent lorsqu'une seule et même entité se retrouvetrouve sur des sources différentes,différente sans qu'on ait la correspondance entre ces sourcescelles-ci.
Exemple : Fournisseurs ayant un identifiant différent sur les différentes sources
 
Ligne 78 ⟶ 76 :
=== Les problèmes de sources multiples ===
 
Ils suviennentsurviennent lorsqu'une entité possède une représentation différente sur plusieurs sources. il faut avoir des approches de sélection :
* Choisir la source la plus approprié
* CHoisirChoisir la source yanayant l'infomationinformation la plus récente
 
 
Ligne 87 ⟶ 85 :
Les différentes données seront consolidées sur une feuille de calcul dite « '''maître''' ». Cette dernière peut se trouver dans le même classeur que les différentes feuilles de données ou dans un classeur Excel différent.
 
Exemple : Vous avez des coûts répartis dans plusieurs départements/services/thèmes…thèmes…Ces données peuvent se trouver dans le même classeur (ex : un département/service/thème par onglet) ou bien encore se trouver sur différents classeurs Excel (ex : un classeur pour chaque département/service/thème)
 
IlsVous sontallez répartisdonc dansrassembler plusieursces feuillesdonnées de(peut donnéesimporte Excel,l'endroit doncauquel vouselles allezse les rassemblertrouvent) dans la feuille de calcul « maître » de dépenses de la société/association…etc.
Cette feuille peut également contenir, pard'autres exemple,données telles que le total des ventes en moyenne et, le niveau des stocks...
 
 
Il existe deux méthodes de consolidation sur Excel :
Pour consolider avec des fonctionnalités d'Excel, il existe deux méthodes.
 
=== Par position ===
 
Lorsque des données provenant des différentes feuilles et/ou classeur sont disposées de la même manière et possèdent les mêmes libellés de ligne et/ou colonnes.
 
 
Ligne 112 ⟶ 110 :
Consolider
 
Sélectionner dans « références » :les Lesdifférents tableaux de chaque ongletdonnées
 
Cocher "ligne du Hauthaut" et "colonne de gauche" si on veut '''faire apparaître les libellés de lignes/colonnes'''
 
 
Ligne 136 ⟶ 134 :
Sélectionner dans « références » : Les tableaux de chaque onglet 
 
Cocher "ligne du Hauthaut" et "colonne de gauche" pour permettre à Excel de '''calculer et restituer les bonnes données selon le bon intitulé'''
 
 
Ligne 161 ⟶ 159 :
 
 
Ici nous voulons toujours la somme doncqui nous gardonsest la valeur par défaut.
Encore une fois nous rajoutons les références (qui sont les 4 tableaux de ventes par trimestre).
Cette fois-ci cependant nousNous cochons toutes les étiquettes. En effet comme les différents tableaux ne présentent pas les mêmes données aux mêmes endroits et dans la même position (colonne et ligne) il faut absolument cocher « Ligneligne du haut » et « Colonnecolonne de gauche ». Ceci aura pour effet de demander à Excel de trouver lui-même les étiquettes pouret d'y additionner les bons chiffres.
 
 
Ligne 172 ⟶ 170 :
 
 
Si on veut voir le détail des données prises en considération dans la somme dedes valeurs, on clique toujours sur les petits « + » à gauche du tableau.