« Intégration de données/Connexion » : différence entre les versions

Contenu supprimé Contenu ajouté
Spcteamwork (discussion | contributions)
Aucun résumé des modifications
Spcteamwork (discussion | contributions)
Aucun résumé des modifications
Ligne 1 :
* '''''La connexion des données, qu’est-ce que c’est ?'''''
 
Le principe même de l’intégration des données est de regrouper et d’assembler des données hétérogènes en provenance de sources variées et multiples afin d’en construire un ensemble homogène. Le but étant de rendre les données exploitables afin d’avoir un outil fiable d’aide à la décision.
Le terme connexion désigne simplement l’acheminement des données de la BD source à l’entrepôt de destination.
 
* '''''Et donc, comment ça marche ?'''''
 
La connexion entre les données sources et la base de données de destination se fait en trois étapes principales :
 
1) Extraction : Tout d’abord il faut extraire les données des sources (HTML, XML, fichiers textes, etc.).
1) Extraction :
Tout d’abord il faut extraire les données des sources (HTML, XML, fichiers textes, etc.).
2) Transformation : Il faut dans un second temps transformer les données afin qu’elles deviennent similaires dans le fichier cible et ainsi exploitables.
2) Transformation :
Il faut dans un second temps transformer les données afin qu’elles deviennent similaires dans le fichier cible et ainsi exploitables.
 
3) Chargement : Enfin, les données doivent être stockées dans le Data Warehouse cible.
3) Chargement :
Enfin, les données doivent être stockées dans le Data Warehouse cible.
 
Notons que toutes les étapes peuvent être réalisées par un même logiciel et que cette décomposition est surtout un moyen de mieux comprendre le déroulement de la procédure.