« Gestion de projet stratégique/Projet décisionnel » : différence entre les versions

Contenu supprimé Contenu ajouté
m Robot : Remplacement de texte automatisé (-l'intérêt +l’intérêt)
m Robot : Remplacement de texte automatisé (-l'historique +l’historique)
Ligne 36 :
Les outils sont regroupés dans un système appelé "ETL" (Extraction, Transformation et Loading). Ce système représente environ 70% du projet décisionnel en moyenne, il est complexe et on ne doit pas y trouver de mauvaises informations, sinon il sera inutilisable. On ne peut pas trouver de modèle de conception d'ETL car chaque organisation possède ses propres systèmes, sa propre logique de fonctionnement ou culture. ETL a pour utilité d'optimiser les outils pour gérer des flux de données.
 
*Le stockage : les bases de données, appelées Datawarehouse, qui sont utilisées pour le stockage sont différentes des bases de production. Le datawarehouse n'est pas utilisé uniquement pour stocker mais aussi pour gérer l'historiquel’historique des données pour observer l'évolution des données de l'entreprise dans le temps. De plus, le stockage des données peut être considérablement plus volumineux que les bases opérationnelles qui l'alimentent. Au vu du volume important et des données qui peuvent s'emmagasiner, la diffusion se fait via des datamarts. Ces derniers sont comme des datawarehouse mais contenant des données moins lourdes. Grâce aux datamarts, le projet peut être rapidement conduit à son terme et le temps d'attente est moins long pour les utilisateurs.
 
*La diffusion : le but des datawarehouse est de stocker des données et celui des datamarts est de présenter une vue métier des données. Cette vue a comme but de nettoyer les informations inutiles pour l'utilisateur et de transformer des données pour prendre un sens métier. Cela permet aux utilisateurs d’avoir plusieurs significations différentes sur une même base de données en fonction de l'utilisateur qui y accède. En effet, par exemple, un service peut avoir une appellation différente ou une signification différente d'un autre service. La diffusion peut être sous différentes formes ou moyens tels que des diffusions de rapports, des portails d'entreprises ou des applications (exemple : Business Object).
Ligne 126 :
Contrairement aux faits qui reflètent l'activité par exemple une vente, les données des axes d'analyse représentent la connaissance que l'entreprise a de son environnement.
 
Un nouvel enjeu, concerne l'archivage des données celui ci consiste à conserver l'historiquel’historique des évènements clés de l'entreprise tout en les replaçant dans le contexte organisationnel.
Dans notre exemple précédent, l'enjeu est de pouvoir retrouver la segmentation à laquelle était associée le client Y ou encore à quelle gamme appartenait le produit X. Toutes ces données permettent de caractériser un fait et toutes ses évolutions possibles. L'avantage de l'analyse des données est également d'obtenir des résultats identiques qui s'appuient donc sur la même organisation d'analyse et sur les mêmes règles de calcul.
Cet aspect là est pratiquement impossible avec un système opérationnel classique qui ne gère que l'organisation actuelle. Tout changement se traduit par des mises à jour de données informatiques et remplace définitivement l'ancienne structure d'analyse.
Ligne 167 :
*Incomplètes c'est-à-dire, la présence de champs manquants conduisant à des cellules vides. Egalement, elles peuvent être incorrectes dans ce cas, il s'agit de mauvaises codification, de calculs imprécis, d'enregistrements doublonnés ou encore de mauvaise information entrée dans le système source telle qu'une inversion de date.
*Incompréhensibles telles que des codifications inconnues du système ou encore des données non structurées en provenance de traitement de texte.
*Incohérentes liés à des codifications changeantes liées à des réorganisations dans l'entreprise. Dans ce cas, il y a un risque de perdre l'antériorité de l'historiquel’historique de l'entreprise. La présence de multiplication de codes différents pour une même entité comme par exemple un produit ou client ayant changé plusieurs fois de codification dans le temps. Les données peuvent concernés des périodes différentes ce qui fausse l'information ou encore la mise à jour de la table des faits dans le datawarehouse est quotidienne alors que la table de dimension associée est mensuelle, ce qui engendre une non correspondance des données.
 
La phase de préparation du chargement des données dans le datawarehouse (ETL) est longue et coûteuse. Elle nécessite de multiples contrôles afin d'assurer une parfaite cohérence des données. On comprends que la complexité d'un entrepôt de données s'accroît avec le nombre de sources de données en entrée. Cependant, il ne faut pas négliger le fait que l'identification de pièges peuvent disparaître selon les personnes. Pour cela, l'ETL (Extrat Transform Load) qui est un outil destinés à l'extraction, à la transformation et au chargement des données dans un datawarehouse devra faire l'objet d'une documentation précise afin de limiter les risques d'erreurs.