Intégration de données/Historique et avant-propos
Introduction
modifierPour bien comprendre l’intégration de données, il faut tout d’abord avoir à l’esprit les évolutions technologiques qui ont permis aux entreprises de se développer et d’avoir des outils d'aide à la décision. Il s’agit du monde informatique décisionnelle. Ce domaine, jeune et en plein essor, constitue un levier d’actions pour les entreprises depuis l’utilisation récurrente des systèmes informatiques de gestion en entreprise. C’est pour cela que les avancées technologiques ainsi que les exigences du marché ont rendu ce domaine incontournable chez les analystes, décideurs et développeurs. Tout le monde veut se mettre au BI (Business intelligent), et tout le monde à raison. La valeur ajoutée que peut apporter un environnement de BI dans une entreprise est simplement stupéfiante par un contrôle permanent de la gestion interne, de la gestion des stocks, et la possibilité d’anticiper et prévoir les tendances et habitudes des consommateurs.
Le terme "informatique décisionnel", est important à connaître afin de mieux illustrer une composante qui en fait partie : L’intégration de données.
Nous parlerons d'abord de la genèse de ce phénomène, puis nous distinguerons la différence entre le mode opérationnel et décisionnel dans une entreprise.
Historique
modifierPour mieux comprendre un phénomène, il est indispensable de faire un retour à la source pour comprendre les contraintes et besoins des entreprises. Il faut donc s’intéresser au besoin en information du début des années 1970 à nos jours.
Le commencement
modifierDébut des années 1970, l'informatique reste un " petit gadget " que les chefs d'entreprise précurseurs ont. Il s'agit d'une première approche du monde informatique, cela n'a pas pour initiative d'estimer la rentabilité ou l'efficacité d'un produit mais c'est un outil que l'on a pour le plaisir, faire un pas dans le futur… Le besoin en information, dans ces années là, commence à apparaître car la concurrence commence à être intense. La prise de conscience a été rapide sur l’enjeu primordial : le patron qui détient l'information détient le marché. Avant, la gestion des entreprises se faisait manuellement jusqu'au jour où on entendit parler d'une machine nommée ordinateur et qui pouvait faire des calculs de façon automatiques tout en les sauvegardant dans leur mémoire. Il y a donc un vrai essor pour les entreprises, elles s'informatisent et le besoin en informatique est accompli. Les chefs d'entreprise peuvent avoir les résultats de leurs différentes activités que se soit journalier, mensuellement ou annuellement.
Les Data Centers
modifierDans les années 1980, l'informatisation de l'univers professionnel continue, les entreprises les plus malignes accumulent beaucoup de données de leurs activités pour établir des stratégique et être efficient. On peut voir l'émergence des Data Centers. Les départements informatiques ont répertoriés des années et des années de données de production qu'il faut donc trier et analyser. Avec un volume aussi conséquent, les analystes et les patrons s'y intéressent. En effet, c’est en analysant les données de l’entreprise qu'on peut savoir ce qui peut entrevoir les axes d'amélioration dans l’entreprise. Manque d'évolution technologique et de maturité, le seul service capable de fournir des rapports des données est le service informatique. La direction ainsi que le département informatique travaille donc étroitement et les exigences de la direction devienne de plus en plus compliqué à gérer pour le service. Les conditions de travail deviennent de plus en plus difficile et la surcharge de travail est importante pour les informaticiens. De plus, les systèmes de production aussi.
Les systèmes de reporting
modifierOn s'aperçoit très vite que la demande en information ne pourra jamais être pleinement satisfaite si le département informatique est surchargé dû au constante sollicitation de toute la direction. Les informaticiens doivent réfléchir à des logiciels de génération de rapports. Les logiciels sont composés de menus et auront des fonctionnalités permettant à l'utilisateur d'interroger des rapports paramétrables. La solution semble répondre aux besoins, mais deux incidents apparaissent des outils de reporting :
- Les utilisateurs demandent de façon récurrente de l'information, les systèmes se retrouvent saturés : Avec le reporting, les utilisateurs se sentent plus indépendants. Ils commencèrent à interroger la base de façon régulière, ce qui entraîne la saturation sur les serveurs. On trouve la solution de faire des mises à jour matérielles sur les serveurs pour qu'ils soient utilisable mais ce n'était pas une solution durable. On s'occupait de la cause dans l'urgence de la demande et non la cause.
- Manque de visibilité du marché et de l'information des reportings : On sait que, début des années 1990, l'insatisfaction des décideurs et les exigences à l'attention des informaticiens était grandissante car ces derniers devaient, avec les technologies de l'époque, pouvoir assouvir et répondre à la soif de connaissance de la direction. Cependant, les reporting donnaient des rapports qui ne donnaient pas assez d'informations pertinentes et pointues, ce qui ne faisait qu’alimenter la curiosité et des interrogations.
L'informatique décisionnelle
modifierFace à ces constats, chercheurs en informatique et professionnels se sont posés la question suivante : comment faciliter la prise de décisions des décideurs? Il ne fallait pas qu'un système mais un environnement parce que la seule manière de répondre efficacement à la curiosité des décideurs et aux interrogations est d'avoir un outil qui permet de faire la sélection des données les intéressant. Dans le travail des analystes, on sait qu'ils n'ont jamais de cible concrète, ils cherchent, par des biais différents et d'analyse, le moyen d'améliorer l'entreprise. Cependant, ils ont des pistes, des doutes, des points de départ mais jamais rien de concret. Un processus d’input - output ne serait donc pas pertinent pour eux. Il faut donc un environnement. On se demande maintenant les éléments que composent cet environnement pour aider les décideurs à prendre des décisions :
- Simple : L'environnement doit être simple et intuitif pour être manipulé par des non informaticiens.
- Rapide : Le temps des décideurs est précieux.
- volume important de données : La prise de décision au niveau des analystes et des chefs d'entreprise se fait à un haut niveau d'abstraction. On analyse la tendance des ventes sur les quatre dernières années pour en tirer des conclusions et établir des actions à mener. Il doit pouvoir gérer de très gros volumes de données.
- Indépendant du système de production : Il faut que le système soit robuste. Il ne doit pas planter à cause d'une requête effectuée.
- Pour un membre restreint d'utilisateurs : Ne concerne que le sommet de la pyramide. (par exemple : La DAF)
- Fiable et hétérogène : Il doit pouvoir concatener toutes les sources de données que possède l'entreprise. La conséquence d'avoir un risque d'erreur dans les données n'est pas négligeable. Il s'agit de minimiser ce risque. La non fiabilité impliquera forcément le manque d'intérêt de l'outil.
Avec tous ces changements, des concepts, outils, logiciels se sont formés et axés autour de ce nouveau domaine : L'informatique décisionnelle. Une nouvelle manière de concevoir en entreprise était née. On désire maintenant séparer le décisionnel du transactionnel. On sait que les systèmes d'opération sont fait pour agir et non pour prendre des décisions stratégiques. Le BI est né.
Intégration de données
modifierAvant-propos
modifierL'essor des nouvelles technologies et du Web a subitement amplifié et simplifié la collecte, le stockage et l'accès aux données d’une entreprise. Présentées de façon regroupé et explicite, elles sont analysées et contribuent à faciliter la prise de décision, permettant de partager les connaissances et les idées.
Pour bien comprendre l’intégration de données, il faut commencer par définir ces termes avant de se lancer dans des explications plus précises.
Données
Une donnée est une information numérique ou alphabétique souvent codée, lisible par une machine et son utilisateur. C’est la description élémentaire d’une réalité. Ces données permettent d’avoir une information et sont indiscutables. Ces données servent de base pour une recherche ou un examen quelconque mais est dépourvue de tout raisonnement, constatation, supposition et probabilité.
Intégration
En informatique, le terme intégration désigne également la conception et la réalisation d'un système d'information intégré par la mise en relation de différents logiciels ou matériels existants.
Entrepôt de données
Un entrepôt de données est un serveur informatique où un certain volume de données est stocké sur un même support informatique. Il peut aussi se nommer base de données décisionnelle, ou encore data warehouse. Cet entrepôt de données permettra de collecter, d’organiser et d’analyser un ensemble de données consolidées. Il va regrouper une partie ou l’ensemble des données. Le but étant de faciliter la prise de décision en entreprise.
« Un entrepôt de données est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le support d'un processus d'aide à la décision. » Bill Immon.
Pourquoi est-il nécessaire de faire une intégration de données ?
modifier- Sources diverses et disparates
- Sources sur différentes plateformes et OS
- Application Legacy utilisant des BD et autres technologies obsolètes
- Historique non-préservé dans les sources
- Qualité de données douteuse et changeante
- Structure des systèmes sources changeante
- Incohérence entre les différentes sources
- Données dans un format difficilement interprétable ou ambigu
L’intégration de données est un processus qui permet de regrouper et mélanger la multitude de données qui provient de différentes applications de production, voir des fichiers dits « plats » (Fichier Excel, fichiers texte, XMLS…). Il s’agit alors de les intégrer, de les homogénéiser et de leur donner un sens unique compréhensible par tous les utilisateurs. Ainsi, ce système doit permettre un accès efficace, facile et sûr aux données intégrées et homogénéisées.
« Je ne suis pas un crack en informatique, loin de là, mais il n’y a pas que les mécaniciens qui sachent conduire une voiture. » Joseph Finder.
Objectifs
modifierL’intégration de données permet de :
- Piloter l’ensemble des bases de données interne et externe d’une organisation.
- Organiser les processus par lesquels des données informatives sont collectées, regroupées dans un format.
- Assurer un accès rapide, simple, efficace aux données traitées.
- Améliorer la consultation et l'analyse des données effectuées par les collaborateurs et les consultants.
- Organiser techniquement de façon homogène des données d’entreprise.
- Faire une analyse précise comme des reportings et des tableaux de bords efficace.
- Améliorer la prise de décision des décideurs.
En somme, l'objectif à retenir du processus d'intégration des données est qu’à terme, ces données soient utilisables de façon homogène comme si elles constituaient une seule base de données permettant ainsi une analyse de l’existant.
But
modifierL’intégration de données va permettre d’homogénéiser les données et ainsi de faire « parler » les données entre elles. Cela permettra, par la suite, de répondre aux interrogations des décideurs grâce à des analyses plus poussées (Reportings, tableaux de bords…). Schéma cycle du traitement de l’information dans l’entreprise
Bibliographie
modifierJean-Marie Gouarné, "Le Projet décisionnel - Enjeux, Modèles, Architectures du Data Warehouse", Eyrolles, 1997.
Alain Fernandez, « Les Nouveaux Tableaux de bord des managers, Le Projet Business Intelligence clés en main, » Eyrolles, 6e édition, 2013.
James Taylor, “Decision Management System », IBM Press, Pearson Education.
R. Kimball, L. Reeves, M. Ross, W. Thornthwaite, « Le Data Warehouse : Guide de conduite de projet » Eyrolles, 2005
Isabelle Comyn-Wattiau, Jacky Akoka « Les bases de données, PUF, Que sais-je? » , chap. IX Les bases de données décisionnelles, 2003.