« Talend/Généralités sur Talend » : différence entre les versions

Contenu supprimé Contenu ajouté
MaitreCoq (discussion | contributions)
Aucun résumé des modifications
MaitreCoq (discussion | contributions)
Aucun résumé des modifications
Ligne 8 :
 
 
Le fait que les systèmes d’information des entreprises deviennent de plus en plus complexes n’est pas vraiment nouveau. Une première raison à cela tient au fait que les entreprises déploient généralement de nouvelles applications tout en maintenant les anciennes solutions (“empilage de couches”).
Talend Open Studio est un ETL open source apparu en 2005, développé par la société Talend. C’est un ETL de type « générateur de code », c’est-à-dire qu’il permet de créer graphiquement des processus de manipulation et de transformation de données puis de générer l’exécutable correspondant sous forme de programme Java ou Perl.
Une liste très exhaustive de composants permet de se connecter à tout type de base de données ou d’applications (SAP, SugarCRM,…).
 
En outre les entreprises sont contraintes d’ouvrir de plus en plus leurs systèmes d’information à leurs fournisseurs, leurs partenaires et leurs clients. Enfin cette complexification s’explique aussi par la multiplication des formats de stockage de données, des protocoles (FTP, HTTP, SOAP, SCP, etc.) et des technologies des bases de données.
Talend offre deux produits d’intégration de données :
* '''Talend Open Studio''' for Data Integration, outil de développement gratuit et Open Source
* '''Talend Enterprise Data Integration''' qui intègre des fonctionnalités avancées de déploiement et de gestion distribué sous licence commerciale.
 
Une question ressort de ces trois constats : '''''Comment réussir son intégration de données lorsque ses données sont éparpillées dans tous ces types de systèmes d’information ?'''''
== Talend Open Studio ==
'''Talend Open Studio (TOS)''' est une plate-forme d’intégration de données Open Source, basée sur le langage Java. TOS permet de répondre à toutes les problématiques liées au traitement des données dans la chaîne décisionnelle :
 
Les fonctions qui se cachent derrière le principe d’intégration données sont variées : l’intégration décisionnelle (alimentation d’entrepôts de données) et l’intégration opérationnelle (capture et migration de données, synchronisation de bases de données, échanges inter-applicatifs, etc
<br />
 
'''Talend open studio''' couvre tous ces besoins qu’il s’agisse d’intégration décisionnelle ou opérationnelle.
* ETL : Extraction,Transformation , et Chargement des données
* EAI : Échange de données Inter-Application
* Synchronisation des données
 
==Talend open studio==
 
L’une des grandes forces de TOS réside dans le fait de pouvoir se connecter à quasiment toutes les sources de données, applications métier et type de fichier existant. Et ce grâce à plus de 250 composants utilisables par les développeurs. Parmi ses composants, on trouve différentes familles. Voici quelques exemples de familles de composants :
 
- Applications Métier (Mode Ecriture, Lecture)
Microsoft CRM, SAP, Sage CRM, Salesforce, SugarCRM, …
- Base de données (Mode Ecriture, Lecture)
AS400, MS SQL, Oracle, DB2, MySQL, PostgreSQL, Access, ODBC, …
- Fichier (Mode Ecriture, Lecture)
Excel, CSV, TXT, …
- Internet
FTP, WebServices, HTTP, SSH, …
- Orchestration
Fusion des flux, Réplication des flux, mise en attente de l’exécution, itération sur l’ensemble du contenu d’un répertoire, …
- Qualité de données
Unicité des données, remplacement de caractère dans une chaîne, changement de l’encodage d’un fichier, …
- Transformation
Agrégation, Conversion de type, Filtre, Tri, Mappage
- XML
 
Grâce à sa communauté active de développeurs, TOS s’enrichit de jour en jour en nouveaux composants, jobs, routines, …Ces éléments sont alors mis à disposition des utilisateurs pour ensuite être utilisés.