« Talend/L'intégration de données » : différence entre les versions

Contenu supprimé Contenu ajouté
MaitreCoq (discussion | contributions)
Aucun résumé des modifications
MaitreCoq (discussion | contributions)
Aucun résumé des modifications
Ligne 19 :
Comme l’expression l’indique, le Big Data se caractérise par la '''taille''' ou la '''volumétrie''' des informations. Mais d’autres attributs, notamment la '''vitesse''' et le '''type de données''', sont aussi à considérer. En ce qui concerne le type, le Big Data est souvent rattaché à du contenu '''non structuré''' ou '''semi-structuré''', ce qui peut représenter un défi pour les environnements classiques de stockage relationnel et de calcul. Les données non structurées et semi-structurées sont partout : contenu web, posts twitter ou commentaires client en format libre. Par vitesse on entend la rapidité avec laquelle les informations sont créées. Grâce à ces nouvelles technologies, il est maintenant possible d’analyser et d’utiliser l’importante masse de données fournie par les fichiers log des sites web, l’analyse d’opinions des réseaux sociaux, et même les vidéos en streaming et les capteurs environnementaux. Nous pouvons ainsi tirer parti d’une vision stratégique impossible jusqu’à ce jour.
 
Les produits d’intégration de données de Talend permettent d’accéder, de transformer et d’intégrer des données de tout système en temps réel ou par lots afin de répondre aux besoins d’intégration de données opérationnelles et analytiques. Avec plus de 800 composants, Talend intègre presque toutes
les sources possibles de données.
 
== Objectifs ==
 
Les objectifs Big data de Talend se déclinent en 4V :
 
* '''V'''olume : Le volume décrit la quantité de données générées par des entreprises ou des personnes.
Avec l'arrivée d'internet et des réseaux sociaux la quantité de données numériques produites dans le monde a explosé.
Les entreprises, tous secteurs d’activité confondus, doivent aujourd'hui trouver des moyens pour gérer un volume de données en constante augmentation. On parle aujourd'hui couramment de Pétaoctets (1 000 Téraoctets).
* '''V'''ariété : Ces données ont pour caractéristiques outre le fait d'être volumineuses d'être non structurées ou de formats très variables, contrairement aux données qui jusqu’à présent étaient formatées dans des bases de données classiques. Ainsi, médias sociaux, vidéo, contenu sémantique, logs internet, données de géolocalisation... sont autant de sources de données lourdes qui ne présentent pas de "format type".
* '''V'''itesse : Besoin de traiter en temps réel des flux considérables qu'il devient impossible de stocker
 
* '''V'''isualisation : Simplifier et rendre accessible toute cette quantité d'information
 
 
== Utilisation en entreprise du Big data Talend ==
 
Talend offre deux solutions d’intégration Big Data pour répondre à tous les besoins : '''Talend Open Studio for Big Data''', outil de développement Open source gratuit, et '''Talend Platform for Big Data''', avec des fonctions incluses de qualité de données, de déploiement avancé et de gestion.
Ligne 27 ⟶ 42 :
 
[[File:Talend Big data.gif|gauche|Talend Big data]]
<br /><br /> Le '''Big Data''' représente un changement significatif de modèle au niveau de la technologie des entreprises modernes et transforme ce qu’elles sont aujourd’hui. Les entreprises capturent des '''trillions d’octets d’informations''' concernant leurs clients, leurs fournisseurs, les opérations d’entreprise. Des millions de réseaux de capteurs embarqués dans des appareils, tels que les téléphones portables, les compteurs d’énergie et les automobiles sentent les données, les créent et les communiquent. Le désir de collecter les enregistrements des détails des appels, les logs internet, les données des réseaux de capteurs, des transactions financières, des médias sociaux et des textes internet, puis de les analyser par rapport aux sources de données existantes, est toujours plus fort. En collectant et analysant ces données, les entreprises ont une meilleure vision des nouvelles opportunités et des menaces du marché.<br />
 
Talend offre un environnement graphique simple qui permet aux développeurs de mapper visuellement des sources Big Data et cibles de données volumineuses, sans avoir besoin d’écrire du code complexe. Une fois la connexion Big Data configurée, le code est automatiquement généré et déployé en tant que service, exécutable.
Ligne 38 ⟶ 53 :
=== Talend Platform for Big Data ===
 
[[File:Big data Gif.gifpng|droitecentré|Big data Gif]]
 
 
=== Le Big Data pilote votre entreprise ===
[[File:Big data Gif.gif|droite|Big data Gif]]
<br /><br /><br /><br /><br /><br /><br /><br /><br /><br /><br /><br /><br /><br /><br /><br /><br />
 
== L'intégration de données ==