« Intégration de données/Standardisation » : différence entre les versions

Contenu supprimé Contenu ajouté
Spcteamwork (discussion | contributions)
Spcteamwork (discussion | contributions)
Ligne 20 :
L’opération de standardisation est lourde sir vous avez des données qui pèsent avec des milliers de pages à traiter. Il serait bien plus simple d’automatiser le processus de standardisation avec le scraping de données (=récupération des données). Ce type d’extraction et de standardisation des données sont proposés par les outils suivant sous forme de codage : google refine, scraperwiki, et le convertisseur Able2Exxtract PDF.
 
== Outils de mise en forme ==
==
Au vu de l’accroissement du volume de données, le développement de nouveaux outils a été généré afin de rendre plus efficace la mise en forme de ces données. Avant ces nouveaux outils, la gestion et la mise en forme des données étaient principalement effectuées à partir de scripts, cependant il devenait plus favorable d’introduire de nouveaux outils pour gagner en rapidité. Voici les principaux outils utilisés aujourd’hui pour la mise en forme des données :