Filtrage des informations/Exemple de filtrage chez Yahoo
Le principe
modifierYahoo utilise depuis 2007 le logiciel Yahoo Pipes qui possède de nombreuses fonctionnalités comme la collecte, l’analyse des flux et sa propagation. Ce logiciel est comparé à une plate forme de veille, elle permet à la fois d’associer et d’analyser du contenu émanant de différentes sources et d’en dégager à la sortie un flux unique.
Le logiciel a la faculté de rassembler des sources autour de certains sujets qui ont préalablement été définis en fonction des thématiques de veille tel que :concurrents, fournisseurs, marché. Il va ensuite faire ressortir cette différente thématique et les acheminer vers les personnes intéressées.
5 étapes pour atteindre l'objectif :
- Collecte
- Groupage
- Filtrage
- Déboulonnage
- Tri
Logiciels associés au filtrage chez Yahoo
modifier- Le module filtre va permettre de bloquer des flux différents selon leur emplacement : dans le titre, dans le lien, dans la description, ou encore si la description ne contient pas un mot défini. Ce module va donc réaliser un filtrage rigoureux et exact des flux RSS sur les champs titre, auteur, date de publication, lien.
- Le module Regex va avoir comme fonction d’acquérir et remplacer certaines chaines de caractères par l’usage d’expressions régulières (les expressions régulières sont une chaîne de caractères permettant de décrire un ensemble variable par l’utilisation d'une syntaxe precise ex : ^, $, ., *). Le but va être d’améliorer la mise en forme.
- Le module String Regex va être utilisé lorsque cette recherche-remplacement doit être effectuée sur la totalité des champs de l’article et non sur un champ précis comme c’est le cas pour le module Regex.
- Les modules users inputs permettent d’entrer des éléments dans l’interface « run ». L’objectif est d’affiner une recherche à partir d’éléments précis comme la date, la ville (EX : 30/04/1998).