« Pentaho/Data Mining » : différence entre les versions

Contenu supprimé Contenu ajouté
Ligne 5 :
Le '''''data mining''''' ou '''''fouille de données''''', est l'ensemble des méthodes et techniques destinées à l'exploration et l'analyse de bases de données informatiques souvent très grande, de façon automatique ou semi-automatique, en vue de détecter dans ces données des règles, des associations, des tendances inconnues ou cachées, des structures particulières restituant l'essentiel de l'information utile tout en réduisant la quantité de données.
Pour résumer, le data mining est l'art d'extraire des informations à partir de données afin de prendre une décision stratégique.
 
 
Il existe deux type de data mining: le descriptif et le prédictif.
*'''Le descriptif''' vise à mettre en évidence des informations présentes mais cachées par le volume important de donné. C'est le cas lors de classification automatique d'individu et des recherches d’associations de produits ou médicaments.
*'''Le prédictif''' vise à tirer, faire ressortir de nouvelles informations partir des informations présentes. Ces nouvelles informations seront alors qualitatives( ex: scoring: classer les clients selon des critère définis)ou quantitatives (prédictions: prévision de chiffrechiffres)
 
=== Objectifs ===