« Pentaho/Data Mining » : différence entre les versions

Contenu supprimé Contenu ajouté
Hiladamouss (discussion | contributions)
Aucun résumé des modifications
Hiladamouss (discussion | contributions)
Aucun résumé des modifications
Ligne 13 :
[[Pentaho]]. }}
 
=== Définition ===
 
Le '''''data mining''''' ou '''''fouille de données''''', est l'ensemble des méthodes et techniques destinées à l'exploration et l'analyse de bases de données informatiques souvent très grande, de façon automatique ou semi-automatique, en vue de détecter dans ces données des règles, des associations, des tendances inconnues ou cachées, des structures particulières restituant l'essentiel de l'information utile tout en réduisant la quantité de données.
Ligne 21 :
Il existe deux type de data mining: le descriptif et le prédictif.
*'''Le descriptif''' vise à mettre en évidence des informations présentes mais cachées par le volume important de donné. C'est le cas lors de classification automatique d'individu et des recherches d’associations de produits ou médicaments.
*'''Le prédictif''' vise à tirer, faire ressortir de nouvelles informations partir des informations présentes. Ces nouvelles informations seront alors qualitatives( ex: scoring: classer les clients selon des critère définis) ou quantitatives (prédictions: prévision de chiffres)
 
=== Objectifs ===
 
Le data mining est une technique d'aide à la décision très utilisée par les entreprises actuelles, peu importe le secteur d'activités. En effet il est aussi bien utilisé par les entreprises commerciales que les industrielles, ou encore les entités financières.
Ligne 32 :
Et c'est là que le data mining devient intéressant. Avec le data mining nous passons de '''"l'analyse confirmatoire"''' à '''"l'analyse"exploratoire"'''. Les techniques de data mining, plus complexes que la statistique descriptive de base, s'appuient sur des outils d'intelligence artificielle([[Réseaux de neurones]]), la théorie de l'information([[Arbres de décision]]),des statistiques inférentielles(basées sur des échantillons)et des analyses de données traditionnelles(analyse factorielle, classification automatique...)
 
=== Data mining avec Pentaho ===
 
 
=== Son utilisation en entreprise ===
 
=== Article connexe ===
* [[Datamining]]