« Pentaho/Data Mining » : différence entre les versions

Contenu supprimé Contenu ajouté
Hiladamouss (discussion | contributions)
Aucun résumé des modifications
Hiladamouss (discussion | contributions)
Ligne 30 :
*Quand seront-ils intéressés?".
Chaque consommateur est unique et se différencie par ses goûts, son mode de vie, son sexe, son âge, son lieu d'habitation et bien d'autres critères. Il est donc évident que les profils de clientèle à découvrir sont des profils complexes.Les simples oppositions telles que"jeune/âgé", "femme/homme","citadin/ruraux" peuvent facilement se retrouver avec des statistiques descriptives.Mais la réalité est faite de combinaisons plus complexes, dont les variables discriminantes ne sont pas celles auxquelles on pense directement. C'est dernières sont tellement subtiles que nous n'aurions pas pu les découvrir par hasard.
Et c'est là que le data mining devient intéressant. Avec le data mining nous passons de '''"l'analyse confirmatoire"''' à '''"l'analyse"exploratoire"'''. Les techniques de data mining, plus complexes que la statistique descriptive de base, s'appuient sur des outils d'intelligence artificielle ([[Réseaux de neurones]]), la théorie de l'information ([[Arbres de décision]]),des statistiques inférentielles (basées sur des échantillons)et des analyses de données traditionnelles(analyse factorielle, classification automatique...)
 
== Utilisation en entreprise de data mining Pentaho ==