« Pentaho/Data Mining » : différence entre les versions

Contenu supprimé Contenu ajouté
Hiladamouss (discussion | contributions)
Hiladamouss (discussion | contributions)
Ligne 12 :
=== Objectifs ===
 
Le data mining est une technique d'aide à la décision tréstrès utilisée par les entreprises actuelles, et ceci tout secteurs d'activités confondus. En enfeteffet il est aussi bien utilisé par les entreprises commerciales que les industrielles, ou encore les entités financières. Aujourd'hui, les entreprises ne se demandent plus seulement"combien de clients ont acheté tel produit pendant telle période?", "quel est leur profil?", "quel autre produit les intérésserontintéresseront?",et" quand seront-ils intéréssésintéressés?". Chaque consommateur est différentunique et se différencie par ses goûts, son mode de vie, son sexe, son age, son lieu d'habitation et bien d'autres critères. Il est donc évident que les profils de clientèle à découvrir sont des profils complexes.Les simples oppositions telles que"jeune/âgé", "femme/homme","citadin/ruraux" peuvent facilement se retrouver avec des statistiques descriptives.Mais la réalité est faite de combinaisons plus complexes, dont les variables discriminantes ne sont pas celles auxquelles on pense directement. C'est dernières sont tellement subtiles que nous n'aurions pas pu les découvrir par hasard. Et c'est là que le data mining devient intéressant. Avec le data mining nous passons de l'analyse "confirmatoire" à l'analyse"exploratoire"
[[File:CART tree titanic survivors.png|thumb|CART tree titanic survivors]]