« Pentaho/Data Mining » : différence entre les versions
Contenu supprimé Contenu ajouté
Aucun résumé des modifications |
|||
Ligne 10 :
{{Définition
| contenu =
« Le '''''Data Mining''''' est une technique d'extraction d'information et de découverte de connaissances à partir d'un gros volume de données, avec une méthode et des outils spécifiques »
[[Pentaho]]. }}
== Définition ==
Le '''''
Pour résumer, le data mining est l'art d'extraire des informations à partir de données afin de prendre une décision stratégique.
Il existe deux type de
*
*
== Objectifs ==
Le
Aujourd'hui, les entreprises ne se demandent plus seulement"combien de clients ont acheté tel produit pendant telle période?", "quel est leur profil?", mais plutôt les questions suivantes:
*Quel autre produit les intéresseront?
*Quand seront-ils intéressés?".
Chaque consommateur est unique et se différencie par ses goûts, son mode de vie, son sexe, son âge, son lieu d'habitation et bien d'autres critères. Il est donc évident que les profils de clientèle à découvrir sont des profils complexes.Les simples oppositions telles que "jeune/âgé", "femme/homme", "citadin/ruraux" peuvent facilement se retrouver avec des statistiques descriptives.Mais la réalité est faite de combinaisons plus complexes, dont les variables discriminantes ne sont pas celles auxquelles on pense directement. C'est dernières sont tellement subtiles que nous n'aurions pas pu les découvrir par hasard.
Et c'est là que le
== Utilisation en entreprise de data mining Pentaho ==
|