« Pentaho/Data Mining » : différence entre les versions
Contenu supprimé Contenu ajouté
Ligne 37 :
Le data mining est un procédé basé sur des algorithmes et des statistiques pour découvrir les modèles et les corrélations significatives qui ne peuvent apparaître dans une base de données classique.
<br />
Le data mining ne se restreint pas à une visualisation simple des chiffres tels que le chiffre d'affaire global selon la région; mais a pour but de faire ressortir des informations cachées mais présente dans la masse de volumes, suite à des combinaisons peu
<br />▼
<br />
Avec l'outil data mining dans un premier temps nous faisons ressortir les chiffres concernant les ventes par ville dans le périmètre donné (USA). <br />
Nous observons qu'à l'est des USA, nos ventes sont en majorité dans le rouge à l'exception de New York qui se trouve en vert. <br />
''Pourquoi un tel résultat?''
▲<br />
<br />
Après avoir zoomé sur cette zone, nous constatons que New York est la seule ville qui nous rapporte un chiffre d'affaire satisfaisant par rapport aux villes avoisinantes. <br />
▲[[File:New data mining2.JPG|center|Add caption here]]
Ce qui nous amène à soulever des interrogations telles que : " pourquoi les trains se vendent plus au nord qu'à l'ouest? Quels sont les facteurs démographiques qui jouent sur nos chiffres de ventes? Quels sont les moyens et actions à mettre en oeuvre?" ...
== Article connexe ==
|