« Pentaho/Data Mining » : différence entre les versions
Contenu supprimé Contenu ajouté
Aucun résumé des modifications |
|||
Ligne 10 :
{{Définition
| contenu =
« Le '''''Data Mining''''' est une technique d'extraction d'information et de découverte de connaissances à partir d'un gros volume de données, avec une méthode et des outils spécifiques. »
[[Pentaho]]. }}
== Définition ==
Le '''''Data Mining''''' ou '''''fouille de données''''', est l'ensemble des méthodes et techniques destinées à l'exploration et l'analyse de bases de données informatiques souvent très
Pour résumer, le data mining est l'art d'extraire des informations à partir de données afin de prendre une décision stratégique.
Il existe deux type de '''''Data Mining''''': le descriptif et le prédictif.
* ''Le descriptif'' vise à mettre en évidence des informations présentes mais cachées par le volume important de donné. C'est le cas lors de la classification automatique d'individu et des recherches d’associations de produits ou médicaments.
* ''Le prédictif'' vise à tirer, faire ressortir de nouvelles informations à partir des informations présentes. Ces nouvelles informations seront alors qualitatives.
Exemples - Scoring : - Prédictions : == Objectifs ==
Le '''''Data Mining''''' est une technique d'aide à la décision très utilisée par les entreprises actuelles, peu importe le secteur d'activités. En effet il est aussi bien utilisé par les entreprises commerciales que les industrielles, ou encore les entités financières.
Aujourd'hui, les entreprises ne se demandent plus seulement "
*Quel autre produit les
*Quand seront-ils intéressés?
Chaque consommateur est unique et se différencie par ses goûts, son mode de vie, son sexe, son âge, son lieu d'habitation et bien d'autres critères. Il est donc évident que les profils de clientèle à découvrir sont des profils complexes. Les simples oppositions telles que "jeune/âgé", "femme/homme", "citadin/ruraux" peuvent facilement se retrouver avec des statistiques descriptives. Mais la réalité est faite de combinaisons plus complexes, dont les variables discriminantes ne sont pas celles auxquelles on pense directement.
Et c'est là que le '''''Data Mining''''' devient intéressant.
Avec le '''''Data Mining''''' nous passons de "l'analyse confirmatoire" à "l'analyse exploratoire". Les techniques de '''''Data Mining''''', plus complexes que la statistique descriptive de base, s'appuient sur des outils d'intelligence artificielle ([[Réseaux de neurones]]), la théorie de l'information ([[Arbres de décision]]), des statistiques == Utilisation en entreprise de data mining Pentaho ==
Une fois que l'on a l'analyse, le reporting, et les tableaux de bord déployés, il est temps de passer à la phase exploitation des données. Le
Le
<br />
Le
<br />
Grâce à cette extraction, nous pouvons observer nos chiffres de ventes par produits selon un périmètre définit. <br />
Avec l'outil
Nous observons qu'à l'est des USA, nos ventes sont en majorité dans le rouge à l'exception de New York qui se trouve en vert. <br />
''Pourquoi un tel résultat?''
Ligne 49 ⟶ 53 :
<br />
Après avoir zoomé sur cette zone, nous constatons que New York est la seule ville qui nous rapporte un chiffre d'
Ce qui nous amène à soulever des interrogations telles que : "Pourquoi avons nous des meilleurs ventes à New York? Quels sont les facteurs (démographiques, culturels,
[[File:Data mining13.JPG|center|Add caption here]]
|