Arbres de décision/Définition
Définition
modifierL’arbre de décision est un arbre au sens informatique du terme. Il est représenté sous la forme graphique d’un arbre, d’une arborescence, ou encore d’un diagramme illustrant des règles de décision. Un arbre décisionnel est un outil d'aide à la décision, qui représente graphiquement un séquencement logique, faisant apparaître les différents résultats possibles, en fonction des choix effectués à chaque étape.
Les arbres de décision permettent d’effectuer des classifications pour des données, représentées par des ensembles d’attributs. Il existe deux catégories d'arbre de décision :
- arbre de classification : la variable expliquée est de type nominale (facteur). À chaque étape du partage, on cherche à réduire l'impureté totale des deux nœuds fils par rapport au nœud père.
- arbre de régression : la variable expliquée est de type numérique et il s'agit de prédire une valeur la plus proche possible de la vraie valeur.
Constitution
modifierUn arbre de décision est composé de nœuds de décision, qui permettent de tester les attributs. Un nœud de décision est étiqueté par un test qui peut être appliqué à chaque description d’un individu ou d’une population. Il est composé de branches qui représentent chacune une valeur de l’attribut testé. Il peut également être constitué de feuilles, c'est-à-dire les nœuds terminaux, qui indiquent la classe résultante. À toute description est associée une seule feuille de l’arbre de décision.
Détails en illustration
modifier
Avantages
modifierIl permet de mettre à plat divers résultats envisagés en fonction des décisions prises. Il permet de faire des prédictions utilisées lors d’un lancement de projet, ou pour la résolution d’un problème rencontré. Il y a peu de perturbation des individus extrêmes, car ils sont isolés dans les petites feuilles de l'arbre. On peut aboutir à un traitement d'un grand nombre de variables explicatives.
Cet arbre regroupe toutes les observations d’un échantillonnage. Divers résultats sont envisagés et envisageables en fonctions des décisions prises, ou à prendre. Les résultats sont représentés avec chacune des options intermédiaires.