Arbres de décision/Conception
Pourquoi mettre en place un arbre de décision ?
modifierLe but de la construction d’un arbre de décision est de déterminer les meilleurs attributs à placer à chaque nœud, afin d’obtenir un arbre le plus petit possible et qu’il permette d’en retirer les meilleures prédictions.
Il est nécessaire de connaitre les étapes de la conception d’un arbre de décision. Comment fait-on pour mettre en place et pour mettre en application cet outil ?
Confection à partir d'un algorithme
modifierÀ partir d’un ensemble d’observations T = {(x, y)}, on souhaite construire un arbre de décision prédisant l’attribut y en fonction de nouvelles instances x. Pour ce faire, il existe essentiellement deux familles d’algorithmes à ce jour : les arbres de Quinlan et les arbres CART. Les deux approches peuvent être schématisés comme ci-dessous :
ArbreDecision(T) si "condition d'arret" retourner feuille(T) sinon choisir le "meilleur" attribut i entre 1 et m pour chaque valeur v de l'attribut i T[v] = {(x, y) de T tels que x_i = v} t[v] = ArbreDecision(T[v]) fin pour retourner noeud(i, {v -> t[v]}) fin si
Il est donc nécessaire, avant toute chose, d'élaborer l'algorithme pour la mise en application de l'arbre décisionnel.
Finition à partir d'un tableau récapitulatif
modifierEnsuite, pour mettre sur pied un arbre de décision, il est nécessaire d’élaborer un tableau, récapitulant toutes les questions qu’il faut se poser, les conséquences qui découlent des réponses à ces questions et de mettre en avant la réponse qui permettra de planifier au mieux notre dessein (base d’apprentissage).
Finalisation d'un arbre de décision
modifierDès que le tableau regroupant toutes les options et solutions est finalisé,l'arbre de décision peut être élaboré.
Une fois l’arbre construit, il faut effectuer un test sur l’ensemble des données (base de test).