Statistique à deux variables/Ajustement affine par les moindres carrés

Début de la boite de navigation du chapitre
Ajustement affine par les moindres carrés
Icône de la faculté
Chapitre no 2
Leçon : Statistique à deux variables
Chap. préc. :Séries de données statistiques quantitatives à deux variables
Chap. suiv. :Sommaire
fin de la boite de navigation du chapitre
En raison de limitations techniques, la typographie souhaitable du titre, « Statistique à deux variables : Ajustement affine par les moindres carrés
Statistique à deux variables/Ajustement affine par les moindres carrés
 », n'a pu être restituée correctement ci-dessus.

Ajustement par la méthode des moindres carrés

modifier

La forme d'un nuage de points invite à retenir pour l'ajuster des modèles de fonctions familières :

  • soit le modèle affine  
  • soit le modèle exponentiel  
  • soit le modèle puissance  
  • ...

Pour ajuster une série à un modèle, il faut un critère : dans la méthode des moindres carrés, on retient le critère suivant : la somme des carrés des écarts verticaux entre les valeurs   observés et celles   données par le modèle doit être minimale :

Sur la figure ci-dessous, cela représente la somme des carrés des longueurs vertes :

 


Ajustement affine par la méthode des moindres carrés

modifier

Lorsque le nuage est de forme allongée, on peut tenter un ajustement affine en utilisant le théorème suivant :

Début d’un théorème
Fin du théorème


Remarque 1 : on appelle parfois cette droite droite de régression de y en x.

Remarque 2 : une démonstration de ce théorème est donnée dans la leçon Trace et transposée de matrice.

Interpolation et extrapolation

modifier

Pour une valeur   de la variable  , la connaissance de   permet de prévoir approximativement la valeur correspondante de  . Pour cela, on calcule  .

  • Si   appartient à l'intervalle d'observation des valeurs de  , on dit qu'on fait une interpolation.
  • Si   est à l'extérieur de l'intervalle d'observation, on parle d'extrapolation.
Cela suppose de faire l'hypothèse que le modèle reste plausible à l'extérieur de l'intervalle.