Statistique inférentielle/Estimation d'un paramètre
Le problème de l'estimation
modifierOn désire connaître la valeur d'un paramètre (moyenne m, écart-type ou fréquence d'une modalité p) d'une variable statistique liée à une population de taille N.
Mais on ne dispose pour cela que d'un échantillon de taille n (typiquement supérieur à 30).
On a une correspondance entre les paramètres sur la population et les paramètres sur l'échantillon.
On notera les paramètres calculés à partir de l'échantillon avec une barre :
Population mère | Échantillon | |
---|---|---|
Effectif | N | n |
Moyenne | m | |
Écart-type | ||
Fréquence | f |
La question posée est :
Les paramètres de l'échantillon constituent-ils de bonnes estimations des paramètres inconnus de la population ?
Sinon, y en a-t-il de meilleurs ?
Estimation d'une moyenne
modifier
Estimation de l'écart-type
modifierLa meilleure estimation de l'écart-type de la population n’est pas l'écart-type de l'échantillon.
Exemple
modifierUne usine fabrique des pièces cylindriques dont on mesure le diamètre.
On obtient sur un échantillon :
Diamètre | [23,59;23,61[ | [23,61;23,63[ | [23,63;23,65[ | [23,65;23,67[ | [23,67;23,68[ |
---|---|---|---|---|---|
Effectif | 6 | 8 | 51 | 30 | 5 |
1) Calculer la moyenne et l'écart-type de cet échantillon.
2) Donner une estimation de la moyenne et de l'écart-type de la production totale.
Estimation d'une fréquence
modifier
Exemple
modifierDans un échantillon de 150 pièces, on a relevé 3 pièces défectueuses.
Donner une estimation du pourcentage de pièces défectueuses dans la production.
Incertitude
modifierMalgré la certitude que nous donne ces théorèmes quant au fait d’avoir les meilleures estimations possibles, il n'y a aucune raison que les paramètres de l'échantillon correspondent exactement à ceux de la population.
On peut quantifier l'incertitude relative à ces estimations grâce à la théorie des intervalles de confiance.