Statistique inférentielle/Estimation d'un paramètre
Le problème de l'estimation modifier
On désire connaître la valeur d'un paramètre (moyenne m, écart-type ou fréquence d'une modalité p) d'une variable statistique liée à une population de taille N.
Mais on ne dispose pour cela que d'un échantillon de taille n (typiquement supérieur à 30).
On a une correspondance entre les paramètres sur la population et les paramètres sur l'échantillon.
On notera les paramètres calculés à partir de l'échantillon avec une barre :
Population mère | Échantillon | |
---|---|---|
Effectif | N | n |
Moyenne | m | |
Écart-type | ||
Fréquence | f |
La question posée est :
Les paramètres de l'échantillon constituent-ils de bonnes estimations des paramètres inconnus de la population ?
Sinon, y en a-t-il de meilleurs ?
Estimation d'une moyenne modifier
Estimation de l'écart-type modifier
La meilleure estimation de l'écart-type de la population n’est pas l'écart-type de l'échantillon.
Exemple modifier
Une usine fabrique des pièces cylindriques dont on mesure le diamètre.
On obtient sur un échantillon :
Diamètre | [23,59;23,61[ | [23,61;23,63[ | [23,63;23,65[ | [23,65;23,67[ | [23,67;23,68[ |
---|---|---|---|---|---|
Effectif | 6 | 8 | 51 | 30 | 5 |
1) Calculer la moyenne et l'écart-type de cet échantillon.
2) Donner une estimation de la moyenne et de l'écart-type de la production totale.
Estimation d'une fréquence modifier
Exemple modifier
Dans un échantillon de 150 pièces, on a relevé 3 pièces défectueuses.
Donner une estimation du pourcentage de pièces défectueuses dans la production.
Incertitude modifier
Malgré la certitude que nous donne ces théorèmes quant au fait d’avoir les meilleures estimations possibles, il n'y a aucune raison que les paramètres de l'échantillon correspondent exactement à ceux de la population.
On peut quantifier l'incertitude relative à ces estimations grâce à la théorie des intervalles de confiance.