Statistique inférentielle/Intervalle de confiance d'une moyenne
Loi d'échantillonnage de la moyenne
modifierLa théorie de l'échantillonnage
modifierEn statistique, il est en général impossible d'étudier un caractère sur toute une population de taille N élevée. La théorie de l'échantillonnage se pose la question suivante. En supposant connus les paramètres statistiques de la population, que peut-on en déduire sur les échantillons prélevés dans la population ? On suppose que ces échantillons sont prélevés au hasard et que le tirage de ces échantillons est effectué avec remise.
L'ensemble de ces échantillons de taille n est appelé échantillonnage de taille n.
Étudions dans ces conditions la loi d'échantillonnage des moyennes.
Loi d'échantillonnage des moyennes
modifierOn suppose donc sur une population de taille N une variable aléatoire X de moyenne m
- et d'écart-type .
Pour prélever un échantillon de taille n,
on a procédé à n épreuves indépendantes auxquelles correspondent n variables aléatoires
de même loi que X.
La variable aléatoire représentant la moyenne de l'échantillon est :
- Elle dépend bien sûr de la taille n des échantillons.
D'après le théorème central limite, on déduit :
Intervalle de confiance de la moyenne
modifierL'estimation ponctuelle de la moyenne de la population à partir de celle de l'échantillon n'indique pas le risque d'erreur.
Il s'agit de déterminer un intervalle contenant la valeur de la moyenne de la population avec un risque d'erreur décidé à l'avance.
En posant , le théorème précédent implique que suit une loi normale centrée réduite.
Soit la probabilité, fixée à l'avance, que n'appartiennent pas à l'intervalle , alors :
donc
on obtient donc le :
- Un intervalle de confiance de la moyenne m au seuil de risque est :
- où t est le nombre tel que et se lit dans la table de la loi normale N(0;1).
Exemple
modifierOn suppose que la durée de vie d'un composant électrique, exprimée en heures,
suit une loi normale de moyenne m inconnue et d'écart-type
Une étude sur un échantillon de 16 composants donne une durée de vie moyenne de 3 000 h.
Déterminer un intervalle de confiance pour m au seuil de risque de 10%.