Échantillonnage et estimation pour le bio-médical/Tests d'homogénéité

Début de la boite de navigation du chapitre

Les tests d'homogénéité permettent de s'assurer que deux échantillons ont bien été extrait d'une même population. Dans les tests d'homogénéité les paramètres de la population sont inconnus donc ne figure pas dans les formules.

Tests d'homogénéité
Icône de la faculté
Chapitre no 5
Leçon : Échantillonnage et estimation pour le bio-médical
Chap. préc. :Tests de conformité
Chap. suiv. :Sommaire
fin de la boite de navigation du chapitre
En raison de limitations techniques, la typographie souhaitable du titre, « Échantillonnage et estimation pour le bio-médical : Tests d'homogénéité
Échantillonnage et estimation pour le bio-médical/Tests d'homogénéité
 », n'a pu être restituée correctement ci-dessus.

Comparaison des moyennes de deux échantillons indépendants.

modifier

Soit deux échantillons.

Le premier d'effectif  , de moyenne   et écart-type  .

Le deuxième d'effectif  , de moyenne   et écart-type  .

Le problème que l'on se propose de résoudre est : Ces deux échantillons ont-ils été extraits d'une même population ?


Mise en place du test.

Soit  , l'hypothèse : Les deux échantillons ont été extraits d'une même population.

Soit  , l'hypothèse : Les deux échantillons proviennent de populations différentes.


Soit   l'estimation de l'écart-type de la population d'où a été extrait le premier échantillon.

 

Soit   l'estimation de l'écart-type de la population d'où a été extrait le deuxième échantillon.

 

Soit   la variable aléatoire qui prend pour valeur les moyennes du premier échantillon.

Soit   la variable aléatoire qui prend pour valeur les moyennes du deuxième échantillon.

Nous admettrons le théorème suivant :

Si l'hypothèse   est vraie et si   et  , la variable aléatoire   définie par :

 

suit sensiblement une loi normale centrée réduite.

Pour faire le test, on procédera donc ainsi :

On calcule la valeur   est définie par :

 


Si  , on accepte l'hypothèse  .

Si  , on rejette l'hypothèse  .

On rappelle que :

  pour  .

  pour  .

  est le risque de première espèce.


Remarque : Les cas   ou   sont plus délicats et seront donc étudiés dans une leçon de niveau supérieur.


 

Exemple.

On a prélevé deux échantillons de pommes pour étudier le poids des pommes.

Le premier, au début de la récolte, a pour taille 100, pour moyenne 120 grammes et pour écart-type 20 grammes.

Le deuxième, en fin de récolte, a pour taille 150, pour moyenne 150 grammes et pour écart type 10 grammes.

la différence entre les poids moyens à ces deux époques différentes de la récolte est-elle significative au risque de première espèce 5 % ?


Réponse.

L'écart-type estimé  , de la population d'où aurait été extrait l'échantillon de début de récolte est :

 

L'écart-type estimé   de la population d'où aurait été extrait l'échantillon de fin de récolte est :

 

Mise en place du test.

Soit  , l'hypothèse : Il n'y a pas de différence entre le poids des pommes de début et de fin de récolte.

Soit  , l'hypothèse : Le poids des pommes en début de récolte n'est pas le même qu'en fin de récolte.

Si   est vraie,

 

suis sensiblement une loi normale centrée réduite.


Calculons :

 

Au risque de première espèce, si   était vraie, on devrait avoir  . Mais on constate que  . On peut en conclure que le poids des pommes en début de récolte est probablement différent du poids des pommes en fin de récolte.


Comparaison des fréquences des deux échantillons différents.

modifier

Soit deux échantillons.

On observe sur le premier échantillon d'effectif   un caractère avec une fréquence  .

On observe sur le deuxième échantillon d'effectif   le même caractère avec une fréquence  .


Le problème que l'on se propose de résoudre est :

Ces deux échantillons ont-ils été extraits d'une même population ?


Mise en place du Test.

Soit  , l'hypothèse : Les deux échantillons ont été extrait d'une même population.

Soit  , l'hypothèse : Les deux échantillons proviennent de populations différentes.


Soit   la variable aléatoire qui prend pour valeur les fréquences du caractère sur le premier échantillon.

Soit   la variable aléatoire qui prend pour valeur les fréquences du caractère sur le deuxième échantillon.


Nous admettrons le théorème suivant :

Si l'hypothèse   est vraie et si   et  , la variable aléatoire   définie par :

 

suit sensiblement une loi normale centrée réduite.

  étant l'estimation de  , fréquence sur la population.

  est donnée par la formule :

 .

Pour faire le test, on procédera donc ainsi :

On calcule d'abord   :

 .

On calcule ensuite la valeur   définie par :

 .

Si  , on accepte l'hypothèse  .

Si  , on rejette l'hypothèse  .

On rappelle que :

  pour  .

  pour  .

  est le risque de première espèce.


Remarque : Les cas   ou  , On ne peut rien dire.


 

Exemple.

Sur 40 malades qui ont été traités avec un médicament A, 15 % ont été guéris.

Sur 60 malades qui ont été traités avec un médicament B, 25 % ont été guéris.

Peut-on affirmer au risque 5 % qu'il y a une différence d'efficacité entre les deux médicaments.


Réponse.

Mise en place du test.

Soit  , l'hypothèse : Il n'y a pas de différence d'efficacité entre les médicaments A et B.

Soit  , l'hypothèse : L'efficacité des médicaments A et B est différente.

si l'hypothèse   était vraie, la fréquence estimée de guérison commune des médicaments A et B serait :

 

Si   était vraie,   suivrait une loi normale centrée réduite.

Calculons  

Nous remarquons que  .

Donc au risque de première espèce  , on ne peut pas rejeter l'hypothèse  . On ne peut pas dire qu'il y a une différence d'efficacité entre les deux médicaments. La différence observée peut être due aux fluctuations d'échantillonnage.