Échantillonnage et estimation pour le bio-médical/Tests de conformité

Début de la boite de navigation du chapitre

Les tests de conformité permettent de s'assurer :

  • qu'un échantillon a bien été extrait d'une population donnée ;
  • qu'un phénomène est conforme aux prévisions d'une loi théorique ;
  • que les performances de nouveaux produits sont meilleures que celle d'un ancien produit déjà connu.
Tests de conformité
Icône de la faculté
Chapitre no 4
Leçon : Échantillonnage et estimation pour le bio-médical
Chap. préc. :Estimation
Chap. suiv. :Tests d'homogénéité

Exercices :

Test du χ²
fin de la boite de navigation du chapitre
En raison de limitations techniques, la typographie souhaitable du titre, « Échantillonnage et estimation pour le bio-médical : Tests de conformité
Échantillonnage et estimation pour le bio-médical/Tests de conformité
 », n'a pu être restituée correctement ci-dessus.

Comparaison de la moyenne d'un échantillon à la moyenne de la population

modifier

Soit   une variable aléatoire telle que :

 .

On considère un échantillon dont la moyenne et   et l'écart-type est  . Le problème que l'on se propose de résoudre est le suivant :

L'échantillon a-t-il été extrait d'une population régie par la variable aléatoire   ?


Soit   l'écart-type estimé à partir de  .


Mise en place du test.

Soit  , l'hypothèse : L'échantillon a été extrait d'une population régie par la variable aléatoire  .

Soit  , l'hypothèse : L'échantillon n'a pas été extrait d'une population régie par la variable aléatoire  .


Si   est vraie et si  , on sait d'après a théorie de l'échantillonnage que   (variable aléatoire qui prend pour valeur les moyennes des échantillons extrait de la population) suit sensiblement une loi normale de moyenne   et écart-type  .

on en déduit que   suit sensiblement une loi normale centrée réduite.

Puisqu'il s'agit de comparer   à  , cela suppose   connue. Par contre, il se peut que   ne soit pas connu. On le remplace alors par son estimation   et l'on obtient que :

si   suit sensiblement une loi normale centrée réduite.

Pour faire le test, on procède donc ainsi :

On calcule   et  . on en déduit   grâce à :

 

et l'on calcule la valeur   définie par :

 .

Si  , on accepte l'hypothèse  .

Si  , on rejette l'hypothèse  .

On rappelle que :

  pour  .

  pour  .

  est le risque de première espèce.


Si   et si   suit une loi normale.

  suit une loi normale centrée réduite.


  suis une loi de Student à   degrés de liberté.


Si   et si   ne suit pas une loi normale, on ne peut rien dire.


 

Exemple.

La moyenne des taux de glycémie chez des individus normaux est de 1,18 grammes par litre. On analyse le taux de glycémie chez une équipe de 40 plongeurs juste après qu'ils aient passé une semaine par   mètres de profondeur. On trouve sur l'échantillon une moyenne de 1,165 grammes par litre et un écart type de 0,06 gramme par litre. Peut-on dire au risque 5 % que la plongée par grand fond a une influence sur le taux de glycémie ?


Solution.

Mise en place du test :

Soit   l'hypothèse : La plongée sous-marine n'a pas d'influence sur le taux de glycémie.

Soit   l'hypothèse : La plongée sous-marine modifie le taux de glycémie.

Dans le cas où  est vraie et comme  , on peut dire que   suit une loi normale centrée réduite.

 

 .

Pour  .

On remarque que  .

Donc au risque de première espèce 5 %, on peut dire que la plongée sous-marine n'influe pas sur le taux de glycémie. La différence observée est probablement due aux fluctuations d'échantillonnage.

Comparaison de la fréquence sur un échantillon à la fréquence sur la population

modifier

Soit   la fréquence d'un caractère sur une population.

Soit   la fréquence observée d'un caractère sur un échantillon de   individus.


Le problème que l'on se propose de résoudre est :

L'échantillon a-t-il été extrait d'une population sur laquelle la fréquence des caractères est   ?


Mise en place du test :

Soit  , l'hypothèse : L'échantillon a été extrait d'une population sur laquelle la fréquence du caractère est  .

Soit  , l'hypothèse : L'échantillon n'a pas été extrait d'une population sur laquelle la fréquence du caractère est  .

Si   est vraie et si  , on sait d'après a théorie de l'échantillonnage que   (variable aléatoire qui prend pour valeur les fréquences observée sur les échantillons extrait de la population) suit une loi normale de moyenne   et écart-type  .

Par conséquent, on peut en déduire que :

  suit sensiblement une loi normale centrée réduite.

Puisqu'il s'agit de comparer   à  , cela suppose   connu.

Pour faire le test, on procédera donc ainsi :

On calcule la valeur   définie par :

 

Si  , on accepte l'hypothèse  .

Si  , on rejette l'hypothèse  .

On rappelle que :

  pour  .

  pour  .

  est le risque de première espèce.


 

Exemple.

On sait qu'une souris grise réussit un test d'intelligence dans 37 % des cas. On fait subir le test à 35 souris blanches et l'on constate que 18 d'entre elles réussissent le test. Peut-on déduire au risque 5 % que l'intelligence des souris blanches est différente de celle des souris grises ?


Réponse.

Mise en place du test.

Soit  , l'hypothèse : il n'y a pas de différence entre l'intelligence des souris grises et l'intelligence des souris blanches.

Soit  , l'hypothèse : les souris grises et les souris blanches n'ont pas la même intelligence.

Dans le cas où   est vraie et comme  , on peut dire que :

  suit sensiblement une loi normale centrée réduite.

Calculons :  .

 , donc on accepte l'hypothèse  . On ne peut pas dire que les souris grises et les souris blanches ont une intelligence différente. La différence observée est probablement due aux fluctuations d'échantillonnage.


Test du Khi-deux

modifier
 
Wikipedia-logo-v2.svg
Wikipédia possède un article à propos de « Test du χ² ».

Le test du Khi-deux est un test de conformité qui permet de s'assurer qu'un ensemble d'effectifs observés est conforme à un ensemble d'effectifs théoriques. La loi du Khi-deux est une variable aléatoire continue qui dépend d'un paramètre appelé degré de liberté.

Soit  , les effectifs observés sur un échantillon et soit  , les effectifs que l'on devrait théoriquement avoir sur cet échantillon.


Mise en place du test.

Soit   l'hypothèse : Les effectifs observés sont conformes aux effectifs théoriques.

Soit   l'hypothèse : Les effectifs observés ne sont pas conformes aux effectifs théoriques.

Si   est vraie, la variable aléatoire   qui prend pour valeur :

 

suit une loi du Khi-deux à   degrés de liberté.

Pour faire le test, on procède donc ainsi :

On calcule les effectifs que l'on devrait théoriquement observer sur notre échantillon. C'est-à-dire  . On calcule :

 

et l'on regarde si le nombre obtenu dépasse ou non le nombre donné dans la table du Khi-deux à la colonne indiquant le risque de première espèce   et à la ligne indiquant le degré de liberté  . Si le nombre obtenu   est inférieur au nombre donné dans le tableau, on accepte l'hypothèse  . Si le nombre   est supérieur nombre donné dans le tableau, on rejette l'hypothèse  .

 

Exemple.

On a effectué le croisement de balsamines blanches avec des balsamines pourpres. On obtient en deuxième génération :

1790 balsamines pourpres.

547 balsamines rose.

548 balsamines blanc lavande.

213 balsamines blanches.


la théorie mendélienne prévoyait :

9/16 de balsamine pourpres.

3/16 de balsamine roses.

3/16 de balsamines blanc lavande.

1/16 de balsamines blanches.


Peut-on accepter l'hypothèse de répartition mendélienne avec un risque de première espèce de 5%.


Réponse.

Notre échantillon contient en tout   balsamines. Théoriquement, on aurait dû obtenir:

  balsamines pourpres.

  balsamines rose.

  balsamines blanc lavande.

  balsamines blanche.


Mise en place du test.

Soit   l'hypothèse : La répartition obtenue est conforme à la répartition mendélienne.

Soit   l'hypothèse : La répartition obtenue n'est pas conforme à la répartition mendélienne.

si   est vraie, la variable aléatoire   qui prend pour valeur :

 

  sont les effectifs observés respectivement pour les balsamines pourpres, roses, blanc lavande et blanches, suit une loi du Khi-deux à   degrés de liberté.

Calculons :

 .

Cherchons dans la table du Khi-deux à la ligne   et à la colonne  . On lit  . Comme  , on accepte l'hypothèse  . La répartition peut donc être considérée comme mendélienne. Les différences observées sont probablement dues aux fluctuations d'échantillonnage.