Échantillonnage et estimation pour le bio-médical/Tests de conformité
Les tests de conformité permettent de s'assurer :
- qu'un échantillon a bien été extrait d'une population donnée ;
- qu'un phénomène est conforme aux prévisions d'une loi théorique ;
- que les performances de nouveaux produits sont meilleures que celle d'un ancien produit déjà connu.
Comparaison de la moyenne d'un échantillon à la moyenne de la population
modifierSoit une variable aléatoire telle que :
.
On considère un échantillon dont la moyenne et et l'écart-type est . Le problème que l'on se propose de résoudre est le suivant :
L'échantillon a-t-il été extrait d'une population régie par la variable aléatoire ?
Soit l'écart-type estimé à partir de .
Mise en place du test.
Soit , l'hypothèse : L'échantillon a été extrait d'une population régie par la variable aléatoire .
Soit , l'hypothèse : L'échantillon n'a pas été extrait d'une population régie par la variable aléatoire .
Si est vraie et si , on sait d'après a théorie de l'échantillonnage que (variable aléatoire qui prend pour valeur les moyennes des échantillons extrait de la population) suit sensiblement une loi normale de moyenne et écart-type .
on en déduit que suit sensiblement une loi normale centrée réduite.
Puisqu'il s'agit de comparer à , cela suppose connue. Par contre, il se peut que ne soit pas connu. On le remplace alors par son estimation et l'on obtient que :
si suit sensiblement une loi normale centrée réduite.
Pour faire le test, on procède donc ainsi :
On calcule et . on en déduit grâce à :
et l'on calcule la valeur définie par :
.
Si , on accepte l'hypothèse .
Si , on rejette l'hypothèse .
On rappelle que :
pour .
pour .
est le risque de première espèce.
Si et si suit une loi normale.
suit une loi normale centrée réduite.
suis une loi de Student à degrés de liberté.
Si et si ne suit pas une loi normale, on ne peut rien dire.
Exemple. La moyenne des taux de glycémie chez des individus normaux est de 1,18 grammes par litre. On analyse le taux de glycémie chez une équipe de 40 plongeurs juste après qu'ils aient passé une semaine par mètres de profondeur. On trouve sur l'échantillon une moyenne de 1,165 grammes par litre et un écart type de 0,06 gramme par litre. Peut-on dire au risque 5 % que la plongée par grand fond a une influence sur le taux de glycémie ?
Mise en place du test : Soit l'hypothèse : La plongée sous-marine n'a pas d'influence sur le taux de glycémie. Soit l'hypothèse : La plongée sous-marine modifie le taux de glycémie. Dans le cas où est vraie et comme , on peut dire que suit une loi normale centrée réduite.
. Pour . On remarque que . Donc au risque de première espèce 5 %, on peut dire que la plongée sous-marine n'influe pas sur le taux de glycémie. La différence observée est probablement due aux fluctuations d'échantillonnage. |
Comparaison de la fréquence sur un échantillon à la fréquence sur la population
modifierSoit la fréquence d'un caractère sur une population.
Soit la fréquence observée d'un caractère sur un échantillon de individus.
Le problème que l'on se propose de résoudre est :
L'échantillon a-t-il été extrait d'une population sur laquelle la fréquence des caractères est ?
Mise en place du test :
Soit , l'hypothèse : L'échantillon a été extrait d'une population sur laquelle la fréquence du caractère est .
Soit , l'hypothèse : L'échantillon n'a pas été extrait d'une population sur laquelle la fréquence du caractère est .
Si est vraie et si , on sait d'après a théorie de l'échantillonnage que (variable aléatoire qui prend pour valeur les fréquences observée sur les échantillons extrait de la population) suit une loi normale de moyenne et écart-type .
Par conséquent, on peut en déduire que :
suit sensiblement une loi normale centrée réduite.
Puisqu'il s'agit de comparer à , cela suppose connu.
Pour faire le test, on procédera donc ainsi :
On calcule la valeur définie par :
Si , on accepte l'hypothèse .
Si , on rejette l'hypothèse .
On rappelle que :
pour .
pour .
est le risque de première espèce.
Exemple. On sait qu'une souris grise réussit un test d'intelligence dans 37 % des cas. On fait subir le test à 35 souris blanches et l'on constate que 18 d'entre elles réussissent le test. Peut-on déduire au risque 5 % que l'intelligence des souris blanches est différente de celle des souris grises ?
Mise en place du test. Soit , l'hypothèse : il n'y a pas de différence entre l'intelligence des souris grises et l'intelligence des souris blanches. Soit , l'hypothèse : les souris grises et les souris blanches n'ont pas la même intelligence. Dans le cas où est vraie et comme , on peut dire que : suit sensiblement une loi normale centrée réduite. Calculons : . , donc on accepte l'hypothèse . On ne peut pas dire que les souris grises et les souris blanches ont une intelligence différente. La différence observée est probablement due aux fluctuations d'échantillonnage. |
Test du Khi-deux
modifierLe test du Khi-deux est un test de conformité qui permet de s'assurer qu'un ensemble d'effectifs observés est conforme à un ensemble d'effectifs théoriques. La loi du Khi-deux est une variable aléatoire continue qui dépend d'un paramètre appelé degré de liberté.
Soit , les effectifs observés sur un échantillon et soit , les effectifs que l'on devrait théoriquement avoir sur cet échantillon.
Mise en place du test.
Soit l'hypothèse : Les effectifs observés sont conformes aux effectifs théoriques.
Soit l'hypothèse : Les effectifs observés ne sont pas conformes aux effectifs théoriques.
Si est vraie, la variable aléatoire qui prend pour valeur :
suit une loi du Khi-deux à degrés de liberté.
Pour faire le test, on procède donc ainsi :
On calcule les effectifs que l'on devrait théoriquement observer sur notre échantillon. C'est-à-dire . On calcule :
et l'on regarde si le nombre obtenu dépasse ou non le nombre donné dans la table du Khi-deux à la colonne indiquant le risque de première espèce et à la ligne indiquant le degré de liberté . Si le nombre obtenu est inférieur au nombre donné dans le tableau, on accepte l'hypothèse . Si le nombre est supérieur nombre donné dans le tableau, on rejette l'hypothèse .
Exemple. On a effectué le croisement de balsamines blanches avec des balsamines pourpres. On obtient en deuxième génération : 1790 balsamines pourpres. 547 balsamines rose. 548 balsamines blanc lavande. 213 balsamines blanches.
9/16 de balsamine pourpres. 3/16 de balsamine roses. 3/16 de balsamines blanc lavande. 1/16 de balsamines blanches.
Notre échantillon contient en tout balsamines. Théoriquement, on aurait dû obtenir: balsamines pourpres. balsamines rose. balsamines blanc lavande. balsamines blanche.
Soit l'hypothèse : La répartition obtenue est conforme à la répartition mendélienne. Soit l'hypothèse : La répartition obtenue n'est pas conforme à la répartition mendélienne. si est vraie, la variable aléatoire qui prend pour valeur :
où sont les effectifs observés respectivement pour les balsamines pourpres, roses, blanc lavande et blanches, suit une loi du Khi-deux à degrés de liberté. Calculons : . Cherchons dans la table du Khi-deux à la ligne et à la colonne . On lit . Comme , on accepte l'hypothèse . La répartition peut donc être considérée comme mendélienne. Les différences observées sont probablement dues aux fluctuations d'échantillonnage. |