Variables aléatoires discrètes/Exercices/Autour de la loi binomiale
Exercice 2-1
modifierUn patient, qui a 32 dents, rend visite à son dentiste pour son contrôle annuel. Celui-ci lui fait un détartrage et lui soigne toutes les caries dentaires qu’il peut avoir. Dans cet exercice, on supposera que la probabilité de se carier, dans un intervalle de temps donné, est la même pour toutes les dents.
- Que peut-on dire de la probabilité qu’il ait exactement une dent cariée lors de son prochain contrôle qu’il effectuera exactement un an après (365 jours) ?
- Que devient cette probabilité si, au lieu de faire son contrôle un an après, il le fait deux ans après ?
- Est-il vraisemblable qu’à chaque contrôle annuel, il ait exactement une dent cariée pendant une durée de cinq ans ?
- Reprendre l'étude de la première question avec un patient auquel on aurait arraché des dents.
- Combien faut-il arracher de dents à un patient ayant 32 dents pour que la probabilité qu’il ait exactement une dent cariée pendant cinq ans puisse éventuellement être supérieure à 1%.
1. Soit p la probabilité de se carier pour une dent en une année et soit P, la probabilité qu’il y ait exactement une dent cariée au bout d'un an. Nous allons étudier les valeurs que peut prendre P.
Une première étude intuitive nous montre que P pourrait théoriquement prendre la valeur 0 pour une dentition parfaite, mais ne pourra jamais prendre la valeur 1 car on peut logiquement penser que s'il est possible qu’il y ait exactement une dent cariée, la probabilité qu’il y en ait aucune ou au moins 2 n’est pas nulle. On s'attend donc à ce que P appartienne à un intervalle allant de 0 à une valeur m comprise entre 0 et 1. Essayons donc de déterminer m.
En supposant que la probabilité p, qu'a une dent de se carrier, soit la même pour toutes les dents et soit indépendante les unes des autres, nous voyons que P suit une loi binomiale de paramètre (32, p).
La probabilité d’avoir exactement une dent cariée au bout d'un an est donc :
- .
Nous voyons que nous nous sommes ramenés à l'étude de la fonction :
- .
Calculons la dérivée de cette fonction :
- .
Nous voyons que la dérivée s'annule pour p = 1 et pour p = 1/32.
Une étude de signe de la dérivée nous montre que la fonction f est croissante sur l'intervalle [0;1/32] et décroissante sur l'intervalle [1/32;1]. Par conséquent, nous pouvons dire que f atteint son maximum m pour p = 1/32. Ce maximum est :
- .
En conclusion, nous pouvons dire que :
. |
Or
- ,
valeur très légèrement inférieure à la fraction 37/99 (à 0,000003 près).
On peut donc écrire plus simplement :
. |
2. Tout le raisonnement fait dans la question précédente ne tient pas compte du fait que le prochain contrôle a lieu un an après. Par conséquent, la condition vérifiée par P est la même que précédemment. À savoir :
. |
3. Nous avons une suite d’événements indépendants ayant la même probabilité P de se produire (P étant inférieur à 37/99). Nous avons donc affaire, cette fois, à une loi binomiale de paramètre (5, P). La probabilité que cet événement se produise cinq fois est donc :
- .
Comme P est inférieur à 37/99, la probabilité qu'à chaque visite, il y ait une seule dent cariée et ceci pendant cinq ans, est inférieure à :
- .
Cette probabilité étant faible (moins de 1%), il est peu vraisemblable que pendant cinq ans, il y ait exactement une carie à soigner chaque année.
4. Si l’on reprend l'étude de la première question avec un patient ayant N dents (N inférieur ou égal à 32), on obtient :
- .
Nous voyons que nous nous sommes ramenés à l'étude de la fonction :
- .
Calculons la dérivée de cette fonction :
- .
La dérivée s'annule pour p = 1 et pour p = 1/N.
Une étude de signe de la dérivée nous montre que la fonction f est croissante sur l'intervalle [0 ; 1/N] et décroissante sur l'intervalle [1/N ; 1]. Par conséquent, f atteint son maximum m pour p = 1/N. Ce maximum est :
- .
Nous voyons que nous devons, cette fois, étudier la fonction :
- .
Cette fonction n’est pas définie pour x < 1. Ce n’est pas gênant, car on imagine mal un patient n'ayant pas de dents allant se faire soigner des caries dentaires.
Calculons la dérivée de cette fonction :
- .
Le signe de cette dérivée sur l'intervalle ]1 ; 32] est le même que le signe de l’expression :
- ,
dont la dérivée première est :
et la dérivée seconde est :
- .
La dérivée seconde de h est clairement négative. Par conséquent, la dérivée première de h est décroissante jusqu'à h'(32) qui est environ égal à 0,0005. Cette dernière valeur étant positive, on en déduit que la dérivée première de h est positive, ce qui entraîne que h est croissante jusqu'à h(32) qui est environ égal à -0,016. Cette dernière valeur étant négative, on en déduit que la fonction h est négative. Ce qui entraîne que la dérivée de g est négative. Par conséquent, la fonction g est décroissante.
Nous voyons donc que la probabilité qu'un patient ait exactement une dent cariée lors de sa prochaine visite chez son dentiste appartient à un intervalle allant de 0 à une valeur d'autant plus grande qu’il a moins de dents.
Si N est le nombre de dents, cette probabilité appartient à l'intervalle :
- .
Par exemple :
Pour N = 1, la probabilité qu’il ait exactement une dent cariée lors du prochain contrôle appartient à l'intervalle [0 ; 1]
Pour N = 2, la probabilité qu’il ait exactement une dent cariée lors du prochain contrôle appartient à l'intervalle [0 ; 0,5]
Pour N = 3, la probabilité qu’il ait exactement une dent cariée lors du prochain contrôle appartient à l'intervalle [0 ; 4/9]
...
Pour N = 32, la probabilité qu’il ait exactement une dent cariée lors du prochain contrôle appartient à l'intervalle [0 ; 37/99]
5. Comme nous l'avons vu à la question 3, la probabilité que le patient ait une dent cariée exactement pendant cinq ans est au maximum égale à P5. Pour un patient auquel on aura arraché des dents, compte tenu de la question 4, cette probabilité appartiendra à l'intervalle :
- .
Si l’on veut que cette probabilité puisse éventuellement dépasser 1 %, il nous faudra donc résoudre l'inéquation :
- .
Cette inéquation est difficile à résoudre directement. Toutefois, nous avons vu précédemment que le premier membre décroit en fonction de N. Nous pouvons donc faire une recherche par dichotomie. Pour N = 6, le premier membre est égal, à peu près, à 0,0105 et pour N = 7, le premier membre est égal, à peu près, à 0,0098. La solution de l'inéquation est donc : n < 7. Il faudrait donc arracher 26 dents au patient si l’on veut que la probabilité, qu’il ait une et une seule dent cariée à chaque contrôle pendant cinq ans, soit éventuellement supérieure à 1 %.
Exercice 2-2
modifierOn a estimé qu'un certain vaccin peut provoquer une légère réaction allergique, à une fréquence d'une allergie sur cent vaccinations.
On note X la variable aléatoire donnant le nombre de réactions allergiques dans des échantillons de 20 personnes vaccinées.
- Expliquez pourquoi X suit une loi binomiale B(n, p) dont on précisera les paramètres. Donnez alors la loi de probabilité de X, sa moyenne E(X) ainsi que son écart-type σ(X). Calculez la probabilité p(X > 2).
- On a remarqué que ce vaccin peut également provoquer des accidents graves, à une fréquence d'un accident pour 100 000 vaccinations. On note Y la variable aléatoire représentant le nombre d’accidents graves survenus dans des échantillons de 30 000 personnes vaccinées. Ainsi, Y suit une loi binomiale B(m, π) avec m = 30 000 et π = 0,00001.
- Calculez p(Y = 0) et p(Y = 1) (on gardera beaucoup de chiffres après la virgule).
- Pourquoi Y suit-il approximativement une loi de Poisson P(λ) dont on déterminera le paramètre λ > 0 ? Vérifiez que cette approximation est plutôt bonne en recalculant p(Y = 0) et p(Y = 1) à partir de la loi de Poisson.
- En utilisant la loi de Poisson, calculez p(Y = k) pour k ∈ {2, 3, 4}.
- Pour calculer X (1 échantillon), on répète 20 fois, de manière indépendante, la même expérience aléatoire qui n'a que deux issues possibles : « allergique » et « non allergique », avec p(allergique) = 0,01. On est exactement dans la définition de la loi binomiale B(n, p) avec n = 20 et p = 0,01. Les valeurs de X sont donc {0, 1, … , 19, 20} avec les probabilités . On sait que la moyenne de X est E(X) = np = 0,2 et l’écart-type ≈ 0,44.
p(X > 2) = 1 − p(X ≤ 2) = 1 − (p(X = 0) + p(X = 1) + p(X = 2)) ≈ 1 − (0,818 + 0,165 + 0,016) ≈ 0,001. - p(Y = 0) ≈ 0,7408171 et p(Y = 1) ≈ 0,2222473.
- On a m > 30 (m grand), π ≤ 0,1 (π petit) et mπ ≤ 10 (mπ « contrôlé »), donc Y suit approximativement une loi de Poisson P(λ) de paramètre λ = mπ = 0,3. On a alors p(Y = k) ≈ . On obtient alors, en utilisant la loi de Poisson, p(Y = 0) ≈ 0,7408182 et p(Y = 1) ≈ 0,2222454. On voit qu'on a les mêmes valeurs qu'avec la formule de la loi binomiale jusqu’au 5-ième chiffre après la virgule.
- p(Y = 2) ≈ 0,0333, p(Y = 3) ≈ 0,0033 et p(Y = 4) ≈ 0,0003.