On considère toujours le caractère d'hypertension qui apparaît avec une proportion de 0,3 dans la population, mais nous prenons à présent des échantillons de 100 personnes.
Question
Quel est l'intervalle de fluctuation correspondant à cette situation ?
Solution
Nous avons p=0,3, n=100. Les conditions de validité[1] de la formule sont respectées. Nous pouvons donc calculer l'intervalle de fluctuation au seuil de 95% à l'aide de la formule vue en cours.
\(I=\left[ 0,3-\frac{1}{\sqrt{100}} ;0,3+\frac{1}{\sqrt{100}}\right]\)
donc \(I=[0,2 ;0,4]\)
On peut donc s'attendre avec une probabilité de 0,95 que les fréquences observées dans les échantillons soient comprises entre 0,2 et 0,4
Question
Si on prend 500 échantillons différents de taille 100, à combien d'échantillons dont la fréquence observée du caractère se situe en dehors de l'intervalle de fluctuation calculé ci-dessus peut-on s'attendre ?
Solution
On a 5% de chances que les échantillons soient en dehors de l'intervalle de fluctuation. Sur 500 échantillons, on peut donc s'attendre à \(500\times \frac{5}{100}\) soit 25 échantillons en dehors de l'intervalle.
Remarque :
Ceci n'est bien sur qu'une probabilité. En pratique, sur une simulation de 500 échantillons, le nombre d'échantillons situés à l'intérieur de l'intervalle peut fluctuer autour de la probabilité de 95%. Sur la simulation ci-dessous par exemple, nous lisons que 98% des échantillons sont dans l'intervalle de fluctuation.