Initiation à la statistique/Introduction
Qu’est ce que les statistiques ?
modifierC’est une théorie mathématique dont le but est :
- Organiser des données en grand nombre pour pouvoir les interpréter.
- Calculer une moyenne permet de résumer en un seul nombre un grand nombre de notes.
- Calculer un pourcentage permet de résumer en un seul nombre la relation d’un ensemble à une de ses parties.
- Les statistiques sont très utilisées :
- Dans le commerce, la finance…
- En sciences humaines : histoire, économie, médecine, géographie…
Les résultats d’une enquête consistent en une liste désordonnée d’informations, dont il est difficile d’extraire la signification sans un traitement mathématique préalable.
Exemple 1 : Les notes des élèves d’une classe à un devoir
modifierLes élèves d’une classe ont obtenu les notes suivantes à un devoir :
Pour mieux comprendre ces données, on les trie par ordre croissant :
Cette présentation reste peu convaincante, on décide alors de présenter les résultats de l’enquête sous forme d’un tableau d’effectifs.
Tableau des effectifs
modifierL’effectif d’une valeur est le nombre de fois où cette valeur apparaît.
Exemple 1: notes des élèves
notes | 5 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 16 | Total |
effectifs | 1 | 1 | 2 | 4 | 3 | 2 | 1 | 1 | 1 | 16 |
Tableau des effectifs cumulés
modifierIl sert à visualiser la vitesse de croissance des effectifs en fonction du caractère étudié. On l’utilise en troisième pour déterminer la médiane d’une série statistique.
Reprenons l’exemple 1 des notes des élèves :
notes | 5 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 16 |
effectifs | 1 | 1 | 2 | 4 | 3 | 2 | 1 | 1 | 1 |
effectifs cumulés | 1 | 2 | 4 | 8 | 11 | 13 | 14 | 15 | 16 |
Tableau des fréquences
modifierLorsque la population étudiée est trop grande, ou bien lorsque l’on cherche à faire la comparaison entre deux populations de tailles différentes, on préfère se ramener à une population de 100, donc travailler en pourcentages, appelés ici fréquences.
La fréquence de la note 10, par exemple, se calcule ainsi :
En procédant de même pour les autres notes, on obtient le tableau des fréquences suivant :
notes | 5 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 16 | Total |
fréquences en % | 6,25 | 6,25 | 12,50 | 25,00 | 18,75 | 12,50 | 6,25 | 6,25 | 6,25 | 100 |
Tableau des fréquences cumulées
modifierEn procédant comme pour les effectifs cumulés, on peut construire un tableau des fréquences cumulées, par exemple avec l'exemple 1 des notes :
notes | 5 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 16 |
fréquences en % | 6,25 | 6,25 | 12,50 | 25,00 | 18,75 | 12,50 | 6,25 | 6,25 | 6,25 |
fréquences cumulées en % | 6,25 | 12,5 | 25 | 50 | 68,75 | 81,25 | 87,5 | 93,75 | 100 |
Exemple 2 : La couleur préférée
modifierOn a demandé à 13 personnes leur couleur préférée.
Pour mieux comprendre ces résultats, on les trie par couleur :
Cette liste reste peu éclairante, on présente les résultats de l’enquête sous forme d’un tableau d’effectifs.
Tableau des effectifs
modifierExemple 2: couleur préférée
Couleurs | Effectifs |
Bleu | 7 |
Rouge | 2 |
Jaune | 4 |
Total | 13 |
Tableau des fréquences
modifierEn procédant comme dans l’exemple précédent, on obtient le tableau des fréquences :
Couleurs | Fréquences en % |
Bleu | 53,85 |
Rouge | 15,38 |
Jaune | 30,77 |
Total | 100 |
Diagramme circulaire
modifierLes diagrammes statistiques servent à prendre connaissance de l’essentiel d’une étude statistique en un seul coup d'œil. Le type de diagramme utilisé dépend de l'étude.
Le caractère statistique étudié ici, la couleur, n’est pas un nombre. On dit qu’il est qualitatif.
On construit alors un diagramme circulaire (ou « camembert ») : on découpe un cercle en secteurs dont la surface (et donc l’angle) est proportionnelle à l’effectif ou la fréquence.
Complétons le tableau par le calcul des angles au centre.
Couleurs | Fréquences en % | Angle en degré |
Bleu | 53,85 | 194 |
Rouge | 15,38 | 55 |
Jaune | 30,77 | 111 |
Total | 100 | 360 |
Il ne reste plus qu’à dessiner les secteurs :
Notion de moyenne : Exemple de la taille des élèves
modifierExemple 3 : Moyenne simple
modifierVoici les tailles de 5 élèves, la taille moyenne est celle d’un élève idéal ni trop grand ni trop petit. Y a-t-il un élève qui ait la taille « représentative » de la classe et quelle est cette taille ?
Tailles en cm | 178 | 180 | 182 | 181 | 179 |
En additionnant tous les résultats et en divisant par le nombre d’individus dans la classe, nous obtiendrons ce que l’on appelle la moyenne.
La moyenne est donc 180 cm
Exemple 4 : Moyenne pondérée par les effectifs
modifierVoici maintenant un groupe plus important d'élèves, dont certains ont la même taille. Peut-on calculer la taille moyenne sans additionner toutes les tailles (ce qui est long et pénible)?
Il faut d’abord construire le tableau des effectifs :
Taille | 178 | 179 | 180 | 181 | 182 | Effectif |
Effectif | 5 | 2 | 3 | 1 | 4 | 5+2+3+1+4=15 |
Taille × effectif | 178 × 5 | 179 × 2 | 180 × 3 | 181 × 1 | 182 × 4 | Somme des tailles |
Produit | 890 | 358 | 540 | 181 | 728 | 890+358+540+181+728=2697 |
La moyenne est ici le total des tailles à diviser par le nombre d'élèves : soit 2697/15 = 179,8 cm
Exemple 4 : Diagramme en bâtons
modifierLe caractère statistique étudié ici, la taille, est un nombre. Un diagramme circulaire ne rendrait pas compte de sa grandeur. On construit alors un diagramme en bâtons (ou en barres).
Elevons pour chaque mesure un trait vertical proportionnel au nombre d'élèves.
Regroupement en classes : Exemple des salaires
modifierLorsque le caractère statistique prend un grand nombre de valeurs différentes, elles peuvent être regroupées en classes (ou intervalles, ou tranches …).
En quatrième, on travaille toujours avec des classes de même largeur.
Tableau des effectifs
modifierExemple 5 : Répartition des revenus annuels en milliers d’euros dans une population de 4370 personnes.
Salaires | entre 5 (inclus) et 10 exclus | entre 10 (inclus) et 15 exclus | entre 15 (inclus) et 20 exclus | entre 20 (inclus) et 25 exclus | entre 25 (inclus) et 30 exclus | entre 30 (inclus) et 35 exclus | entre 35 (inclus) et 40 exclus | Total |
Effectifs | 306 | 231 | 385 | 1180 | 1468 | 568 | 232 | 4370 |
Tableau des fréquences
modifierLes effectifs ici sont trop grands pour que l’on puisse se faire une idée simple de la répartition, on préfère alors travailler en pourcentages ou fréquences et se ramener ainsi à une population de 100.
Salaires | entre 5 (inclus) et 10 exclus | entre 10 (inclus) et 15 exclus | entre 15 (inclus) et 20 exclus | entre 20 (inclus) et 25 exclus | entre 25 (inclus) et 30 exclus | entre 30 (inclus) et 35 exclus | entre 35 (inclus) et 40 exclus | Total |
Fréquences | 7,0 | 5,3 | 8,8 | 27,0 | 33,6 | 13,0 | 5,3 | 100 |
Moyenne
modifierSalaires | entre 5 (inclus) et 10 exclus | entre 10 (inclus) et 15 exclus | entre 15 (inclus) et 20 exclus | entre 20 (inclus) et 25 exclus | entre 25 (inclus) et 30 exclus | entre 30 (inclus) et 35 exclus | entre 35 (inclus) et 40 exclus | Total |
Effectifs | 306 | 231 | 385 | 1180 | 1468 | 568 | 232 | 4370 |
centre de chaque classe | 7,5 | 12,5 | 17,5 | 22,5 | 27,5 | 32,5 | 37,5 | total des salaires |
Total des salaires de chaque classe |
2295 | 2887,5 | 6737,5 | 26550 | 40370 | 18460 | 8700 | 106000 |
Le salaire moyen parmi cet échantillon est donc de 106000/4370 = 24,25 soit environ 24250 Euros.
Histogramme
modifierOn représente cette étude statistique par un histogramme, formé de rectangles qui recouvrent toutes les classes considérées.