« Initiation à la statistique » : différence entre les versions

Contenu supprimé Contenu ajouté
m a renommé Statistiques en Initiation aux statistiques
Aucun résumé des modifications
Ligne 1 :
{{Entête de leçon
{{Page importée à nettoyer}}
|idfaculté=maths
[[Catégorie:Page importée depuis Wikibooks]]
}}
{{cadre|couleur fond=#ffffff}}
== Introduction ==
{{Liste de chapitres
|idfaculté=maths
|1=[[/Tableau des effectifs]]
|2=[[/Tableau des effectifs]]
|3=[[/Moyenne]]
|4=[[/Médiane]]
|annexe1=[[/Annexe|Annexe]]
|exo1=[[...]]
|exo2=[[...]]
}}
<div style="margin:2em 0; font-size: 140%; font-family:Times, Serif; font-style: italic;">
<blockquote>
Les statistiques forment une théorie mathématique dont le but est d'interpréter des données en grand nombre. Elles sont utilisées dans les sciences humaines et dans les domaines appliqués, comme la finance ou le commerce.
</blockquote>
</div>
 
====Niveau et prérequis conseillés====
{{CoursMathsCollège}}
Ce cours est du niveau '''Simple'''
 
Prérequis conseillés : '''[[Introduction aux mathématiques élémentaires]]'''
== Qu'est ce que les statistiques ==
 
====Référents====
C’est une théorie mathématique dont le but est :
Ces contributeurs sont prêts à vous aider concernant ce cours :
:
*[[Utilisateur:Nicostella|Nicostella]] (Prof de maths et un des développeurs du cours)
{{clr}}
{{fin}}
 
[[Catégorie:Page importée depuis Wikibooks]]
*Organiser des données en grand nombre pour pouvoir les interpréter.
 
**Calculer une moyenne permet de « résumer » en un seul nombre un grand nombre de notes.
**Calculer un pourcentage permet de résumer en un seul nombre la relation d’un ensemble à une de ses parties
 
*Elles sont très utilisées :
 
**Dans le [[w:commerce|commerce]], la [[w:finance|finance]], ...
**En [[w:sciences humaines|sciences humaines]] : [[w:histoire|histoire]], [[w:économie|économie]], [[w:histoire|histoire]], [[w:médecine|médecine]], [[w:géographie|géographie]], …
 
Les résultats d’une enquête consistent en une liste désordonnée d’informations, dont il est difficile d'extraire la signification sans un traitement mathématique préalable.
 
== Exemple 1 : Les notes des élèves d'une classe à un devoir ==
 
Les élèves d'une classe ont obtenu les notes suivantes à un devoir :
 
<center>'''Notes sur 20 ''' : 10, 9, 12, 11, 10, 8, 14 ,11 ,9 ,16 ,5 ,12 ,10 ,11 ,10 ,13</center>
 
Pour mieux comprendre ces données, on les trie par ordre croissant
 
<center>'''Notes triées''' : 5, 8, 9, 9, 10, 10, 10, 10, 11, 11, 11, 12, 12, 13, 14, 16</center>
 
Cette présentation reste peu convaincante, on décide alors de présenter les résultats de l’enquête sous forme d’un '''tableau d’effectifs'''.
 
=== Tableau des effectifs ===
 
L’'''effectif''' d’une valeur est le nombre de fois où cette valeur apparaît.
 
''Exemple 1: note des élèves''
<Center>
{| border cellspacing="0"
|-----
| align="center" | notes
| align="center" | 5 || align="center" | 8
| align="center" | 9
| align="center" | 10 || align="center" | 11
| align="center" | 12
| align="center" | 13 || align="center" | 14
| align="center" | 16 || align="center" | Total
|-----
| align="center" | effectifs
| align="center" | 1 || align="center" | 1
| align="center" | 2
| align="center" | 4 || align="center" | 3
| align="center" | 2
| align="center" | 1 || align="center" | 1
| align="center" | 1 || align="center" | 16
|}
</center>
 
=== Tableau des effectifs cumulés ===
 
Il sert à mettre visualiser la vitesse de croissance des effectifs en fonction du caractère étudié. On l'utilise en troisième pour déterminer la médiane d'une série statistique.
 
Reprenons l'exemple 1 des notes des élèves :
 
<Center>
{| border cellspacing="0"
|-----
| align="center" | notes
| align="center" | 5 || align="center" | 8
| align="center" | 9
| align="center" | 10 || align="center" | 11
| align="center" | 12
| align="center" | 13 || align="center" | 14
| align="center" | 16
|-----
| align="center" | effectifs
| align="center" | 1 || align="center" | 1
| align="center" | 2
| align="center" | 4 || align="center" | 3
| align="center" | 2
| align="center" | 1 || align="center" | 1
| align="center" | 1
|-----
| align="center" | effectifs cumulés
| align="center" | 1 || align="center" | 2
| align="center" | 4
| align="center" | 8 || align="center" | 11
| align="center" | 13
| align="center" | 14 || align="center" | 15
| align="center" | 16
|}
</center>
 
=== Tableau des fréquences ===
 
Lorsque la population étudiée est trop grande, ou bien lorsque l’on cherche à faire la comparaison entre deux populations de tailles différentes, on préfère '''se ramener à une population de 100''', donc travailler en pourcentages, appelés ici '''fréquences'''.
 
La fréquence de la note 10, par exemple, se calcule ainsi :
 
<center><math>\frac{\mbox{Effectif de la note 10}}{\mbox{Effectif total}}=\frac{4}{16}=0,25=25%</math></center>
 
En procédant de même pour les autres notes, on obtient le tableau des fréquences :
 
 
<center>
{| border cellspacing="0"
|-----
| align="center" | notes || align="center" | 5
| align="center" | 8
| align="center" | 9 || align="center" | 10
| align="center" | 11
| align="center" | 12 || align="center" | 13
| align="center" | 14
| align="center" | 16 || align="center" | Total
|-----
| align="center" | fréquences en %
| align="center" | 6,25 || align="center" | 6,25
| align="center" | 12,50
| align="center" | 25,00 || align="center" | 18,75
| align="center" | 12,50
| align="center" | 6,25 || align="center" | 6,25
| align="center" | 6,25 || align="center" | 100
|}
</center>
 
=== Tableau des fréquences cumulées ===
 
En procédant comme pour les effectifs cumulés, on peut construire un tableau des fréquences cumulées , par exemple avec l''''exemple 1''' des notes :
 
<center>
{| border cellspacing="0"
|-----
| align="center" | notes || align="center" | 5
| align="center" | 8
| align="center" | 9 || align="center" | 10
| align="center" | 11
| align="center" | 12 || align="center" | 13
| align="center" | 14
| align="center" | 16
|-----
| align="center" | fréquences en %
| align="center" | 6,25 || align="center" | 6,25
| align="center" | 12,50
| align="center" | 25,00 || align="center" | 18,75
| align="center" | 12,50
| align="center" | 6,25 || align="center" | 6,25
| align="center" | 6,25
|-----
| align="center" | fréquences cumulées en %
| align="center" | 6,25 || align="center" | 12,5
| align="center" | 25
| align="center" | 50 || align="center" | 68,75
| align="center" | 81,25
| align="center" | 87,5 || align="center" | 93,75
| align="center" | 100
|}
</center>
 
== Exemple 2 : La couleur préférée ==
 
On a demandé à 13 personnes leur couleur préférée.
 
<center>'''Couleur préférée''' : bleu, rouge, bleu, bleu, jaune, bleu, rouge, bleu, bleu, jaune, jaune, bleu, jaune</center>
 
Pour mieux comprendre ces résultats, on les trie par couleur :
 
<center>'''Couleurs préférées triées''' : bleu, bleu, bleu, bleu, bleu, bleu, bleu, rouge, rouge, jaune, jaune, jaune, jaune</center>
 
Cette liste reste peu éclairante, on présente les résultats de l’enquête sous forme d’un tableau d’effectifs.
 
=== Tableau des effectifs ===
 
''Exemple 2: couleur préférée''
<center>
{| border cellspacing="0"
|-----
| align="center" | Couleurs
| align="center" | Effectifs
 
|-----
| align="center" | Bleu || align="center" | 7
|-----
| align="center" | Rouge || align="center" | 2
|-----
| align="center" | Jaune || align="center" | 4
|-----
| align="center" | Total || align="center" | 13
|}
</center>
 
 
=== Tableau des fréquences ===
 
En procédant comme dans l'exemple précédent, on obtient le tableau des fréquences :
 
<center>
{| border cellspacing="0"
|-----
| align="center" | Couleurs
| align="center" | Fréquences en %
 
|-----
| align="center" | Bleu || align="center" | 53,85
|-----
| align="center" | Rouge || align="center" | 15,38
|-----
| align="center" | Jaune || align="center" | 30,77
|-----
| align="center" | Total || align="center" | 100
|}
</center>
 
=== Diagramme circulaire ===
 
Les diagrammes statistiques servent à prendre connaissance de l'essentiel d'une étude statistique '''en un seul coup d'oeil'''. Le type de diagramme utilisé dépendra de l'étude.
 
Le caractère statistique étudié ici, la couleur, n'est pas un nombre, on dit qu'il est '''qualitatif'''.
 
On construit alors un diagramme circulaire (ou "camembert") : on découpe un cercle en secteurs dont la surface (et donc l'angle) est proportionnelle à l'effectif ou la fréquence.
 
Complétons le tableau par le calcul des angles au centre.
 
<center>
{| border cellspacing="0"
|-----
| align="center" | Couleurs
| align="center" | Fréquences en %
| align="center" | Angle en degré
 
|-----
| align="center" | Bleu || align="center" | 53,85
| align="center" | 194
 
|-----
| align="center" | Rouge || align="center" | 15,38
| align="center" | 55
 
|-----
| align="center" | Jaune || align="center" | 30,77
| align="center" | 111
 
|-----
| align="center" | Total || align="center" | 100
| align="center" | 360
|}
</center>
 
Il ne reste plus qu'à dessiner les secteurs :
 
<center>[[Image:Diagramme en camembert.PNG]]</center>
 
== Notion de moyenne : Exemple de la taille des élèves ==
 
=== Exemple 3 : Moyenne simple ===
 
Voici les tailles de 4 élèves, la '''taille moyenne''' est celle d'un élève idéal ni trop grand ni trop petit. Y a-t-il un élève qui ait la taille « représentative » de la classe et quelle est cette taille?
 
 
<center>
{| border cellspacing="0"
|-----
| align="center" | Tailles en cm || align="center" width="10" | 178
| align="center" | 180
| align="center" | 182 || align="center" | 181
| align="center" | 179
|}
</center>
 
 
En additionnant tous les résultats et en divisant par le nombre d'individus dans la classe, nous obtiendrons ce que l'on appelle la [[moyenne]].
 
<center><math>178+180+182+181+179\,</math><math>=900\,</math></center>
 
 
<center><math>\frac{900}{5}</math><math>=180\,</math></center>
 
 
La moyenne est donc '''180 cm'''
 
=== Exemple 4 : Moyenne pondérée par les effectifs ===
 
Voici maintenant un groupe plus important d'élèves, dont certains ont la même taille. Peut-on calculer la taille moyenne sans additionner toutes les tailles (ce qui est long et pénible)?
 
Il faut d'abord construire le tableau des effectifs :
 
 
 
<center>
{| border cellspacing="0"
|-----
| align="center" | <math>\scriptstyle{Taille}</math> || align="center" | 178
| align="center" | 179
| align="center" | 180 || align="center" | 181
| align="center" | 182 || align="center" | <math>\scriptstyle{Effectif\ total}</math>
|-----
| align="center" | <math>\scriptstyle{Effectif}</math> || align="center" | 5
| align="center" | 2
| align="center" | 3 || align="center" | 1
| align="center" | 4
| align="center" | 5+2+3+1+4='''15'''
 
|-----
| align="center" | <math>\scriptstyle{Taille\times effectif}</math>
| align="center" | 178<math> \times </math>5
| align="center" | 179<math>\times </math>2
| align="center" | 180<math>\times </math>3
| align="center" | 181<math>\times </math>1
| align="center" | 182<math>\times </math>4
| align="center" | <math>\scriptstyle{Somme\ des\ tailles}</math>
 
|-----
| align="center" | <math>\scriptstyle{Produit}</math>
| align="center" | 890 || align="center" | 358
| align="center" | 540
| align="center" | 181 || align="center" | 728
| align="center" | 890+358+540+181+728='''2697'''
|}
</center>
 
 
 
La moyenne est ici le '''total des tailles à diviser par le nombre d'élèves''' : soit 2697/15 = '''179,8 cm'''
 
=== Exemple 4 : Diagramme en bâtons ===
 
Le caractère statistique étudié ici, la taille, est un nombre, un diagramme circulaire ne rendrait pas compte de sa grandeur. On construit alors un diagramme en bâtons (ou en barres).
 
Élevons pour chaque mesure un trait vertical proportionnel au nombre d'élèves.
 
<center>[[Image:Diagramme en batons.png]]<br />
<small>''Répartition des 15 élèves selon leur taille en cm.''</small></center>
 
== Regroupement en classes : Exemple des salaires ==
 
Lorsque le caractère statistique peut prendre un grand nombre de valeurs différentes, on les regroupe en '''classes'''(ou intervalles, ou tranches ...).
 
En quatrième, on travaille toujours avec des classes de même largeur.
 
=== Tableau des effectifs ===
 
'''Exemple 5''' : Répartition des revenus annuels en milliers d'euros dans une population de 4370 personnes.
 
<center>
{| border="1" cellspacing="0"
|-----
| align="center" | Salaires
| align="center" | entre 5 (inclus) et 10 exclus
| align="center" | entre 10 (inclus) et 15 exclus
| align="center" | entre 15 (inclus) et 20 exclus
| align="center" | entre 20 (inclus) et 25 exclus
| align="center" | entre 25 (inclus) et 30 exclus
| align="center" | entre 30 (inclus) et 35 exclus
| align="center" | entre 35 (inclus) et 40 exclus
| align="center" | Total
|-----
| align="center" | Effectifs || align="center" | 306
| align="center" | 231
| align="center" | 385 || align="center" | 1180
| align="center" | 1468
| align="center" | 568 || align="center" | 232
| align="center" | 4370
|}
</center>
 
=== Tableau des fréquences ===
 
Les effectifs ici sont trop grands pour que l'on puisse se faire une idée simple de la répartition, on préfère alors travailler en pourcentages ou '''fréquences''' et se ramener ainsi à une population de 100.
 
<center>
{| border cellspacing="0"
|-----
| align="center" | Salaires
| align="center" | entre 5 (inclus) et 10 exclus
| align="center" | entre 10 (inclus) et 15 exclus
| align="center" | entre 15 (inclus) et 20 exclus
| align="center" | entre 20 (inclus) et 25 exclus
| align="center" | entre 25 (inclus) et 30 exclus
| align="center" | entre 30 (inclus) et 35 exclus
| align="center" | entre 35 (inclus) et 40 exclus
| align="center" | Total
|-----
| align="center" | Fréquences || align="center" | 7,0
| align="center" | 5,3
| align="center" | 8,8 || align="center" | 27,0
| align="center" | 33,6
| align="center" | 13,0 || align="center" | 5,3
| align="center" | 100
|}
</center>
 
=== Moyenne ===
 
{{Début cadre|violet}}
Quand on regroupe une série statistique en classe, on calcule la moyenne en prenant comme valeurs les centres de chaque classe.
{{Fin cadre}}
 
<center>
{| border cellspacing="0"
|-----
| align="center" | Salaires
| align="center" | entre 5 (inclus) et 10 exclus
| align="center" | entre 10 (inclus) et 15 exclus
| align="center" | entre 15 (inclus) et 20 exclus
| align="center" | entre 20 (inclus) et 25 exclus
| align="center" | entre 25 (inclus) et 30 exclus
| align="center" | entre 30 (inclus) et 35 exclus
| align="center" | entre 35 (inclus) et 40 exclus
| align="center" | Total
|-----
| align="center" | Effectifs
|align="center" | 306
| align="center" | 231
| align="center" | 385
| align="center" | 1180
| align="center" | 1468
| align="center" | 568
| align="center" | 232
| align="center" | 4370
 
|-----
| align="center" | centre de chaque classe
| align="center" | 7,5
| align="center" | 12,5
| align="center" | 17,5
| align="center" | 22,5
| align="center" | 27,5
| align="center" | 32,5
| align="center" | 37,5
| align="center" | total des salaires
|-----
| align="center" | Total des salaires<br />de chaque classe
| align="center" | 2295
| align="center" | 2887,5
| align="center" | 6737,5
| align="center" | 26550
| align="center" | 40370
| align="center" | 18460
| align="center" | 8700
| align="center" | 106000
|}
</center>
 
Le salaire moyen parmi cet échantillon est donc de 106000/4370 = 24,25 soit environ 24250 Euros.
 
=== Histogramme ===
 
On représente cette étude statistique par un histogramme, formé de rectangles qui recouvrent toute la classe considérée.
 
 
<center> [[Image:Histogramme 1.svg]]</center>
 
[[Catégorie:Cours de mathématiques niveau quatrième (France)|Statistiques]]
[[Catégorie:Mathématiques]]