Strict Standards: Only variables should be passed by reference in /data/web/4/1/maths.toile-libre.org/htdocs/config/ecran_securite.php on line 283
Statistique descriptive - Mathématiques

Accueil > Première ES > Cours et Exercices > Statistique descriptive

Statistique descriptive

lundi 12 juin 2017, par David Rodrigues

Statistique descriptive

Vocabulaire

I – Statistique descriptive

1. Vocabulaire d’une série statistique
Définitions  :
L’ensemble de personnes ou d’objets concernés par l’étude statistique considéré est appelée population.
Tout élément de la population est appelé individu.
Pour une population choisie, on peu étudier un caractère (une propriété) de ses individus.
Un caractère est dit caractère quantitatif lorsqu’il est possible de le mesure en associant un ombre à chaque individu. Deux cas se présentent :
Un caractère quantitatif est dit discret lorsqu’il ne prend qu’un nombre fini de valeurs numériques (année de naissance, nombre d’enfants par famille…)
Un caractère quantitatif est dit continu lorsque les nombres qui le mesurent peuvent prendre toutes les valeurs d’un intervalle (la masse, la taille, la durée de vie d’un ordinateur…)
Un caractère non quantitatif est dit caractère qualitatif (couleur des yeux...)


Exercice type

On demande à chaque élève de la classe leur nombre de frères et sœurs.
Quel(le) est la population ? Le caractère étudié ? Un individu ? Le type de caractère ?



La population est l’ensemble des élèves de la classe.
Le caractère est le nombre de frères et sœurs d’un individu.
Chaque élève est un individu.
Le caractère est quantitatif discret.


2. Effectifs et fréquences



Une série statistique est une liste de données (une donnée par individu de la population). Pour l’étudier, on regroupe généralement les données suivant la valeur du caractère.
Dans les définitions suivantes, on considère un nombre p de valeurs d’un caractère, classées dans l’ordre croissant. On notera x1 la première valeur, x2 la seconde, … et xp la dernière valeur.

Définitions  :
L’effectif de la série est le nombre N de données (donc le nombre d’individus de la population).
L’effectif d’une valeur xi est le nombre ni de données de la série ayant cette valeur.
L’effectif cumulé croissant (resp. décroissant) d’une valeur xi est la somme des effectifs des valeurs inférieures (resp. supérieures) ou égales à xi.
La fréquence d’une valeur xi est le quotient fi de l’effectif de cette valeur par l’effectif de la série : $ \frac{n_\text{i}}{\text{N}}$.
La fréquence cumulée croissante (resp. décroissante) d’une valeur xi est la somme des fréquences des valeurs inférieures (resp. supérieures) ou égales à xi.



Remarques  : Une fréquence est un nombre compris entre 0 et 1. La somme des fréquence des valeurs d’une série est 1.

Exercice type

Compléter le tableau.

Nombre de frères et sœurs 0 1 2 3 4 5
Effectifs
Effectifs cumulés croissants
Fréquences
Fréquences cumulées croissantes


3. Représentations d’une série statistique

Nuage de points

JPEG - 17.9 ko
Nuage de points

Courbe représentative de la fonction qui à toute valeur du caractère présente dans la série associe son effectif.

Diagrammes en bâtons ou en barres

JPEG - 17.9 ko
Diagramme bâtons

Plus lisible que le précédent : on ajoute une barre verticale dont la hauteur correspond à l’effectif.

Diagrammes circulaires (ou camemberts)

JPEG - 17 ko
Diagramme circulaire

L’angle au centre de chaque secteur est proportionnel à l’effectif de la valeur.
Représente graphiquement les fréquences de répartition.

Histogrammes

Lorsque les valeurs sont regroupées en classe, l’aire de chaque rectangle est proportionnel à l’effectif de la classe.

Diagrammes cumulatifs

JPEG - 19.2 ko
Diagramme cumulatif

Courbe représentative de la fonction qui à toute valeur du caractère présente dans la série associe son effectif ou sa fréquence cumulée.
Permet de lire graphiquement médiane et quartiles.

Exercice type

Représenter la série statistique du nombres de frères et sœurs des élèves de la classe par un diagramme en bâtons puis un diagramme circulaire.

Indicateurs

II – Indicateurs de position et de dispersion

1. Moyenne
Définition  :
La moyenne d’une série statistique, notée $\bar{x}$, est le réel défini par :
$ \bar{x}=\frac{x_{1} \times n_{1}+x_{2} \times n_{2}+x_{3} \times n_{3}+\ldots +x_p \times n_p}{n_{1}+n_{2}+n_{3}+\ldots +n_p}=\frac{x_{1} \times n_{1}+x_{2} \times n_{2}+x_{3} \times n_{3}+\ldots +x_p \times n_p}{N} ={\frac{1}{\text{N}}} \sum_{}^{}{{x_i}{n_i}}$


Corollaire  :
On peut calculer la moyenne à partir des fréquences.
$\bar{x}={x_{1} \times f_{1}+x_{2} \times f_{2}+x_{3} \times f_{3}+\ldots +x_p \times f_p} =\sum_{}^{}{{x_\text{i}}{f_\text{i}}}$


Démonstration :

Par définition, $ \frac{n_\text{i}}{\text{N}}=f_\text{i}$.



Remarque  : Si les valeurs sont regroupées par classe, on obtient une valeur approchée de la moyenne de la série en utilisant les centres des classes.

Exercice type

Calculer la moyenne du nombre de frères et sœurs dans la classe.


2. Médiane
Définition  :
La médiane d’une série statistique est un réel tel que au moins 50% des données de la série lui sont inférieures ou égales et au moins 50% des données de la série lui sont supérieures ou égales


Méthode  : On ordonne les données de la série statistique.
Si l’effectif est impair, la médiane est la donnée $ \frac{\text{N}+{1}}{2}$.
Si l’effectif est pair, on prend par convention la moyenne entre les données $ \frac{\text{N}}{2}$ et $ {\frac{\text{N}}{2}}+{1}$.


3. Quartiles
Définition  :
Le premier (resp. troisième) quartile, noté Q₁ (resp. Q₃), d’une série statistique est la plus petite valeur de la série telle que au moins 25% (resp. 75%) des données lui sont inférieures ou égales.



Remarque  : On représente médiane et quartiles dans un diagramme en boite.

PNG - 14.1 ko
Diagramme en boite


Exercice type

Construire le diagramme en boite de la série statistique du nombre de frères et sœurs dans la classe.



4. Indicateurs de dispersion
Définitions  :
L’étendue d’une série statistique est la différence entre les valeurs extrêmes de la série.
L’écart interquartile est la différence entre les troisième et premier quartiles.


Définitions  :
La variance d’une série statistique est le réel défini par :
$ \text{V}\left( x\right) =\frac{n_{1}\left( x_{1}-\bar{x}\right) ^{2}+n_{2}\left( x_{2}-\bar{x}\right) ^{2}+n_{3}\left( x_{3}-\bar{x}\right) ^{2}+ \ldots +n_p\left( x_p-\bar{x}\right) ^{2}}{\text{N}} ={\frac{1}{\text{N}}}\sum_{}^{}{{n_\text{i}}\left( {x_\text{i}}-\bar{x}\right) ^{2}}$

L’ écart type d’une série statistique le réel défini par :$\sigma\left( x\right) = \sqrt {\text{V}\left( x\right) }$




Remarque  : La variance est la moyenne des carrés des écarts avec la moyenne.

Propriété  :
On peut calculer la variance en utilisant la formule :
$\text{V}\left( x\right) =\frac{{n_1}{x_1}^{2}+{n_2}{x_2}^{2}+{n_3}{x_3}^{2}+\ldots+{n_p}{x_p}^{2}}{N} -{\bar{x}}^{2}={\frac{1}{\text{N}}}\sum_{}^{}{n_\text{i}}{x_\text{i}}^{2}-{\bar{x}}^{2}$



Propriété  :
On peut calculer la variance en utilisant la formule :
$\text{V}\left( x\right) ={{f_1}{x_1}^{2}+{f_2}{x_2}^{2}+{f_3}{x_3}^{2}+\ldots+{f_p}{x_p}^{2}}-{\bar{x}}^{2}=\sum_{}^{}{f_\text{i}}{x_\text{i}}^{2}-{\bar{x}}^{2}$


Démonstration :

$n_{1}\left( x_{1}-\bar{x}\right) ^{2}=n_{1}\left( x_{1}^{2}-{2}x_{1}{\bar{x}}+{\bar{x}}^{2}\right) =n_{1}x_{1}^{2}-{2}n_{1}x_{1}\bar{x}+{\bar{x}}^{2}$

Alors
$ \begin{eqnarray} V\left( x\right) &=& {\frac{1}{\text{N}}}\sum_{}^{}{{n_\text{i}}\left( {x_\text{i}}-\bar{x}\right) ^{2}} \\ &=& {\frac{1}{\text{N}}}\sum_{}^{}{{n_\text{i}}{x_\text{i}}^{2}}-{2}{n_\text{i}}{x_\text{i}} \bar{x}+{\bar{x}}^2 \\ &=& {\frac{1}{\text{N}}}\sum_{}^{}{n_\text{i}}{x_\text{i}}^{2}-{\frac{1}{\text{N}}}\sum_{}^{}{{2}{n_\text{i}}{x_\text{i}}{\bar{x}}}+{\frac{1}{\text{N}}}\sum_{}^{}{\bar{x}}^{2} \\ &=& {\frac{1}{\text{N}}}\sum_{}^{}{n_\text{i}}{x_\text{i}}^{2}-2{\bar{x}}^2+{\bar{x}}^{2} \\ &=& {\frac{1}{\text{N}}}\sum_{}^{}{n_\text{i}}{x_\text{i}}^{2}-{\bar{x}}^{2} \end{eqnarray} $


SPIP | | Plan du site | Suivre la vie du site RSS 2.0
Habillage visuel © digitalnature sous Licence GPL