Introduction à la statistique descriptive

29 novembre 2025

Crée tes propres fiches en 30 secondes

Colle ton cours, Revizly le transforme en résumé, fiches, flashcards et QCM.

Commencer gratuitement

Synthèse rapide

  1. La statistique descriptive permet de résumer un ensemble de données par des indicateurs clés.
  2. La moyenne, la médiane et le mode sont des mesures centrales essentielles.
  3. Les mesures de dispersion incluent l'écart-type, la variance et l'étendue.
  4. La représentation graphique utilise histograms, diagrammes en boîte et nuages de points.
  5. La loi des grands nombres assure la convergence de la moyenne empirique vers la moyenne théorique.
  6. La loi normale est une distribution continue symétrique caractérisée par sa moyenne et son écart-type.
  7. La transformation de variables permet de normaliser ou standardiser des données.
  8. La corrélation mesure la relation linéaire entre deux variables.
  9. La régression linéaire modélise la dépendance d'une variable par une ou plusieurs autres.
  10. La statistique inférentielle permet d'estimer des paramètres et de tester des hypothèses.

Concepts et définitions

  • Population : ensemble complet d’individus, d’objets ou de phénomènes étudiés.
  • Échantillon : sous-ensemble représentatif de la population.
  • Variable : caractéristique mesurée sur chaque individu.
  • Variable quantitative : admissible à des opérations arithmétiques (ex : taille, poids).
  • Variable qualitative : catégorique (ex : couleur, sexe).
  • Distribution : fonction qui associe à chaque valeur la probabilité ou la fréquence d’apparition.

Formules, lois, principes

  • Moyenne arithmétique : $$ \bar{x} = \frac{1}{n} \sum_{i=1}^n x_i $$
  • Variance : $$ \sigma^2 = \frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2 $$
  • Écart-type : $$ \sigma = \sqrt{\sigma^2} $$
  • Coéfficient de corrélation de Pearson : $$ r = \frac{\sum_{i=1}^n (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum_{i=1}^n (x_i - \bar{x})^2} \sqrt{\sum_{i=1}^n (y_i - \bar{y})^2}} $$

Méthodes et procédures

  1. Collecte d’un échantillon représentatif.
  2. Calcul des mesures de tendance centrale (moyenne, médiane, mode).
  3. Calcul des mesures de dispersion (écart-type, variance, étendue).
  4. Représentation graphique adaptée (histogramme, diagramme en boîte).
  5. Vérification des propriétés de distribution (normalité, asymétrie).
  6. Mise en relation entre variables (corrélation, régression).
  7. Application des lois de probabilité pour l’inférence statistique.
  8. Réalisation de tests d’hypothèses pour valider des conjectures.

Exemples illustratifs

  1. Calcul de la moyenne et de l’écart-type d’un échantillon de résultats à un examen.
  2. Représentation graphique de la distribution des âges d’une population via un histogramme.
  3. Analyse de la relation entre le nombre d’heures étudiées et la note obtenue par une régression linéaire.

Pièges et points d'attention

  • Confusion entre moyenne et médiane en présence de données asymétriques.
  • Sous-estimation de l’impact des valeurs extrêmes sur la moyenne.
  • Mauvaise interprétation de la corrélation comme causalité.
  • Négliger la vérification de la normalité pour certains tests statistiques.
  • Utilisation incorrecte des mesures de dispersion pour des variables qualitatives.

Glossaire

  • Population : ensemble complet d’individus ou objets d’étude.
  • Échantillon : sous-ensemble représentatif de la population.
  • Variable : caractéristique mesurée ou observée.
  • Distribution : fonction associant valeurs et probabilités.
  • Distribution normale : distribution symétrique caractérisée par deux paramètres : la moyenne et l’écart-type.
  • Régression linéaire : modèle linéaire d’explication d’une variable par d’autres.
  • Corrélation : mesure de la dépendance linéaire entre deux variables.