Introduction aux fondamentaux de la statistique

26 novembre 2025

Crée tes propres fiches en 30 secondes

Colle ton cours, Revizly le transforme en résumé, fiches, flashcards et QCM.

Commencer gratuitement

Synthèse rapide

  • La statistique traite de la collecte, l’analyse, l’interprétation et la représentation des données.
  • La différence principale entre statistique descriptive et inférentielle.
  • Les lois de probabilités, notamment la loi normale et la loi normale centrée réduite, essentielles pour l’estimation et l’intervalle de confiance.
  • L’importance de l’échantillonnage pour réduire les coûts et le temps tout en garantissant la représentativité.
  • La loi de Student adaptée pour les petites tailles d’échantillons ou lorsque la variance de la population est inconnue.

Concepts et définitions

  • Variable : caractéristique mesurable d’un individu, pouvant être quantitative (numérique) ou qualitative (catégorielle).
  • Individu/observation : unité étudiée (personne, objet, pays…).
  • Population : ensemble complet d’individus ou d’observations.
  • Échantillon : sous-ensemble représentatif de la population.
  • Estimateur : règle ou formule utilisée pour estimer un paramètre de la population à partir de l’échantillon.

Formules, lois, principes

  • Moyenne d’échantillon : $$ \bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i $$
  • Variance d’échantillon : $$ s^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})^2 $$
  • Écart-type d’échantillon : $$ s = \sqrt{s^2} $$
  • Loi normale : distribution continue en forme de cloche, paramétrée par la moyenne $ \mu $ et l’écart-type $ \sigma $.
  • Loi normale centrée réduite : $$ Z = \frac{X - \mu}{\sigma} \sim N(0,1) $$
  • La règle empirique pour la loi normale : environ 68% des observations dans $ \pm 1\sigma $, 95% dans $ \pm 2\sigma $, 99.7% dans $ \pm 3\sigma $.

Méthodes et procédures

  1. Définir clairement la population ciblée.
  2. Choisir ou déterminer la taille de l’échantillon $ n $, en s’assurant que celui-ci est représentatif.
  3. Sélectionner la méthode d’échantillonnage (aléatoire simple, stratifié, en grappes…).
  4. Recueillir les données de manière rigoureuse.
  5. Calculer la moyenne, la variance, et l’écart-type de l’échantillon.
  6. Vérifier l’adéquation avec la loi normale si nécessaire (tests de normalité).
  7. Estimer le paramètre de la population et construire des intervalles de confiance.
  8. À partir des estimations, réaliser des tests d’hypothèses si besoin.

Exemples illustratifs

  • Distribution des poids d’un lot de bocaux en conserves, suivant une loi normale $ N(250, 7.5) $, puis l’estimation de la proportion de bocaux pesant moins de 248 g.
  • Analyse des prélèvements d’achats pour déterminer le montant moyen et son intervalle de confiance.
  • Évaluation du risque que la charge totale de passagers dans une cabine dépasse la limite autorisée à partir de la moyenne et de l’écart-type de leurs poids.

Pièges et points d'attention

  • Confusion entre moyenne d’échantillon et de la population.
  • Mal interpréter la signification des paramètres $ \mu $ et $ \sigma $.
  • Utiliser la loi de Student inappropriée si la taille de l’échantillon est grande ou si la variance est connue.
  • Négliger la variabilité intrinsèque des données.
  • Sous-estimer l’importance de la représentativité dans l’échantillonnage.
  • Confondre intervalle de confiance et intervalle de prédiction.
  • Application incorrecte de la règle empirique si la distribution n’est pas normale.

Glossaire

  • Variable : caractéristique mesurable.
  • Echantillon : sous-ensemble sélectionné de la population.
  • Estimateur : formule utilisée pour faire une estimation.
  • Lois de probabilité : règles mathématiques décrivant la distribution des variables aléatoires.
  • Loi normale : distribution symétrique en forme de cloche.
  • Loi de Student : distribution utilisée pour estimer la moyenne lorsque l’échantillon est petit ou la variance inconnue.
  • Intervalle de confiance : plage dans laquelle le paramètre de la population se trouve avec une probabilité donnée.
  • Erreur type : écart-type de la distribution de l’estimation.
  • Variance : mesure de la dispersion des données.