Fiche de révision : Introduction à l'inférence statistique

📋 Plan du Cours

  1. Inférence statistique et tests paramétriques
  2. Hypothèses unilatérales et bilatérales
  3. Distribution d’échantillonnage et normalité
  4. Test z et comparaison à une population
  5. Test t et intervalle de confiance
  6. Comparaison de deux groupes indépendants et appariés

📖 1. Inférence statistique et tests paramétriques

🔑 Notions clés & Définitions

  • Inférence statistique : Approche qui utilise un échantillon pour tirer des conclusions probabilistes sur les caractéristiques d’une population.
  • Tests paramétriques : Tests qui supposent une loi de distribution connue pour les données et exigent des conditions de validité avant l’interprétation.
  • p-valeur : Probabilité d’observer (ou un résultat plus extrême) les données si l’hypothèse nulle H0 est vraie.

📝 Points essentiels

  • La démarche d’inférence comporte 4 étapes : énoncer l’objectif théorique, choisir le test en vérifiant les conditions, formuler H0/H1, puis calculer la p-valeur pour conclure sur H0.
  • Les tests paramétriques concernent des variables continues et reposent sur une distribution d’échantillonnage normale, condition la plus importante.
  • Pour comparer des moyennes de deux populations avec mesures indépendantes, une condition supplémentaire est l’homogénéité des variances (homoscédasticité).
  • On rejette H0 quand la p-valeur est ≤ 0,05, et on ne la rejette pas si elle est > 0,05.

💡 Astuce mémo

p-valeur = “si H0 est vraie, à quel point c’est improbable ?” (petit ⇒ rejet de H0, grand ⇒ non-rejet).

📖 2. Hypothèses unilatérales et bilatérales

🔑 Notions clés & Définitions

  • Hypothèse unilatérale : Hypothèse où l’alternative ne décrit qu’un effet dans une seule direction (augmentation ou diminution).
  • Hypothèse bilatérale : Hypothèse où l’alternative décrit toute différence, qu’elle soit une augmentation ou une diminution.
  • H0 et H1 : Hypothèse nulle H0 et hypothèse alternative H1 forment un couple opposé utilisé pour décider du rejet de H0.

📝 Points essentiels

  • Sous forme unilatérale, H1 postule une augmentation ou une diminution de la valeur; sous forme bilatérale, H1 postule une différence dans l’une ou l’autre direction.
  • Choisir une hypothèse unilatérale n’est justifié que s’il existe des preuves solides pour anticiper un sens précis de l’effet.
  • Une conclusion de non-rejet de H0 ne prouve pas que H0 est vraie, elle indique seulement qu’il n’y a pas assez d’évidence contre H0.
  • Si les hypothèses sont bilatérales, la p-valeur se calcule en combinant les extrêmes des deux côtés de la distribution (facteur 2 par rapport au côté unique).

💡 Astuce mémo

Unilatéral = sens unique (↗ ou ↘), Bilatéral = deux sens (↔).

📖 3. Distribution d’échantillonnage et normalité

🔑 Notions clés & Définitions

  • Distribution d’échantillonnage : Une distribution d’échantillonnage décrit les valeurs qu’une statistique prend quand on répète l’échantillonnage de la même population de très nombreuses fois.
  • DEM des moyennes : La DEM des moyennes (distribution d’échantillonnage de la moyenne) correspond à la distribution des moyennes calculées à partir de nombreux échantillons de même taille.
  • Erreur standard : L’erreur standard est l’écart-type de la DEM, et elle vaut l’écart-type de la population divisé par la racine de la taille d’échantillon.

📝 Points essentiels

  • La moyenne de la DEM des moyennes est égale à la moyenne de la population : μXˉ=μ\mu_{\bar X}=\mu.
  • L’erreur standard de la DEM vaut σXˉ=σ/n\sigma_{\bar X}=\sigma/\sqrt{n}, donc elle diminue quand nn augmente.
  • Si la population est normale, la DEM est normale pour tout nn ; si elle est symétrique non normale, la DEM est presque normale même pour petites tailles.
  • Si la population est fortement asymétrique, on vise typiquement n30n\ge 30 pour que la DEM soit assez proche de la normale.

📖 4. Test z et comparaison à une population

🔑 Notions clés & Définitions

  • Test z : Un test z évalue si une moyenne (ou une valeur) observée est compatible avec une population normale quand la dispersion de la population est connue.
  • Valeur standardisée z : La valeur standardisée z mesure l’écart entre l’observation et la moyenne de la population, exprimé en unités d’erreur standard.

📝 Points essentiels

  • Pour une moyenne d’échantillon avec population normale et écart-type population connu, z=Xˉμσ/nz=\dfrac{\bar X-\mu}{\sigma/\sqrt{n}} et on compare à la loi normale standard.
  • En test bilatéral avec zone de rejet totale 0,05, les seuils critiques sont z=±1,96z=\pm1{,}96 (2,5% de chaque côté) pour décider du rejet de H0.
  • La p-valeur vaut la petite portion d’un côté en test unilatéral, et vaut deux fois cette portion en test bilatéral.
  • Pour comparer une valeur individuelle à une population normale où μ\mu et σ\sigma sont connus, on utilise z=Xμσz=\dfrac{X-\mu}{\sigma}, puis la p-valeur correspond à la queue demandée par H1.

💡 Astuce mémo

Bilatéral : z seuils ±1,96 et p = 2×(queue d’un côté) ; Individuel : z = (X−μ)/σ (pas de /√n).

📖 5. Test t et intervalle de confiance

🔑 Notions clés & Définitions

  • Distribution t de Student : La distribution t de Student décrit la forme de la statistique tt quand l’écart-type de la population est inconnu et remplacé par ss^*.
  • Degrés de liberté dl : Les degrés de liberté dldl déterminent la forme exacte de la distribution t de Student et se calculent ici par dl=n1dl=n-1 quand on estime une seule moyenne.
  • Erreur standard s2 : L’erreur standard est la dispersion de la moyenne estimée, obtenue en divisant l’écart-type corrigé ss^* par la racine de l’effectif nn.

📝 Points essentiels

  • Quand 62 est inconnue, on remplace 62 par ss^* et la statistique suit une loi t avec dl=n1dl=n-1 (données supposées proches de la normalité).
  • Pour un intervalle de confiance bilatéral à 95% avec une loi t, les bornes s’écrivent 44_{inf}=xbar- t_{0,025;dl}44_{s^*}/\sqrt{n} et 44_{sup}=xbar+ t_{0,025;dl}44_{s^*}/\sqrt{n}.
  • Si le seuil bilatéral est 0,05, alors chaque côté correspond à 0,025 dans la table t.
  • Pour l’exemple à 95% avec n=24n=24, on utilise dl=23dl=23 et t0,025;23=2,069t_{0,025;23}=2,069 pour obtenir [xbar-2,069\cdot 0,482\,;xbar+2,069\cdot 0,482]=[13,83\,;\,15,83].

💡 Astuce mémo

t au lieu de z : 62 inconnue 2 2 5e s* 2 2 d5e t, avec dl=n1dl=n-1.

📖 6. Comparaison de deux groupes indépendants et appariés

🔑 Notions clés & Définitions

  • Mesures indépendantes : Des mesures sont indépendantes quand les deux échantillons proviennent de sujets différents, donc sans lien direct entre les valeurs observées.
  • Mesures dépendantes : Des mesures sont dépendantes quand chaque valeur du second échantillon est liée à une valeur du premier sur le même sujet (ou appariement équivalent).
  • Échantillon des différences : Dans le cas apparié, on remplace deux colonnes par une seule variable d = (score2 − score1) pour tester sa moyenne à 0.

📝 Points essentiels

  • Pour comparer deux moyennes avec mesures indépendantes quand σ et s sont inconnus, on impose normalité (dans chaque groupe) et on teste l’homoscédasticité avant de choisir le test paramétrique.
  • Sous normalité et indépendance, la différence des moyennes suit une loi t et les degrés de liberté valent n1 + n2 − 2, car l’erreur standard est estimée à partir de deux moyennes.
  • Pour les mesures dépendantes (appariées), l’erreur standard n’est plus celle de la simple somme des variances, donc on teste plutôt la moyenne des différences d avec une loi t.
  • Dans le test apparié, les degrés de liberté valent n − 1, avec H0 : μd = 0 et H1 : μd ≠ 0 (bilatéral).

💡 Astuce mémo

Indépendant = t sur (X1−X2) ; Apparié = t sur (d = X2−X1) avec df n−1.

📊 Tableaux de synthèse

Choix de test selon le type de variable

Type de variableTestHypothèsesPoint clé
Variable continueParamétrique (t, IC)Normalité (+ homoscédasticité si comparaison)Plus puissant si conditions respectées
Variable continue (ou discrète)Non paramétriqueAucune hypothèse de loiPlus robuste, souvent moins puissant
Variable catégorielleChi-carréDonnées en fréquencesCompare des proportions
Variable discrèteChi-carréDonnées en fréquencesNe s’applique pas aux variables continues

Hypothèse unilatérale vs bilatérale

Alternative H1FormeZone de rejetp-valeur
UnilatéraleEffet dans un seul sens (↗ ou ↘)5% d’un seul côté (si seuil 0,05)Égale à la petite portion d’un côté
BilatéraleDifférence dans les deux sens5% partagé : 2,5% + 2,5%= 2 × petite portion d’un côté

⚠️ Pièges & confusions fréquents

  1. Confondre H0 rejetée/non rejetée : ne jamais dire « H0 est vraie » quand on ne rejette pas.
  2. Prendre la p-valeur bilatérale comme unilatérale (ou l’inverse) : en bilatéral, p-valeur = 2×petite portion d’un côté.
  3. Utiliser z avec /√n pour une valeur individuelle : pour un score individuel, z = (X−μ)/σ (pas de racine de n).
  4. Oublier que pour tests t on remplace σ par s* et qu’alors la loi devient t avec dl = n−1 (estimation d’une moyenne).
  5. Confondre normalité de la population et normalité de la DEM : les tests paramétriques exigent la normalité de la distribution d’échantillonnage.
  6. Ne pas vérifier l’homoscédasticité uniquement quand la normalité des deux groupes est respectée (sinon, test non paramétrique).
  7. Mélanger mesures indépendantes et dépendantes : pour dépendantes, on teste la moyenne des différences d (dl = n−1), pas la différence des moyennes.

✅ Checklist Examen

  1. Énoncer les 4 étapes de l’inférence statistique (objectif → choix du test/conditions → H0/H1 → calcul p-valeur et décision).
  2. Choisir correctement le type de test (paramétrique/non paramétrique/chi-carré) selon le type de variable et les conditions.
  3. Écrire H0 et H1 en précisant si le contraste est unilatéral ou bilatéral et vérifier le sens de H1.
  4. Interpréter la p-valeur et appliquer la règle du cours : rejet si p ≤ 0,05, sinon non-rejet.
  5. Relier la DEM à ses caractéristiques : moyenne de la DEM = μ et erreur standard = σ/√n, via TCL.
  6. Vérifier la normalité requise pour les tests paramétriques (n≥30 ou, si n<30, symétrie/boxplot et choix test).
  7. Savoir faire un test z : cas moyenne avec σ connu et variable DEM, et cas score individuel avec z=(X−μ)/σ.
  8. Savoir faire un test t et un IC à 95% : loi t, dl=n−1, seuil bilatéral 0,05 correspondant à 0,025 par côté.
  9. Construire un IC bilatéral pour μ : μ± t* ou μ±1,96* (selon z/t) et utiliser s* quand σ est inconnu.
  10. Comparer deux groupes indépendants : contrôler normalité des deux + homoscédasticité (F), puis tester μ1−μ2 avec dl=n1+n2−2.
  11. Comparer deux groupes dépendants : créer d (d=X2−X1 ou selon l’écriture du cours), tester H0: μd=0 avec t et dl=n−1.

Testez vos connaissances

Testez vos connaissances sur Introduction à l'inférence statistique avec 12 questions à choix multiples avec corrections détaillées.

1. Que décrit une distribution d’échantillonnage ?

2. Qu’énonce le mieux l’inférence statistique ?

Faire le QCM →

Révisez avec les flashcards

Mémorisez les concepts clés de Introduction à l'inférence statistique avec 12 flashcards interactives.

Inférence statistique — définition ?

Utilisation d’un échantillon pour déduire des caractéristiques de la population.

Tests paramétriques — rôle ?

Supposent une loi connue et conditions de normalité pour les données.

Hypothèse unilatérale — effet ?

Effet dans une seule direction (augmentation ou diminution).

Voir les flashcards →

Cours similaires

Crée tes propres fiches de révision

Importe ton cours et l'IA génère fiches, QCM et flashcards en 30 secondes.

Générateur de fiches