Fiche de révision : Introduction à l'inférence statistique

Plan du Cours

Inférence statistique et tests paramétriques
Hypothèses unilatérales et bilatérales
Distribution d’échantillonnage et normalité
Test z et comparaison à une population
Test t et intervalle de confiance
Comparaison de deux groupes indépendants et appariés

1. Inférence statistique et tests paramétriques

Notions clés & Définitions

Inférence statistique : Approche qui utilise un échantillon pour tirer des conclusions probabilistes sur les caractéristiques d’une population.
Tests paramétriques : Tests qui supposent une loi de distribution connue pour les données et exigent des conditions de validité avant l’interprétation.
p-valeur : Probabilité d’observer (ou un résultat plus extrême) les données si l’hypothèse nulle H0 est vraie.

Points essentiels

La démarche d’inférence comporte 4 étapes : énoncer l’objectif théorique, choisir le test en vérifiant les conditions, formuler H0/H1, puis calculer la p-valeur pour conclure sur H0.
Les tests paramétriques concernent des variables continues et reposent sur une distribution d’échantillonnage normale, condition la plus importante.
Pour comparer des moyennes de deux populations avec mesures indépendantes, une condition supplémentaire est l’homogénéité des variances (homoscédasticité).
On rejette H0 quand la p-valeur est ≤ 0,05, et on ne la rejette pas si elle est > 0,05.

Astuce mémo

p-valeur = “si H0 est vraie, à quel point c’est improbable ?” (petit ⇒ rejet de H0, grand ⇒ non-rejet).

2. Hypothèses unilatérales et bilatérales

Notions clés & Définitions

Hypothèse unilatérale : Hypothèse où l’alternative ne décrit qu’un effet dans une seule direction (augmentation ou diminution).
Hypothèse bilatérale : Hypothèse où l’alternative décrit toute différence, qu’elle soit une augmentation ou une diminution.
H0 et H1 : Hypothèse nulle H0 et hypothèse alternative H1 forment un couple opposé utilisé pour décider du rejet de H0.

Points essentiels

Sous forme unilatérale, H1 postule une augmentation ou une diminution de la valeur; sous forme bilatérale, H1 postule une différence dans l’une ou l’autre direction.
Choisir une hypothèse unilatérale n’est justifié que s’il existe des preuves solides pour anticiper un sens précis de l’effet.
Une conclusion de non-rejet de H0 ne prouve pas que H0 est vraie, elle indique seulement qu’il n’y a pas assez d’évidence contre H0.
Si les hypothèses sont bilatérales, la p-valeur se calcule en combinant les extrêmes des deux côtés de la distribution (facteur 2 par rapport au côté unique).

Astuce mémo

Unilatéral = sens unique (↗ ou ↘), Bilatéral = deux sens (↔).

3. Distribution d’échantillonnage et normalité

Notions clés & Définitions

Distribution d’échantillonnage : Une distribution d’échantillonnage décrit les valeurs qu’une statistique prend quand on répète l’échantillonnage de la même population de très nombreuses fois.
DEM des moyennes : La DEM des moyennes (distribution d’échantillonnage de la moyenne) correspond à la distribution des moyennes calculées à partir de nombreux échantillons de même taille.
Erreur standard : L’erreur standard est l’écart-type de la DEM, et elle vaut l’écart-type de la population divisé par la racine de la taille d’échantillon.

Points essentiels

La moyenne de la DEM des moyennes est égale à la moyenne de la population : $\mu_{\bar X}=\mu$ .
L’erreur standard de la DEM vaut $\sigma_{\bar X}=\sigma/\sqrt{n}$ , donc elle diminue quand $n$ augmente.
Si la population est normale, la DEM est normale pour tout $n$ ; si elle est symétrique non normale, la DEM est presque normale même pour petites tailles.
Si la population est fortement asymétrique, on vise typiquement $n\ge 30$ pour que la DEM soit assez proche de la normale.

4. Test z et comparaison à une population

Notions clés & Définitions

Test z : Un test z évalue si une moyenne (ou une valeur) observée est compatible avec une population normale quand la dispersion de la population est connue.
Valeur standardisée z : La valeur standardisée z mesure l’écart entre l’observation et la moyenne de la population, exprimé en unités d’erreur standard.

Points essentiels

Pour une moyenne d’échantillon avec population normale et écart-type population connu, $z=\dfrac{\bar X-\mu}{\sigma/\sqrt{n}}$ et on compare à la loi normale standard.
En test bilatéral avec zone de rejet totale 0,05, les seuils critiques sont $z=\pm1{,}96$ (2,5% de chaque côté) pour décider du rejet de H0.
La p-valeur vaut la petite portion d’un côté en test unilatéral, et vaut deux fois cette portion en test bilatéral.
Pour comparer une valeur individuelle à une population normale où $\mu$ et $\sigma$ sont connus, on utilise $z=\dfrac{X-\mu}{\sigma}$ , puis la p-valeur correspond à la queue demandée par H1.

Astuce mémo

Bilatéral : z seuils ±1,96 et p = 2×(queue d’un côté) ; Individuel : z = (X−μ)/σ (pas de /√n).

5. Test t et intervalle de confiance

Notions clés & Définitions

Distribution t de Student : La distribution t de Student décrit la forme de la statistique $t$ quand l’écart-type de la population est inconnu et remplacé par $s^*$ .
Degrés de liberté dl : Les degrés de liberté $dl$ déterminent la forme exacte de la distribution t de Student et se calculent ici par $dl=n-1$ quand on estime une seule moyenne.
Erreur standard s2 : L’erreur standard est la dispersion de la moyenne estimée, obtenue en divisant l’écart-type corrigé $s^*$ par la racine de l’effectif $n$ .

Points essentiels

Quand $62$ est inconnue, on remplace $62$ par $s^*$ et la statistique suit une loi t avec $dl=n-1$ (données supposées proches de la normalité).
Pour un intervalle de confiance bilatéral à 95% avec une loi t, les bornes s’écrivent $44_{inf}=xbar- t_{0,025;dl}44_{s^*}/\sqrt{n}$ et $44_{sup}=xbar+ t_{0,025;dl}44_{s^*}/\sqrt{n}$ .
Si le seuil bilatéral est 0,05, alors chaque côté correspond à 0,025 dans la table t.
Pour l’exemple à 95% avec $n=24$ , on utilise $dl=23$ et $t_{0,025;23}=2,069$ pour obtenir $[xbar-2,069\cdot 0,482\,;xbar+2,069\cdot 0,482]=[13,83\,;\,15,83]$ .

Astuce mémo

t au lieu de z : $62$ inconnue 2 2 5e s* 2 2 d5e t, avec $dl=n-1$ .

6. Comparaison de deux groupes indépendants et appariés

Notions clés & Définitions

Mesures indépendantes : Des mesures sont indépendantes quand les deux échantillons proviennent de sujets différents, donc sans lien direct entre les valeurs observées.
Mesures dépendantes : Des mesures sont dépendantes quand chaque valeur du second échantillon est liée à une valeur du premier sur le même sujet (ou appariement équivalent).
Échantillon des différences : Dans le cas apparié, on remplace deux colonnes par une seule variable d = (score2 − score1) pour tester sa moyenne à 0.

Points essentiels

Pour comparer deux moyennes avec mesures indépendantes quand σ et s sont inconnus, on impose normalité (dans chaque groupe) et on teste l’homoscédasticité avant de choisir le test paramétrique.
Sous normalité et indépendance, la différence des moyennes suit une loi t et les degrés de liberté valent n1 + n2 − 2, car l’erreur standard est estimée à partir de deux moyennes.
Pour les mesures dépendantes (appariées), l’erreur standard n’est plus celle de la simple somme des variances, donc on teste plutôt la moyenne des différences d avec une loi t.
Dans le test apparié, les degrés de liberté valent n − 1, avec H0 : μd = 0 et H1 : μd ≠ 0 (bilatéral).

Astuce mémo

Indépendant = t sur (X1−X2) ; Apparié = t sur (d = X2−X1) avec df n−1.

Tableaux de synthèse

Choix de test selon le type de variable

Type de variable	Test	Hypothèses	Point clé
Variable continue	Paramétrique (t, IC)	Normalité (+ homoscédasticité si comparaison)	Plus puissant si conditions respectées
Variable continue (ou discrète)	Non paramétrique	Aucune hypothèse de loi	Plus robuste, souvent moins puissant
Variable catégorielle	Chi-carré	Données en fréquences	Compare des proportions
Variable discrète	Chi-carré	Données en fréquences	Ne s’applique pas aux variables continues

Hypothèse unilatérale vs bilatérale

Alternative H1	Forme	Zone de rejet	p-valeur
Unilatérale	Effet dans un seul sens (↗ ou ↘)	5% d’un seul côté (si seuil 0,05)	Égale à la petite portion d’un côté
Bilatérale	Différence dans les deux sens	5% partagé : 2,5% + 2,5%	= 2 × petite portion d’un côté

Pièges & confusions fréquents

Confondre H0 rejetée/non rejetée : ne jamais dire « H0 est vraie » quand on ne rejette pas.
Prendre la p-valeur bilatérale comme unilatérale (ou l’inverse) : en bilatéral, p-valeur = 2×petite portion d’un côté.
Utiliser z avec /√n pour une valeur individuelle : pour un score individuel, z = (X−μ)/σ (pas de racine de n).
Oublier que pour tests t on remplace σ par s* et qu’alors la loi devient t avec dl = n−1 (estimation d’une moyenne).
Confondre normalité de la population et normalité de la DEM : les tests paramétriques exigent la normalité de la distribution d’échantillonnage.
Ne pas vérifier l’homoscédasticité uniquement quand la normalité des deux groupes est respectée (sinon, test non paramétrique).
Mélanger mesures indépendantes et dépendantes : pour dépendantes, on teste la moyenne des différences d (dl = n−1), pas la différence des moyennes.

Checklist Examen

Énoncer les 4 étapes de l’inférence statistique (objectif → choix du test/conditions → H0/H1 → calcul p-valeur et décision).
Choisir correctement le type de test (paramétrique/non paramétrique/chi-carré) selon le type de variable et les conditions.
Écrire H0 et H1 en précisant si le contraste est unilatéral ou bilatéral et vérifier le sens de H1.
Interpréter la p-valeur et appliquer la règle du cours : rejet si p ≤ 0,05, sinon non-rejet.
Relier la DEM à ses caractéristiques : moyenne de la DEM = μ et erreur standard = σ/√n, via TCL.
Vérifier la normalité requise pour les tests paramétriques (n≥30 ou, si n<30, symétrie/boxplot et choix test).
Savoir faire un test z : cas moyenne avec σ connu et variable DEM, et cas score individuel avec z=(X−μ)/σ.
Savoir faire un test t et un IC à 95% : loi t, dl=n−1, seuil bilatéral 0,05 correspondant à 0,025 par côté.
Construire un IC bilatéral pour μ : μ± t* ou μ±1,96* (selon z/t) et utiliser s* quand σ est inconnu.
Comparer deux groupes indépendants : contrôler normalité des deux + homoscédasticité (F), puis tester μ1−μ2 avec dl=n1+n2−2.
Comparer deux groupes dépendants : créer d (d=X2−X1 ou selon l’écriture du cours), tester H0: μd=0 avec t et dl=n−1.

Plan du Cours

1. Inférence statistique et tests paramétriques

Notions clés & Définitions

Points essentiels

Astuce mémo

2. Hypothèses unilatérales et bilatérales

Notions clés & Définitions

Points essentiels

Astuce mémo

3. Distribution d’échantillonnage et normalité

Notions clés & Définitions

Points essentiels

4. Test z et comparaison à une population

Notions clés & Définitions

Points essentiels

Astuce mémo

5. Test t et intervalle de confiance

Notions clés & Définitions

Points essentiels

Astuce mémo

6. Comparaison de deux groupes indépendants et appariés

Notions clés & Définitions

Points essentiels

Astuce mémo

Tableaux de synthèse

Choix de test selon le type de variable

Hypothèse unilatérale vs bilatérale

Pièges & confusions fréquents

Checklist Examen

Teste tes connaissances

Révisez avec les flashcards

Cours similaires

Dipôle RC et condensateurs

Équations et inéquations dans R

Écritures et calculs numériques

Formules de trigonométrie

Masse molaire et quantité de matière

Généralités sur les fonctions

Crée tes propres fiches de révision

Fiche de révision : Introduction à l'inférence statistique

📋 Plan du Cours

📖 1. Inférence statistique et tests paramétriques

🔑 Notions clés & Définitions

📝 Points essentiels

💡 Astuce mémo

📖 2. Hypothèses unilatérales et bilatérales

🔑 Notions clés & Définitions

📝 Points essentiels

💡 Astuce mémo

📖 3. Distribution d’échantillonnage et normalité

🔑 Notions clés & Définitions

📝 Points essentiels

📖 4. Test z et comparaison à une population

🔑 Notions clés & Définitions

📝 Points essentiels

💡 Astuce mémo

📖 5. Test t et intervalle de confiance

🔑 Notions clés & Définitions

📝 Points essentiels

💡 Astuce mémo

📖 6. Comparaison de deux groupes indépendants et appariés

🔑 Notions clés & Définitions

📝 Points essentiels

💡 Astuce mémo

📊 Tableaux de synthèse

Choix de test selon le type de variable

Hypothèse unilatérale vs bilatérale

⚠️ Pièges & confusions fréquents

✅ Checklist Examen

Teste tes connaissances

Révisez avec les flashcards

Cours similaires

Dipôle RC et condensateurs

Équations et inéquations dans R

Écritures et calculs numériques

Formules de trigonométrie

Masse molaire et quantité de matière

Généralités sur les fonctions

Crée tes propres fiches de révision

Plan du Cours

1. Inférence statistique et tests paramétriques

Notions clés & Définitions

Points essentiels

Astuce mémo

2. Hypothèses unilatérales et bilatérales

Notions clés & Définitions

Points essentiels

Astuce mémo

3. Distribution d’échantillonnage et normalité

Notions clés & Définitions

Points essentiels

4. Test z et comparaison à une population

Notions clés & Définitions

Points essentiels

Astuce mémo

5. Test t et intervalle de confiance

Notions clés & Définitions

Points essentiels

Astuce mémo

6. Comparaison de deux groupes indépendants et appariés

Notions clés & Définitions

Points essentiels

Astuce mémo

Tableaux de synthèse

Pièges & confusions fréquents

Checklist Examen