Fiche de révision : Analyse descriptive et mesures statistiques fondamentales

📋 Plan du Cours

  1. Série statistique et effectifs
  2. Fréquences et diagrammes cumulés
  3. Mode et classe modale
  4. Médiane et interpolation linéaire
  5. Moyenne arithmétique
  6. Propriétés de la moyenne
  7. Distribution somme de variables
  8. Quartiles déciles et centiles
  9. Écart absolu variance et écart type
  10. Étendue et boîte à moustaches
  11. Comparaison de séries statistiques

📖 1. Série statistique et effectifs

🔑 Notions clés & Définitions

  • Série statistique : Une série statistique décrit la répartition d’individus d’une population selon les valeurs prises par une variable X et selon leurs effectifs.
  • Modalité : Une modalité est une valeur possible x_i (ou un intervalle de valeurs pour une variable continue) que peut prendre le caractère étudié.
  • Effectif n_i : L’effectif n_i est le nombre d’individus associé à la modalité x_i dans l’échantillon étudié.
  • Fréquence f_i : La fréquence f_i est la proportion d’individus associée à la modalité x_i, définie à partir de n_i et de l’effectif total N.
  • Concentration d’effectifs c_i : La concentration c_i mesure, pour une classe d’amplitude donnée, le nombre moyen d’individus par sous-intervalle de largeur 1.

📝 Points essentiels

  • La série statistique relie une variable X aux effectifs n_i des individus pour chaque modalité x_i, ce qui donne la distribution.
  • La somme des effectifs vérifie i=1pni=N\sum_{i=1}^{p} n_i = N, où NN est la taille de l’échantillon.
  • La fréquence est définie par fi=niNf_i = \frac{n_i}{N} et les fréquences vérifient i=1pfi=1\sum_{i=1}^{p} f_i = 1.
  • Sur calculatrice, saisir des effectifs ou des fréquences ne change pas les résultats numériques des outils (moyenne, écart type, etc.).
  • Pour une variable quantitative continue regroupée en classes [si;ti[[s_i ; t_i[, l’amplitude vaut ai=tisia_i=t_i-s_i et la modalité centrale est xi=si+ti2x_i=\frac{s_i+t_i}{2}.
  • La concentration d’effectifs pour la classe [si;ti[[s_i ; t_i[ est ci=niaic_i=\frac{n_i}{a_i}, afin de comparer des classes de tailles différentes.

💡 Astuce mémo

Effectif n_i = nombre, fréquence f_i = part (division par N), concentration c_i = densité dans une classe (division par l’amplitude).

📖 2. Fréquences et diagrammes cumulés

🔑 Notions clés & Définitions

  • Effectifs cumulés croissants ECC : Les effectifs cumulés croissants sont les sommes des effectifs jusqu’à une classe ou une valeur donnée, pour suivre l’accumulation de la série.
  • Fréquences cumulées croissantes FCC : Les fréquences cumulées croissantes sont les sommes des fréquences jusqu’à une classe ou une valeur donnée, pour suivre la progression proportionnelle de la série.
  • Diagramme des FCC ou ECC : Le diagramme des FCC (ou ECC) est une représentation où l’on place des segments entre des points de coordonnées ((x);FCC(x))((x) ; FCC(x)) (ou ((x);ECC(x))((x) ; ECC(x))).

📝 Points essentiels

  • Pour construire un diagramme cumulatif des FCC ou des ECC, on utilise comme ordonnée la valeur cumulée (ECC ou FCC) et comme abscisse les valeurs extrêmes des classes.
  • Le diagramme des FCC (ou ECC) est formé de segments dont les extrémités ont pour coordonnées (x;FCC(x))(x ; FCC(x)) (ou (x;ECC(x)))(x ; ECC(x))).
  • Les FCC (ou ECC) servent à lire directement la progression des individus au fur et à mesure des classes ou valeurs, au lieu de ne regarder que les effectifs par classe.

📖 3. Mode et classe modale

🔑 Notions clés & Définitions

  • Mode : Le mode est la modalité d’une variable discrète qui possède le plus grand effectif dans la série.
  • Classe modale : La classe modale est l’intervalle d’une variable continue qui a la plus grande concentration d’effectifs.
  • Bimodale : Une série est bimodale quand elle admet deux modalités ayant la même fréquence maximale et donc deux modes.
  • Tri modale : Une série est tri modale quand elle admet trois modalités avec un effectif maximum et donc trois modes.

📝 Points essentiels

  • Pour une variable discrète, le mode correspond à la modalité dont l’effectif est maximal, et la série peut avoir plusieurs modes.
  • Une série bimodale, tri modale, etc. signifie qu’il y a plusieurs modalités partageant le même effectif maximal.
  • Pour une variable continue, la classe modale est l’intervalle dont la concentration est la plus élevée.
  • Dans l’exemple 1, les deux modes sont 65 € et 68 € (distribution bimodale).
  • Dans l’exemple 2, la classe modale est [100 ; 110[.

💡 Astuce mémo

Discret = effectif max, Continu = concentration max.

📖 4. Médiane et interpolation linéaire

🔑 Notions clés & Définitions

  • Médiane : La médiane est la modalité telle qu’au plus la moitié de la population se trouve en-dessous d’elle.
  • Classe médiane : La classe médiane est l’intervalle qui contient la médiane quand la variable est continue.
  • Interpolation linéaire : L’interpolation linéaire consiste à situer la médiane à l’intérieur de sa classe en supposant une progression proportionnelle des cumulées entre les bornes.
  • ECC(M) : ECC(M) est le cumul des effectifs à la valeur médiane, qui vaut N/2 pour identifier la position de la médiane.

📝 Points essentiels

  • Pour une variable discrète, la médiane correspond à la valeur de l’individu numéro (N+1)/2 si N est impair.
  • Pour une variable discrète avec N pair, deux choix sont possibles : moyenne des deux valeurs centrales ou prise de la valeur du N/2-ème individu.
  • Pour une variable continue, on utilise la simplification ECC(M)=N/2 et FCC(M)=50% pour localiser la médiane dans la classe médiane.
  • La position de M dans sa classe se calcule par proportion a/A=b/B (Thalès), avec a distance à partir de la borne inférieure et b distance sur l’axe des cumulées.
  • Avec l’exemple donné : M se calcule à partir de a= M-100, A=10, b=50-43, B=64-43, menant à M=103,3.

💡 Astuce mémo

Thalès = mêmes fractions : (M- borne inférieure)/amplitude = (FCC/ECC avant M)/écart de cumulée dans la classe.

📖 5. Moyenne arithmétique

🔑 Notions clés & Définitions

  • Moyenne arithmétique : La moyenne arithmétique est la valeur qui, si elle s’appliquait uniformément à tous les individus, donnerait le même total que les valeurs réellement observées.
  • Moyenne pondérée : La moyenne arithmétique d’une série se calcule en pondérant chaque valeur xix_i par son effectif nin_i ou par sa fréquence fif_i.

📝 Points essentiels

  • Pour des effectifs, la moyenne vérifie x=X=i=1pnixiN=1Ni=1pnixi\overline{x}=X=\dfrac{\sum_{i=1}^p n_i x_i}{N}=\dfrac{1}{N}\sum_{i=1}^p n_i x_i avec N=niN=\sum n_i.
  • Pour des fréquences, la moyenne vérifie x=X=i=1pfixi\overline{x}=X=\sum_{i=1}^p f_i x_i avec fi=1\sum f_i=1.
  • Dans l’exemple notes 8, 11, 15 avec effectifs 7, 14, 4, la moyenne vaut 10,810{,}8.
  • La moyenne vérifie E(aX)=aE(X)E(aX)=aE(X) pour toute constante aa.
  • La moyenne vérifie E(X+a)=E(X)+aE(X+a)=E(X)+a et E(X+Y)=E(X)+E(Y)E(X+Y)=E(X)+E(Y).
  • La moyenne transforme une somme de valeurs en somme des moyennes via la relation E(X+Y)=E(X)+E(Y)E(X+Y)=E(X)+E(Y).

💡 Astuce mémo

Moyenne = linéarité : on peut sortir les nombres (E(aX)=aE(X)E(aX)=aE(X)), ajouter une constante (E(X+a)=E(X)+aE(X+a)=E(X)+a) et additionner les variables (E(X+Y)=E(X)+E(Y)E(X+Y)=E(X)+E(Y)).

📖 6. Propriétés de la moyenne

🔑 Notions clés & Définitions

  • Espérance E(X) : L’espérance est la valeur moyenne d’une variable aléatoire ou d’une série, notée E(X), utilisée pour calculer des moyennes théoriques.
  • Échelle multiplicative : La moyenne d’une variable multipliée par un scalaire aa est obtenue en multipliant directement la moyenne initiale par aa.
  • Décalage additif : Ajouter une constante aa à toutes les valeurs décale la moyenne de la même constante sans changer la dispersion.
  • Linéarité pour somme : La moyenne de la somme de deux variables s’obtient en additionnant leurs moyennes, via la propriété de linéarité.

📝 Points essentiels

  • Pour tout scalaire aa, on a E(aX)=aE(X)E(aX)=a\,E(X).
  • Pour toute constante aa, on a E(X+a)=E(X)+aE(X+a)=E(X)+a.
  • Pour deux variables XX et YY, on a E(X+Y)=E(X)+E(Y)E(X+Y)=E(X)+E(Y).
  • En combinant les deux premières, E(aX+b)=aE(X)+bE(aX+ b)=a\,E(X)+b pour toute constante bb.

💡 Astuce mémo

E est linéaire : scalaire aa sort (multiplication) et constante +a+a se rajoute (décalage).

📖 7. Distribution somme de variables

🔑 Notions clés & Définitions

  • Variable X : Une variable X représente le prix d’un téléphone et prend les valeurs xix_i avec des effectifs associés nin_i.
  • Variable Y : Une variable Y représente le prix d’une housse et prend les valeurs yjy_j avec des effectifs associés njn_j.
  • Produit d’effectifs : Le nombre de cas pour chaque couple (xi,yj)(x_i,y_j) est donné par le produit ni×njn_i\times n_j.
  • Distribution de X+Y : La distribution de la somme X+YX+Y associe à chaque prix total possible xi+yjx_i+y_j le nombre de cas où il se produit.

📝 Points essentiels

  • Pour obtenir la distribution de X+YX+Y, on forme tous les couples (xi,yj)(x_i,y_j) et on associe à chaque xi+yjx_i+y_j l’effectif ni×njn_i\times n_j.
  • L’espérance E(X+Y)E(X+Y) se calcule à partir du tableau des prix totaux et des effectifs ni×njn_i\times n_j.
  • On compare ensuite E(X+Y)E(X+Y) à la somme des espérances $E(X)+E(Y).
  • Ici, N1=20N_1=20 (téléphone) et N2=7N_2=7 (housse), donc le croisement total mobilise N1×N2=140N_1\times N_2=140 cas.

💡 Astuce mémo

Croisement de sommes = croisement de valeurs, et effectif = multiplication (ni×njn_i\times n_j).

📖 8. Quartiles déciles et centiles

🔑 Notions clés & Définitions

  • Quantiles : Les quantiles sont les valeurs ordonnées qui découpent la population en sous-groupes d’effectifs égaux.
  • Quartiles Q1 Q2 Q3 : Les quartiles sont trois valeurs qui partagent la population en 4 groupes de même taille, avec Q2 égal à la médiane.
  • Déciles D1 à D9 : Les déciles sont les valeurs qui divisent la population en 10 groupes de même taille.
  • Centiles C1 à C99 : Les centiles sont les valeurs qui partagent la population en 100 groupes de même taille.

📝 Points essentiels

  • Q2 est la médiane et l’intervalle [Q1 ; Q3] contient 50% de la population.
  • Caractère discret : Q1 vérifie ECC(Q1)=(N+1)/4 arrondi à l’entier et Q3 vérifie ECC(Q3)=3(N+1)/4 arrondi à l’entier.
  • Caractère continu : Q1 et Q3 sont définis par FCC(Q1)=25% et FCC(Q3)=75%, avec Q2=M.
  • Déciles : en discret, ECC(Dk)=k(N/10) arrondi pour k=1..9, et en continu, FCC(Dk)=10k% pour k=1..9.
  • Centiles : en discret, ECC(Ck)=k(N/100) arrondi pour k=1..99, et en continu, FCC(Ck)=k% pour k=1..99.

📖 9. Écart absolu variance et écart type

🔑 Notions clés & Définitions

  • Écart absolu moyen : L’écart absolu moyen est la moyenne des distances entre chaque valeur et la moyenne, obtenue en prenant la valeur absolue des écarts.
  • Variance : La variance est la moyenne des carrés des écarts à la moyenne, notée V(X) ou σ²(X).
  • Formule de König : La formule de König exprime la variance comme la moyenne des carrés des écarts à la moyenne, via une écriture en somme sur les données.
  • Écart type : L’écart type est la racine carrée de la variance, exprimant la dispersion dans la même unité que la variable X.
  • Intervalle représentatif : L’intervalle représentatif est l’intervalle centré en x̄ et délimité à x̄ ± σ, censé contenir plus de la moitié de la population.

📝 Points essentiels

  • La somme des écarts à la moyenne vaut 0, ce qui rend l’écart moyen (non absolu) impossible à utiliser comme indicateur de dispersion.
  • L’écart absolu moyen utilise les écarts en valeur absolue, tandis que la variance utilise les écarts au carré avant moyenne.
  • La variance vérifie notamment V(aX)=a²·V(X et permet l’outil d’analyse de variance (ANOVA) via ses propriétés.
  • L’écart type est toujours supérieur à l’écart absolu moyen et à la moitié de l’écart interquartile.
  • Dans l’intervalle x̄ − σ ; x̄ + σ, la proportion moyenne est 68,3% de la population, et au moins plus de 50% selon la série.

💡 Astuce mémo

|écarts| donne la distance (écart absolu moyen), écarts² donne la variance, puis racine restitue l’unité (écart type).

📖 10. Étendue et boîte à moustaches

🔑 Notions clés & Définitions

  • Étendue : L’étendue d’une série est le critère qui mesure la dispersion en prenant la différence entre la valeur maximale et la valeur minimale.
  • Valeurs extrêmes : Les valeurs extrêmes sont les deux bornes de la série, à savoir la plus petite et la plus grande valeur observées.
  • Boîte à moustaches : La boîte à moustaches est un graphique de synthèse construit à partir des valeurs extrêmes et des quartiles pour résumer la dispersion.

📝 Points essentiels

  • L’étendue d’une série se calcule comme la différence entre le maximum et le minimum de la série.
  • Une boîte à moustaches se construit à partir des valeurs extrêmes et des quartiles, ce qui permet de visualiser la répartition des valeurs.
  • La comparaison de séries peut se faire en confrontant leurs étendues et la forme de leurs boîtes à moustaches.

💡 Astuce mémo

Étendue = Max − Min : la “longueur” de la série.

📖 11. Comparaison de séries statistiques

🔑 Notions clés & Définitions

  • Moyennes de deux séries : Une moyenne résume la position centrale d’une série, ce qui permet de comparer globalement deux ensembles de données.
  • Écarts types de deux séries : L’écart type mesure la dispersion autour de la moyenne, ce qui permet d’évaluer la variabilité de chaque série.
  • Pourcentage sous un seuil : Le pourcentage sous un seuil correspond à la part des valeurs inférieures à une valeur repère, obtenue en additionnant les effectifs des classes concernées.
  • Intervalles de classes : Les classes définissent les bornes entre lesquelles tombent les observations, et elles déterminent comment on calcule une proportion avant un seuil situé dans une classe.

📝 Points essentiels

  • Pour comparer deux parcelles, on calcule d’abord la moyenne puis l’écart type de chaque série, afin de juger à la fois le niveau et la dispersion.
  • Pour estimer la part des pommes de masse <100 g, on additionne les effectifs des classes entièrement sous 100 g puis on interpole linéairement dans la classe [95 ; 105[.
  • Avec les données de l’énoncé, la proportion de pommes <100 g est d’environ 22,2% pour la parcelle 1 (6 sur 27) et d’environ 25,8% pour la parcelle 2 (8 sur 31), donc c’est la parcelle 2 qui en a le plus.

💡 Astuce mémo

Même logique que « position + étalement » : moyenne = où se situent les valeurs, écart type = à quel point elles se dispersent.

📊 Tableaux de synthèse

Discret vs continu (mode et quartiles)

NotionCaractère discretCaractère continu
Modemodalité de plus grand effectifclasse de plus grande concentration
Quartiles Q1 et Q3ECC(Q1)=(N+1)/4 arrondi, ECC(Q3)=3(N+1)/4 arrondiFCC(Q1)=25% et FCC(Q3)=75%
Médiane (position)valeur de l’individu numéro (N+1)/2 (si N impair), ou (deux conventions si N pair)on utilise ECC(M)=N/2 et interpolation via FCC à 50%

⚠️ Pièges & confusions fréquents

  1. Confondre effectif et fréquence : f_i = n_i/N, et on ne doit pas remplacer N par 1 dans les sommes.
  2. Pour une variable continue, chercher le mode comme “plus grand effectif” au lieu de prendre la classe de plus grande concentration c_i = n_i/a_i.
  3. Utiliser ECC à la place de FCC (ou l’inverse) pour construire/faire une lecture d’un diagramme cumulatif.
  4. Pour la médiane continue, croire que c’est juste la valeur à la borne de la classe médiane, au lieu de l’interpoler avec a/A = b/B.
  5. En médiane discrète avec N pair, oublier qu’il existe deux conventions (moyenne des deux valeurs centrales ou prise de la valeur du N/2-ème).
  6. Calculer l’écart moyen sans valeur absolue : la somme des écarts à la moyenne vaut 0, donc l’indicateur “simple” est nul.
  7. Confondre variance et écart type : la variance est une moyenne de carrés, l’écart type est la racine carrée de la variance.

✅ Checklist Examen

  1. Définir une série statistique et distinguer variable X, modalités x_i, effectifs n_i, fréquences f_i et leurs sommes.
  2. Savoir calculer une fréquence f_i = n_i/N et vérifier que Σ f_i = 1, ainsi que Σ n_i = N.
  3. Pour une variable continue en classes [s_i;t_i[, donner amplitude a_i = t_i−s_i, modalité centrale x_i = (s_i+t_i)/2 et concentration c_i = n_i/a_i.
  4. Construire et/ou lire un diagramme cumulatif : utiliser ECC/FCC comme ordonnée et les extrémités de classes comme abscisses.
  5. Déterminer le mode pour une variable discrète (plus grand effectif) et pour une variable continue (classe de plus grande concentration), y compris séries multimodales.
  6. Déterminer la médiane discrète à partir de l’individu numéro (N+1)/2 (et traiter le cas N pair avec la convention demandée).
  7. Pour une variable continue, localiser la classe médiane puis appliquer l’interpolation linéaire avec a/A = b/B pour trouver M.
  8. Calculer une moyenne : moyenne pondérée par effectifs (Σ n_i x_i / N) ou par fréquences (Σ f_i x_i), et utiliser la linéarité E(aX)=aE(X), E(X+a)=E(X)+a.
  9. Construire la distribution de X+Y en croisant toutes les valeurs, avec effectifs n_i×n_j, puis comparer E(X+Y) à E(X)+E(Y).
  10. Déterminer quantiles : quartiles (Q2=M, et règles ECC en discret / FCC en continu), puis déciles et centiles via les pourcentages ou ECC correspondants.
  11. Calculer et interpréter des indicateurs de dispersion : étendue (Max−Min), écart absolu moyen (moyenne des |écarts|), variance (moyenne des carrés, formule de König) et écart type (racine).

Testez vos connaissances

Testez vos connaissances sur Analyse descriptive et mesures statistiques fondamentales avec 22 questions à choix multiples avec corrections détaillées.

1. Dans une série statistique, que représente l’effectif associé à une modalité donnée ?

2. Pour une variable continue regroupée en classes, comment se définit la concentration d’effectifs d’une classe ?

Faire le QCM →

Révisez avec les flashcards

Mémorisez les concepts clés de Analyse descriptive et mesures statistiques fondamentales avec 22 flashcards interactives.

Série statistique — définition ?

Répartition des individus selon une variable et leurs effectifs.

Modalité — définition ?

Valeur possible que peut prendre la variable.

Effectif n_i — rôle ?

Nombre d'individus pour une modalité.

Voir les flashcards →

Cours similaires

Crée tes propres fiches de révision

Importe ton cours et l'IA génère fiches, QCM et flashcards en 30 secondes.

Générateur de fiches