QCM : Analyse des réseaux et modélisation statistique — 11 questions

Questions et réponses du QCM

1. Qu'est-ce que la régression linéaire simple ?

Une technique permettant d’expliquer une variable quantitative par une autre variable quantitative en utilisant une relation linéaire.
Une méthode pour prédire une variable qualitative à partir d'une variable qualitative.
Une procédure pour comparer deux moyennes dans des échantillons indépendants.
Un modèle pour analyser la relation non linéaire entre plusieurs variables.

Une technique permettant d’expliquer une variable quantitative par une autre variable quantitative en utilisant une relation linéaire.

Explication

La régression linéaire simple est une méthode statistique permettant d’expliquer une variable quantitative 𝑌 par une autre variable quantitative 𝑋, en utilisant un modèle linéaire de la forme Y = aX + b + ε, ce qui correspond à l'option qui décrit une relation linéaire entre deux variables quantitatives.

2. Qui est crédité de la formulation de l'hypothèse nulle utilisée dans le test de significativité du coefficient de corrélation?

Karl Pearson
Ronald Fisher
William Gosset (Student)
Jerzy Neyman

Karl Pearson

Explication

La formulation H0 : r=0 est généralement attribuée à Karl Pearson, qui a développé le test de corrélation et ses hypothèses associées, mentionnées dans le contexte comme étant la base pour tester la significativité du coefficient de corrélation.

3. En quoi le coefficient de régression (a) diffère-t-il de la corrélation (r) dans l'interprétation de la relation entre X et Y ?

Le coefficient a indique l'effet spécifique d'une unité de X sur Y dans un modèle, tandis que r mesure la force et la direction de la relation linéaire globalement.
Le coefficient a est une mesure de la relation dans un modèle causal, alors que r est une mesure purement statistique sans interprétation causale.
Le coefficient a mesure la force de la relation, alors que r indique l'effet précis d'une unité de X sur Y.
Le coefficient a et r sont en réalité identiques, mais leur signe peut différer selon le contexte.

Le coefficient a indique l'effet spécifique d'une unité de X sur Y dans un modèle, tandis que r mesure la force et la direction de la relation linéaire globalement.

Explication

Le coefficient a indique l’effet unitaire de X sur Y dans un modèle de régression, c’est-à-dire combien Y change en moyenne pour une augmentation d’une unité de X, en tenant compte d’autres variables si présentes. La corrélation r, quant à elle, mesure la force et la direction de la relation linéaire entre X et Y, indépendamment d’un modèle spécifique. Leur différence essentielle réside donc dans le fait que a est une mesure d’effet dans un modèle précis, alors que r reflète la force globale de la relation.

4. Quel est l'effet principal du test de significativité du coefficient de corrélation dans la validation d'un modèle ?

Il évalue la normalité des résidus pour confirmer la validité du modèle
Il teste si la moyenne des différences entre deux échantillons appariés est nulle
Il permet de vérifier si la relation entre X et Y est statistiquement significative, justifiant la construction du modèle
Il mesure la proportion de variance expliquée par le modèle, c'est-à-dire R²

Il permet de vérifier si la relation entre X et Y est statistiquement significative, justifiant la construction du modèle

Explication

Le test de significativité du coefficient de corrélation permet de confirmer si la relation entre X et Y est statistiquement significative, ce qui est une étape essentielle pour valider la pertinence d'inclure cette relation dans le modèle. La p-value inférieure à 5% indique une relation linéaire non due au hasard, justifiant la construction du modèle.

5. Quand le contenu du cours a-t-il présenté la régression linéaire multiple comme une extension de la simple, permettant de modéliser la relation avec plusieurs variables explicatives ?

Lors de la section sur la validation du modèle
Lors de l'introduction de la régression logistique
Lors de la présentation de la régression linéaire multiple
Lors de la présentation de la régression linéaire simple

Lors de la présentation de la régression linéaire multiple

Explication

La régression linéaire multiple est présentée dans le contenu comme une extension de la régression simple, permettant d'incorporer plusieurs variables explicatives. La formule générale et la description apparaissent dans la section dédiée à cette étape (point 5) du contenu, ce qui correspond à l'introduction spécifique de cette extension dans le cours.

6. Quelle est la fonction principale de la sélection des variables dans un modèle statistique ?

Optimiser la précision des prédictions uniquement
Visualiser la relation entre variables sans ajuster le modèle
Réduire la complexité du modèle en éliminant les variables non pertinentes ou redondantes
Augmenter le nombre de variables pour améliorer la compréhension du phénomène

Réduire la complexité du modèle en éliminant les variables non pertinentes ou redondantes

Explication

La sélection des variables vise à réduire la complexité du modèle en éliminant les variables redondantes ou non significatives, ce qui augmente la stabilité, la fiabilité et l’interprétabilité du modèle.

7. Quelle est une caractéristique essentielle pour la validation d’un modèle en analyse de régression ?

Confirmer que la valeur p de tous les coefficients est supérieure à 0,05
S’assurer que la corrélation entre X et Y est nulle
Vérifier que les résidus suivent une loi normale avec le test de Shapiro-Wilk
Vérifier que le coefficient de détermination R² est égal à 1

Vérifier que les résidus suivent une loi normale avec le test de Shapiro-Wilk

Explication

La validation du modèle inclut la vérification que les résidus suivent une loi normale, ce qui est testé notamment par le test de Shapiro-Wilk. Cette étape est essentielle pour confirmer que les hypothèses statistiques du modèle sont respectées, garantissant la fiabilité des inférences. Les autres options concernent d’autres aspects du modèle mais ne constituent pas la caractéristique principale de validation évoquée dans la source.

8. Quelle transformation la régression logistique utilise-t-elle pour modéliser la relation entre la probabilité d’un événement et ses variables explicatives ?

Elle utilise la transformation logarithmique du rapport entre la probabilité que l’événement se produise et celle qu’il ne se produise pas, appelée logit.
Elle utilise la transformation quadratique de la variable explicative.
Elle utilise la transformation inverse de la variable explicative.
Elle utilise la transformation exponentielle de la probabilité de l’événement.

Elle utilise la transformation logarithmique du rapport entre la probabilité que l’événement se produise et celle qu’il ne se produise pas, appelée logit.

Explication

La régression logistique utilise la transformation logarithmique du rapport entre la probabilité que l’événement se produise et celle qu’il ne se produise pas, appelée logit, pour modéliser la relation entre la probabilité et les variables explicatives.

9. Comment appliquer la méthode de comparaison de moyennes pour des échantillons appariés dans une étude ?

Tester la différence de médianes des deux échantillons à l’aide d’un test de Wilcoxon, sans calcul de différences.
Comparer simplement les moyennes des deux échantillons en utilisant un test t indépendant, sans tenir compte des appariements.
Calculer la différence de chaque paire, puis tester si la moyenne de ces différences est significativement différente de zéro en utilisant un test t.
Vérifier la normalité des deux échantillons indépendamment, puis comparer leurs variances à l’aide du test de Levene.

Calculer la différence de chaque paire, puis tester si la moyenne de ces différences est significativement différente de zéro en utilisant un test t.

Explication

Dans le cas d’échantillons appariés, la méthode consiste à calculer la différence pour chaque paire d’observations, puis à tester si la moyenne de ces différences est significativement différente de zéro à l’aide d’un test t pour échantillons appariés. Cela permet d’évaluer si la condition ou le moment étudié a un effet significatif.

10. Qu'est-ce qu'un graphe en analyse de réseaux Gephi ?

Une structure composée de sommets et d'arêtes permettant d'analyser la connectivité
Une méthode pour détecter des communautés dans un réseau
Une mesure de la densité du réseau social
Une structure composée uniquement de nœuds sans liens

Une structure composée de sommets et d'arêtes permettant d'analyser la connectivité

Explication

Un graphe est une structure composée de deux ensembles : V, l’ensemble des sommets ou nœuds, et E, l’ensemble des arêtes ou liens entre ces nœuds. Cette définition est fondamentale en analyse de réseaux, car elle permet de représenter la connectivité et la configuration du réseau.

11. Qui est crédité de la formulation de l’algorithme Louvain ?

Mark Granovetter
Duncan J. Watts et Steven Strogatz
Vincent D. Blondel et al.
Albert-László Barabási et Réka Albert

Vincent D. Blondel et al.

Explication

L'algorithme de Louvain a été formulé par Vincent D. Blondel et ses collègues en 2008. Bien que la source ne donne pas cette information explicitement, cette attribution est la connaissance reconnue dans la littérature sur la détection de communautés dans les réseaux sociaux.

Révisez avec les flashcards

Mémorisez les réponses avec 22 flashcards sur Analyse des réseaux et modélisation statistique.

Régression linéaire simple — définition ?

Modèle expliquant Y par X avec Y = aX + b + ε.

Coefficient de régression — rôle ?

Indique l’effet attendu de X sur Y.

Constante b — signification ?

Valeur de Y quand X=0.

Voir les flashcards →

Approfondir avec la fiche

Consultez la fiche de révision complète sur Analyse des réseaux et modélisation statistique.

Voir la fiche →

Cours similaires

Crée tes propres QCM

Importe ton cours et l'IA génère des QCM avec corrections en 30 secondes.

Générateur de QCM