QCM : Introduction au Machine Learning et Types de Données — 14 questions

Questions et réponses du QCM

1. En apprentissage supervisé, sur quoi repose l’entraînement des algorithmes ?

Sur des données étiquetées avec une réponse attendue
Sur des données non organisées sans cible
Sur des données sans aucune indication de sortie
Sur des interactions avec récompense uniquement

Sur des données étiquetées avec une réponse attendue

Explication

L’apprentissage supervisé utilise des données labellisées, c’est-à-dire des exemples accompagnés de la réponse attendue. Cela permet au modèle d’apprendre à classer ou à prédire.

2. Qu’est-ce qui caractérise l’apprentissage non supervisé ?

L’utilisation exclusive de données labellisées pour entraîner le modèle
La prédiction d’une valeur quantitative continue à partir de variables explicatives
L’absence d’étiquettes dans les données utilisées pour apprendre des structures
La présence systématique de réponses attendues pour chaque exemple

L’absence d’étiquettes dans les données utilisées pour apprendre des structures

Explication

En apprentissage non supervisé, on ne dispose pas d’étiquettes et l’objectif est de découvrir des structures ou régularités dans les données. Les autres réponses décrivent l’apprentissage supervisé ou la régression.

3. Quelle affirmation décrit le mieux une donnée ?

Une règle d’organisation d’un tableau
Un résultat obtenu après mise en contexte
Une observation brute non analysée servant de matière première
Un message interprété donnant un sens complet

Une observation brute non analysée servant de matière première

Explication

Une donnée est une observation brute, sans interprétation préalable. L’information, au contraire, correspond au sens interprété de ces observations.

4. Lequel de ces exemples correspond à des données semi-structurées ?

Un fichier XML
Un tableau SQL
Un fichier CSV
Une feuille Excel

Un fichier XML

Explication

Le XML est un exemple de donnée semi-structurée, car il repose sur une structure avec balises et métadonnées. Les fichiers SQL, CSV et Excel sont plutôt des exemples de données structurées.

5. Quel exemple correspond à l’apprentissage semi supervisé ?

Améliorer une performance par essais et récompenses
Prédire une valeur numérique à partir d’un ensemble de variables
Apprendre uniquement à partir de données sans aucune structure
Utiliser à la fois des données avec étiquettes et des données sans étiquettes pendant l’entraînement

Utiliser à la fois des données avec étiquettes et des données sans étiquettes pendant l’entraînement

Explication

L’apprentissage semi supervisé combine des données étiquetées et non étiquetées lors de l’entraînement. Les autres propositions correspondent à d’autres familles du machine learning.

6. Quel est l’objectif principal d’une régression linéaire ?

Regrouper des observations sans utiliser de variable cible
Classer des données en deux classes à partir de labels
Trouver une relation linéaire entre une variable cible quantitative et des variables explicatives
Attribuer une étiquette à chaque observation à partir de catégories

Trouver une relation linéaire entre une variable cible quantitative et des variables explicatives

Explication

La régression linéaire cherche à modéliser une relation linéaire pour prédire une variable cible quantitative. Les autres propositions décrivent plutôt la classification ou l’apprentissage non supervisé.

7. Quel énoncé distingue correctement classification et régression ?

La classification prédit une valeur continue, tandis que la régression donne une étiquette
Les deux ne peuvent fonctionner qu’avec des variables qualitatives
La classification attribue une catégorie, tandis que la régression estime une valeur numérique
Les deux cherchent uniquement à organiser des données en tableaux

La classification attribue une catégorie, tandis que la régression estime une valeur numérique

Explication

La classification sert à attribuer une classe ou une étiquette, alors que la régression vise une valeur quantitative. C’est la distinction fondamentale entre les deux problèmes.

8. Qu’est-ce qui caractérise des données structurées ?

Elles sont toujours du texte brut non organisé
Elles suivent un schéma prédéfini avec lignes et colonnes
Elles n’ont aucun format fixe ni modèle
Elles reposent uniquement sur des balises et des métadonnées

Elles suivent un schéma prédéfini avec lignes et colonnes

Explication

Les données structurées suivent un schéma prédéfini, souvent sous forme de tableaux. Cette organisation facilite la recherche et l’analyse.

9. Que cherche principalement à faire le machine learning ?

Remplacer toute forme de calcul par des règles fixes
Écrire des règles manuelles sans données d’exemple
Apprendre automatiquement des régularités à partir de grands ensembles de données
Transformer chaque donnée en information sans apprentissage

Apprendre automatiquement des régularités à partir de grands ensembles de données

Explication

Le machine learning est une branche de l’intelligence artificielle qui apprend des régularités à partir de données. Il ne repose pas sur des règles fixes programmées à l’avance.

10. Quel exemple illustre le mieux un problème de classification supervisée ?

Estimer un salaire selon les années d’expérience
Calculer une valeur continue à partir d’une mesure
Détecter si un message est un spam ou non
Prédire le prix d’une maison selon sa surface

Détecter si un message est un spam ou non

Explication

La classification attribue une étiquette à une donnée qualitative, comme spam ou non spam. Les autres propositions relèvent de la régression, car elles visent une valeur quantitative.

11. Comment peut-on définir un jeu de données ?

Un ensemble organisé de données liées entre elles
Une liste de valeurs sans aucun lien entre elles
Une seule observation isolée et interprétée
Un message déjà formulé à partir d’une analyse

Un ensemble organisé de données liées entre elles

Explication

Un jeu de données est un ensemble de données organisées et reliées entre elles. Ce n’est pas une simple donnée isolée ni un message déjà interprété.

12. Que prédit un problème de régression ?

Une étiquette de classe
Une balise structurée
Une réponse sans variable cible
Une valeur quantitative continue

Une valeur quantitative continue

Explication

La régression consiste à prédire une grandeur numérique continue. La classification, elle, vise une étiquette ou une catégorie.

13. Dans une régression linéaire, que représente le training set ?

L’ensemble de données d’entraînement utilisé pour ajuster le modèle aux points observés
Un tableau de résultats déjà prédits par le modèle
Le jeu de données réservé uniquement à l’évaluation finale du modèle
Un ensemble de données sans aucune variable explicative

L’ensemble de données d’entraînement utilisé pour ajuster le modèle aux points observés

Explication

Le training set sert à entraîner et ajuster le modèle en le faisant coller aux points observés. Il ne correspond pas au test final ni à un ensemble de résultats déjà prédits.

14. Quel enchaînement correspond au cycle d’apprentissage en machine learning ?

Mise en contexte, puis interprétation, puis stockage
Apprentissage sur les données, calcul d’erreur, correction, optimisation puis évaluation
Création d’une règle fixe, puis suppression de l’erreur, puis prédiction
Évaluation d’abord, puis correction, puis importation des données

Apprentissage sur les données, calcul d’erreur, correction, optimisation puis évaluation

Explication

Le cycle comprend l’apprentissage sur les données d’entraînement, le calcul de l’erreur, la correction, l’optimisation et enfin l’évaluation. C’est un processus itératif.

Révisez avec les flashcards

Mémorisez les réponses avec 14 flashcards sur Introduction au Machine Learning et Types de Données.

Données — définition ?

Observations brutes non analysées.

Information — définition ?

Sens interprété d’observations.

Observation brute — rôle ?

Fournir des valeurs sans organisation.

Voir les flashcards →

Approfondir avec la fiche

Consultez la fiche de révision complète sur Introduction au Machine Learning et Types de Données.

Voir la fiche →

Cours similaires

Crée tes propres QCM

Importe ton cours et l'IA génère des QCM avec corrections en 30 secondes.

Générateur de QCM