QCM : Introduction au Machine Learning et Types de Données — 14 questions

Question 1

1. En apprentissage supervisé, sur quoi repose l’entraînement des algorithmes ?

Sur des données étiquetées avec une réponse attendue

Sur des données non organisées sans cible

Sur des données sans aucune indication de sortie

Sur des interactions avec récompense uniquement

Explication

L’apprentissage supervisé utilise des données labellisées, c’est-à-dire des exemples accompagnés de la réponse attendue. Cela permet au modèle d’apprendre à classer ou à prédire.

Answer

Sur des données étiquetées avec une réponse attendue

Question 2

2. Qu’est-ce qui caractérise l’apprentissage non supervisé ?

L’utilisation exclusive de données labellisées pour entraîner le modèle

La prédiction d’une valeur quantitative continue à partir de variables explicatives

L’absence d’étiquettes dans les données utilisées pour apprendre des structures

La présence systématique de réponses attendues pour chaque exemple

Explication

En apprentissage non supervisé, on ne dispose pas d’étiquettes et l’objectif est de découvrir des structures ou régularités dans les données. Les autres réponses décrivent l’apprentissage supervisé ou la régression.

Answer

L’absence d’étiquettes dans les données utilisées pour apprendre des structures

Question 3

3. Quelle affirmation décrit le mieux une donnée ?

Une règle d’organisation d’un tableau

Un résultat obtenu après mise en contexte

Une observation brute non analysée servant de matière première

Un message interprété donnant un sens complet

Explication

Une donnée est une observation brute, sans interprétation préalable. L’information, au contraire, correspond au sens interprété de ces observations.

Answer

Une observation brute non analysée servant de matière première

Question 4

4. Lequel de ces exemples correspond à des données semi-structurées ?

Un fichier XML

Un tableau SQL

Un fichier CSV

Une feuille Excel

Explication

Le XML est un exemple de donnée semi-structurée, car il repose sur une structure avec balises et métadonnées. Les fichiers SQL, CSV et Excel sont plutôt des exemples de données structurées.

Answer

Un fichier XML

Question 5

5. Quel exemple correspond à l’apprentissage semi supervisé ?

Améliorer une performance par essais et récompenses

Prédire une valeur numérique à partir d’un ensemble de variables

Apprendre uniquement à partir de données sans aucune structure

Utiliser à la fois des données avec étiquettes et des données sans étiquettes pendant l’entraînement

Explication

L’apprentissage semi supervisé combine des données étiquetées et non étiquetées lors de l’entraînement. Les autres propositions correspondent à d’autres familles du machine learning.

Answer

Utiliser à la fois des données avec étiquettes et des données sans étiquettes pendant l’entraînement

Question 6

6. Quel est l’objectif principal d’une régression linéaire ?

Regrouper des observations sans utiliser de variable cible

Classer des données en deux classes à partir de labels

Trouver une relation linéaire entre une variable cible quantitative et des variables explicatives

Attribuer une étiquette à chaque observation à partir de catégories

Explication

La régression linéaire cherche à modéliser une relation linéaire pour prédire une variable cible quantitative. Les autres propositions décrivent plutôt la classification ou l’apprentissage non supervisé.

Answer

Trouver une relation linéaire entre une variable cible quantitative et des variables explicatives

Question 7

7. Quel énoncé distingue correctement classification et régression ?

La classification prédit une valeur continue, tandis que la régression donne une étiquette

Les deux ne peuvent fonctionner qu’avec des variables qualitatives

La classification attribue une catégorie, tandis que la régression estime une valeur numérique

Les deux cherchent uniquement à organiser des données en tableaux

Explication

La classification sert à attribuer une classe ou une étiquette, alors que la régression vise une valeur quantitative. C’est la distinction fondamentale entre les deux problèmes.

Answer

La classification attribue une catégorie, tandis que la régression estime une valeur numérique

Question 8

8. Qu’est-ce qui caractérise des données structurées ?

Elles sont toujours du texte brut non organisé

Elles suivent un schéma prédéfini avec lignes et colonnes

Elles n’ont aucun format fixe ni modèle

Elles reposent uniquement sur des balises et des métadonnées

Explication

Les données structurées suivent un schéma prédéfini, souvent sous forme de tableaux. Cette organisation facilite la recherche et l’analyse.

Answer

Elles suivent un schéma prédéfini avec lignes et colonnes

Question 9

9. Que cherche principalement à faire le machine learning ?

Remplacer toute forme de calcul par des règles fixes

Écrire des règles manuelles sans données d’exemple

Apprendre automatiquement des régularités à partir de grands ensembles de données

Transformer chaque donnée en information sans apprentissage

Explication

Le machine learning est une branche de l’intelligence artificielle qui apprend des régularités à partir de données. Il ne repose pas sur des règles fixes programmées à l’avance.

Answer

Apprendre automatiquement des régularités à partir de grands ensembles de données

Question 10

10. Quel exemple illustre le mieux un problème de classification supervisée ?

Estimer un salaire selon les années d’expérience

Calculer une valeur continue à partir d’une mesure

Détecter si un message est un spam ou non

Prédire le prix d’une maison selon sa surface

Explication

La classification attribue une étiquette à une donnée qualitative, comme spam ou non spam. Les autres propositions relèvent de la régression, car elles visent une valeur quantitative.

Answer

Détecter si un message est un spam ou non

Question 11

11. Comment peut-on définir un jeu de données ?

Un ensemble organisé de données liées entre elles

Une liste de valeurs sans aucun lien entre elles

Une seule observation isolée et interprétée

Un message déjà formulé à partir d’une analyse

Explication

Un jeu de données est un ensemble de données organisées et reliées entre elles. Ce n’est pas une simple donnée isolée ni un message déjà interprété.

Answer

Un ensemble organisé de données liées entre elles

Question 12

12. Que prédit un problème de régression ?

Une étiquette de classe

Une balise structurée

Une réponse sans variable cible

Une valeur quantitative continue

Explication

La régression consiste à prédire une grandeur numérique continue. La classification, elle, vise une étiquette ou une catégorie.

Answer

Une valeur quantitative continue

Question 13

13. Dans une régression linéaire, que représente le training set ?

L’ensemble de données d’entraînement utilisé pour ajuster le modèle aux points observés

Un tableau de résultats déjà prédits par le modèle

Le jeu de données réservé uniquement à l’évaluation finale du modèle

Un ensemble de données sans aucune variable explicative

Explication

Le training set sert à entraîner et ajuster le modèle en le faisant coller aux points observés. Il ne correspond pas au test final ni à un ensemble de résultats déjà prédits.

Answer

L’ensemble de données d’entraînement utilisé pour ajuster le modèle aux points observés

Question 14

14. Quel enchaînement correspond au cycle d’apprentissage en machine learning ?

Mise en contexte, puis interprétation, puis stockage

Apprentissage sur les données, calcul d’erreur, correction, optimisation puis évaluation

Création d’une règle fixe, puis suppression de l’erreur, puis prédiction

Évaluation d’abord, puis correction, puis importation des données

Explication

Le cycle comprend l’apprentissage sur les données d’entraînement, le calcul de l’erreur, la correction, l’optimisation et enfin l’évaluation. C’est un processus itératif.

Answer

Apprentissage sur les données, calcul d’erreur, correction, optimisation puis évaluation

QCM : Introduction au Machine Learning et Types de Données — 14 questions

Questions et réponses du QCM

1. En apprentissage supervisé, sur quoi repose l’entraînement des algorithmes ?

2. Qu’est-ce qui caractérise l’apprentissage non supervisé ?

3. Quelle affirmation décrit le mieux une donnée ?

4. Lequel de ces exemples correspond à des données semi-structurées ?

5. Quel exemple correspond à l’apprentissage semi supervisé ?

6. Quel est l’objectif principal d’une régression linéaire ?

7. Quel énoncé distingue correctement classification et régression ?

8. Qu’est-ce qui caractérise des données structurées ?

9. Que cherche principalement à faire le machine learning ?

10. Quel exemple illustre le mieux un problème de classification supervisée ?

11. Comment peut-on définir un jeu de données ?

12. Que prédit un problème de régression ?

13. Dans une régression linéaire, que représente le training set ?

14. Quel enchaînement correspond au cycle d’apprentissage en machine learning ?

Révisez avec les flashcards

Approfondir avec la fiche

Cours similaires

Écosystème de l’esport et médiation numérique

Listes, piles, files et arbres

Algorithmique et structures de données

Gestion des fichiers en PHP

Identification utilisateur en PHP

Automated PCB Fault Diagnosis

Crée tes propres QCM