Espace de données d’apprentissage — composants ?
Features, labels, représentation numérique
Dataset — sous-ensembles principaux ?
Training, validation, test
Features numériques — types ?
Continue, discrète
Features catégorielles — encodages ?
Ordinal, one-hot
Sortie problème ML — nature ?
Régression ou classification
Qualité des données — problèmes courants ?
Données manquantes, incohérences, outliers
Transformation — objectif principal ?
Rendre les données exploitables
Feature engineering — actions ?
Sélection, création, réduction de dimension
Phases apprentissage — ordre ?
Préparation, entraînement, validation, test
Validation croisée — but ?
Évaluer stabilité et généralisation
Métriques de régression — exemple ?
MSE, MAE, RMSE, R²
Matrice confusion — éléments ?
TP, TN, FP, FN
Erreur quadratique moyenne — sigification ?
Pénalise grosses erreurs
R² — interprétation ?
Part de variance expliquée
Validation stratifiée — avantage ?
Conserve proportions de classes
Normalisation — but ?
Comparer features sur même échelle
Standardisation — formule ?
(x - μ)/σ
Discrétisation — utilité ?
Simplifier ou interpréter
Sur-apprentissage — signe ?
Bonne performance train, mauvaise test
Testez vos connaissances avec un QCM de 20 questions sur Introduction aux données et validation en ML.
1. Que représente l’espace de données d’apprentissage dans un problème supervisé ?
2. Dans une représentation matricielle des données, que désigne généralement X ?
Révisez le cours complet dans la fiche de révision de Introduction aux données et validation en ML.
Voir la fiche →Bases de données
Bases de données
Programmation
Programmation
Importe ton cours et l'IA génère des flashcards en 30 secondes.
Générateur de flashcards