Décision de classe = “Qui est-ce ?” : on compare les caractéristiques à des profils connus (supervisé) pour choisir la bonne étiquette, puis on compte les erreurs.
Train/Test : 80-20 (ou 70-30) pour apprendre puis vérifier l’erreur.
Train/Test : 80/20 (ou 70/30) pour estimer l’erreur une fois ; Cross-val : k tours (k−1 pour apprendre, 1 pour tester).
Test = données inconnues : erreur mesurée sur l’inconnu pour estimer l’erreur en production.
Train pour apprendre, Test pour juger : même modèle, données différentes.
Précision = “positifs prédits corrects” (peu de faux positifs) ; Recall = “positifs réels retrouvés” (peu de faux négatifs).
Précision = « vrais positifs parmi prédits positifs » ; Recall = « vrais positifs parmi positifs réels » ; F1 = « moyenne harmonique » qui punit le déséquilibre.
TVP monte et TFP suit quand tu baisses le seuil : ROC = compromis vrais positifs vs faux positifs.
AUC = “Aire = Probabilité” : c’est la chance qu’un positif soit mieux classé qu’un négatif.
| Date | Événement |
|---|---|
| 1 Octobre 2020 | Début du support de cours (Classification Chapitre 3 Partie 1) |
| 6 Octobre 2020 | Diapositive sur la définition de la classification et ses caractéristiques |
| 7 Octobre 2020 | Diapositive sur des exemples de problèmes de classification |
| 8 Octobre 2020 | Diapositive sur le processus de classification en deux étapes |
| 10 Octobre 2020 | Diapositive sur l’estimation du taux d’erreur via le test set |
| 11 Octobre 2020 | Diapositive sur le train test split |
| 12 Octobre 2020 | Diapositive sur la cross validation |
| 16 Octobre 2020 | Diapositive sur l’évaluation des méthodes de classification (importance et test set) |
| 17 Octobre 2020 | Diapositive sur la remarque : évaluer sur l’échantillon de test |
| 18 Octobre 2020 | Diapositive listant les indicateurs : accuracy, recall, precision, F1 score |
Indicateurs issus de la matrice de confusion
| Indicateur | Question | Formule (selon cours) |
|---|---|---|
| Accuracy | Pourcentage de bonnes prédictions | Accuracy = (vrais positifs + vrais négatifs) / total |
| Recall | Quelle proportion de positifs réels est identifiée correctement ? | Recall = vrais positifs / (vrais positifs + faux négatifs) |
| Précision | Quelle proportion d’identifications positives est effectivement correcte ? | Precision = vrais positifs / (vrais positifs + faux positifs) |
| F1 score | Combiner précision et rappel | F1 score = 2 * (Recall * Precision) / (Recall + Precision) |
Testez vos connaissances sur Introduction aux Méthodes de Classification avec 9 questions à choix multiples avec corrections détaillées.
1. Quelles sont les deux étapes du processus de classification ?
2. Dans quel type de problème la classification peut-elle être utilisée ?
Mémorisez les concepts clés de Introduction aux Méthodes de Classification avec 18 flashcards interactives.
Classification — définition ?
Prédire l’appartenance à une catégorie.
Classes — rôle ?
Groupes cibles à identifier.
Apprentissage supervisé — rôle ?
Utilise des données étiquetées.
Bases de données
Bases de données
Bases de données
Programmation
Importe ton cours et l'IA génère fiches, QCM et flashcards en 30 secondes.
Générateur de fiches