Features = Entrées ; Label = Sortie ; Distance + règle = Décision.
Supervisé = labels connus ; k-NN = regarde les voisins.
Cas similaires → décision ; pas de “phase d’entraînement” lourde.
1 voisin = “copie” ; k voisins = “vote/agrégation”.
Distances → tri → k voisins → mode (vote) → prédiction.
Distance = identité + symétrie + triangle ; k-NN = “proches” selon d.
Euclidienne = carrés ; Manhattan = absolus ; Minkowski = puissance p ; p→∞ = max.
k petit → underfitting ; k grand → overfitting ; trouver le bon milieu.
Pas de modèle → mais stockage + calcul à chaque prédiction.
Choix de distance selon le type de données
| Type de données | Distance candidate | Idée clé |
|---|---|---|
| Données quantitatives de même type | Euclidienne | Bon candidat pour des variables du même type. |
| Données de types différents | Manhattan | Bonne mesure quand les input variables ne sont pas du même type. |
Testez vos connaissances sur Introduction à k-NN et Distance en Apprentissage Machine avec 4 questions à choix multiples avec corrections détaillées.
1. Dans un problème d’apprentissage supervisé, quel rôle joue principalement un modèle de machine learning ?
2. Quelle est la fonction principale d’un modèle machine learning dans le contexte de la prédiction ?
Mémorisez les concepts clés de Introduction à k-NN et Distance en Apprentissage Machine avec 9 flashcards interactives.
Problème — définition ?
Une tâche de prédiction à partir de données.
Features en ML
Propriétés des données utilisées pour prédire.
k-NN — apprentissage supervisé ?
Utilise des données labellisées pour prédire.
Bases de données
Bases de données
Bases de données
Programmation
Importe ton cours et l'IA génère fiches, QCM et flashcards en 30 secondes.
Générateur de fiches