Introduction aux modèles de langage et stratégies de décodage

Extrait de la fiche de révision

1. 📌 L'essentiel

  • Un modèle de langage estime la probabilité d'une séquence de tokens : P(w1,...,wT)=t=1TP(wtw1,...,wt1)P(w_1, ..., w_T) = \prod_{t=1}^T P(w_t | w_1, ..., w_{t-1}).
  • La tokenisation sous-mots (BPE, WordPiece, SentencePiece) réduit le vocabulaire et gère les rares.
  • Stratégies de décodage principales : Greedy, Beam Search, Sampling.
  • Greedy : choix du token le plus probable à chaque étape, rapide mais peu créatif.
  • Beam Search : exploration de plusieurs séquences, plus cohérent mais plus lent.
  • Sampling : choix probabiliste contrôlé par température, top-k, top-p pour plus de diversité.
  • La température modifie la distribution : T<1 pour plus conservateur, T>1 pour plus créatif.
  • Top-k limite la sélection aux k tokens les plus probables, renormalisés.
  • Top-p (Nucleus) sélectionne un ensemble dynamique de tokens jusqu’à la somme des probabilités p.
  • Contrôler la répétition via Repetition Penalty ou No-Repeat N-gram.
  • La graine (seed) permet la reproductibilité des résultats.
Lire la fiche complète →

Aperçu du QCM

1. Quelle stratégie de décodage consiste à choisir à chaque étape le token le plus probable, de manière rapide et déterministe ?

2. Quelle est la principale caractéristique d’un modèle de langage?

3. Quelle est la principale fonction d'un modèle de langage (LLM) ?

Faire le QCM (10 questions) →

Aperçu des flashcards

Tokenisation — rôle ?

Découpe le texte en unités manipulables

Modèle de langage — définition?

Probabiliste, prédit la prochaine token.

Modèle de langage — définition ?

Estimations probabilistes de séquences de tokens

Tokenisation — rôle?

Réduit le vocabulaire, gère l'inconnu.

Greedy — stratégie ?

Choix du token le plus probable à chaque étape

Décodage Greedy — caractéristique?

Choix du token le plus probable, rapide.

Voir toutes les 10 flashcards →

Questions fréquentes

Que contient la fiche de révision sur Introduction aux modèles de langage et stratégies de décodage ?

La fiche de révision couvre les notions essentielles de Introduction aux modèles de langage et stratégies de décodage. Elle est structurée par thématiques pour faciliter l'apprentissage et la mémorisation, avec des définitions clés, des explications et des synthèses.

Lire la fiche complète →

Combien de questions contient le QCM sur Introduction aux modèles de langage et stratégies de décodage ?

Le QCM contient 10 questions à choix multiples avec corrections détaillées et explications pour chaque réponse. Idéal pour tester vos connaissances et identifier vos lacunes.

Faire le QCM (10 questions) →

Comment réviser Introduction aux modèles de langage et stratégies de décodage avec les flashcards ?

Revizly propose 10 flashcards interactives sur Introduction aux modèles de langage et stratégies de décodage. Chaque carte présente une question au recto et la réponse au verso, permettant une révision active et efficace basée sur la répétition espacée.

Voir toutes les 10 flashcards →

Cours similaires

Crée tes propres fiches depuis tes cours

Importe ton PDF ou colle ton cours, l'IA génère fiches, QCM et flashcards en 30 secondes.