1. Quelle est la cause principale de l'apprentissage par renforcement ?
Il apprend par essais et erreurs en recevant des récompenses ou pénalités
Explication
L'apprentissage par renforcement apprend par essais et erreurs, en recevant des récompenses ou pénalités. Cette méthode repose donc sur l'idée que l'agent doit expérimenter différentes actions pour maximiser ses récompenses, ce qui explique son mode d'apprentissage.