Aller au contenu principal
⚙️

Apprentissage par renforcement

Technique

⚙️ Technique 🌐 Reinforcement Learning

Définition

Méthode d’apprentissage où un agent apprend par essais, erreurs et récompenses dans un environnement. L’agent reçoit des signaux positifs ou négatifs selon ses actions, et optimise sa stratégie pour maximiser la récompense cumulée. Cette technique est utilisée dans les jeux (AlphaGo), la robotique, et l’alignement des LLM via RLHF.

En anglais

Reinforcement Learning — A learning paradigm where an agent learns to make optimal decisions by interacting with an environment and receiving reward or penalty signals. The agent optimizes its strategy to maximize cumulative reward. This technique powers game-playing AI (AlphaGo), robotics, and LLM alignment through RLHF.

Termes associés

⚙️
Apprentissage profond
⚙️
Attention (mécanisme d’)
⚙️
Benchmark
⚙️
Classification
⚙️
Clustering
⚙️
Data augmentation

Explorer le glossaire complet

Découvrez tous les termes de l’intelligence artificielle dans notre glossaire.