University of Alberta
Principes de l'apprentissage par renforcement
University of Alberta

Principes de l'apprentissage par renforcement

Ce cours fait partie de Spécialisation Apprentissage par renforcement

Enseigné en Anglais

Certains éléments de contenu peuvent ne pas être traduits

Martha White
Adam White

Instructeurs : Martha White

91 160 déjà inscrits

Inclus avec Coursera Plus

Cours

Familiarisez-vous avec un sujet et apprenez les fondamentaux

4.8

(2,757 avis)

|

92%

niveau Intermédiaire

Expérience recommandée

15 heures (approximativement)
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Formaliser les problèmes sous forme de processus de décision de Markov

  • Comprendre les méthodes d'exploration de base et le compromis exploration/exploitation

  • Comprendre les fonctions de valeur, en tant qu'outil général pour une prise de décision optimale

  • Savoir comment mettre en œuvre la programmation dynamique en tant que solution efficace à un problème de contrôle industriel

Compétences que vous acquerrez

  • Catégorie : Approximation des fonctions
  • Catégorie : Intelligence artificielle (IA)
  • Catégorie : Apprentissage par renforcement
  • Catégorie : Apprentissage automatique
  • Catégorie : Systèmes intelligents

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

5 quizzes

Cours

Familiarisez-vous avec un sujet et apprenez les fondamentaux

4.8

(2,757 avis)

|

92%

niveau Intermédiaire

Expérience recommandée

15 heures (approximativement)
Planning flexible
Apprenez à votre propre rythme

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Placeholder

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation Apprentissage par renforcement
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable
Placeholder
Placeholder

Obtenez un certificat professionnel

Ajoutez cette qualification à votre profil LinkedIn ou à votre CV

Partagez-le sur les réseaux sociaux et dans votre évaluation de performance

Placeholder

Il y a 5 modules dans ce cours

Bienvenue à : Fundamentals of Reinforcement Learning, le premier cours d'une spécialisation en quatre parties sur l'apprentissage par renforcement qui vous est proposée par l'Université de l'Alberta, Onlea et Coursera. Dans ce module pré-cours, vous serez présenté à vos instructeurs, aurez un aperçu de ce que le cours vous réserve, et recevrez une feuille de route approfondie pour vous aider à rendre votre voyage à travers cette spécialisation aussi fluide que possible.

Inclus

4 vidéos2 lectures1 sujet de discussion

Au cours de la première semaine de ce cours, vous apprendrez à comprendre le compromis exploration-exploitation dans la prise de décision séquentielle, à mettre en œuvre des algorithmes incrémentaux pour estimer les valeurs d'action et à comparer les forces et les faiblesses de différents algorithmes d'exploration. Pour l'évaluation notée de cette semaine, vous implémenterez et testerez un agent epsilon-greedy.

Inclus

8 vidéos3 lectures1 quiz1 devoir de programmation1 sujet de discussion2 plugins

Lorsque vous êtes confronté à un problème industriel, la première étape, et la plus importante, consiste à traduire ce problème en un processus décisionnel de Markov (PDM). La qualité de votre solution dépend fortement de la façon dont vous effectuez cette traduction. Cette semaine, vous apprendrez la définition des PDM, vous comprendrez ce qu'est un comportement orienté vers un but et comment il peut être obtenu en maximisant des récompenses scalaires, et vous comprendrez également la différence entre les tâches épisodiques et les tâches continues. Pour l'évaluation notée de cette semaine, vous créerez trois exemples de tâches de votre cru qui s'inscrivent dans le cadre des PDM.

Inclus

7 vidéos2 lectures1 quiz1 évaluation par les pairs1 sujet de discussion

Une fois que le problème est formulé comme un MDP, la recherche de la politique optimale est plus efficace lorsque l'on utilise des fonctions de valeur. Cette semaine, vous apprendrez à définir les politiques et les fonctions de valeur, ainsi que les équations de Bellman, qui est la technologie clé que tous nos algorithmes utiliseront.

Inclus

9 vidéos3 lectures2 quizzes1 sujet de discussion

Cette semaine, vous apprendrez à calculer des fonctions de valeur et des politiques optimales, en supposant que vous disposiez du modèle MDP. Vous mettrez en œuvre la programmation dynamique pour calculer les fonctions de valeur et les politiques optimales et comprendrez l'utilité de la programmation dynamique pour les applications et les problèmes industriels. En outre, vous découvrirez l'itération de politique généralisée en tant que modèle commun pour la construction d'algorithmes qui maximisent la récompense. Pour l'évaluation notée de cette semaine, vous mettrez en œuvre un agent de programmation dynamique efficace dans un problème de contrôle industriel simulé.

Inclus

10 vidéos3 lectures1 quiz1 devoir de programmation1 sujet de discussion

Instructeurs

Évaluations de l’enseignant
4.7 (790 évaluations)
Martha White
University of Alberta
4 Cours96 391 apprenants
Adam White
University of Alberta
4 Cours96 391 apprenants

Offert par

University of Alberta

Recommandé si vous êtes intéressé(e) par Apprentissage automatique

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Avis des étudiants

Affichage de 3 sur 2757

4.8

2 757 avis

  • 5 stars

    81,75 %

  • 4 stars

    14,59 %

  • 3 stars

    2,46 %

  • 2 stars

    0,43 %

  • 1 star

    0,76 %

AM
5

Révisé le 1 juil. 2021

GJ
5

Révisé le 25 avr. 2020

MN
5

Révisé le 11 avr. 2024

Placeholder

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à plus de 7 000 cours de renommée internationale, à des projets pratiques et à des programmes de certificats reconnus sur le marché du travail, tous inclus dans votre abonnement

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions