University of Alberta
Principes de l'apprentissage par renforcement
University of Alberta

Principes de l'apprentissage par renforcement

Martha White
Adam White

Instructeurs : Martha White

93 878 déjà inscrits

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
4.8

(2,783 avis)

niveau Intermédiaire

Expérience recommandée

Planning flexible
Env. 15 heures
Apprenez à votre propre rythme
92%
La plupart des étudiants ont apprécié ce cours
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
4.8

(2,783 avis)

niveau Intermédiaire

Expérience recommandée

Planning flexible
Env. 15 heures
Apprenez à votre propre rythme
92%
La plupart des étudiants ont apprécié ce cours

Ce que vous apprendrez

  • Formaliser les problèmes sous forme de processus de décision de Markov

  • Comprendre les méthodes d'exploration de base et le compromis exploration/exploitation

  • Comprendre les fonctions de valeur, en tant qu'outil général pour une prise de décision optimale

  • Savoir comment mettre en œuvre la programmation dynamique en tant que solution efficace à un problème de contrôle industriel

Compétences que vous acquerrez

  • Catégorie : Approximation des fonctions
  • Catégorie : Intelligence artificielle (IA)
  • Catégorie : Apprentissage par renforcement
  • Catégorie : Apprentissage automatique
  • Catégorie : Systèmes intelligents

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

5 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Emplacement réservé

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation Apprentissage par renforcement
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable
Emplacement réservé
Emplacement réservé

Obtenez un certificat professionnel

Ajoutez cette qualification à votre profil LinkedIn ou à votre CV

Partagez-le sur les réseaux sociaux et dans votre évaluation de performance

Emplacement réservé

Il y a 5 modules dans ce cours

Bienvenue à : Fundamentals of Reinforcement Learning, le premier cours d'une spécialisation en quatre parties sur l'apprentissage par renforcement qui vous est proposée par l'Université de l'Alberta, Onlea et Coursera. Dans ce module pré-cours, vous serez présenté à vos instructeurs, aurez un aperçu de ce que le cours vous réserve, et recevrez une feuille de route approfondie pour vous aider à rendre votre voyage à travers cette spécialisation aussi fluide que possible.

Inclus

4 vidéos2 lectures1 sujet de discussion

Au cours de la première semaine de ce cours, vous apprendrez à comprendre le compromis exploration-exploitation dans la prise de décision séquentielle, à mettre en œuvre des algorithmes incrémentaux pour estimer les valeurs d'action et à comparer les forces et les faiblesses de différents algorithmes d'exploration. Pour l'évaluation notée de cette semaine, vous implémenterez et testerez un agent epsilon-greedy.

Inclus

8 vidéos3 lectures1 devoir1 devoir de programmation1 sujet de discussion2 plugins

Lorsque vous êtes confronté à un problème industriel, la première étape, et la plus importante, consiste à traduire ce problème en un processus décisionnel de Markov (PDM). La qualité de votre solution dépend fortement de la façon dont vous effectuez cette traduction. Cette semaine, vous apprendrez la définition des PDM, vous comprendrez ce qu'est un comportement orienté vers un but et comment il peut être obtenu en maximisant des récompenses scalaires, et vous comprendrez également la différence entre les tâches épisodiques et les tâches continues. Pour l'évaluation notée de cette semaine, vous créerez trois exemples de tâches de votre cru qui s'inscrivent dans le cadre des PDM.

Inclus

7 vidéos2 lectures1 devoir1 évaluation par les pairs1 sujet de discussion

Une fois que le problème est formulé comme un MDP, la recherche de la politique optimale est plus efficace lorsque l'on utilise des fonctions de valeur. Cette semaine, vous apprendrez à définir les politiques et les fonctions de valeur, ainsi que les équations de Bellman, qui est la technologie clé que tous nos algorithmes utiliseront.

Inclus

9 vidéos3 lectures2 devoirs1 sujet de discussion

Cette semaine, vous apprendrez à calculer des fonctions de valeur et des politiques optimales, en supposant que vous disposiez du modèle MDP. Vous mettrez en œuvre la programmation dynamique pour calculer les fonctions de valeur et les politiques optimales et comprendrez l'utilité de la programmation dynamique pour les applications et les problèmes industriels. En outre, vous découvrirez l'itération de politique généralisée en tant que modèle commun pour la construction d'algorithmes qui maximisent la récompense. Pour l'évaluation notée de cette semaine, vous mettrez en œuvre un agent de programmation dynamique efficace dans un problème de contrôle industriel simulé.

Inclus

10 vidéos3 lectures1 devoir1 devoir de programmation1 sujet de discussion

Instructeurs

Évaluations de l’enseignant
4.7 (802 évaluations)
Martha White
University of Alberta
4 Cours99 236 apprenants
Adam White
University of Alberta
4 Cours99 236 apprenants

Offert par

University of Alberta

Recommandé si vous êtes intéressé(e) par Apprentissage automatique

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Avis des étudiants

4.8

2 783 avis

  • 5 stars

    81,69 %

  • 4 stars

    14,57 %

  • 3 stars

    2,54 %

  • 2 stars

    0,43 %

  • 1 star

    0,75 %

Affichage de 3 sur 2783

AM
5

Révisé le 1 juil. 2021

MN
5

Révisé le 11 avr. 2024

SE
4

Révisé le 24 juin 2020

Emplacement réservé

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions