Un système complet d'apprentissage par renforcement (Capstone)

Un système complet d'apprentissage par renforcement (Capstone)

Ce cours fait partie de Spécialisation Apprentissage par renforcement

Instructeurs : Martha White

22 180 déjà inscrits

Inclus avec Coursera Plus

6 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

4.7

(630 avis)

niveau Intermédiaire

Expérience recommandée

Planning flexible

Env. 15 heures

Apprenez à votre propre rythme

93%

La plupart des étudiants ont apprécié ce cours

6 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

4.7

(630 avis)

niveau Intermédiaire

Expérience recommandée

Planning flexible

Env. 15 heures

Apprenez à votre propre rythme

93%

La plupart des étudiants ont apprécié ce cours

Compétences que vous acquerrez

Catégorie : Approximation des fonctions
Catégorie : Intelligence artificielle (IA)
Catégorie : Apprentissage par renforcement
Catégorie : Apprentissage automatique
Catégorie : Systèmes intelligents

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

2 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

En savoir plus sur Coursera pour les affaires

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation Apprentissage par renforcement

Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.

Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable

Obtenez un certificat professionnel

Ajoutez cette qualification à votre profil LinkedIn ou à votre CV

Partagez-le sur les réseaux sociaux et dans votre évaluation de performance

Il y a 6 modules dans ce cours

Dans ce dernier cours, vous rassemblerez vos connaissances des cours 1, 2 et 3 pour mettre en œuvre une solution RL complète à un problème. Ce projet vous permettra de voir comment chaque composant - formulation du problème, sélection de l'algorithme, sélection des paramètres et conception de la représentation - s'intègre dans une solution complète, et comment faire des choix appropriés lors du déploiement du RL dans le monde réel. Ce projet vous demandera d'implémenter à la fois l'environnement pour stimuler votre problème et un agent de contrôle avec une approximation de fonction de réseau neuronal. En outre, vous mènerez une étude scientifique de votre système d'apprentissage afin de développer votre capacité à évaluer la robustesse des agents RL. Pour utiliser le RL dans le monde réel, il est essentiel de (a) formaliser correctement le problème en tant que MDP, (b) sélectionner les algorithmes appropriés, (c) identifier les choix dans votre implémentation qui auront un impact important sur la performance et (d) valider le comportement attendu de vos algorithmes. Ce cours est utile pour tous ceux qui prévoient d'utiliser le RL pour résoudre des problèmes réels. Pour réussir ce cours, vous devrez avoir suivi les cours 1, 2 et 3 de cette Specializations ou l'équivalent. A la fin de ce cours, vous serez en mesure de :

Bienvenue au dernier cours de synthèse de la Specialization Reinforcement Learning ! !!

Inclus

2 vidéos2 lectures1 sujet de discussion

Cette semaine, vous lirez une description d'un problème et la traduirez en un PDM. Vous compléterez le code squelette pour cet environnement, afin d'obtenir un PDM complet à utiliser dans ce projet de fin d'études.

Inclus

4 vidéos1 devoir de programmation

4 vidéosTotal 23 minutes

Réunion initiale avec Martha : formalisation du problème4 minutesPrévisualiser le module
Andy Barto : Qu'est-ce que les traces d'éligibilité et pourquoi sont-elles appelées ainsi ?9 minutes
Passons en revue les processus de décision de Markov : Processus de décision de Markov6 minutes
Passons en revue les exemples de tâches épisodiques et continues : Exemples de tâches épisodiques et continues3 minutes

1 devoir de programmationTotal 180 minutes

MoonShot Technologies180 minutes

Cette semaine, vous choisirez parmi trois algorithmes, afin d'apprendre une politique pour l'environnement. Vous réfléchirez et discuterez de la pertinence de chaque algorithme pour cet environnement.

Inclus

7 vidéos1 devoir

7 vidéosTotal 39 minutes

Rencontre avec Niko : Choix de l'algorithme d'apprentissage3 minutesPrévisualiser le module
Passons en revue : Sarsa attendu3 minutes
Faisons le point : Qu'est-ce que l'apprentissage par questions et réponses ?3 minutes
Passons à l'action : Récompense moyenne - Une nouvelle façon de formuler les problèmes de contrôle10 minutes
Passons à la loupe : Algorithme acteur-critique5 minutes
Csaba Szepesvari sur le paysage des problèmes8 minutes
Andy et Rich : Conseils aux étudiants5 minutes

1 devoir

Choisir le bon algorithme0 minutes

Cette semaine, vous identifierez les paramètres clés qui affectent les performances de votre agent. L'objectif est de comprendre l'espace des options, pour vous permettre ensuite de choisir le paramètre que vous étudierez en profondeur pour votre agent.

Inclus

4 vidéos1 devoir

4 vidéosTotal 25 minutes

Réunion sur l'architecture des agents avec Martha : aperçu des choix de conception6 minutesPrévisualiser le module
Passons en revue : Approximation non linéaire avec les réseaux neuronaux4 minutes
Drew Bagnell sur l'identification du système et le contrôle optimal6 minutes
Susan Murphy sur la LR dans le domaine de la santé mobile7 minutes

1 devoirTotal 40 minutes

Impact du choix des paramètres dans RL40 minutes

Cette semaine, vous mettrez en œuvre votre agent en utilisant Expected Sarsa ou Q-learning avec RMSProp et des réseaux neuronaux. Pour utiliser les réseaux neuronaux, vous devrez utiliser une stratégie de sélection de taille de pas plus prudente, c'est pourquoi vous utiliserez RMSProp. Vous vérifierez également l'exactitude de votre agent.

Inclus

6 vidéos1 devoir de programmation

6 vidéosTotal 28 minutes

Rencontre avec Adam : bien choisir les détails de l'agent4 minutesPrévisualiser le module
Passons en revue : Stratégies d'optimisation pour les NN4 minutes
Passons en revue : Sarsa attendu avec approximation de fonction2 minutes
Passons en revue : Dyna et Q-learning dans un labyrinthe simple5 minutes
Rencontre avec Martha : expérience approfondie Replay4 minutes
Martin Riedmiller sur le cadre "Collect and Infer" pour une RL efficace sur le plan des données6 minutes

1 devoir de programmationTotal 480 minutes

Mettre en place votre agent480 minutes

Cette semaine, vous identifierez un paramètre à étudier pour votre agent. Une fois que vous aurez sélectionné le paramètre à étudier, nous vous fournirons une fourchette de valeurs et des valeurs spécifiques pour d'autres paramètres. Vous écrirez un script pour faire fonctionner votre agent et votre environnement sur l'ensemble des paramètres, afin de déterminer les performances en fonction de ces paramètres. Vous aurez une idée de l'impact des paramètres sur les performances de l'agent. Vous pourrez également visualiser les agents que vous aurez appris. Votre étude des paramètres consistera en un tableau de valeurs dont nous vérifierons l'exactitude.

Inclus

6 vidéos1 devoir de programmation

6 vidéosTotal 28 minutes

Rencontre avec Adam : études de paramètres en RL5 minutesPrévisualiser le module
Passons à l'action : Comparaison entre TD et Monte Carlo5 minutes
Joelle Pineau à propos de RL that Matters9 minutes
Rencontre avec Martha : discuter de vos résultats2 minutes
Synthèse du cours2 minutes
Synthèse de la spécialisation3 minutes

1 devoir de programmationTotal 60 minutes

Compléter l'étude des paramètres60 minutes

Instructeurs

Évaluations de l’enseignant

4.8 (112 évaluations)

Martha White

University of Alberta

4 Cours99 236 apprenants

Adam White

University of Alberta

4 Cours99 236 apprenants

Offert par

University of Alberta

Alberta Machine Intelligence Institute

Recommandé si vous êtes intéressé(e) par Apprentissage automatique

UiPath
Flux de contrôle dans l'APR
Cours
The Hong Kong University of Science and Technology
Mathématiques pour les ingénieurs : Le cours de base
Cours
Sungkyunkwan University
Utiliser R pour la régression et l'apprentissage automatique dans l'investissement
Cours
DeepLearning.AI
Modèles, couches et fonctions de perte personnalisés avec TensorFlow
Cours

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018

’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020

’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021

’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Avis des étudiants

4.7

630 avis

5 stars
77,77 %
4 stars
16,03 %
3 stars
5,07 %
2 stars
0,63 %
1 star
0,47 %

Affichage de 3 sur 630

Révisé le 10 juil. 2020

Strongly recommend this course to others. The project could be a little more challenging though. Thanks, Martha, Adam, and RAs, for your good teaching!

Révisé le 31 mai 2020

Matha and Adam, thank you again. I will try to apply what I learned here to my own work, a content recommendation system based on deep learning and reinforcement learning.

Révisé le 27 avr. 2020

This is the final chapter. It is one of the easiest and it was fun doing that lunar landing project. This specialisation is the best for a person taking baby steps in the reinforcement learning.

Voir plus d’avis

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Découvrir les diplômes

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions

L'accès aux cours et aux devoirs dépend de votre type d'inscription. Si vous suivez un cours en mode audit, vous pourrez consulter gratuitement la plupart des supports de cours. Pour accéder aux devoirs notés et obtenir un certificat, vous devrez acheter l'expérience de certificat, pendant ou après votre audit. Si vous ne voyez pas l'option d'audit :

Il se peut que le cours ne propose pas d'option d'audit. Vous pouvez essayer un essai gratuit ou demander une aide financière.
Le cours peut proposer l'option "Cours complet, pas de certificat" à la place. Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.

Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la Specializations, et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page de réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn. Si vous souhaitez uniquement lire et visualiser le contenu du cours, vous pouvez auditer le cours gratuitement.

Si vous vous êtes abonné, vous bénéficiez d'une période d'essai gratuite de 7 jours pendant laquelle vous pouvez annuler votre abonnement sans pénalité. Après cette période, nous ne remboursons pas, mais vous pouvez résilier votre abonnement à tout moment. Consultez notre politique de remboursement complète.