Dans ce dernier cours, vous rassemblerez vos connaissances des cours 1, 2 et 3 pour mettre en œuvre une solution RL complète à un problème. Ce projet vous permettra de voir comment chaque composant - formulation du problème, sélection de l'algorithme, sélection des paramètres et conception de la représentation - s'intègre dans une solution complète, et comment faire des choix appropriés lors du déploiement du RL dans le monde réel. Ce projet vous demandera d'implémenter à la fois l'environnement pour stimuler votre problème et un agent de contrôle avec une approximation de fonction de réseau neuronal. En outre, vous mènerez une étude scientifique de votre système d'apprentissage afin de développer votre capacité à évaluer la robustesse des agents RL. Pour utiliser le RL dans le monde réel, il est essentiel de (a) formaliser correctement le problème en tant que MDP, (b) sélectionner les algorithmes appropriés, (c) identifier les choix dans votre implémentation qui auront un impact important sur la performance et (d) valider le comportement attendu de vos algorithmes. Ce cours est utile pour tous ceux qui prévoient d'utiliser le RL pour résoudre des problèmes réels. Pour réussir ce cours, vous devrez avoir suivi les cours 1, 2 et 3 de cette Specializations ou l'équivalent. A la fin de ce cours, vous serez en mesure de :
Un système complet d'apprentissage par renforcement (Capstone)
Ce cours fait partie de Spécialisation Apprentissage par renforcement
Instructeurs : Martha White
22 180 déjà inscrits
Inclus avec
(630 avis)
Expérience recommandée
Compétences que vous acquerrez
- Catégorie : Approximation des fonctions
- Catégorie : Intelligence artificielle (IA)
- Catégorie : Apprentissage par renforcement
- Catégorie : Apprentissage automatique
- Catégorie : Systèmes intelligents
Détails à connaître
Ajouter à votre profil LinkedIn
2 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées
Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable
Obtenez un certificat professionnel
Ajoutez cette qualification à votre profil LinkedIn ou à votre CV
Partagez-le sur les réseaux sociaux et dans votre évaluation de performance
Il y a 6 modules dans ce cours
Bienvenue au dernier cours de synthèse de la Specialization Reinforcement Learning ! !!
Inclus
2 vidéos2 lectures1 sujet de discussion
Cette semaine, vous lirez une description d'un problème et la traduirez en un PDM. Vous compléterez le code squelette pour cet environnement, afin d'obtenir un PDM complet à utiliser dans ce projet de fin d'études.
Inclus
4 vidéos1 devoir de programmation
Cette semaine, vous choisirez parmi trois algorithmes, afin d'apprendre une politique pour l'environnement. Vous réfléchirez et discuterez de la pertinence de chaque algorithme pour cet environnement.
Inclus
7 vidéos1 devoir
Cette semaine, vous identifierez les paramètres clés qui affectent les performances de votre agent. L'objectif est de comprendre l'espace des options, pour vous permettre ensuite de choisir le paramètre que vous étudierez en profondeur pour votre agent.
Inclus
4 vidéos1 devoir
Cette semaine, vous mettrez en œuvre votre agent en utilisant Expected Sarsa ou Q-learning avec RMSProp et des réseaux neuronaux. Pour utiliser les réseaux neuronaux, vous devrez utiliser une stratégie de sélection de taille de pas plus prudente, c'est pourquoi vous utiliserez RMSProp. Vous vérifierez également l'exactitude de votre agent.
Inclus
6 vidéos1 devoir de programmation
Cette semaine, vous identifierez un paramètre à étudier pour votre agent. Une fois que vous aurez sélectionné le paramètre à étudier, nous vous fournirons une fourchette de valeurs et des valeurs spécifiques pour d'autres paramètres. Vous écrirez un script pour faire fonctionner votre agent et votre environnement sur l'ensemble des paramètres, afin de déterminer les performances en fonction de ces paramètres. Vous aurez une idée de l'impact des paramètres sur les performances de l'agent. Vous pourrez également visualiser les agents que vous aurez appris. Votre étude des paramètres consistera en un tableau de valeurs dont nous vérifierons l'exactitude.
Inclus
6 vidéos1 devoir de programmation
Instructeurs
Recommandé si vous êtes intéressé(e) par Apprentissage automatique
The Hong Kong University of Science and Technology
Sungkyunkwan University
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Avis des étudiants
630 avis
- 5 stars
77,77 %
- 4 stars
16,03 %
- 3 stars
5,07 %
- 2 stars
0,63 %
- 1 star
0,47 %
Affichage de 3 sur 630
Révisé le 10 juil. 2020
Strongly recommend this course to others. The project could be a little more challenging though. Thanks, Martha, Adam, and RAs, for your good teaching!
Révisé le 31 mai 2020
Matha and Adam, thank you again. I will try to apply what I learned here to my own work, a content recommendation system based on deep learning and reinforcement learning.
Révisé le 27 avr. 2020
This is the final chapter. It is one of the easiest and it was fun doing that lunar landing project. This specialisation is the best for a person taking baby steps in the reinforcement learning.
Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
L'accès aux cours et aux devoirs dépend de votre type d'inscription. Si vous suivez un cours en mode audit, vous pourrez consulter gratuitement la plupart des supports de cours. Pour accéder aux devoirs notés et obtenir un certificat, vous devrez acheter l'expérience de certificat, pendant ou après votre audit. Si vous ne voyez pas l'option d'audit :
Il se peut que le cours ne propose pas d'option d'audit. Vous pouvez essayer un essai gratuit ou demander une aide financière.
Le cours peut proposer l'option "Cours complet, pas de certificat" à la place. Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la Specializations, et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page de réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn. Si vous souhaitez uniquement lire et visualiser le contenu du cours, vous pouvez auditer le cours gratuitement.
Si vous vous êtes abonné, vous bénéficiez d'une période d'essai gratuite de 7 jours pendant laquelle vous pouvez annuler votre abonnement sans pénalité. Après cette période, nous ne remboursons pas, mais vous pouvez résilier votre abonnement à tout moment. Consultez notre politique de remboursement complète.