Reinforcement Learning ist ein Teilbereich des maschinellen Lernens, aber auch ein allgemeiner Formalismus für automatisierte Entscheidungsfindung und KI. Dieser Kurs führt Sie in statistische Lerntechniken ein, bei denen ein Agent explizit Aktionen ausführt und mit der Welt interagiert. Das Verständnis der Bedeutung und der Herausforderungen von Lernagenten, die Entscheidungen treffen, ist heute von entscheidender Bedeutung, da immer mehr Unternehmen an interaktiven Agenten und intelligenten Entscheidungen interessiert sind.
Grundlagen des Reinforcement Learning
Dieser Kurs ist Teil von Spezialisierung Reinforcement Learning
Dozenten: Martha White
93.878 bereits angemeldet
Bei enthalten
(2,783 Bewertungen)
Empfohlene Erfahrung
Was Sie lernen werden
Formalisieren Sie Probleme als Markov-Entscheidungsprozesse
Verstehen Sie die grundlegenden Explorationsmethoden und den Kompromiss zwischen Exploration und Ausbeutung
Wertfunktionen als Allzweckwerkzeug für optimale Entscheidungen verstehen
Wissen, wie man dynamische Programmierung als effizienten Lösungsansatz für ein industrielles Steuerungsproblem einsetzt
Kompetenzen, die Sie erwerben
- Kategorie: Funktion Approximation
- Kategorie: Künstliche Intelligenz (KI)
- Kategorie: Reinforcement Learning
- Kategorie: Maschinelles Lernen
- Kategorie: Intelligente Systeme
Wichtige Details
Zu Ihrem LinkedIn-Profil hinzufügen
5 Aufgaben
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.
Erweitern Sie Ihre Fachkenntnisse
- Lernen Sie neue Konzepte von Branchenexperten
- Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
- Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
- Erwerben Sie ein Berufszertifikat zur Vorlage
Erwerben Sie ein Karrierezertifikat.
Fügen Sie diese Qualifikation zur Ihrem LinkedIn-Profil oder Ihrem Lebenslauf hinzu.
Teilen Sie es in den sozialen Medien und in Ihrer Leistungsbeurteilung.
In diesem Kurs gibt es 5 Module
Willkommen bei: Grundlagen des Verstärkungslernens, dem ersten Kurs einer vierteiligen Specialization über Verstärkungslernen, die von der University of Alberta, Onlea und Coursera angeboten wird. In diesem Vorbereitungsmodul lernen Sie Ihre Dozenten kennen, erhalten einen Vorgeschmack auf das, was Sie in diesem Kurs erwartet, und erhalten einen detaillierten Fahrplan, um Ihre Reise durch diese Spezialisierung so reibungslos wie möglich zu gestalten.
Das ist alles enthalten
4 Videos2 Lektüren1 Diskussionsthema
In der ersten Woche dieses Kurses werden Sie lernen, den Kompromiss zwischen Exploration und Ausbeutung bei sequentiellen Entscheidungen zu verstehen, inkrementelle Algorithmen zur Schätzung von Aktionswerten zu implementieren und die Stärken und Schwächen verschiedener Algorithmen zur Exploration zu vergleichen. Für die benotete Bewertung in dieser Woche werden Sie einen Epsilon-Greedy-Agenten implementieren und testen.
Das ist alles enthalten
8 Videos3 Lektüren1 Aufgabe1 Programmieraufgabe1 Diskussionsthema2 Plug-ins
Wenn Sie in der Industrie mit einem Problem konfrontiert werden, besteht der erste und wichtigste Schritt darin, dieses Problem in einen Markov Decision Process (MDP) zu übersetzen. Die Qualität Ihrer Lösung hängt stark davon ab, wie gut Sie diese Übersetzung durchführen. In dieser Woche werden Sie die Definition von MDPs kennenlernen, Sie werden verstehen, wie zielgerichtetes Verhalten aus der Maximierung skalarer Belohnungen resultiert und Sie werden auch den Unterschied zwischen episodischen und kontinuierlichen Aufgaben verstehen. Für die benotete Bewertung in dieser Woche werden Sie drei eigene Beispielaufgaben erstellen, die in den MDP-Rahmen passen.
Das ist alles enthalten
7 Videos2 Lektüren1 Aufgabe1 peer review1 Diskussionsthema
Sobald das Problem als MDP formuliert ist, ist die Suche nach der optimalen Strategie effizienter, wenn Wertfunktionen verwendet werden. In dieser Woche lernen Sie die Definition von Strategien und Wertfunktionen sowie die Bellman-Gleichungen kennen, die Schlüsseltechnologie, die alle unsere Algorithmen verwenden werden.
Das ist alles enthalten
9 Videos3 Lektüren2 Aufgaben1 Diskussionsthema
In dieser Woche werden Sie lernen, wie Sie Wertfunktionen und optimale Strategien berechnen können, vorausgesetzt, Sie haben das MDP-Modell. Sie werden die dynamische Programmierung implementieren, um Wertfunktionen und optimale Strategien zu berechnen und den Nutzen der dynamischen Programmierung für industrielle Anwendungen und Probleme zu verstehen. Außerdem lernen Sie die Generalized Policy Iteration als gängige Vorlage für die Konstruktion von Algorithmen zur Maximierung der Belohnung kennen. Für die benotete Bewertung in dieser Woche werden Sie einen effizienten Agenten der dynamischen Programmierung für ein simuliertes industrielles Steuerungsproblem implementieren.
Das ist alles enthalten
10 Videos3 Lektüren1 Aufgabe1 Programmieraufgabe1 Diskussionsthema
Dozenten
Empfohlen, wenn Sie sich für Maschinelles Lernen interessieren
University of Alberta
Columbia University
New York University
University of Alberta
Warum entscheiden sich Menschen für Coursera für ihre Karriere?
Bewertungen von Lernenden
2.783 Bewertungen
- 5 stars
81,69 %
- 4 stars
14,57 %
- 3 stars
2,54 %
- 2 stars
0,43 %
- 1 star
0,75 %
Zeigt 3 von 2783 an
Geprüft am 1. Juli 2021
This course is great for people who are just starting out. The programming assignments are really great and practically introduce you to the basic concepts of reinforcement learning.
Geprüft am 11. Apr. 2024
The concepts may sound confusing in the beginning, but as you go forward you find it interesting and understanding. I suggest you completely read the reading assignments before watching the videos.
Geprüft am 24. Juni 2020
c
Neue Karrieremöglichkeiten mit Coursera Plus
Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.
Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.
Häufig gestellte Fragen
Der Zugang zu Vorlesungen und Aufgaben hängt von der Art Ihrer Einschreibung ab. Wenn Sie einen Kurs im Prüfungsmodus belegen, können Sie die meisten Kursmaterialien kostenlos einsehen. Um auf benotete Aufgaben zuzugreifen und ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung während oder nach Ihrer Prüfung erwerben. Wenn Sie die Prüfungsoption nicht sehen:
Der Kurs bietet möglicherweise keine Prüfungsoption. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen.
Der Kurs bietet möglicherweise stattdessen die Option 'Vollständiger Kurs, kein Zertifikat'. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.
Wenn Sie sich für den Kurs einschreiben, erhalten Sie Zugang zu allen Kursen der Specializations, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Ihr elektronisches Zertifikat wird Ihrer Erfolgsseite hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder zu Ihrem LinkedIn-Profil hinzufügen. Wenn Sie die Kursinhalte nur lesen und ansehen möchten, können Sie den Kurs kostenlos besuchen.
Wenn Sie ein Abonnement abgeschlossen haben, erhalten Sie eine kostenlose 7-tägige Testphase, in der Sie kostenlos kündigen können. Danach gewähren wir keine Rückerstattung, aber Sie können Ihr Abonnement jederzeit kündigen. Siehe unsere vollständigen Rückerstattungsbedingungen.