University of Alberta
Grundlagen des Reinforcement Learning
University of Alberta

Grundlagen des Reinforcement Learning

Martha White
Adam White

Dozenten: Martha White

93.878 bereits angemeldet

Bei Coursera Plus enthalten

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
4.8

(2,783 Bewertungen)

Stufe Mittel

Empfohlene Erfahrung

Flexibler Zeitplan
Ca. 15 Stunden
In Ihrem eigenen Lerntempo lernen
92%
Den meisten Lernenden hat dieser Kurs gefallen
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
4.8

(2,783 Bewertungen)

Stufe Mittel

Empfohlene Erfahrung

Flexibler Zeitplan
Ca. 15 Stunden
In Ihrem eigenen Lerntempo lernen
92%
Den meisten Lernenden hat dieser Kurs gefallen

Was Sie lernen werden

  • Formalisieren Sie Probleme als Markov-Entscheidungsprozesse

  • Verstehen Sie die grundlegenden Explorationsmethoden und den Kompromiss zwischen Exploration und Ausbeutung

  • Wertfunktionen als Allzweckwerkzeug für optimale Entscheidungen verstehen

  • Wissen, wie man dynamische Programmierung als effizienten Lösungsansatz für ein industrielles Steuerungsproblem einsetzt

Kompetenzen, die Sie erwerben

  • Kategorie: Funktion Approximation
  • Kategorie: Künstliche Intelligenz (KI)
  • Kategorie: Reinforcement Learning
  • Kategorie: Maschinelles Lernen
  • Kategorie: Intelligente Systeme

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Bewertungen

5 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Platzhalter

Erweitern Sie Ihre Fachkenntnisse

Dieser Kurs ist Teil der Spezialisierung Spezialisierung Reinforcement Learning
Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.
  • Lernen Sie neue Konzepte von Branchenexperten
  • Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
  • Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
  • Erwerben Sie ein Berufszertifikat zur Vorlage
Platzhalter
Platzhalter

Erwerben Sie ein Karrierezertifikat.

Fügen Sie diese Qualifikation zur Ihrem LinkedIn-Profil oder Ihrem Lebenslauf hinzu.

Teilen Sie es in den sozialen Medien und in Ihrer Leistungsbeurteilung.

Platzhalter

In diesem Kurs gibt es 5 Module

Willkommen bei: Grundlagen des Verstärkungslernens, dem ersten Kurs einer vierteiligen Specialization über Verstärkungslernen, die von der University of Alberta, Onlea und Coursera angeboten wird. In diesem Vorbereitungsmodul lernen Sie Ihre Dozenten kennen, erhalten einen Vorgeschmack auf das, was Sie in diesem Kurs erwartet, und erhalten einen detaillierten Fahrplan, um Ihre Reise durch diese Spezialisierung so reibungslos wie möglich zu gestalten.

Das ist alles enthalten

4 Videos2 Lektüren1 Diskussionsthema

In der ersten Woche dieses Kurses werden Sie lernen, den Kompromiss zwischen Exploration und Ausbeutung bei sequentiellen Entscheidungen zu verstehen, inkrementelle Algorithmen zur Schätzung von Aktionswerten zu implementieren und die Stärken und Schwächen verschiedener Algorithmen zur Exploration zu vergleichen. Für die benotete Bewertung in dieser Woche werden Sie einen Epsilon-Greedy-Agenten implementieren und testen.

Das ist alles enthalten

8 Videos3 Lektüren1 Aufgabe1 Programmieraufgabe1 Diskussionsthema2 Plug-ins

Wenn Sie in der Industrie mit einem Problem konfrontiert werden, besteht der erste und wichtigste Schritt darin, dieses Problem in einen Markov Decision Process (MDP) zu übersetzen. Die Qualität Ihrer Lösung hängt stark davon ab, wie gut Sie diese Übersetzung durchführen. In dieser Woche werden Sie die Definition von MDPs kennenlernen, Sie werden verstehen, wie zielgerichtetes Verhalten aus der Maximierung skalarer Belohnungen resultiert und Sie werden auch den Unterschied zwischen episodischen und kontinuierlichen Aufgaben verstehen. Für die benotete Bewertung in dieser Woche werden Sie drei eigene Beispielaufgaben erstellen, die in den MDP-Rahmen passen.

Das ist alles enthalten

7 Videos2 Lektüren1 Aufgabe1 peer review1 Diskussionsthema

Sobald das Problem als MDP formuliert ist, ist die Suche nach der optimalen Strategie effizienter, wenn Wertfunktionen verwendet werden. In dieser Woche lernen Sie die Definition von Strategien und Wertfunktionen sowie die Bellman-Gleichungen kennen, die Schlüsseltechnologie, die alle unsere Algorithmen verwenden werden.

Das ist alles enthalten

9 Videos3 Lektüren2 Aufgaben1 Diskussionsthema

In dieser Woche werden Sie lernen, wie Sie Wertfunktionen und optimale Strategien berechnen können, vorausgesetzt, Sie haben das MDP-Modell. Sie werden die dynamische Programmierung implementieren, um Wertfunktionen und optimale Strategien zu berechnen und den Nutzen der dynamischen Programmierung für industrielle Anwendungen und Probleme zu verstehen. Außerdem lernen Sie die Generalized Policy Iteration als gängige Vorlage für die Konstruktion von Algorithmen zur Maximierung der Belohnung kennen. Für die benotete Bewertung in dieser Woche werden Sie einen effizienten Agenten der dynamischen Programmierung für ein simuliertes industrielles Steuerungsproblem implementieren.

Das ist alles enthalten

10 Videos3 Lektüren1 Aufgabe1 Programmieraufgabe1 Diskussionsthema

Dozenten

Lehrkraftbewertungen
4.7 (802 Bewertungen)
Martha White
University of Alberta
4 Kurse99.236 Lernende
Adam White
University of Alberta
4 Kurse99.236 Lernende

von

Empfohlen, wenn Sie sich für Maschinelles Lernen interessieren

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.
Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“
Jennifer J.
Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“
Larry W.
Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“
Chaitanya A.
„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Bewertungen von Lernenden

4.8

2.783 Bewertungen

  • 5 stars

    81,69 %

  • 4 stars

    14,57 %

  • 3 stars

    2,54 %

  • 2 stars

    0,43 %

  • 1 star

    0,75 %

Zeigt 3 von 2783 an

AM
5

Geprüft am 1. Juli 2021

MN
5

Geprüft am 11. Apr. 2024

SE
4

Geprüft am 24. Juni 2020

Platzhalter

Neue Karrieremöglichkeiten mit Coursera Plus

Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten

Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.

Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online

Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.

Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.

Häufig gestellte Fragen