University of Alberta
Vorhersage und Kontrolle mit Funktionsannäherung
University of Alberta

Vorhersage und Kontrolle mit Funktionsannäherung

Martha White
Adam White

Dozenten: Martha White

25.764 bereits angemeldet

Bei Coursera Plus enthalten

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
4.8

(820 Bewertungen)

Stufe Mittel

Empfohlene Erfahrung

Flexibler Zeitplan
Ca. 21 Stunden
In Ihrem eigenen Lerntempo lernen
90%
Den meisten Lernenden gefiel dieser Kurs
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
4.8

(820 Bewertungen)

Stufe Mittel

Empfohlene Erfahrung

Flexibler Zeitplan
Ca. 21 Stunden
In Ihrem eigenen Lerntempo lernen
90%
Den meisten Lernenden gefiel dieser Kurs

Kompetenzen, die Sie erwerben

  • Kategorie: Funktion Approximation
  • Kategorie: Künstliche Intelligenz (KI)
  • Kategorie: Reinforcement Learning
  • Kategorie: Maschinelles Lernen
  • Kategorie: Intelligente Systeme

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Bewertungen

4 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Platzhalter

Erweitern Sie Ihre Fachkenntnisse

Dieser Kurs ist Teil der Spezialisierung Spezialisierung Reinforcement Learning
Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.
  • Lernen Sie neue Konzepte von Branchenexperten
  • Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
  • Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
  • Erwerben Sie ein Berufszertifikat zur Vorlage
Platzhalter
Platzhalter

Erwerben Sie ein Karrierezertifikat.

Fügen Sie diese Qualifikation zur Ihrem LinkedIn-Profil oder Ihrem Lebenslauf hinzu.

Teilen Sie es in den sozialen Medien und in Ihrer Leistungsbeurteilung.

Platzhalter

In diesem Kurs gibt es 5 Module

Willkommen zum dritten Kurs der Reinforcement Learning Specialization: Prediction and Control with Function Approximation, der Ihnen von der University of Alberta, Onlea und Coursera angeboten wird. In diesem Modul zur Vorbereitung auf den Kurs lernen Sie Ihre Dozenten kennen und erhalten einen Vorgeschmack auf das, was der Kurs für Sie bereithält. Stellen Sie sich Ihren Mitschülern im Abschnitt "Meet and Greet" vor!

Das ist alles enthalten

2 Videos2 Lektüren1 Diskussionsthema

In dieser Woche werden Sie lernen, wie man eine Wertfunktion für eine gegebene Strategie schätzt, wenn die Anzahl der Zustände viel größer ist als der dem Agenten zur Verfügung stehende Speicher. Sie werden lernen, wie Sie eine parametrische Form der Wertfunktion angeben, wie Sie eine Zielfunktion spezifizieren und wie die Schätzung des Gradientenabstiegs verwendet werden kann, um Werte aus der Interaktion mit der Welt zu schätzen.

Das ist alles enthalten

13 Videos2 Lektüren1 Aufgabe1 Programmieraufgabe1 Diskussionsthema

Die Merkmale, die zur Konstruktion der Wertschätzungen des Agenten verwendet werden, sind vielleicht der wichtigste Teil eines erfolgreichen Lernsystems. In diesem Modul diskutieren wir zwei grundlegende Strategien für die Konstruktion von Merkmalen: (1) eine feste Basis, die eine erschöpfende Partition der Eingabe bildet, und (2) die Anpassung der Merkmale, während der Agent mit Hilfe von Neuronalen Netzen und Backpropagation mit der Welt interagiert. In der benoteten Aufgabe dieser Woche werden Sie eine einfache, aber unendliche Zustandsvorhersageaufgabe mit einem Neuronalen Netzwerk und TD-Lernen lösen.

Das ist alles enthalten

11 Videos2 Lektüren1 Aufgabe1 Programmieraufgabe1 Diskussionsthema

In dieser Woche werden Sie sehen, dass die Konzepte und Werkzeuge, die in den Modulen zwei und drei eingeführt wurden, eine unkomplizierte Erweiterung der klassischen TD-Kontrollmethoden auf die Funktionsapproximation ermöglichen. Insbesondere werden Sie lernen, wie Sie die optimale Strategie in MDPs mit unendlichen Zuständen finden können, indem Sie einfach Semi-Gradienten-TD-Methoden mit verallgemeinerter Iteration der Strategie kombinieren, was zu klassischen Kontrollmethoden wie Q-learning und Sarsa führt. Wir schließen mit einer Diskussion über eine neue Problemformulierung für RL - die durchschnittliche Belohnung -, die in Zukunft zweifellos in vielen Anwendungen von RL zum Einsatz kommen wird.

Das ist alles enthalten

7 Videos2 Lektüren1 Aufgabe1 Programmieraufgabe2 Diskussionsthemen

Jeder Algorithmus, den Sie bisher kennen gelernt haben, schätzt eine Wertfunktion als Zwischenschritt auf dem Weg zu einer optimalen Strategie. Eine alternative Strategie besteht darin, die Parameter der Strategie direkt zu lernen. In dieser Woche lernen Sie diese Policy-Gradienten-Methoden kennen und erfahren, welche Vorteile sie gegenüber wertfunktionsbasierten Methoden haben. Sie werden auch erfahren, wie Policy-Gradienten-Methoden verwendet werden können, um die optimale Strategie bei Aufgaben mit kontinuierlichen Zustands- und Aktionsräumen zu finden.

Das ist alles enthalten

11 Videos2 Lektüren1 Aufgabe1 Programmieraufgabe1 Diskussionsthema

Dozenten

Lehrkraftbewertungen
4.8 (107 Bewertungen)
Martha White
University of Alberta
4 Kurse97.887 Lernende
Adam White
University of Alberta
4 Kurse97.887 Lernende

von

Empfohlen, wenn Sie sich für Maschinelles Lernen interessieren

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.
Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“
Jennifer J.
Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“
Larry W.
Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“
Chaitanya A.
„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Bewertungen von Lernenden

Zeigt 3 von 820

4.8

820 Bewertungen

  • 5 stars

    84,54 %

  • 4 stars

    12,40 %

  • 3 stars

    1,94 %

  • 2 stars

    0,72 %

  • 1 star

    0,36 %

CP
5

Geprüft am 18. Jan. 2020

AP
4

Geprüft am 12. Apr. 2020

JF
5

Geprüft am 10. Juli 2020

Platzhalter

Neue Karrieremöglichkeiten mit Coursera Plus

Unbegrenzter Zugang zu über 7.000 erstklassigen Kursen, praktischen Projekten und Zertifikatsprogrammen, die Sie auf den Beruf vorbereiten – alles in Ihrem Abonnement enthalten

Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.

Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online

Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.

Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.

Häufig gestellte Fragen