Schenken Sie Ihrer Karriere Coursera Plus mit einem Rabatt von $160 , der jährlich abgerechnet wird. Sparen Sie heute.

University of California, Davis

Verteiltes Rechnen mit Spark SQL

Brooke Wenig
Conor Murphy

Dozenten: Brooke Wenig

49.096 bereits angemeldet

Enthalten inCoursera Plus

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
4.4

(687 Bewertungen)

Stufe Mittel
Einige einschlägige Kenntnisse erforderlich
Flexibler Zeitplan
Ca. 8 Stunden
In Ihrem eigenen Lerntempo lernen
86%
Den meisten Lernenden gefiel dieser Kurs
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
4.4

(687 Bewertungen)

Stufe Mittel
Einige einschlägige Kenntnisse erforderlich
Flexibler Zeitplan
Ca. 8 Stunden
In Ihrem eigenen Lerntempo lernen
86%
Den meisten Lernenden gefiel dieser Kurs

Was Sie lernen werden

  • Verwenden Sie den kollaborativen Databricks-Arbeitsbereich, um skalierbaren Spark SQL-Code zu schreiben, der auf einem Cluster von Rechnern ausgeführt wird

  • Inspizieren Sie die Spark-Benutzeroberfläche, um die Abfrageleistung zu analysieren und Engpässe zu identifizieren

  • Erstellen Sie eine End-to-End-Pipeline, die Daten liest, sie umwandelt und das Ergebnis speichert

  • Bauen Sie eine Medaillon (Bronze, Silber, Gold) Lakehouse-Architektur mit Delta Lake auf, um die Zuverlässigkeit, Skalierbarkeit und Leistung Ihrer Daten zu gewährleisten

Kompetenzen, die Sie erwerben

  • Kategorie: Datenverarbeitung
  • Kategorie: SQL
  • Kategorie: Apache Spark
  • Kategorie: Deltasee

Wichtige Details

Erwerben Sie ein Karrierezertifikat.

Zu Ihrem LinkedIn-Profil hinzufügen

Bewertungen

4 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Platzhalter

Erweitern Sie Ihre Fachkenntnisse

Dieser Kurs ist Teil der Spezialisierung Spezialisierung Lernen Sie SQL-Grundlagen für Data Science
Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.
  • Lernen Sie neue Konzepte von Branchenexperten
  • Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
  • Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
  • Erwerben Sie ein Berufszertifikat zur Vorlage
Platzhalter
Platzhalter

Erwerben Sie ein Karrierezertifikat.

Fügen Sie diese Qualifikation zur Ihrem LinkedIn-Profil oder Ihrem Lebenslauf hinzu.

Teilen Sie es in den sozialen Medien und in Ihrer Leistungsbeurteilung.

Platzhalter

In diesem Kurs gibt es 4 Module

In diesem Modul werden Sie in der Lage sein, die Kernkonzepte des verteilten Rechnens zu diskutieren und zu erkennen, wann und wo sie anzuwenden sind. Sie werden in der Lage sein, die grundlegende Datenstruktur von Apache Spark™, bekannt als DataFrame, zu identifizieren. Außerdem werden Sie den kollaborativen Databricks-Arbeitsbereich überprüfen.

Das ist alles enthalten

6 Videos3 Lektüren1 Aufgabe1 Diskussionsthema

In diesem Modul werden Sie in der Lage sein, die Kernkonzepte von Spark zu erklären. Wir besprechen gängige Möglichkeiten zur Steigerung der Abfrageleistung durch Zwischenspeichern von Daten und Ändern von Spark-Konfigurationen. Wir werden auch die Spark-Benutzeroberfläche überprüfen, um die Leistung zu analysieren und Engpässe zu identifizieren, sowie Abfragen mit Adaptive Query Execution zu optimieren.

Das ist alles enthalten

6 Videos1 Lektüre1 Aufgabe

In diesem Modul werden Sie in der Lage sein, die allgemeinen Anforderungen von Datenanwendungen zu erkennen und zu diskutieren. Sie werden in der Lage sein, Daten in einer Vielzahl von Formaten zu prüfen und die Kompromisse zwischen diesen Formaten zu vergleichen und gegenüberzustellen. Sie werden halbstrukturierte JSON-Daten (die in Big-Data-Umgebungen üblich sind) sowie Schemata und paralleles Schreiben von Daten erforschen und untersuchen. Sie werden in der Lage sein, eine End-to-End-Pipeline zu verstehen, die Daten liest, sie umwandelt und das Ergebnis speichert.

Das ist alles enthalten

7 Videos1 Lektüre1 Aufgabe

In diesem Modul werden Sie die wichtigsten Merkmale von Data Lakes, Data Warehouses und Lakehouses kennenlernen. Lakehouses kombinieren die Skalierbarkeit und kostengünstige Speicherung von Data Lakes mit der Geschwindigkeit und den ACID-Transaktionsgarantien von Data Warehouses. Sie werden ein produktionsreifes Lakehouse in Kombination mit Spark in einem Open Source-Projekt, Delta Lake, untersuchen. Wer behauptet, Zeitreisen seien nicht möglich, war noch nie in einem Lakehouse!

Das ist alles enthalten

8 Videos1 Lektüre1 Aufgabe1 Diskussionsthema

Dozenten

Lehrkraftbewertungen
4.6 (151 Bewertungen)
Brooke Wenig
University of California, Davis
1 Kurs49.096 Lernende

von

Empfohlen, wenn Sie sich für Datenanalyse interessieren

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.
Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“
Jennifer J.
Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“
Larry W.
Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“
Chaitanya A.
„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Bewertungen von Lernenden

Zeigt 3 von 687

4.4

687 Bewertungen

  • 5 stars

    64,38 %

  • 4 stars

    23,11 %

  • 3 stars

    6,39 %

  • 2 stars

    2,32 %

  • 1 star

    3,77 %

SK
5

Geprüft am 12. Juni 2022

WO
5

Geprüft am 20. Nov. 2021

KS
5

Geprüft am 13. Mai 2020

Platzhalter

Neue Karrieremöglichkeiten mit Coursera Plus

Unbegrenzter Zugang zu über 7.000 erstklassigen Kursen, praktischen Projekten und Zertifikatsprogrammen, die Sie auf den Beruf vorbereiten – alles in Ihrem Abonnement enthalten

Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.

Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online

Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.

Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.

Häufig gestellte Fragen