In diesem Kurs dreht sich alles um Big Data. Er richtet sich an Studenten mit SQL-Erfahrung, die den nächsten Schritt auf ihrer Datenreise machen möchten, indem sie das verteilte Rechnen mit Apache Spark erlernen. Die Teilnehmer erhalten ein umfassendes Verständnis dieses Open-Source-Standards für die Arbeit mit großen Datenmengen. Die Teilnehmer lernen die Grundlagen der Datenanalyse mit SQL auf Spark kennen und legen damit den Grundstein für die Kombination von Daten mit fortgeschrittenen Analysen im großen Maßstab und in Produktionsumgebungen. Die vier Module bauen aufeinander auf und am Ende des Kurses werden Sie Folgendes verstehen: die Spark-Architektur, Abfragen innerhalb von Spark, gängige Möglichkeiten zur Optimierung von Spark-SQL und den Aufbau zuverlässiger Datenpipelines.
Verteiltes Rechnen mit Spark SQL
Dieser Kurs ist Teil von Spezialisierung Lernen Sie SQL-Grundlagen für Data Science
Unterrichtet auf Englisch
Einige Inhalte können nicht übersetzt werden
Dozenten: Brooke Wenig
48.263 bereits angemeldet
Bei enthalten
Kurs
(680 Bewertungen)
86%
Was Sie lernen werden
Verwenden Sie den kollaborativen Databricks-Arbeitsbereich, um skalierbaren Spark SQL-Code zu schreiben, der auf einem Cluster von Rechnern ausgeführt wird
Inspizieren Sie die Spark-Benutzeroberfläche, um die Abfrageleistung zu analysieren und Engpässe zu identifizieren
Erstellen Sie eine End-to-End-Pipeline, die Daten liest, sie umwandelt und das Ergebnis speichert
Bauen Sie eine Medaillon (Bronze, Silber, Gold) Lakehouse-Architektur mit Delta Lake auf, um die Zuverlässigkeit, Skalierbarkeit und Leistung Ihrer Daten zu gewährleisten
Kompetenzen, die Sie erwerben
- Kategorie: Datenverarbeitung
- Kategorie: SQL
- Kategorie: Apache Spark
- Kategorie: Deltasee
Wichtige Details
Zu Ihrem LinkedIn-Profil hinzufügen
8 Quizzes
Kurs
(680 Bewertungen)
86%
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.
Erweitern Sie Ihre Fachkenntnisse
- Lernen Sie neue Konzepte von Branchenexperten
- Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
- Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
- Erwerben Sie ein Berufszertifikat zur Vorlage
Erwerben Sie ein Karrierezertifikat.
Fügen Sie diese Qualifikation zur Ihrem LinkedIn-Profil oder Ihrem Lebenslauf hinzu.
Teilen Sie es in den sozialen Medien und in Ihrer Leistungsbeurteilung.
In diesem Kurs gibt es 4 Module
In diesem Modul werden Sie in der Lage sein, die Kernkonzepte des verteilten Rechnens zu erörtern und zu erkennen, wann und wo sie anzuwenden sind. Sie werden in der Lage sein, die grundlegende Datenstruktur von Apache Spark™ zu identifizieren, die als DataFrame bekannt ist. Außerdem werden Sie den kollaborativen Databricks-Arbeitsbereich verwenden und SQL-Code schreiben, der auf einem Cluster von Rechnern ausgeführt wird.
Das ist alles enthalten
6 Videos3 Lektüren2 Quizzes1 Diskussionsthema
In diesem Modul werden Sie in der Lage sein, die Kernkonzepte von Spark zu erklären. Sie lernen, wie Sie die Leistung von Abfragen durch das Zwischenspeichern von Daten und die Änderung von Spark-Konfigurationen verbessern können. Sie werden auch die Spark-Benutzeroberfläche verwenden, um die Leistung zu analysieren und Engpässe zu identifizieren sowie Abfragen mit Adaptive Query Execution zu optimieren.
Das ist alles enthalten
6 Videos2 Lektüren2 Quizzes
In diesem Modul werden Sie in der Lage sein, die allgemeinen Anforderungen von Datenanwendungen zu erkennen und zu diskutieren. Sie werden in der Lage sein, auf Daten in einer Vielzahl von Formaten zuzugreifen und die Kompromisse zwischen diesen Formaten zu vergleichen und gegenüberzustellen. Sie werden halbstrukturierte JSON-Daten (die in Big-Data-Umgebungen üblich sind) sowie Schemata und parallele Datenschreibvorgänge erkunden und untersuchen. Sie werden in der Lage sein, eine End-to-End-Pipeline zu erstellen, die Daten liest, umwandelt und das Ergebnis speichert.
Das ist alles enthalten
7 Videos2 Lektüren2 Quizzes
In diesem Modul werden Sie die wichtigsten Merkmale von Data Lakes, Data Warehouses und Lakehouses kennenlernen. Lakehouses kombinieren die Skalierbarkeit und kostengünstige Speicherung von Data Lakes mit der Geschwindigkeit und den ACID-Transaktionsgarantien von Data Warehouses. Sie werden ein produktionsreifes Lakehouse erstellen, indem Sie Spark mit dem Open-Source-Projekt Delta Lake kombinieren. Wer behauptet, Zeitreisen seien nicht möglich, war noch nie in einem Lakehouse!
Das ist alles enthalten
8 Videos2 Lektüren2 Quizzes1 peer review1 Diskussionsthema
Dozenten
Empfohlen, wenn Sie sich für Datenanalyse interessieren
Duke University
École Polytechnique Fédérale de Lausanne
Warum entscheiden sich Menschen für Coursera für ihre Karriere?
Bewertungen von Lernenden
Zeigt 3 von 680
680 Bewertungen
- 5 stars
64,56 %
- 4 stars
23,27 %
- 3 stars
6,44 %
- 2 stars
2,34 %
- 1 star
3,36 %
Geprüft am 20. Nov. 2021
Geprüft am 12. Juni 2022
Geprüft am 13. Mai 2020
Neue Karrieremöglichkeiten mit Coursera Plus
Unbegrenzter Zugang zu über 7.000 erstklassigen Kursen, praktischen Projekten und Zertifikatsprogrammen, die Sie auf den Beruf vorbereiten – alles in Ihrem Abonnement enthalten
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.
Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.
Häufig gestellte Fragen
Der Zugang zu Vorlesungen und Aufgaben hängt von der Art Ihrer Einschreibung ab. Wenn Sie einen Kurs im Prüfungsmodus belegen, können Sie die meisten Kursmaterialien kostenlos einsehen. Um auf benotete Aufgaben zuzugreifen und ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung während oder nach Ihrer Prüfung erwerben. Wenn Sie die Prüfungsoption nicht sehen:
Der Kurs bietet möglicherweise keine Prüfungsoption. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen.
Der Kurs bietet möglicherweise stattdessen die Option 'Vollständiger Kurs, kein Zertifikat'. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.
Wenn Sie sich für den Kurs einschreiben, erhalten Sie Zugang zu allen Kursen der Specializations, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Ihr elektronisches Zertifikat wird Ihrer Erfolgsseite hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder zu Ihrem LinkedIn-Profil hinzufügen. Wenn Sie die Kursinhalte nur lesen und ansehen möchten, können Sie den Kurs kostenlos besuchen.
Wenn Sie ein Abonnement abgeschlossen haben, erhalten Sie eine kostenlose 7-tägige Testphase, in der Sie kostenlos kündigen können. Danach gewähren wir keine Rückerstattung, aber Sie können Ihr Abonnement jederzeit kündigen. Siehe unsere vollständigen Rückerstattungsbedingungen.