École Polytechnique Fédérale de Lausanne
Big Data-Analyse mit Scala und Spark (Version Scala 2)
École Polytechnique Fédérale de Lausanne

Big Data-Analyse mit Scala und Spark (Version Scala 2)

2.275 bereits angemeldet

Bei Coursera Plus enthalten

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Mittel
Einige einschlägige Kenntnisse erforderlich
Es dauert 27 Stunden
3 Wochen bei 9 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Mittel
Einige einschlägige Kenntnisse erforderlich
Es dauert 27 Stunden
3 Wochen bei 9 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Kompetenzen, die Sie erwerben

  • Kategorie: Scala Programmierung
  • Kategorie: Big Data
  • Kategorie: SQL
  • Kategorie: Apache Spark

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Platzhalter
Platzhalter

Erwerben Sie ein Karrierezertifikat.

Fügen Sie diese Qualifikation zur Ihrem LinkedIn-Profil oder Ihrem Lebenslauf hinzu.

Teilen Sie es in den sozialen Medien und in Ihrer Leistungsbeurteilung.

Platzhalter

In diesem Kurs gibt es 4 Module

Machen Sie sich mit Scala auf Ihrem Computer vertraut. Erledigen Sie eine Beispielaufgabe, um sich mit unserer einzigartigen Art und Weise, Aufgaben einzureichen, vertraut zu machen. In dieser Woche schlagen wir eine Brücke zwischen der Datenparallelität im Szenario des gemeinsamen Speichers (gelernt im Kurs Parallele Programmierung, Voraussetzung) und dem verteilten Szenario. Wir befassen uns mit wichtigen Problemen, die in verteilten Systemen auftreten, wie Latenz und Ausfall. Anschließend werden wir uns mit den Grundlagen von Spark beschäftigen, einem funktionsorientierten Framework für die Verarbeitung großer Datenmengen in Scala. Zum Abschluss der ersten Woche üben wir, was wir über Spark gelernt haben, indem wir uns sofort die Hände schmutzig machen und einen realen Datensatz analysieren.

Das ist alles enthalten

7 Videos6 Lektüren3 Programmieraufgaben

Diese Woche befassen wir uns mit einer speziellen Art von RDD, den sogenannten Paar-RDDs. Mit dieser speziellen Art von RDDs in der Hand werden wir wesentliche Operationen mit großen Datensätzen, wie Reduktionen und Joins, behandeln.

Das ist alles enthalten

4 Videos2 Programmieraufgaben

Diese Woche befassen wir uns mit den Auswirkungen der Verwendung von Operationen wie Joins auf die Leistung. Ist es möglich, das gleiche Ergebnis zu erzielen, ohne für den Overhead der Datenübertragung über das Netzwerk zu bezahlen? Wir werden diese Frage beantworten, indem wir untersuchen, wie wir unsere Daten partitionieren können, um eine bessere Datenlokalisierung zu erreichen und so einige unserer Spark-Jobs zu optimieren.

Das ist alles enthalten

4 Videos

Mit unserem neu gewonnenen Verständnis für die Kosten der Datenbewegung in einem Spark-Auftrag und einigen Erfahrungen mit der Optimierung von Aufträgen für die Datenlokalität in der letzten Woche, werden wir uns diese Woche darauf konzentrieren, wie wir ähnliche Optimierungen einfacher erreichen können. Können uns strukturierte Daten helfen? Wir werden uns Spark SQL und seinen leistungsstarken Optimierer ansehen, der die Struktur nutzt, um beeindruckende Optimierungen durchzuführen. Anschließend werden wir uns mit DataFrames und Datasets beschäftigen, die uns eine Möglichkeit bieten, RDDs mit den leistungsstarken automatischen Optimierungen hinter Spark SQL zu kombinieren.

Das ist alles enthalten

5 Videos2 Programmieraufgaben

Dozent

Prof. Heather Miller
École Polytechnique Fédérale de Lausanne
2 Kurse102.373 Lernende

Empfohlen, wenn Sie sich für Algorithmen interessieren

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.
Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“
Jennifer J.
Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“
Larry W.
Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“
Chaitanya A.
„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“
Platzhalter

Neue Karrieremöglichkeiten mit Coursera Plus

Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten

Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.

Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online

Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.

Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.

Häufig gestellte Fragen