Yonsei University

Big Data Aufstrebende Technologien

27.973 bereits angemeldet

Bei Coursera Plus enthalten

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
4.7

(286 Bewertungen)

Stufe Anfänger
Keine Vorkenntnisse erforderlich
Flexibler Zeitplan
Ca. 29 Stunden
In Ihrem eigenen Lerntempo lernen
94%
Den meisten Lernenden hat dieser Kurs gefallen
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
4.7

(286 Bewertungen)

Stufe Anfänger
Keine Vorkenntnisse erforderlich
Flexibler Zeitplan
Ca. 29 Stunden
In Ihrem eigenen Lerntempo lernen
94%
Den meisten Lernenden hat dieser Kurs gefallen

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Bewertungen

10 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Platzhalter

Erweitern Sie Ihre Fachkenntnisse

Dieser Kurs ist Teil der Spezialisierung Spezialisierung Aufkommende Technologien: Von Smartphones über IoT bis hin zu Big Data
Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.
  • Lernen Sie neue Konzepte von Branchenexperten
  • Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
  • Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
  • Erwerben Sie ein Berufszertifikat zur Vorlage
Platzhalter
Platzhalter

Erwerben Sie ein Karrierezertifikat.

Fügen Sie diese Qualifikation zur Ihrem LinkedIn-Profil oder Ihrem Lebenslauf hinzu.

Teilen Sie es in den sozialen Medien und in Ihrer Leistungsbeurteilung.

Platzhalter

In diesem Kurs gibt es 6 Module

Das erste Modul "Big Data Rankings & Products" befasst sich mit dem Verhältnis und den Marktanteilen von Big Data-Hardware, Software und professionellen Dienstleistungen. Diese Informationen geben Aufschluss darüber, wie Industrie, Produkte, Dienstleistungen, Schulen und Regierungsorganisationen in Zukunft von der Big-Data-Technologie beeinflusst werden. Um einen tieferen Einblick in die weltweit führenden Big-Data-Produkte und -Dienstleistungen zu erhalten, bietet der Vortrag einen Überblick über die wichtigsten Big-Data-Unternehmen, darunter IBM, SAP, Oracle, HPE, Splunk, Dell, Teradata, Microsoft, Cisco und AWS. Um die Leistungsfähigkeit der Big-Data-Technologie zu verstehen, wird der Unterschied zwischen der Big-Data-Analyse und der traditionellen Datenanalyse erläutert. Es folgt ein Vortrag über die 4 V großen Herausforderungen der Big Data-Technologie, die sich mit Fragen des Volumens, der Vielfalt, der Geschwindigkeit und der Wahrhaftigkeit der massiven Daten beschäftigen. Auf der Grundlage dieser einführenden Informationen wird die Big-Data-Technologie vorgestellt, die von Wal-Mart, Amazon und Citibank eingesetzt wird, um globale Erkenntnisse über Investitionen zu gewinnen, neue Geschäfte und Fabriken zu finden und Empfehlungssysteme in Echtzeit zu betreiben.

Das ist alles enthalten

6 Videos2 Aufgaben

Das zweite Modul "Big Data & Hadoop" befasst sich mit den Eigenschaften und der Funktionsweise von Hadoop, dem ursprünglichen Big-Data-System, das von Google verwendet wurde. Die Vorlesungen erklären die Funktionsweise von MapReduce, HDFS (Hadoop Distributed FileSystem) und die Verarbeitung von Datenblöcken. Diese Funktionen werden auf einem Cluster von Knoten ausgeführt, denen die Rolle von NameNode oder DataNode zugewiesen ist, wobei die Datenverarbeitung von den in den Vorlesungen erläuterten JobTrackern und TaskTrackern durchgeführt wird. Darüber hinaus werden die Merkmale der Metadatentypen und die Unterschiede in den Datenanalyseprozessen von Hadoop und SQL (Structured Query Language) erläutert. Dann wird die Hadoop Release Series vorgestellt, zu der auch die Beschreibungen von Hadoop YARN (Yet Another Resource Negotiator), HDFS Federation und HDFS HA (High Availability) Big Data Technologie gehören.

Das ist alles enthalten

8 Videos2 Aufgaben

Das dritte Modul "Spark" konzentriert sich auf die Operationen und Eigenschaften von Spark, der derzeit beliebtesten Big-Data-Technologie der Welt. Der Vortrag behandelt zunächst die Unterschiede in den Datenanalyseeigenschaften von Spark und Hadoop und geht dann auf die Funktionen der Spark Big Data-Verarbeitung ein, die auf den Kerneinheiten RDD (Resilient Distributed Datasets), Spark Core, Spark SQL, Spark Streaming, MLlib (Machine Learning Library) und GraphX basieren. Es werden Details zu den Funktionen von Spark DAG (Directed Acyclic Graph) Stufen und Pipeline-Prozessen erläutert, die auf der Grundlage von Spark-Transformationen und -Aktionen gebildet werden. Insbesondere werden die Definition und die Vorteile von Lazy-Transformationen und DAG-Operationen beschrieben sowie die Merkmale von Spark-Variablen und Serialisierung. Darüber hinaus wird der Prozess der Spark-Cluster-Operationen auf der Grundlage von Mesos, Standalone und YARN vorgestellt.

Das ist alles enthalten

11 Videos2 Aufgaben

Das vierte Modul "Spark ML & Streaming" befasst sich mit der Funktionsweise von Spark ML (Machine Learning) und der Durchführung von Spark Streaming-Operationen. Zu den Spark ML-Algorithmen gehören Featurisierung, Pipelines, Persistenz und Dienstprogramme, die mit RDDs (Resilient Distributed Datasets) arbeiten, um Informationen aus riesigen Datensätzen zu extrahieren. In den Vorlesungen werden die Merkmale der DataFrame-basierten API erläutert, die die primäre ML-API im spark.ml-Paket ist. Zunächst werden die grundlegenden statistischen Algorithmen von Spark ML vorgestellt, die auf Korrelation und Hypothesentests (P-Wert) basieren, gefolgt von den Klassifizierungs- und Regressionsalgorithmen von Spark ML, die auf linearen Modellen, Naive Bayes und Entscheidungsbaumtechniken basieren. Dann werden die Merkmale von Spark Streaming, Streaming-Eingabe und -Ausgabe sowie die Streaming-Empfängertypen (einschließlich Basis, benutzerdefiniert und erweitert) erläutert, gefolgt von der Frage, wie der Spark Streaming-Prozess und DStream (Discretized Stream) Big Data Streaming-Operationen für Echtzeit- und echtzeitnahe Anwendungen ermöglichen.

Das ist alles enthalten

4 Videos2 Aufgaben

Das fünfte Modul "Storm" konzentriert sich auf die Eigenschaften und den Betrieb von Storm Big Data-Systemen. Der Vortrag behandelt zunächst die Unterschiede in den Datenanalyseeigenschaften von Storm, Spark und der Hadoop-Technologie. Dann werden die Merkmale der Storm Big Data-Verarbeitung auf der Grundlage von Nimbus, Spouts und Bolts beschrieben, gefolgt von den Details zu Storm Streams, Supervisor und ZooKeeper. Weitere Einzelheiten zu den zuverlässigen und unzuverlässigen Spouts und Bolts von Storm werden erläutert, gefolgt von den Vorteilen des DAG (Directed Acyclic Graph) von Storm und der Verwaltung von Datenstrom-Warteschlangen. Darüber hinaus werden die Vorteile der Verwendung von Storm-basierten schnellen Echtzeitanwendungen vorgestellt, zu denen Echtzeitanalysen, Online-ML (Machine Learning), kontinuierliche Berechnungen, DRPC (Distributed Remote Procedure Call) und ETL (Extract, Transform, Load) gehören.

Das ist alles enthalten

5 Videos2 Aufgaben

Das sechste und letzte Modul "IBM SPSS Statistics Project" konzentriert sich auf die Vermittlung von Erfahrungen mit einem der bekanntesten und am weitesten verbreiteten statistischen Big Data-Analysesysteme der Welt. Die Vorlesung beginnt mit der Einrichtung und Verwendung von IBM SPSS Statistics und beschreibt dann, wie IBM SPSS Statistics verwendet werden kann, um Erfahrungen mit der Datenanalyse in Unternehmen zu sammeln. Anschließend werden die statistischen Datenverarbeitungsergebnisse zweier Projekte, die auf der Verwendung des IBM SPSS Statistics Big Data-Systems basieren, durchgeführt. Die Projekte werden durchgeführt, damit die Teilnehmer neue Möglichkeiten zur Verwendung, Analyse und Erstellung von Diagrammen über die Beziehungen zwischen Datensätzen entdecken und die statistischen Ergebnisse mit IBM SPSS Statistics vergleichen können.

Das ist alles enthalten

1 Video1 peer review

Dozent

Lehrkraftbewertungen
4.8 (76 Bewertungen)
Jong-Moon Chung
Yonsei University
12 Kurse366.936 Lernende

von

Yonsei University

Empfohlen, wenn Sie sich für Datenmanagement interessieren

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.
Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“
Jennifer J.
Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“
Larry W.
Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“
Chaitanya A.
„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Bewertungen von Lernenden

4.7

286 Bewertungen

  • 5 stars

    79,37 %

  • 4 stars

    14,33 %

  • 3 stars

    3,14 %

  • 2 stars

    1,39 %

  • 1 star

    1,74 %

Zeigt 3 von 286 an

SD
5

Geprüft am 3. Juni 2020

RP
5

Geprüft am 15. Nov. 2020

RS
5

Geprüft am 25. Sep. 2020

Platzhalter

Neue Karrieremöglichkeiten mit Coursera Plus

Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten

Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.

Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online

Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.

Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.

Häufig gestellte Fragen