Jedes Mal, wenn Sie Google verwenden, um etwas zu suchen, jedes Mal, wenn Sie Facebook, Twitter, Instagram oder einen anderen SNS (Social Network Service) nutzen, und jedes Mal, wenn Sie von einer empfohlenen Liste von Produkten auf Amazon.com kaufen, nutzen Sie ein Big Data-System. Darüber hinaus unterstützt Big Data-Technologie Ihr Smartphone, Ihre Smartwatch, Alexa, Siri und Ihr Auto (wenn es sich um ein neueres Modell handelt) jeden Tag. Die führenden Unternehmen der Welt setzen derzeit Big Data-Technologie ein, und jedes Unternehmen benötigt fortschrittliche Unterstützung durch Big Data-Technologie. Einfach ausgedrückt: Big Data-Technologie ist keine Option für Ihr Unternehmen, sondern eine Notwendigkeit für Überleben und Wachstum. Jetzt ist also der richtige Zeitpunkt, um zu lernen, was Big Data ist und wie Sie es zum Vorteil Ihres Unternehmens einsetzen können. Dieser Kurs mit 6 Modulen befasst sich zunächst mit den weltweiten Marktanteilen von Big-Data-Hardware, -Software und -Dienstleistungen und behandelt dann die weltweit führenden Big-Data-Produktlinien und -Dienstleistungen der wichtigsten Big-Data-Unternehmen. Anschließend wird erläutert, wie Big-Data-Analysen auf der Grundlage der drei weltweit beliebtesten Big-Data-Technologien Hadoop, Spark und Storm möglich sind. Der letzte Teil konzentriert sich auf die Vermittlung von Erfahrungen mit einem der berühmtesten und am weitesten verbreiteten statistischen Big-Data-Analysesysteme der Welt, dem IBM SPSS Statistics. Dieser Kurs wurde entwickelt, um Sie darauf vorzubereiten, in der kommenden Big-Data-Ära erfolgreicher in der strategischen Unternehmensplanung zu sein. Willkommen in der faszinierenden Welt von Big Data!
Big Data Aufstrebende Technologien
Dieser Kurs ist Teil von Spezialisierung Aufkommende Technologien: Von Smartphones über IoT bis hin zu Big Data
Dozent: Jong-Moon Chung
27.973 bereits angemeldet
Bei enthalten
(286 Bewertungen)
Wichtige Details
Zu Ihrem LinkedIn-Profil hinzufügen
10 Aufgaben
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.
Erweitern Sie Ihre Fachkenntnisse
- Lernen Sie neue Konzepte von Branchenexperten
- Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
- Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
- Erwerben Sie ein Berufszertifikat zur Vorlage
Erwerben Sie ein Karrierezertifikat.
Fügen Sie diese Qualifikation zur Ihrem LinkedIn-Profil oder Ihrem Lebenslauf hinzu.
Teilen Sie es in den sozialen Medien und in Ihrer Leistungsbeurteilung.
In diesem Kurs gibt es 6 Module
Das erste Modul "Big Data Rankings & Products" befasst sich mit dem Verhältnis und den Marktanteilen von Big Data-Hardware, Software und professionellen Dienstleistungen. Diese Informationen geben Aufschluss darüber, wie Industrie, Produkte, Dienstleistungen, Schulen und Regierungsorganisationen in Zukunft von der Big-Data-Technologie beeinflusst werden. Um einen tieferen Einblick in die weltweit führenden Big-Data-Produkte und -Dienstleistungen zu erhalten, bietet der Vortrag einen Überblick über die wichtigsten Big-Data-Unternehmen, darunter IBM, SAP, Oracle, HPE, Splunk, Dell, Teradata, Microsoft, Cisco und AWS. Um die Leistungsfähigkeit der Big-Data-Technologie zu verstehen, wird der Unterschied zwischen der Big-Data-Analyse und der traditionellen Datenanalyse erläutert. Es folgt ein Vortrag über die 4 V großen Herausforderungen der Big Data-Technologie, die sich mit Fragen des Volumens, der Vielfalt, der Geschwindigkeit und der Wahrhaftigkeit der massiven Daten beschäftigen. Auf der Grundlage dieser einführenden Informationen wird die Big-Data-Technologie vorgestellt, die von Wal-Mart, Amazon und Citibank eingesetzt wird, um globale Erkenntnisse über Investitionen zu gewinnen, neue Geschäfte und Fabriken zu finden und Empfehlungssysteme in Echtzeit zu betreiben.
Das ist alles enthalten
6 Videos2 Aufgaben
Das zweite Modul "Big Data & Hadoop" befasst sich mit den Eigenschaften und der Funktionsweise von Hadoop, dem ursprünglichen Big-Data-System, das von Google verwendet wurde. Die Vorlesungen erklären die Funktionsweise von MapReduce, HDFS (Hadoop Distributed FileSystem) und die Verarbeitung von Datenblöcken. Diese Funktionen werden auf einem Cluster von Knoten ausgeführt, denen die Rolle von NameNode oder DataNode zugewiesen ist, wobei die Datenverarbeitung von den in den Vorlesungen erläuterten JobTrackern und TaskTrackern durchgeführt wird. Darüber hinaus werden die Merkmale der Metadatentypen und die Unterschiede in den Datenanalyseprozessen von Hadoop und SQL (Structured Query Language) erläutert. Dann wird die Hadoop Release Series vorgestellt, zu der auch die Beschreibungen von Hadoop YARN (Yet Another Resource Negotiator), HDFS Federation und HDFS HA (High Availability) Big Data Technologie gehören.
Das ist alles enthalten
8 Videos2 Aufgaben
Das dritte Modul "Spark" konzentriert sich auf die Operationen und Eigenschaften von Spark, der derzeit beliebtesten Big-Data-Technologie der Welt. Der Vortrag behandelt zunächst die Unterschiede in den Datenanalyseeigenschaften von Spark und Hadoop und geht dann auf die Funktionen der Spark Big Data-Verarbeitung ein, die auf den Kerneinheiten RDD (Resilient Distributed Datasets), Spark Core, Spark SQL, Spark Streaming, MLlib (Machine Learning Library) und GraphX basieren. Es werden Details zu den Funktionen von Spark DAG (Directed Acyclic Graph) Stufen und Pipeline-Prozessen erläutert, die auf der Grundlage von Spark-Transformationen und -Aktionen gebildet werden. Insbesondere werden die Definition und die Vorteile von Lazy-Transformationen und DAG-Operationen beschrieben sowie die Merkmale von Spark-Variablen und Serialisierung. Darüber hinaus wird der Prozess der Spark-Cluster-Operationen auf der Grundlage von Mesos, Standalone und YARN vorgestellt.
Das ist alles enthalten
11 Videos2 Aufgaben
Das vierte Modul "Spark ML & Streaming" befasst sich mit der Funktionsweise von Spark ML (Machine Learning) und der Durchführung von Spark Streaming-Operationen. Zu den Spark ML-Algorithmen gehören Featurisierung, Pipelines, Persistenz und Dienstprogramme, die mit RDDs (Resilient Distributed Datasets) arbeiten, um Informationen aus riesigen Datensätzen zu extrahieren. In den Vorlesungen werden die Merkmale der DataFrame-basierten API erläutert, die die primäre ML-API im spark.ml-Paket ist. Zunächst werden die grundlegenden statistischen Algorithmen von Spark ML vorgestellt, die auf Korrelation und Hypothesentests (P-Wert) basieren, gefolgt von den Klassifizierungs- und Regressionsalgorithmen von Spark ML, die auf linearen Modellen, Naive Bayes und Entscheidungsbaumtechniken basieren. Dann werden die Merkmale von Spark Streaming, Streaming-Eingabe und -Ausgabe sowie die Streaming-Empfängertypen (einschließlich Basis, benutzerdefiniert und erweitert) erläutert, gefolgt von der Frage, wie der Spark Streaming-Prozess und DStream (Discretized Stream) Big Data Streaming-Operationen für Echtzeit- und echtzeitnahe Anwendungen ermöglichen.
Das ist alles enthalten
4 Videos2 Aufgaben
Das fünfte Modul "Storm" konzentriert sich auf die Eigenschaften und den Betrieb von Storm Big Data-Systemen. Der Vortrag behandelt zunächst die Unterschiede in den Datenanalyseeigenschaften von Storm, Spark und der Hadoop-Technologie. Dann werden die Merkmale der Storm Big Data-Verarbeitung auf der Grundlage von Nimbus, Spouts und Bolts beschrieben, gefolgt von den Details zu Storm Streams, Supervisor und ZooKeeper. Weitere Einzelheiten zu den zuverlässigen und unzuverlässigen Spouts und Bolts von Storm werden erläutert, gefolgt von den Vorteilen des DAG (Directed Acyclic Graph) von Storm und der Verwaltung von Datenstrom-Warteschlangen. Darüber hinaus werden die Vorteile der Verwendung von Storm-basierten schnellen Echtzeitanwendungen vorgestellt, zu denen Echtzeitanalysen, Online-ML (Machine Learning), kontinuierliche Berechnungen, DRPC (Distributed Remote Procedure Call) und ETL (Extract, Transform, Load) gehören.
Das ist alles enthalten
5 Videos2 Aufgaben
Das sechste und letzte Modul "IBM SPSS Statistics Project" konzentriert sich auf die Vermittlung von Erfahrungen mit einem der bekanntesten und am weitesten verbreiteten statistischen Big Data-Analysesysteme der Welt. Die Vorlesung beginnt mit der Einrichtung und Verwendung von IBM SPSS Statistics und beschreibt dann, wie IBM SPSS Statistics verwendet werden kann, um Erfahrungen mit der Datenanalyse in Unternehmen zu sammeln. Anschließend werden die statistischen Datenverarbeitungsergebnisse zweier Projekte, die auf der Verwendung des IBM SPSS Statistics Big Data-Systems basieren, durchgeführt. Die Projekte werden durchgeführt, damit die Teilnehmer neue Möglichkeiten zur Verwendung, Analyse und Erstellung von Diagrammen über die Beziehungen zwischen Datensätzen entdecken und die statistischen Ergebnisse mit IBM SPSS Statistics vergleichen können.
Das ist alles enthalten
1 Video1 peer review
Dozent
Empfohlen, wenn Sie sich für Datenmanagement interessieren
University of California San Diego
EIT Digital
Campus BBVA
Warum entscheiden sich Menschen für Coursera für ihre Karriere?
Bewertungen von Lernenden
286 Bewertungen
- 5 stars
79,37 %
- 4 stars
14,33 %
- 3 stars
3,14 %
- 2 stars
1,39 %
- 1 star
1,74 %
Zeigt 3 von 286 an
Geprüft am 3. Juni 2020
I have learned so much about the Big Data technologies in this course. It is a very useful course.
Geprüft am 15. Nov. 2020
Nice course, it gave me good idea on big data technologies. looking forward to do more courses on big data
Geprüft am 25. Sep. 2020
good course get lot of knowledge how data is processed online
Neue Karrieremöglichkeiten mit Coursera Plus
Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.
Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.
Häufig gestellte Fragen
Der Zugang zu Vorlesungen und Aufgaben hängt von der Art Ihrer Einschreibung ab. Wenn Sie einen Kurs im Prüfungsmodus belegen, können Sie die meisten Kursmaterialien kostenlos einsehen. Um auf benotete Aufgaben zuzugreifen und ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung während oder nach Ihrer Prüfung erwerben. Wenn Sie die Prüfungsoption nicht sehen:
Der Kurs bietet möglicherweise keine Prüfungsoption. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen.
Der Kurs bietet möglicherweise stattdessen die Option 'Vollständiger Kurs, kein Zertifikat'. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.
Wenn Sie sich für den Kurs einschreiben, erhalten Sie Zugang zu allen Kursen der Specializations, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Ihr elektronisches Zertifikat wird Ihrer Erfolgsseite hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder zu Ihrem LinkedIn-Profil hinzufügen. Wenn Sie die Kursinhalte nur lesen und ansehen möchten, können Sie den Kurs kostenlos besuchen.
Wenn Sie ein Abonnement abgeschlossen haben, erhalten Sie eine kostenlose 7-tägige Testphase, in der Sie kostenlos kündigen können. Danach gewähren wir keine Rückerstattung, aber Sie können Ihr Abonnement jederzeit kündigen. Siehe unsere vollständigen Rückerstattungsbedingungen.