In diesem IBM Kurs zum Selbststudium lernen Sie alles über Big Data! Sie werden mit den Merkmalen von Big Data und deren Anwendung in der Big Data-Analyse vertraut gemacht. Sie werden auch praktische Erfahrungen mit Big Data-Verarbeitungstools wie Apache Hadoop und Apache Spark sammeln.
Bernard Marr definiert Big Data als die digitalen Spuren, die wir in diesem digitalen Zeitalter erzeugen. Zu Beginn des Kurses werden Sie verstehen, was Big Data ist und wie die Erkenntnisse aus Big Data für eine Vielzahl von Anwendungsfällen genutzt werden können. Sie werden auch untersuchen, wie Big Data Technologien wie Parallelverarbeitung, Skalierung und Datenparallelität nutzt. Als nächstes lernen Sie Hadoop kennen, ein Open-Source-Framework, das die verteilte Verarbeitung großer Datenmengen ermöglicht, und sein Ökosystem. Sie werden wichtige Anwendungen kennenlernen, die mit Hadoop Hand in Hand gehen, wie das Distributed File System (HDFS), MapReduce und HBase. Sie werden mit Hive vertraut gemacht, einer Data Warehouse-Software, die eine SQL-ähnliche Schnittstelle zur effizienten Abfrage und Bearbeitung großer Datensätze bietet. Anschließend erhalten Sie einen Einblick in Apache Spark, eine Open-Source-Verarbeitungs-Engine, die Anwendern neue Möglichkeiten zur Speicherung und Nutzung von Big Data bietet. In diesem Kurs erfahren Sie, wie Sie Spark nutzen können, um zuverlässige Erkenntnisse zu gewinnen. Der Kurs bietet einen Überblick über die Plattform und geht auf die Komponenten ein, aus denen Apache Spark besteht. Sie lernen DataFrames kennen und führen grundlegende DataFrame-Operationen durch und arbeiten mit SparkSQL. Sie erfahren, wie Spark die von Ihrer Anwendung gestellten Anfragen verarbeitet und überwacht und wie Sie die Arbeit mit der Spark Application UI verfolgen können. Dieser Kurs enthält mehrere praktische Übungen, die Ihnen helfen, die erlernten Konzepte anzuwenden und zu üben. Sie werden Hadoop- und Spark-Übungen mit verschiedenen Tools und Technologien durchführen, darunter Docker, Kubernetes, Python und Jupyter Notebooks.