Möchten Sie Ihr Wissen über die Big Data-Landschaft erweitern? Dieser Kurs richtet sich an diejenigen, die neu in der Datenwissenschaft sind und verstehen möchten, warum es das Zeitalter von Big Data gibt. Er richtet sich an diejenigen, die sich mit der Terminologie und den Kernkonzepten hinter Big-Data-Problemen, -Anwendungen und -Systemen vertraut machen wollen. Es richtet sich an diejenigen, die darüber nachdenken wollen, wie Big Data für ihr Unternehmen oder ihre Karriere nützlich sein könnte. Er bietet eine Einführung in eines der am weitesten verbreiteten Frameworks, Hadoop, das die Analyse von Big Data vereinfacht und zugänglicher gemacht hat - und damit das Potenzial von Daten, unsere Welt zu verändern, erhöht! Am Ende dieses Kurses werden Sie in der Lage sein: * die Big-Data-Landschaft zu beschreiben, einschließlich Beispielen von Big-Data-Problemen aus der realen Welt, einschließlich der drei Hauptquellen von Big Data: Menschen, Organisationen und Sensoren.
* Die V's von Big Data (Volume, Velocity, Variety, Veracity, Valence und Value) zu erklären und zu erläutern, warum jedes dieser V's die Datenerfassung, -überwachung, -speicherung, -analyse und -berichterstattung beeinflusst * einen Mehrwert aus Big Data zu ziehen, indem Sie einen 5-stufigen Prozess zur Strukturierung Ihrer Analyse verwenden.
* Erkennen Sie, was Big-Data-Probleme sind und was nicht, und können Sie Big-Data-Probleme in datenwissenschaftliche Fragen umwandeln. * Erklären Sie die architektonischen Komponenten und Programmiermodelle, die für skalierbare Big-Data-Analysen verwendet werden. * Fassen Sie die Funktionen und den Wert der Kernkomponenten des Hadoop-Stacks zusammen, einschließlich des Ressourcen- und Jobmanagementsystems YARN, des Dateisystems HDFS und des MapReduce-Programmiermodells. * Installieren Sie ein Programm mit Hadoop und führen Sie es aus! Dieser Kurs richtet sich an Einsteiger in die Datenwissenschaft. Es sind keine vorherigen Programmiererfahrungen erforderlich, aber die Fähigkeit, Anwendungen zu installieren und eine virtuelle Maschine zu verwenden, ist notwendig, um die praktischen Aufgaben zu erledigen.
Hardware-Anforderungen: (A) Quad-Core-Prozessor (VT-x- oder AMD-V-Unterstützung empfohlen), 64-Bit; (B) 8 GB RAM; (C) 20 GB freier Speicherplatz. So finden Sie Ihre Hardware-Informationen: (Windows): Öffnen Sie System, indem Sie auf die Schaltfläche Start klicken, mit der rechten Maustaste auf Computer klicken und dann auf Eigenschaften klicken; (Mac): Öffnen Sie die Übersicht, indem Sie auf das Apple-Menü und dann auf "Über diesen Mac" klicken Die meisten Computer mit 8 GB RAM, die in den letzten 3 Jahren gekauft wurden, erfüllen die Mindestanforderungen. Sie benötigen eine Hochgeschwindigkeits-Internetverbindung, da Sie Dateien mit einer Größe von bis zu 4 GB herunterladen werden.
Softwareanforderungen: Dieser Kurs basiert auf mehreren Open-Source-Softwaretools, darunter Apache Hadoop. Die gesamte erforderliche Software kann kostenlos heruntergeladen und installiert werden. Zu den Softwareanforderungen gehören: Windows 7+, Mac OS X 10.10+, Ubuntu 14.04+ oder CentOS 6+ VirtualBox 5+.