Die Datenanalyse hat die Datenerfassung als Engpass für die evidenzbasierte Entscheidungsfindung abgelöst - wir ertrinken darin. Um Wissen aus großen, heterogenen und verrauschten Datensätzen zu extrahieren, sind nicht nur leistungsstarke Rechenressourcen erforderlich, sondern auch die Programmierabstraktionen, um sie effektiv zu nutzen. Die Abstraktionen, die im letzten Jahrzehnt entstanden sind, verschmelzen Ideen aus parallelen Datenbanken, verteilten Systemen und Programmiersprachen zu einer neuen Klasse skalierbarer Datenanalyseplattformen, die die Grundlage für Data Science in realistischen Maßstäben bilden. In diesem Kurs lernen Sie die Landschaft der relevanten Systeme kennen, die Prinzipien, auf denen sie beruhen, ihre Kompromisse und wie Sie ihren Nutzen anhand Ihrer Anforderungen bewerten können. Sie werden erfahren, wie praktische Systeme aus der Pionierforschung der Informatik entstanden sind und welche Systeme am Horizont auftauchen werden. Cloud Computing, SQL- und NoSQL-Datenbanken, MapReduce und das daraus entstandene Ökosystem, Spark und seine Zeitgenossen sowie spezialisierte Systeme für Graphen und Arrays werden behandelt. Außerdem lernen Sie die Geschichte und den Kontext von Data Science kennen, die Fähigkeiten, Herausforderungen und Methoden, die der Begriff impliziert, und wie Sie ein Data Science-Projekt strukturieren. Am Ende dieses Kurses werden Sie in der Lage sein: Lernziele:
Schenken Sie Ihrer Karriere Coursera Plus mit einem Rabatt von $160 , der jährlich abgerechnet wird. Sparen Sie heute.
Datenmanipulation in großem Maßstab: Systeme und Algorithmen
Dieser Kurs ist Teil von Spezialisierung Datenwissenschaft in großem Maßstab
Dozent: Bill Howe
61.357 bereits angemeldet
Bei enthalten
(766 Bewertungen)
Kompetenzen, die Sie erwerben
- Kategorie: Relationale Algebra
- Kategorie: Python-Programmierung
- Kategorie: SQL
- Kategorie: Mapreduce
Wichtige Details
Zu Ihrem LinkedIn-Profil hinzufügen
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.
Erweitern Sie Ihre Fachkenntnisse
- Lernen Sie neue Konzepte von Branchenexperten
- Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
- Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
- Erwerben Sie ein Berufszertifikat zur Vorlage
Erwerben Sie ein Karrierezertifikat.
Fügen Sie diese Qualifikation zur Ihrem LinkedIn-Profil oder Ihrem Lebenslauf hinzu.
Teilen Sie es in den sozialen Medien und in Ihrer Leistungsbeurteilung.
In diesem Kurs gibt es 5 Module
Verstehen Sie die Terminologie und die wiederkehrenden Prinzipien, die mit Data Science verbunden sind, und verstehen Sie die Struktur von Data-Science-Projekten und neue Methoden, um sie anzugehen. Warum gibt es dieses aufstrebende Feld? In welcher Beziehung steht es zu anderen Bereichen? Wodurch zeichnet sich dieser Kurs aus? Wie sehen datenwissenschaftliche Projekte aus, und wie sollte man sie angehen? Was sind einige Beispiele für datenwissenschaftliche Projekte?
Das ist alles enthalten
22 Videos4 Lektüren1 Programmieraufgabe
Relationale Datenbanken sind die Arbeitsgrundlage für die Verwaltung großer Datenmengen. Obwohl sie ursprünglich für Probleme im Unternehmensbetrieb entwickelt wurden, haben sie sich auch für die Analyse von Daten als bemerkenswert geeignet erwiesen. Am wichtigsten ist jedoch, dass die Prinzipien, die relationalen Datenbanken zugrunde liegen, bei der Verwaltung, Bearbeitung und Analyse von Daten in großem Maßstab universell sind. Selbst als sich die Landschaft der großen Datensysteme im letzten Jahrzehnt dramatisch vergrößert hat, sind relationale Modelle und Sprachen ein verbindendes Konzept geblieben. Für die Arbeit mit umfangreichen Daten gibt es kein wichtigeres Programmiermodell, das Sie lernen müssen.
Das ist alles enthalten
24 Videos1 Programmieraufgabe
Das MapReduce-Programmiermodell (im Gegensatz zu seinen Implementierungen) wurde als vereinfachende Abstraktion für die parallele Bearbeitung riesiger Datensätze vorgeschlagen und ist nach wie vor ein wichtiges Konzept, das Sie kennen sollten, wenn Sie moderne Big Data-Plattformen verwenden und bewerten.
Das ist alles enthalten
26 Videos1 Programmieraufgabe
Bei NoSQL-Systemen geht es ausschließlich um die Skalierung und nicht um die Analyse, und sie sind für den praktizierenden Datenwissenschaftler wohl weniger relevant. Sie nehmen jedoch einen wichtigen Platz in vielen praktischen Big-Data-Plattformarchitekturen ein, und Datenwissenschaftler müssen ihre Grenzen und Stärken verstehen, um sie effektiv zu nutzen.
Das ist alles enthalten
36 Videos
Graphenstrukturierte Daten werden in datenwissenschaftlichen Kontexten immer häufiger verwendet, da sie die Kommunikation zwischen Entitäten modellieren: Menschen (soziale Netzwerke), Computer (Internetkommunikation), Städte und Länder (Verkehrsnetze) oder Unternehmen (Finanztransaktionen). Lernen Sie die gebräuchlichen Algorithmen zur Extraktion von Informationen aus Graphdaten kennen und erfahren Sie, wie Sie diese skalieren können.
Das ist alles enthalten
21 Videos
Dozent
Empfohlen, wenn Sie sich für Datenanalyse interessieren
University of Illinois Urbana-Champaign
University of Colorado Boulder
University of California, Davis
Coursera Instructor Network
Warum entscheiden sich Menschen für Coursera für ihre Karriere?
Bewertungen von Lernenden
Zeigt 3 von 766
766 Bewertungen
- 5 stars
57,23 %
- 4 stars
25,16 %
- 3 stars
8,99 %
- 2 stars
4,82 %
- 1 star
3,78 %
Geprüft am 10. Jan. 2016
Geprüft am 1. Jan. 2016
Geprüft am 3. Okt. 2016
Neue Karrieremöglichkeiten mit Coursera Plus
Unbegrenzter Zugang zu über 7.000 erstklassigen Kursen, praktischen Projekten und Zertifikatsprogrammen, die Sie auf den Beruf vorbereiten – alles in Ihrem Abonnement enthalten
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.
Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.
Häufig gestellte Fragen
Der Zugang zu Vorlesungen und Aufgaben hängt von der Art Ihrer Einschreibung ab. Wenn Sie einen Kurs im Prüfungsmodus belegen, können Sie die meisten Kursmaterialien kostenlos einsehen. Um auf benotete Aufgaben zuzugreifen und ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung während oder nach Ihrer Prüfung erwerben. Wenn Sie die Prüfungsoption nicht sehen:
Der Kurs bietet möglicherweise keine Prüfungsoption. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen.
Der Kurs bietet möglicherweise stattdessen die Option 'Vollständiger Kurs, kein Zertifikat'. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.
Wenn Sie sich für den Kurs einschreiben, erhalten Sie Zugang zu allen Kursen der Specializations, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Ihr elektronisches Zertifikat wird Ihrer Erfolgsseite hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder zu Ihrem LinkedIn-Profil hinzufügen. Wenn Sie die Kursinhalte nur lesen und ansehen möchten, können Sie den Kurs kostenlos besuchen.
Wenn Sie ein Abonnement abgeschlossen haben, erhalten Sie eine kostenlose 7-tägige Testphase, in der Sie kostenlos kündigen können. Danach gewähren wir keine Rückerstattung, aber Sie können Ihr Abonnement jederzeit kündigen. Siehe unsere vollständigen Rückerstattungsbedingungen.