Hinweis: Sie sollten alle anderen Kurse dieser Specialization abschließen, bevor Sie diesen Kurs beginnen. Dieser sechswöchige Projektkurs der Data Mining Specialization ermöglicht es Ihnen, die erlernten Algorithmen und Techniken für Data Mining aus den vorangegangenen Kursen der Specialization, einschließlich Pattern Discovery, Clustering, Text Retrieval, Text Mining und Visualisierung, anzuwenden, um interessante Data Mining-Herausforderungen aus der Praxis zu lösen. Konkret werden Sie an einem Datensatz mit Restaurantbewertungen von Yelp arbeiten und all das Wissen und die Fähigkeiten, die Sie in den vorangegangenen Kursen erlernt haben, einsetzen, um diesen Datensatz zu analysieren und interessantes und nützliches Wissen zu entdecken. Der Aufbau des Projekts legt den Schwerpunkt auf: 1) die Simulation des Arbeitsablaufs eines Data Miners in einer realen Arbeitsumgebung; 2) die Integration verschiedener Mining-Techniken, die in mehreren Einzelkursen behandelt wurden; 3) das Experimentieren mit verschiedenen Möglichkeiten, ein Problem zu lösen, um Ihr Verständnis der Techniken zu vertiefen; und 4) die Möglichkeit, eigene Ideen vorzuschlagen und kreativ zu erforschen.
Ziel des Projekts ist die Analyse und Auswertung eines großen Yelp-Bewertungsdatensatzes, um nützliche Erkenntnisse zu gewinnen, die den Menschen bei der Entscheidungsfindung in der Gastronomie helfen. Das Projekt wird die folgenden Ergebnisse umfassen:
1. Visualisierung von Meinungen: Erforschen und visualisieren Sie den Inhalt der Bewertungen, um zu verstehen, was die Leute in diesen Bewertungen gesagt haben. 2. Erstellung einer Karte der Küchen: Durchforsten Sie den Datensatz, um die Landschaft der verschiedenen Küchen und ihre Gemeinsamkeiten zu verstehen. 3. Entdeckung beliebter Gerichte für eine Küche: Durchsuchen Sie den Datensatz, um die gängigen/beliebten Gerichte einer bestimmten Küche zu entdecken. 4. Empfehlung von Restaurants, um die Entscheidung zu erleichtern, wo man essen gehen möchte: Durch Auswertung des Datensatzes können Sie eine Rangliste der Restaurants für ein bestimmtes Gericht erstellen und den Hygienezustand eines Restaurants vorhersagen. Aus der Sicht der Benutzer kann eine Cuisine Map ihnen helfen, zu verstehen, welche Küchen es gibt, und das Gesamtbild aller Arten von Küchen und ihrer Beziehungen zu sehen. Sobald sie sich für eine Küche entschieden haben, möchten sie wissen, welche Gerichte in dieser Küche beliebt sind, und entscheiden, welche Gerichte sie essen möchten. Schließlich müssen sie sich für ein Restaurant entscheiden. Es wäre also nützlich, Restaurants auf der Grundlage eines bestimmten Gerichts zu empfehlen. Außerdem wäre es hilfreich, die hygienischen Bedingungen in einem Restaurant vorherzusagen.
Durch die Arbeit an diesen Aufgaben werden Sie Erfahrungen mit einem typischen Arbeitsablauf im Data Mining sammeln, der die Datenvorverarbeitung, die Datenexploration, die Datenanalyse, die Verbesserung der Analysemethoden und die Präsentation der Ergebnisse umfasst. Sie werden Gelegenheit haben, mehrere Algorithmen aus verschiedenen Kursen zu kombinieren, um eine relativ komplizierte Mining-Aufgabe zu lösen und mit verschiedenen Lösungsansätzen zu experimentieren, um zu verstehen, wie das Problem am besten zu lösen ist. Wir werden Ihnen bestimmte Ansätze vorschlagen, aber Sie sind herzlich eingeladen, Ihre eigenen Ideen zu erforschen, da die offene Erforschung ein Ziel des Projekts ist.
Sie müssen für jede der Aufgaben einen kurzen Bericht zur Bewertung durch Ihre Kollegen einreichen. Außerdem müssen Sie einen konsolidierten Abschlussbericht vorlegen, der ebenfalls von anderen Teilnehmern bewertet wird.