One of the important topics that every data analyst should be familiar with is the distributed data processing technologies. As a data analyst, you should be able to apply different queries to your dataset to extract useful information out of it. but what if your data is so big that working with it on your local machine is not easy to be done. That is when the distributed data processing and Spark Technology will become handy. So in this project, we are going to work with pyspark module in python and we are going to use google colab environment in order to apply some queries to the dataset we have related to lastfm website which is an online music service where users can listen to different songs. This dataset is containing two csv files listening.csv and genre.csv. Also, we will learn how we can visualize our query results using matplotlib.
Offrez à votre carrière le cadeau de Coursera Plus avec $160 de réduction, facturé annuellement. Économisez aujourd’hui.
(287 avis)
Expérience recommandée
Ce que vous apprendrez
Learn how to setup the google colab for distributed data processing
Learn applying different queries to your dataset to extract useful Information
Learn how to visualize this information using matplotlib
Compétences que vous pratiquerez
- Catégorie : Google colab
- Catégorie : Data Analysis
- Catégorie : Python Programming
- Catégorie : pySpark SQL
Détails à connaître
Ajouter à votre profil LinkedIn
Disponible uniquement sur ordinateur
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées
Apprendre, pratiquer et appliquer des compétences prêtes à l'emploi en moins de 2 heures
- Bénéficiez d’une formation par des experts du secteur
- Gagnez en expérience pratique en effectuant des tâches professionnelles du monde réel
- Renforcez votre confiance en utilisant les outils et technologies les plus récents
À propos de ce Projet Guidé
Apprendrez étape par étape
Votre enseignant(e) vous guidera étape par étape, grâce à une vidéo en écran partagé sur votre espace de travail :
Prepare the Google Colab for distributed data processing
Mounting our Google Drive into Google Colab environment
Importing first file of our Dataset (1 Gb) into pySpark dataframe
Applying some Queries to extract useful information out of our data
Importing second file of our Dataset (3 Mb) into pySpark dataframe
Joining two dataframes and prepapre it for more advanced queries
Learn visualizing our query results using matplotlib
Expérience recommandée
Learners should be familiar with Python programming Language, Spark Technology and have a little experience working with google colab environment
5 images de projet
Instructeur
Offert par
Méthode d’apprentissage
Apprentissage pratique basé sur les compétences
Mettez en pratique de nouvelles compétences en effectuant des tâches professionnelles.
Conseils d’experts
Suivez les vidéos pré-enregistrées d’experts à l’aide d’une interface unique, divisée en deux.
Aucun téléchargement ou installation requis(e)
Accédez aux outils et aux ressources dont vous avez besoin dans un espace de travail cloud préconfiguré.
Disponible uniquement sur ordinateur de bureau
Ce Projet Guidé est conçu pour les ordinateurs portables ou de bureau disposant d’une connexion internet fiable, et non pour les appareils mobiles.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Avis des étudiants
Affichage de 3 sur 287
287 avis
- 5 stars
63,06 %
- 4 stars
24,39 %
- 3 stars
8,71 %
- 2 stars
1,74 %
- 1 star
2,09 %
Vous aimerez peut-être aussi
DeepLearning.AI
University of California San Diego
Universidad Nacional Autónoma de México
Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à plus de 7 000 cours de renommée internationale, à des projets pratiques et à des programmes de certificats reconnus sur le marché du travail, tous inclus dans votre abonnement
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
En achetant un Projet Guidé, vous obtenez tout ce dont vous avez besoin pour terminer ce Projet Guidé, y compris l'accès à un espace de travail de bureau cloud, via votre navigateur web, qui contient les fichiers et les logiciels dont vous avez besoin pour commencer, ainsi que les instructions vidéo étape par étape d'un expert en la matière.
Comme votre espace de travail contient un bureau cloud dimensionné pour un ordinateur portable ou de bureau, les Projets Guidés ne sont pas disponibles sur votre appareil mobile.
Les enseignants des Projets Guidés sont des experts en la matière qui ont de l'expérience dans les compétences, les outils ou le domaine de leur projet et qui sont passionnés par le partage de leurs connaissances avec des millions d'étudiants dans le monde.