Offrez à votre carrière le cadeau de Coursera Plus avec $160 de réduction, facturé annuellement. Économisez aujourd’hui.

University of California, Davis

Calcul distribué avec Spark SQL

Brooke Wenig
Conor Murphy

Instructeurs : Brooke Wenig

49 096 déjà inscrits

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
4.4

(687 avis)

niveau Intermédiaire
Certaines connaissances prérequises
Planning flexible
Env. 8 heures
Apprenez à votre propre rythme
86%
La plupart des apprenants ont aimé ce cours
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
4.4

(687 avis)

niveau Intermédiaire
Certaines connaissances prérequises
Planning flexible
Env. 8 heures
Apprenez à votre propre rythme
86%
La plupart des apprenants ont aimé ce cours

Ce que vous apprendrez

  • Utilisez l'espace de travail collaboratif Databricks pour écrire du code Spark SQL évolutif qui s'exécute sur un cluster de machines

  • Inspecter l'interface utilisateur de Spark pour analyser les performances des requêtes et identifier les goulots d'étranglement

  • Créez un pipeline de bout en bout qui lit les données, les transforme et enregistre le résultat

  • Construisez une architecture de type médaillon (bronze, argent, or) avec Delta Lake pour garantir la fiabilité, l'évolutivité et la performance de vos données

Compétences que vous acquerrez

  • Catégorie : Science des données
  • Catégorie : SQL
  • Catégorie : Apache Spark
  • Catégorie : Lac Delta

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

4 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Emplacement réservé

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation Apprenez les bases de SQL pour la science des données
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable
Emplacement réservé
Emplacement réservé

Obtenez un certificat professionnel

Ajoutez cette qualification à votre profil LinkedIn ou à votre CV

Partagez-le sur les réseaux sociaux et dans votre évaluation de performance

Emplacement réservé

Il y a 4 modules dans ce cours

Dans ce module, vous serez en mesure de discuter des concepts fondamentaux de l'informatique distribuée et de reconnaître quand et où les appliquer. Vous serez en mesure d'identifier la structure de données de base d'Apache Spark™, connue sous le nom de DataFrame. En outre, vous passerez en revue l'espace de travail collaboratif Databricks.

Inclus

6 vidéos3 lectures1 devoir1 sujet de discussion

Dans ce module, vous serez en mesure d'expliquer les concepts fondamentaux de Spark. Nous discuterons des moyens courants d'augmenter les performances des requêtes en mettant en cache les données et en modifiant les configurations de Spark. Nous passerons également en revue l'UI de Spark pour analyser les performances et identifier les goulots d'étranglement, ainsi que pour optimiser les requêtes avec Adaptive Query Execution.

Inclus

6 vidéos1 lecture1 devoir

Dans ce module, vous serez en mesure d'identifier et de discuter les exigences générales des applications de données. Vous serez en mesure d'examiner les données dans une variété de formats et de comparer les compromis entre ces formats. Vous explorerez et examinerez les données JSON semi-structurées (courantes dans les environnements Big data) ainsi que les schémas et les écritures de données parallèles. Vous serez en mesure de comprendre un pipeline de bout en bout qui lit les données, les transforme et comment il enregistre le résultat.

Inclus

7 vidéos1 lecture1 devoir

Dans ce module, vous identifierez les principales caractéristiques des lacs de données, des entrepôts de données et des lakehouses. Les lakehouses combinent l'évolutivité et le stockage à faible coût des lacs de données avec la vitesse et les garanties transactionnelles ACID des entrepôts de données. Vous examinerez un lakehouse de niveau de production combiné à Spark dans un projet open-source, Delta Lake. Celui qui a dit que le voyage dans le temps n'était pas possible n'a jamais visité un lakehouse !

Inclus

8 vidéos1 lecture1 devoir1 sujet de discussion

Instructeurs

Évaluations de l’enseignant
4.6 (151 évaluations)
Brooke Wenig
University of California, Davis
1 Cours49 096 apprenants

Offert par

Recommandé si vous êtes intéressé(e) par Analyse des Données

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Avis des étudiants

Affichage de 3 sur 687

4.4

687 avis

  • 5 stars

    64,38 %

  • 4 stars

    23,11 %

  • 3 stars

    6,39 %

  • 2 stars

    2,32 %

  • 1 star

    3,77 %

SK
5

Révisé le 12 juin 2022

WO
5

Révisé le 20 nov. 2021

KS
5

Révisé le 13 mai 2020

Emplacement réservé

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à plus de 7 000 cours de renommée internationale, à des projets pratiques et à des programmes de certificats reconnus sur le marché du travail, tous inclus dans votre abonnement

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions