University of California, Davis

Calcul distribué avec Spark SQL

Ce cours fait partie de Spécialisation Apprenez les bases de SQL pour la science des données

Enseigné en Anglais

Certains éléments de contenu peuvent ne pas être traduits

Brooke Wenig
Conor Murphy

Instructeurs : Brooke Wenig

48 263 déjà inscrits

Inclus avec Coursera Plus

Cours

Familiarisez-vous avec un sujet et apprenez les fondamentaux

4.4

(680 avis)

|

86%

niveau Intermédiaire
Certaines connaissances prérequises
13 heures (approximativement)
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Utilisez l'espace de travail collaboratif Databricks pour écrire du code Spark SQL évolutif qui s'exécute sur un cluster de machines

  • Inspecter l'interface utilisateur de Spark pour analyser les performances des requêtes et identifier les goulots d'étranglement

  • Créez un pipeline de bout en bout qui lit les données, les transforme et enregistre le résultat

  • Construisez une architecture de type médaillon (bronze, argent, or) avec Delta Lake pour garantir la fiabilité, l'évolutivité et la performance de vos données

Compétences que vous acquerrez

  • Catégorie : Science des données
  • Catégorie : SQL
  • Catégorie : Apache Spark
  • Catégorie : Lac Delta

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

8 quizzes

Cours

Familiarisez-vous avec un sujet et apprenez les fondamentaux

4.4

(680 avis)

|

86%

niveau Intermédiaire
Certaines connaissances prérequises
13 heures (approximativement)
Planning flexible
Apprenez à votre propre rythme

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Placeholder

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation Apprenez les bases de SQL pour la science des données
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable
Placeholder
Placeholder

Obtenez un certificat professionnel

Ajoutez cette qualification à votre profil LinkedIn ou à votre CV

Partagez-le sur les réseaux sociaux et dans votre évaluation de performance

Placeholder

Il y a 4 modules dans ce cours

Dans ce module, vous serez en mesure de discuter des concepts fondamentaux de l'informatique distribuée et de reconnaître quand et où les appliquer. Vous serez en mesure d'identifier la structure de données de base d'Apache Spark™, connue sous le nom de DataFrame. En outre, vous utiliserez l'espace de travail collaboratif Databricks et écrirez du code SQL qui s'exécute contre un cluster de machines.

Inclus

6 vidéos3 lectures2 quizzes1 sujet de discussion

Dans ce module, vous serez en mesure d'expliquer les concepts fondamentaux de Spark. Vous apprendrez les méthodes courantes pour augmenter les performances des requêtes en mettant en cache les données et en modifiant les configurations de Spark. Vous utiliserez également l'interface utilisateur de Spark pour analyser les performances et identifier les goulots d'étranglement, ainsi que pour optimiser les requêtes avec Adaptive Query Execution.

Inclus

6 vidéos2 lectures2 quizzes

Dans ce module, vous serez en mesure d'identifier et de discuter les exigences générales des applications de données. Vous serez en mesure d'accéder aux données dans une variété de formats et de comparer les compromis entre ces formats. Vous explorerez et examinerez les données JSON semi-structurées (courantes dans les environnements big data) ainsi que les schémas et les écritures de données parallèles. Vous serez en mesure de créer un pipeline de bout en bout qui lit les données, les transforme et enregistre le résultat.

Inclus

7 vidéos2 lectures2 quizzes

Dans ce module, vous identifierez les principales caractéristiques des lacs de données, des entrepôts de données et des entrepôts lacustres. Les entrepôts de données combinent l'évolutivité et le stockage à faible coût des lacs de données avec la vitesse et les garanties transactionnelles ACID des entrepôts de données. Vous construirez un lac de production en combinant Spark et le projet open-source Delta Lake. Celui qui a dit que le voyage dans le temps n'était pas possible n'a jamais visité une maison de lac !

Inclus

8 vidéos2 lectures2 quizzes1 évaluation par les pairs1 sujet de discussion

Instructeurs

Évaluations de l’enseignant
4.6 (149 évaluations)
Brooke Wenig
University of California, Davis
1 Cours48 263 apprenants

Offert par

Recommandé si vous êtes intéressé(e) par Analyse des Données

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Avis des étudiants

Affichage de 3 sur 680

4.4

680 avis

  • 5 stars

    64,56 %

  • 4 stars

    23,27 %

  • 3 stars

    6,44 %

  • 2 stars

    2,34 %

  • 1 star

    3,36 %

WO
5

Révisé le 20 nov. 2021

SK
5

Révisé le 12 juin 2022

KS
5

Révisé le 13 mai 2020

Placeholder

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à plus de 7 000 cours de renommée internationale, à des projets pratiques et à des programmes de certificats reconnus sur le marché du travail, tous inclus dans votre abonnement

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions