Microsoft
Effectuer de la science des données avec Azure Databricks
Microsoft

Effectuer de la science des données avec Azure Databricks

Ce cours fait partie de Certificat professionnel de préparation à l'examen Microsoft Azure Data Scientist Associate (DP-100) Certificat Professionnel

Enseigné en Anglais

Certains éléments de contenu peuvent ne pas être traduits

 Microsoft

Instructeur : Microsoft

7 639 déjà inscrits

Inclus avec Coursera Plus

Cours

Familiarisez-vous avec un sujet et apprenez les fondamentaux

3.4

(58 avis)

niveau Intermédiaire

Expérience recommandée

25 heures (approximativement)
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Exploitez la puissance d'Apache Spark et des clusters puissants fonctionnant sur la plateforme Azure Databricks pour exécuter des charges de travail de science des données.

  • Effectuez de l'apprentissage automatique avec Azure Databricks. Travailler avec des fonctions définies par l'utilisateur (UDF) dans Azure Databricks

  • Travaillez avec des DataFrames dans Azure Databricks. Utilisez Azure Databricks et le notebook Apache Spark pour traiter de grandes quantités de données

  • Construire et interroger un lac Delta

Compétences que vous acquerrez

  • Catégorie : Microsoft Azure
  • Catégorie : Apprentissage automatique
  • Catégorie : Traitement des données
  • Catégorie : Azure Databricks

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

31 quizzes

Cours

Familiarisez-vous avec un sujet et apprenez les fondamentaux

3.4

(58 avis)

niveau Intermédiaire

Expérience recommandée

25 heures (approximativement)
Planning flexible
Apprenez à votre propre rythme

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Placeholder

Élaborez votre expertise en Développement de logiciels

Ce cours fait partie de la Certificat professionnel de préparation à l'examen Microsoft Azure Data Scientist Associate (DP-100) Certificat Professionnel
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à ce Certificat Professionnel.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable auprès de Microsoft
Placeholder
Placeholder

Obtenez un certificat professionnel

Ajoutez cette qualification à votre profil LinkedIn ou à votre CV

Partagez-le sur les réseaux sociaux et dans votre évaluation de performance

Placeholder

Il y a 6 modules dans ce cours

Dans ce module, vous découvrirez les capacités d'Azure Databricks et du notebook Apache Spark pour le traitement de fichiers volumineux. Vous comprendrez la plateforme Azure Databricks et identifierez les types de tâches qui conviennent à Apache Spark. Vous serez également initié à l'architecture d'un Azure Databricks Spark Cluster et des Spark Jobs.

Inclus

7 vidéos5 lectures4 quizzes1 sujet de discussion

Azure Databricks prend en charge les fonctions quotidiennes de traitement des données, telles que les lectures, les écritures et les requêtes. Dans ce module, vous travaillerez avec de grandes quantités de données provenant de sources multiples dans différents formats bruts. Vous apprendrez également à utiliser la classe de colonne DataFrame Azure Databricks pour appliquer des transformations au niveau des colonnes, telles que des tris, des filtres et des agrégations. Vous utiliserez également les opérations avancées des fonctions DataFrame pour manipuler les données, appliquer des agrégats et effectuer des opérations sur la date et l'heure dans Azure Databricks.

Inclus

4 vidéos10 lectures4 quizzes

Azure Databricks prend en charge une gamme de fonctions SQL intégrées, mais vous devez parfois écrire une fonction personnalisée, connue sous le nom de User-Defined Function (UDF). Dans ce module, vous apprendrez à enregistrer et à invoquer des UDF. Vous apprendrez également à utiliser Delta Lake pour créer, ajouter et réinsérer des données dans des tables Apache Spark, en tirant parti de la fiabilité et des optimisations intégrées.

Inclus

4 vidéos7 lectures6 quizzes

Dans ce module, vous apprendrez à utiliser le package d'apprentissage automatique de PySpark pour construire les composants clés des flux de travail d'apprentissage automatique qui comprennent l'analyse exploratoire des données, l'entraînement des modèles et l'évaluation des modèles. Vous apprendrez également à construire des pipelines pour les tâches courantes de caractérisation des données.

Inclus

4 vidéos11 lectures8 quizzes

Dans ce module, vous apprendrez à utiliser MLflow pour suivre les expériences d'apprentissage automatique et à utiliser les modules de la bibliothèque d'apprentissage automatique de Spark pour l'ajustement des hyperparamètres et la sélection des modèles.

Inclus

4 vidéos5 lectures5 quizzes

Dans ce module, vous apprendrez à utiliser le framework Horovod d'Uber ainsi que la bibliothèque Petastorm pour exécuter des tâches d'apprentissage profond distribuées sur Spark en utilisant des ensembles de données d'apprentissage au format Apache Parquet. Vous apprendrez également à utiliser MLflow et le service Azure Machine Learning pour enregistrer, empaqueter et déployer un modèle entraîné dans Azure Container Instance et Azure Kubernetes Service en tant que service web de notation.

Inclus

5 vidéos6 lectures4 quizzes1 sujet de discussion

Instructeur

Évaluations de l’enseignant
2.8 (9 évaluations)
 Microsoft
Microsoft
128 Cours917 900 apprenants

Offert par

Microsoft

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Avis des étudiants

Affichage de 3 sur 58

3.4

58 avis

  • 5 stars

    46,55 %

  • 4 stars

    6,89 %

  • 3 stars

    10,34 %

  • 2 stars

    10,34 %

  • 1 star

    25,86 %

HN
5

Révisé le 24 avr. 2024

AM
5

Révisé le 29 août 2024

Placeholder

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à plus de 7 000 cours de renommée internationale, à des projets pratiques et à des programmes de certificats reconnus sur le marché du travail, tous inclus dans votre abonnement

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions