Dans ce cours, vous apprendrez à exploiter la puissance d'Apache Spark et des clusters puissants fonctionnant sur la plateforme Azure Databricks pour exécuter des charges de travail de science des données dans le nuage. Il s'agit du quatrième cours d'un programme de cinq cours qui vous prépare à passer l'examen de certification DP-100, Conception et mise en œuvre d'une solution de science des données sur Azure : L'examen de certification est l'occasion de prouver vos connaissances et votre expertise dans l'exploitation de solutions d'apprentissage automatique à l'échelle du nuage à l'aide d'Azure Machine Learning. Cette spécialisation vous apprend à tirer parti de vos connaissances existantes en Python et en apprentissage automatique pour gérer l'ingestion et la préparation des données, l'entraînement et le déploiement des modèles, ainsi que la surveillance des solutions d'apprentissage automatique dans Microsoft Azure. Chaque cours vous enseigne les concepts et les compétences qui sont mesurés par l'examen.
Offrez à votre carrière le cadeau de Coursera Plus avec $160 de réduction, facturé annuellement. Économisez aujourd’hui.
Effectuer de la science des données avec Azure Databricks
Ce cours fait partie de Préparation à l'examen Microsoft Azure Data Scientist Associate (DP-100) Certificat Professionnel
Instructeur : Microsoft
8 022 déjà inscrits
Inclus avec
(65 avis)
Expérience recommandée
Ce que vous apprendrez
Exploitez la puissance d'Apache Spark et des clusters puissants fonctionnant sur la plateforme Azure Databricks pour exécuter des charges de travail de science des données.
Effectuez de l'apprentissage automatique avec Azure Databricks. Travailler avec des fonctions définies par l'utilisateur (UDF) dans Azure Databricks
Travaillez avec des DataFrames dans Azure Databricks. Utilisez Azure Databricks et le notebook Apache Spark pour traiter de grandes quantités de données
Construire et interroger un lac Delta
Compétences que vous acquerrez
- Catégorie : Microsoft Azure
- Catégorie : Apprentissage automatique
- Catégorie : Traitement des données
- Catégorie : Azure Databricks
Détails à connaître
Ajouter à votre profil LinkedIn
1 quiz, 30 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées
Élaborez votre expertise en Développement de logiciels
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable auprès de Microsoft
Obtenez un certificat professionnel
Ajoutez cette qualification à votre profil LinkedIn ou à votre CV
Partagez-le sur les réseaux sociaux et dans votre évaluation de performance
Il y a 6 modules dans ce cours
Dans ce module, vous découvrirez les capacités d'Azure Databricks et du notebook Apache Spark pour le traitement de fichiers volumineux. Vous comprendrez la plateforme Azure Databricks et identifierez les types de tâches qui conviennent à Apache Spark. Vous serez également initié à l'architecture d'un Azure Databricks Spark Cluster et des Spark Jobs.
Inclus
7 vidéos5 lectures1 quiz3 devoirs1 sujet de discussion
Azure Databricks prend en charge les fonctions quotidiennes de traitement des données, telles que les lectures, les écritures et les requêtes. Dans ce module, vous travaillerez avec de grandes quantités de données provenant de sources multiples dans différents formats bruts. Vous apprendrez également à utiliser la classe de colonne DataFrame Azure Databricks pour appliquer des transformations au niveau des colonnes, telles que des tris, des filtres et des agrégations. Vous utiliserez également les opérations avancées des fonctions DataFrame pour manipuler les données, appliquer des agrégats et effectuer des opérations sur la date et l'heure dans Azure Databricks.
Inclus
4 vidéos10 lectures4 devoirs
Azure Databricks prend en charge une gamme de fonctions SQL intégrées, mais vous devez parfois écrire une fonction personnalisée, connue sous le nom de User-Defined Function (UDF). Dans ce module, vous apprendrez à enregistrer et à invoquer des UDF. Vous apprendrez également à utiliser Delta Lake pour créer, ajouter et réinsérer des données dans des tables Apache Spark, en tirant parti de la fiabilité et des optimisations intégrées.
Inclus
4 vidéos7 lectures6 devoirs
Dans ce module, vous apprendrez à utiliser le package d'apprentissage automatique de PySpark pour construire les composants clés des flux de travail d'apprentissage automatique qui comprennent l'analyse exploratoire des données, l'entraînement des modèles et l'évaluation des modèles. Vous apprendrez également à construire des pipelines pour les tâches courantes de caractérisation des données.
Inclus
4 vidéos11 lectures8 devoirs
Dans ce module, vous apprendrez à utiliser MLflow pour suivre les expériences d'apprentissage automatique et à utiliser les modules de la bibliothèque d'apprentissage automatique de Spark pour l'ajustement des hyperparamètres et la sélection des modèles.
Inclus
4 vidéos5 lectures5 devoirs
Dans ce module, vous apprendrez à utiliser le framework Horovod d'Uber ainsi que la bibliothèque Petastorm pour exécuter des tâches d'apprentissage profond distribuées sur Spark en utilisant des ensembles de données d'apprentissage au format Apache Parquet. Vous apprendrez également à utiliser MLflow et le service Azure Machine Learning pour enregistrer, empaqueter et déployer un modèle entraîné dans Azure Container Instance et Azure Kubernetes Service en tant que service web de notation.
Inclus
5 vidéos6 lectures4 devoirs1 sujet de discussion
Recommandé si vous êtes intéressé(e) par Développement de logiciels
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Avis des étudiants
Affichage de 3 sur 65
65 avis
- 5 stars
44,61 %
- 4 stars
7,69 %
- 3 stars
10,76 %
- 2 stars
10,76 %
- 1 star
26,15 %
Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à plus de 7 000 cours de renommée internationale, à des projets pratiques et à des programmes de certificats reconnus sur le marché du travail, tous inclus dans votre abonnement
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
L'accès aux cours et aux devoirs dépend de votre type d'inscription. Si vous suivez un cours en mode audit, vous pourrez consulter gratuitement la plupart des supports de cours. Pour accéder aux devoirs notés et obtenir un certificat, vous devrez acheter l'expérience de certificat, pendant ou après votre audit. Si vous ne voyez pas l'option d'audit :
Il se peut que le cours ne propose pas d'option d'audit. Vous pouvez essayer un essai gratuit ou demander une aide financière.
Le cours peut proposer l'option "Cours complet, pas de certificat" à la place. Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours du certificat et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page de réalisations. De là, vous pourrez l'imprimer ou l'ajouter à votre profil LinkedIn. Si vous souhaitez uniquement lire et visualiser le contenu du cours, vous pouvez auditer le cours gratuitement.
Si vous vous êtes abonné, vous bénéficiez d'une période d'essai gratuite de 7 jours pendant laquelle vous pouvez annuler votre abonnement sans pénalité. Après cette période, nous ne remboursons pas, mais vous pouvez résilier votre abonnement à tout moment. Consultez notre politique de remboursement complète.