Les pipelines de données s'inscrivent généralement dans l'un des paradigmes EL (extraction et chargement), ELT (extraction, chargement et transformation) ou ETL (extraction, transformation et chargement). Ce cours indique quel paradigme utiliser pour le traitement de données par lot en fonction du contexte. Il présente également plusieurs technologies Google Cloud de transformation des données, y compris BigQuery, l'exécution de Spark sur Dataproc, les graphiques de pipelines dans Cloud Data Fusion et le traitement des données sans serveur avec Dataflow. Les participants mettront en pratique les connaissances qu'ils auront acquises en créant des composants de pipelines de données sur Google Cloud à l'aide de Qwiklabs.
Building Batch Data Pipelines on GCP en Français
Ce cours fait partie de Spécialisation Data Engineer, Big Data and ML on Google Cloud en Français
Instructeur : Google Cloud Training
Ce que vous apprendrez
Explorer différentes méthodes de chargement de données (EL, ELT et ETL) et déterminer quand les utiliser.
Exécuter Hadoop sur Dataproc, utiliser Cloud Storage et optimiser les jobs Dataproc.
Créer des pipelines de traitement des données à l'aide de Dataflow.
Gérer des pipelines de données avec Data Fusion et Cloud Composer.
Détails à connaître
Ajouter à votre profil LinkedIn
4 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées
Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable
Obtenez un certificat professionnel
Ajoutez cette qualification à votre profil LinkedIn ou à votre CV
Partagez-le sur les réseaux sociaux et dans votre évaluation de performance
Il y a 7 modules dans ce cours
Dans ce module, nous vous présentons le cours et son déroulement.
Inclus
1 vidéo
Ce module passe en revue différentes méthodes de chargement de données (EL, ELT et ETL) et vous indique quand les utiliser.
Inclus
6 vidéos1 devoir
Ce module vous apprend à exécuter Hadoop sur Dataproc, à exploiter Cloud Storage et à optimiser vos jobs Dataproc.
Inclus
11 vidéos1 devoir1 élément d'application
Ce module vous explique comment utiliser Dataflow pour créer vos pipelines de traitement de données.
Inclus
13 vidéos1 devoir6 éléments d'application
Ce module vous montre comment gérer des pipelines de données avec Cloud Data Fusion et Cloud Composer.
Inclus
13 vidéos1 devoir2 éléments d'application
Résumé du cours
Inclus
1 vidéo
Liens PDF vers tous les modules
Inclus
1 lecture
Instructeur
Offert par
Recommandé si vous êtes intéressé(e) par Cloud Computing
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à plus de 7 000 cours de renommée internationale, à des projets pratiques et à des programmes de certificats reconnus sur le marché du travail, tous inclus dans votre abonnement
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
Yes, you can preview the first video and view the syllabus before you enroll. You must purchase the course to access content not included in the preview.
If you decide to enroll in the course before the session start date, you will have access to all of the lecture videos and readings for the course. You’ll be able to submit assignments once the session starts.
Once you enroll and your session begins, you will have access to all videos and other resources, including reading items and the course discussion forum. You’ll be able to view and submit practice assessments, and complete required graded assignments to earn a grade and a Course Certificate.