Les pipelines de données s'inscrivent généralement dans l'un des paradigmes EL (extraction et chargement), ELT (extraction, chargement et transformation) ou ETL (extraction, transformation et chargement). Ce cours indique quel paradigme utiliser pour le traitement de données par lot en fonction du contexte. Il présente également plusieurs technologies Google Cloud de transformation des données, y compris BigQuery, l'exécution de Spark sur Dataproc, les graphiques de pipelines dans Cloud Data Fusion et le traitement des données sans serveur avec Dataflow. Les participants mettront en pratique les connaissances qu'ils auront acquises en créant des composants de pipelines de données sur Google Cloud à l'aide de Qwiklabs.
Building Batch Data Pipelines on GCP en Français
This course is part of Data Engineer, Big Data and ML on Google Cloud en Français Specialization
Instructor: Google Cloud Training
Included with
What you'll learn
Explorer différentes méthodes de chargement de données (EL, ELT et ETL) et déterminer quand les utiliser.
Exécuter Hadoop sur Dataproc, utiliser Cloud Storage et optimiser les jobs Dataproc.
Créer des pipelines de traitement des données à l'aide de Dataflow.
Gérer des pipelines de données avec Data Fusion et Cloud Composer.
Details to know
Add to your LinkedIn profile
4 assignments
See how employees at top companies are mastering in-demand skills
Build your subject-matter expertise
- Learn new concepts from industry experts
- Gain a foundational understanding of a subject or tool
- Develop job-relevant skills with hands-on projects
- Earn a shareable career certificate
Earn a career certificate
Add this credential to your LinkedIn profile, resume, or CV
Share it on social media and in your performance review
There are 7 modules in this course
Dans ce module, nous vous présentons le cours et son déroulement.
What's included
1 video
Ce module passe en revue différentes méthodes de chargement de données (EL, ELT et ETL) et vous indique quand les utiliser.
What's included
6 videos1 assignment
Ce module vous apprend à exécuter Hadoop sur Dataproc, à exploiter Cloud Storage et à optimiser vos jobs Dataproc.
What's included
11 videos1 assignment1 app item
Ce module vous explique comment utiliser Dataflow pour créer vos pipelines de traitement de données.
What's included
13 videos1 assignment6 app items
Ce module vous montre comment gérer des pipelines de données avec Cloud Data Fusion et Cloud Composer.
What's included
13 videos1 assignment2 app items
Résumé du cours
What's included
1 video
Liens PDF vers tous les modules
What's included
1 reading
Instructor
Offered by
Recommended if you're interested in Cloud Computing
Why people choose Coursera for their career
New to Cloud Computing? Start here.
Open new doors with Coursera Plus
Unlimited access to 10,000+ world-class courses, hands-on projects, and job-ready certificate programs - all included in your subscription
Advance your career with an online degree
Earn a degree from world-class universities - 100% online
Join over 3,400 global companies that choose Coursera for Business
Upskill your employees to excel in the digital economy
Frequently asked questions
Yes, you can preview the first video and view the syllabus before you enroll. You must purchase the course to access content not included in the preview.
If you decide to enroll in the course before the session start date, you will have access to all of the lecture videos and readings for the course. You’ll be able to submit assignments once the session starts.
Once you enroll and your session begins, you will have access to all videos and other resources, including reading items and the course discussion forum. You’ll be able to view and submit practice assessments, and complete required graded assignments to earn a grade and a Course Certificate.