Os pipelines de dados geralmente se encaixam em um desses três paradigmas: extração e carregamento (EL), extração, carregamento e transformação (ELT) ou extração, transformação e carregamento (ETL). Este curso descreve qual paradigma deve ser usado em determinadas situações e quando isso ocorre com dados em lote. Além disso, vamos falar sobre várias tecnologias no Google Cloud para transformação de dados, incluindo o BigQuery, a execução do Spark no Dataproc, gráficos de pipeline no Cloud Data Fusion e processamento de dados sem servidor com o Dataflow. Os participantes vão ganhar experiência prática na criação de componentes de pipelines de dados no Google Cloud usando o Qwiklabs.
Building Batch Data Pipelines on GCP em Português Brasileiro
This course is part of Data Engineer, Big Data and ML on Google Cloud em Português Specialization
Instructor: Google Cloud Training
Sponsored by InternMart, Inc
(15 reviews)
What you'll learn
Analisar diferentes métodos de carregamento de dados: EL, ELT e ETL e quando usar cada um deles.
Executar o Hadoop no Dataproc, usar o Cloud Storage e otimizar os jobs do Dataproc.
Usar o Dataflow para criar pipelines de processamento de dados.
Gerenciar pipelines de dados com o Data Fusion e o Cloud Composer.
Details to know
Add to your LinkedIn profile
4 assignments
See how employees at top companies are mastering in-demand skills
Build your subject-matter expertise
- Learn new concepts from industry experts
- Gain a foundational understanding of a subject or tool
- Develop job-relevant skills with hands-on projects
- Earn a shareable career certificate
Earn a career certificate
Add this credential to your LinkedIn profile, resume, or CV
Share it on social media and in your performance review
There are 6 modules in this course
Neste módulo, vamos apresentar o curso e a programação.
What's included
1 video
Este módulo analisa diferentes métodos de carregamento de dados: EL, ELT e ETL e quando usar cada um deles.
What's included
6 videos1 assignment
Este módulo mostra como executar o Hadoop no Dataproc, como usar o Cloud Storage e como otimizar os jobs do Dataproc.
What's included
11 videos1 assignment1 app item
Este módulo aborda o uso do Dataflow para criar pipelines de processamento de dados.
What's included
13 videos1 assignment6 app items
Este módulo mostra como gerenciar pipelines de dados com o Cloud Data Fusion e o Cloud Composer.
What's included
13 videos1 assignment2 app items
Resumo do curso
What's included
1 video
Instructor
Offered by
Why people choose Coursera for their career
Recommended if you're interested in Information Technology
Open new doors with Coursera Plus
Unlimited access to 10,000+ world-class courses, hands-on projects, and job-ready certificate programs - all included in your subscription
Advance your career with an online degree
Earn a degree from world-class universities - 100% online
Join over 3,400 global companies that choose Coursera for Business
Upskill your employees to excel in the digital economy