- Serverless Computing
- Apache Hive
- Apache Hadoop
- Performance Tuning
- Data Pipelines
- Google Cloud Platform
- Data Processing
- PySpark
- Data Migration
- Extract, Transform, Load
- Dataflow
- Apache Spark
Building Batch Data Pipelines on GCP en Español
Completed by Rodrigo Jonathan González Salazar
November 29, 2021
17 hours (approximately)
Rodrigo Jonathan González Salazar's account is verified. Coursera certifies their successful completion of Building Batch Data Pipelines on GCP en Español
What you will learn
Revisar los diferentes métodos de carga de datos: EL, ELT y ETL, y cuándo corresponde usarlos.
Ejecutar Hadoop en Dataproc, usar Cloud Storage y optimizar trabajos de Dataproc.
Compilar tus canalizaciones para el procesamiento de datos con Dataflow.
Administrar canalizaciones de datos con Data Fusion y Cloud Composer.
Skills you will gain

