El manejo de datos que permita generar conocimiento útil para una organización es cada vez más importante en los trabajos de alta demanda al día de hoy. Es así como este curso presenta al estudiante una metodología para el desarrollo de proyectos basados en datos, en especial de ciencia de datos. Hace énfasis en los procesos de exploración, transformación, integración de fuentes de datos estructuradas y no estructuradas con el fin de mejorar la eficiencia y calidad en los resultados de análisis posteriores como los basados en modelos analíticos. El estudiante tendrá a su disposición diferentes tutoriales con ejemplos en contextos cercanos a la realidad para comprender mejor los conceptos desarrollados en el curso y practicar su aprendizaje con el punto de extensión propuesto en cada tutorial. De igual manera, contará con videos, lecturas ilustradas y sugerencias de lecturas para profundizar en los temas de interés. Consideramos que esto le permitirá al estudiante afianzar sus conocimientos llevando a la práctica lo aprendido.
Integración y preparación de datos
This course is part of Ciencia de datos Specialization
Instructors: Maria Del Pilar Villamil Giraldo
Sponsored by EdgePoint Software
8,317 already enrolled
(89 reviews)
Recommended experience
What you'll learn
Comprender qué proceso de exploración, transformación e integración de datos, se requiere para formular una solución a un problema centrado en datos.
Comprender y aplicar técnicas para explorar, transformar e integrar fuentes de datos estructuradas y no estructuradas.
Identificar y solucionar problemas en los datos relacionados con su calidad.
Skills you'll gain
Details to know
Add to your LinkedIn profile
9 assignments
See how employees at top companies are mastering in-demand skills
Build your subject-matter expertise
- Learn new concepts from industry experts
- Gain a foundational understanding of a subject or tool
- Develop job-relevant skills with hands-on projects
- Earn a shareable career certificate
Earn a career certificate
Add this credential to your LinkedIn profile, resume, or CV
Share it on social media and in your performance review
There are 4 modules in this course
Bienvenido al primer módulo del curso. En este módulo trabajaremos sobre la metodología para realizar proyectos centrados en datos, en especial de ciencia de datos. Adicionalmente, profundizaremos en la etapa de entendimiento de los datos, para lo cual comprenderemos temas relacionados con perfilamiento, exploración de datos y visualización de los mismos. De igual manera, introduciremos el caso del proyecto y tendremos una serie de videos en diferentes sectores que espero te ayuden a lograr los objetivos del módulo y disfrutarlo.
What's included
7 videos10 readings3 assignments1 discussion prompt3 plugins
Bienvenido al segundo módulo del curso, centrado en la forma de preparar datos para mejorar su calidad. En este módulo tendrás la oportunidad de entender qué es calidad de datos, describiremos algunas de las dimensiones de calidad más frecuentes en fuentes de datos y las acompañaremos de videos, tutoriales y actividades que te permitirán comprender estas temáticas, entender los problemas que se generan en los datos relacionados con las dimensiones de calidad y, algunas formas de solucionarlos.
What's included
4 videos7 readings2 assignments2 discussion prompts5 plugins
Hola, en este módulo nos centraremos en la integración de datos. Con ello en mente, nos enfocaremos en las diferentes formas de unir dos o más fuentes de información con el fin de generar análisis y conclusiones que no habríamos podido obtener con información fragmentada. Allí recae el punto de importancia de aprender a integrar datos, pues la información integrada representa un valor para nuestros proyectos de Ciencias de Datos. Es por ello que en este módulo vamos a ver qué hay diferentes formas de unir diferentes fuentes de información, como lo son los joins, union y merge. Además, veremos los conceptos de lookup y de filtrado condicional de información en Pandas. Podrás aplicar todo lo aprendido en las actividades del módulo y en los ejercicios propuestos. ¡Espero te guste!
What's included
4 videos6 readings2 assignments2 discussion prompts3 plugins
Bienvenido al cuarto y último modulo del curso. En este módulo veras como transformar datos, con el fin de tener un conjunto de datos que podamos trabajar fácilmente al momento de entrenar nuestros modelos de predicción. Vas a poder seleccionar y transformar atributos mediante técnicas como la normalización, la combinación de atributos para generar nuevas variables, la reducción de dimensionalidad y la transformación de texto. Tendrás la oportunidad de reforzar tu aprendizaje mediante ejercicios prácticos y tutoriales utilizando Python.
What's included
4 videos8 readings2 assignments1 discussion prompt4 plugins
Instructors
Offered by
Why people choose Coursera for their career
Learner reviews
89 reviews
- 5 stars
88.76%
- 4 stars
10.11%
- 3 stars
1.12%
- 2 stars
0%
- 1 star
0%
Showing 3 of 89
Reviewed on May 22, 2024
un curso que disfruté muchísimo, me dio la oportunidad de avanzar de acuerdo a mi ritmo.
Reviewed on Oct 19, 2024
excelente contenido puede mejorar en la cuestion de aprendizaje interactivo
Recommended if you're interested in Data Science
Fundação Instituto de Administração
Universidad Nacional Autónoma de México
Universitat Autònoma de Barcelona
Universidad de Chile
Open new doors with Coursera Plus
Unlimited access to 10,000+ world-class courses, hands-on projects, and job-ready certificate programs - all included in your subscription
Advance your career with an online degree
Earn a degree from world-class universities - 100% online
Join over 3,400 global companies that choose Coursera for Business
Upskill your employees to excel in the digital economy