La visión por computador es una destreza indispensable en el mercado laboral, catalizando avances significativos en campos como la inteligencia artificial, la robótica y la automatización. Su uso transforma nuestra interacción con la tecnología, optimizando sistemas de producción y fomentando la innovación en la interacción humano-computadora. Nuestro curso brinda una comprensión detallada de esta tecnología, destacando su capacidad para procesar información visual en diversas tareas.
Visión artificial contemporánea
Instructor: Pablo Andrés Arbeláez Escalante
Sponsored by Louisiana Workforce Commission
Recommended experience
What you'll learn
Reconocer los orígenes históricos de la visión por computador y explorar arquitecturas clave que la impulsaron.
Identificar las aplicaciones de arquitecturas modernas en casos prácticos de la vida diaria usando técnicas de visión por computador.
Identificar áreas esenciales de la visión por computador, como reconocimiento, segmentación y reconstrucción.
Details to know
Add to your LinkedIn profile
4 assignments
See how employees at top companies are mastering in-demand skills
Earn a career certificate
Add this credential to your LinkedIn profile, resume, or CV
Share it on social media and in your performance review
There are 4 modules in this course
Este módulo ofrece una introducción a la visión por computador, abarcando desde su conceptualización hasta sus aplicaciones prácticas. Exploraremos las tareas fundamentales que constituyen este campo, la evolución histórica de la tecnología y los principios de cómo las máquinas interpretan las imágenes. Nos adentraremos en la naturaleza de las imágenes digitales, cómo se forman y cómo se estructuran los conjuntos de datos para su análisis. Introduciremos el uso del aprendizaje profundo para la clasificación de imágenes y desglosaremos los conceptos y la arquitectura detrás de las Redes Neuronales Convolucionales (CNN). Al final de este módulo, los participantes podrán construir su propia CNN y tendrán una comprensión sólida de los fundamentos de la visión por computador, preparándolos para sumergirse en aplicaciones más complejas.
What's included
4 videos6 readings1 assignment2 plugins
En este módulo exploramos los Transformers Visuales, su impacto en el campo de la visión por computador y sus aplicaciones en escenarios reales. Comenzaremos con una visión general de este sistema, introduciendo su arquitectura innovadora y cómo se diferencia de otros modelos en el procesamiento de imágenes. Además, examinaremos los componentes clave que permiten abordar tareas como la clasificación, detección y segmentación de imágenes. Además, introduciremos distintos métodos de supervisión del aprendizaje automático que darán al participante herramientas necesarias en escenarios donde no hay suficientes anotaciones. Finalizado este módulo, habremos estudiado también los fundamentos de la segmentación y sus inicios como tarea de visión por computador.
What's included
2 videos4 readings1 assignment2 plugins
En este módulo exploraremos los principios básicos de la reconstrucción 3D, el análisis de movimiento y la visión egocéntrica. Iniciaremos con una revisión de los parámetros esenciales para la calibración de cámaras, los cuales son cruciales para el análisis de imágenes en diversas aplicaciones de la visión por computadora. Proseguiremos con el estudio de las técnicas para la reconstrucción tridimensional y el análisis del movimiento, además de revisar algunas de sus aplicaciones prácticas en escenarios reales. Posteriormente, nos enfocaremos en la visión egocéntrica, examinando su evolución y algunas de las principales bases de datos que impulsan el progreso en este campo. Al finalizar este módulo, los participantes tendrán una comprensión sólida de los principios y técnicas que fundamentan la calibración de cámaras, el análisis de movimiento y la visión egocéntrica, preparándolos para aplicar estos conocimientos en el desarrollo de tecnologías de realidad aumentada, realidad mixta y entornos virtuales.
What's included
1 video4 readings1 assignment2 plugins
Este módulo ofrece una introducción a la creciente área de la generación y a los modelos fundacionales en la visión por computador. Exploraremos herramientas de gran utilidad en la generación de imágenes sintéticas, como lo son las redes generativas y los modelos de difusión. Asimismo, los participantes aprenderán a reconocer las limitaciones de estos modelos y el funcionamiento del estado del arte. Exploraremos los elementos esenciales de los modelos fundacionales y cómo éstos permiten combinar datos de distinta naturaleza. Al finalizar, los participantes tendrán el conocimiento necesario para reconocer las piezas clave del desarrollo de herramientas de inteligencia artificial y estarán listos para aplicarlas en tareas de visión por computador.
What's included
3 videos3 readings1 assignment1 ungraded lab
Instructor
Offered by
Why people choose Coursera for their career
Recommended if you're interested in Data Science
École Polytechnique Fédérale de Lausanne
Google Cloud
Tecnológico de Monterrey
Coursera Project Network
Open new doors with Coursera Plus
Unlimited access to 10,000+ world-class courses, hands-on projects, and job-ready certificate programs - all included in your subscription
Advance your career with an online degree
Earn a degree from world-class universities - 100% online
Join over 3,400 global companies that choose Coursera for Business
Upskill your employees to excel in the digital economy