Apprenez à construire des systèmes de recherche multimodale et des systèmes RAG. Les systèmes RAG améliorent un LLM en incorporant des données propriétaires dans le contexte d'interrogation. En général, les applications RAG utilisent des documents textuels, mais que se passe-t-il si le contexte souhaité comprend des éléments multimédias tels que des images, des sons et des vidéos ? Ce cours couvre les aspects techniques de la mise en œuvre de RAG avec des données multimodales. 1. Apprendre comment les modèles multimodaux sont formés par l'apprentissage contrastif et l'implémenter sur un ensemble de données réelles. 2. Construire une recherche multimodale any-to-any pour récupérer un contexte pertinent à travers différents types de données. 3. Apprendre comment les LLMs sont entraînés à comprendre les données multimodales par Visualisation des données et les utiliser sur de multiples exemples de raisonnement par l'image. 4. Mettre en œuvre un système RAG multimodal de bout en bout qui analyse le contexte multimodal récupéré pour générer des réponses pertinentes. 5. Explorer des applications industrielles telles que la Visualisation des données de factures et d'organigrammes pour produire des données structurées. 6. Créer un système de recommandation multi-vectoriel qui suggère des éléments pertinents en comparant leurs similitudes à travers plusieurs modalités. Comme les systèmes IA ont de plus en plus besoin de traiter et de raisonner sur plusieurs modalités de données, apprendre à construire de tels systèmes est une compétence importante pour les développeurs IA. Ce cours vous permet d'acquérir les compétences clés pour intégrer, récupérer et générer à travers différentes modalités. En acquérant une base solide en IA multimodale, vous serez prêt à construire des systèmes de recherche, de RAG et de recommandation plus intelligents.
(15 avis)
Expérience recommandée
Ce que vous apprendrez
Apprendre la multimodalité grâce à l'apprentissage contrastif pour créer des encastrements indépendants de la modalité pour une recherche transparente de n'importe quoi.
Construire des systèmes RAG multimodaux qui récupèrent le contexte multimodal et l'analysent pour générer des réponses plus pertinentes.
Mettre en œuvre des applications industrielles de recherche multimodale et construire des systèmes de recommandation multi-vectoriels.
Compétences que vous pratiquerez
- Catégorie : IA multimodale
- Catégorie : RAG
- Catégorie : LLM
Détails à connaître
Disponible uniquement sur ordinateur
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées
Apprendre, pratiquer et appliquer des compétences prêtes à l'emploi en moins de 2 heures
- Bénéficiez d’une formation par des experts du secteur
- Gagnez en expérience pratique en effectuant des tâches professionnelles du monde réel
À propos de ce projet
Instructeur
Offert par
Méthode d’apprentissage
Apprentissage pratique basé sur des projets
Mettez en pratique de nouvelles compétences en effectuant des tâches professionnelles à l’aide d’instructions étape par étape.
Aucun téléchargement ou installation requis(e)
Accédez aux outils et aux ressources dont vous avez besoin dans un environnement cloud.
Disponible uniquement sur ordinateur de bureau
Ce projet est conçu pour les ordinateurs portables ou de bureau disposant d’une connexion internet fiable, et non pour les appareils mobiles.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Vous aimerez peut-être aussi
Macquarie University
DeepLearning.AI
DeepLearning.AI
Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
Dans les projets, vous réaliserez une activité ou un scénario en suivant un ensemble d’instructions au sein d’un environnement pratique et interactif. Les projets sont réalisés dans un environnement Cloud réel et dans des instances réelles de divers produits, plutôt que dans un environnement de simulation ou de démonstration.
En achetant un projet, vous obtenez tout ce dont vous avez besoin pour terminer ce projet, y compris un accès temporaire à tout produit nécessaire pour terminer le projet.
Même si les Projets sont techniquement disponibles sur les appareils mobiles, nous vous conseillons vivement d’effectuer les projets sur un ordinateur portable ou de bureau uniquement.