Lernen Sie, wie man multimodale Such- und RAG-Systeme aufbaut. RAG-Systeme erweitern ein LLM, indem sie eigene Daten in den Kontext der Eingabeaufforderung einbeziehen. Normalerweise verwenden RAG-Anwendungen Textdokumente, aber was ist, wenn der gewünschte Kontext Multimedia wie Bilder, Audio und Video enthält? Dieser Kurs behandelt die technischen Aspekte der Implementierung von RAG mit multimodalen Daten, um dies zu erreichen. 1. Lernen Sie, wie multimodale Modelle durch kontrastives Lernen trainiert werden und implementieren Sie es auf einem realen Datensatz. 2. Aufbau einer multimodalen Any-to-Any-Suche, um relevanten Kontext über verschiedene Datentypen hinweg zu finden. 3. Lernen Sie, wie LLMs trainiert werden, um multimodale Daten durch visuelles Instruktionstuning zu verstehen, und wenden Sie sie auf mehrere Beispiele für Bildschlüsse an. 4. Implementierung eines multimodalen End-to-End-RAG-Systems, das den abgerufenen multimodalen Kontext analysiert, um aufschlussreiche Antworten zu generieren. 5. Erforschung von Industrieanwendungen wie die visuelle Analyse von Rechnungen und Flussdiagrammen zur Ausgabe strukturierter Daten. 6. Erstellen eines multivektoralen Empfehlungssystems, das relevante Artikel vorschlägt, indem es ihre Ähnlichkeiten über mehrere Modalitäten hinweg vergleicht. AS Da KI-Systeme zunehmend mehrere Datenmodalitäten verarbeiten und schlussfolgern müssen, ist das Erlernen des Aufbaus solcher Systeme eine wichtige Fähigkeit für KI-Entwickler. Dieser Kurs vermittelt Ihnen die Schlüsselkompetenzen zum Einbetten, Abrufen und Generieren über verschiedene Modalitäten hinweg. Durch den Erwerb einer soliden Grundlage in multimodaler KI werden Sie darauf vorbereitet, intelligentere Such-, RAG- und Empfehlungssysteme zu entwickeln.
Empfohlene Erfahrung
Was Sie lernen werden
Lernen Sie Multimodalität mit kontrastivem Lernen, um modalitätsunabhängige Einbettungen für nahtlose Any-to-Any-Abfragen zu erstellen.
Aufbau multimodaler RAG-Systeme, die multimodalen Kontext abrufen und darauf aufbauend relevantere Antworten generieren.
Implementierung industrieller Anwendungen der multimodalen Suche und Aufbau von multivektoralen Empfehlungssystemen.
Kompetenzen, die Sie festigen
- Kategorie: Multimodale KI
- Kategorie: RAG
- Kategorie: LLM
Wichtige Details
Juni 2024
Nur als Desktop-Version verfügbar
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.
Lernen, üben und anwenden von berufsrelevanten Fähigkeiten in weniger als 2 Stunden
- Nehmen Sie an Schulungen von Branchenexperten teil
- Sammeln Sie mit Aufgaben aus der realen Welt praktische Erfahrung
Über dieses Projekt
Dozent
Was Sie beim Lernen erwartet
Praktisches, projektbasiertes Lernen
Üben Sie die Anwendung neuer Kompetenzen, indem Sie berufsbezogene Aufgaben anhand von detaillierten Anweisungen lösen.
Keine Downloads oder Installation erforderlich
Greifen Sie in einer Cloud-Umgebung auf die Tools und Ressourcen zu.
Nur für Desktop verfügbar
Dieses Projekt ist für die Bearbeitung an einem Laptop oder Desktop-Computer mit stabiler Internetverbindung konzipiert und nicht für Mobilgeräte.
Warum entscheiden sich Menschen für Coursera für ihre Karriere?
Ihnen könnte auch Folgendes gefallen:
Google Cloud
DeepLearning.AI
Google Cloud
Neue Karrieremöglichkeiten mit Coursera Plus
Unbegrenzter Zugang zu über 7.000 erstklassigen Kursen, praktischen Projekten und Zertifikatsprogrammen, die Sie auf den Beruf vorbereiten – alles in Ihrem Abonnement enthalten
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.
Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.
Häufig gestellte Fragen
Bei Projekten absolvieren Sie eine Aktivität oder ein Szenario, indem Sie in einer interaktiven, praxisnahen Umgebung eine Reihe von Anweisungen befolgen. Projekte werden in einer echten Cloud-Umgebung und in echten Instanzen verschiedener Produkte bearbeitet, nicht in einer Simulation oder Demo-Umgebung.
Mit dem Kauf eines Projekts erhalten Sie alles, was Sie zum Abschluss des Projekts benötigen, einschließlich des vorübergehenden Zugriffs auf jedes Produkt, das zum Abschluss des Projekts nötig ist.
Auch wenn Projekte theoretisch auf Mobilgeräten verfügbar sind, empfehlen wir Ihnen dringend, sie nur auf einem Laptop oder Desktop-Computer zu bearbeiten.