Nehmen Sie an unserem neuen Kurzkurs Efficiently Serving Large Language Models (Effiziente Bereitstellung großer Sprachmodelle) teil, um ein grundlegendes Verständnis für die Bereitstellung von LLM-Anwendungen von Travis Addair, CTO bei Predibase, zu erlangen. Unabhängig davon, ob Sie bereit sind, Ihre eigene Anwendung zu starten oder gerade erst mit dem Aufbau beginnen, werden die Themen, die Sie in diesem Kurs erforschen werden, Ihr grundlegendes Wissen über die Funktionsweise von LLMs vertiefen und Ihnen helfen, die Leistungsabwägungen besser zu verstehen, die Sie beim Aufbau von LLM-Anwendungen, die eine große Anzahl von Nutzern bedienen sollen, in Betracht ziehen müssen. Sie werden die wichtigsten Optimierungen durchlaufen, die es LLM-Anbietern ermöglichen, Modelle effizient an viele Kunden zu liefern, einschließlich Strategien für die Arbeit mit mehreren fein abgestimmten Modellen gleichzeitig. In diesem Kurs werden Sie: 1. Lernen Sie, wie auto-regressive große Sprachmodelle Text Token für Token generieren. 2. Implementierung der grundlegenden Elemente eines modernen LLM-Inferenzstapels in Code, einschließlich KV-Caching, kontinuierliches Batching und Modellquantisierung, und Benchmarking ihrer Auswirkungen auf den Inferenzdurchsatz und die Latenzzeit. 3. Erforschen Sie die Details der Funktionsweise von LoRA-Adaptern und lernen Sie, wie durch Batching-Techniken verschiedene LoRA-Adapter gleichzeitig an mehrere Kunden ausgeliefert werden können. 4. Lernen Sie den LoRAX-Framework-Inferenzserver von Predibase kennen, um zu sehen, wie diese Optimierungstechniken in einem realen LLM-Inferenzserver implementiert werden. Wenn Sie mehr über die Funktionsweise von LLM-Servern wissen, wird Ihr Verständnis für die Möglichkeiten, die Sie haben, um die Leistung und Effizienz Ihrer LLM-gestützten Anwendungen zu steigern, erheblich verbessert.
Empfohlene Erfahrung
Was Sie lernen werden
Erfahren Sie, wie Large Language Models (LLMs) wiederholt das nächste Token vorhersagen und wie Techniken wie KV-Caching die Texterstellung erheblich beschleunigen können.
Code für effizientes LLM-App-Serving, der die Geschwindigkeit der Modellausgabe und die gleichzeitige Bedienung vieler Nutzer ausgleicht.
Lernen Sie die Grundlagen von Low Rank Adaptern kennen und erfahren Sie, wie Predibase seinen Framework Inference Server aufbaut, um fein abgestimmte Modelle auf einmal zu bedienen.
Kompetenzen, die Sie festigen
- Kategorie: Python (Programmiersprache)
- Kategorie: LLM
Wichtige Details
Juni 2024
Nur als Desktop-Version verfügbar
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.
Lernen, üben und anwenden von berufsrelevanten Fähigkeiten in weniger als 2 Stunden
- Nehmen Sie an Schulungen von Branchenexperten teil
- Sammeln Sie mit Aufgaben aus der realen Welt praktische Erfahrung
Über dieses Projekt
Dozent
Was Sie beim Lernen erwartet
Praktisches, projektbasiertes Lernen
Üben Sie die Anwendung neuer Kompetenzen, indem Sie berufsbezogene Aufgaben anhand von detaillierten Anweisungen lösen.
Keine Downloads oder Installation erforderlich
Greifen Sie in einer Cloud-Umgebung auf die Tools und Ressourcen zu.
Nur für Desktop verfügbar
Dieses Projekt ist für die Bearbeitung an einem Laptop oder Desktop-Computer mit stabiler Internetverbindung konzipiert und nicht für Mobilgeräte.
Warum entscheiden sich Menschen für Coursera für ihre Karriere?
Neue Karrieremöglichkeiten mit Coursera Plus
Unbegrenzter Zugang zu über 7.000 erstklassigen Kursen, praktischen Projekten und Zertifikatsprogrammen, die Sie auf den Beruf vorbereiten – alles in Ihrem Abonnement enthalten
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.
Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.
Häufig gestellte Fragen
Bei Projekten absolvieren Sie eine Aktivität oder ein Szenario, indem Sie in einer interaktiven, praxisnahen Umgebung eine Reihe von Anweisungen befolgen. Projekte werden in einer echten Cloud-Umgebung und in echten Instanzen verschiedener Produkte bearbeitet, nicht in einer Simulation oder Demo-Umgebung.
Mit dem Kauf eines Projekts erhalten Sie alles, was Sie zum Abschluss des Projekts benötigen, einschließlich des vorübergehenden Zugriffs auf jedes Produkt, das zum Abschluss des Projekts nötig ist.
Auch wenn Projekte theoretisch auf Mobilgeräten verfügbar sind, empfehlen wir Ihnen dringend, sie nur auf einem Laptop oder Desktop-Computer zu bearbeiten.