Effiziente Betreuung von LLMs

Effiziente Betreuung von LLMs

Dozent: Travis Addair

Projekt

Bauen Sie mit detaillierten Anweisungen gefragte Jobkompetenzen auf.

Stufe Mittel

Empfohlene Erfahrung

1 Stunde

In Ihrem eigenen Lerntempo lernen

Praktisches Lernen

Mehr erfahren

Projekt

Bauen Sie mit detaillierten Anweisungen gefragte Jobkompetenzen auf.

Stufe Mittel

Empfohlene Erfahrung

1 Stunde

In Ihrem eigenen Lerntempo lernen

Praktisches Lernen

Mehr erfahren

Was Sie lernen werden

Erfahren Sie, wie Large Language Models (LLMs) wiederholt das nächste Token vorhersagen und wie Techniken wie KV-Caching die Texterstellung erheblich beschleunigen können.
Code für effizientes LLM-App-Serving, der die Geschwindigkeit der Modellausgabe und die gleichzeitige Bedienung vieler Nutzer ausgleicht.
Lernen Sie die Grundlagen von Low Rank Adaptern kennen und erfahren Sie, wie Predibase seinen Framework Inference Server aufbaut, um fein abgestimmte Modelle auf einmal zu bedienen.

Kompetenzen, die Sie festigen

Kategorie: Python (Programmiersprache)
Kategorie: LLM

Wichtige Details

Unterrichtet in Englisch

Keine Downloads oder Installation erforderlich

Nur als Desktop-Version verfügbar

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Weitere Informationen zu Coursera für Unternehmen

Lernen, üben und anwenden von berufsrelevanten Fähigkeiten in weniger als 2 Stunden

Nehmen Sie an Schulungen von Branchenexperten teil
Sammeln Sie mit Aufgaben aus der realen Welt praktische Erfahrung

Über dieses Projekt

Nehmen Sie an unserem neuen Kurzkurs Efficiently Serving Large Language Models (Effiziente Bereitstellung großer Sprachmodelle) teil, um ein grundlegendes Verständnis für die Bereitstellung von LLM-Anwendungen von Travis Addair, CTO bei Predibase, zu erlangen. Unabhängig davon, ob Sie bereit sind, Ihre eigene Anwendung zu starten oder gerade erst mit dem Aufbau beginnen, werden die Themen, die Sie in diesem Kurs erforschen werden, Ihr grundlegendes Wissen über die Funktionsweise von LLMs vertiefen und Ihnen helfen, die Leistungsabwägungen besser zu verstehen, die Sie beim Aufbau von LLM-Anwendungen, die eine große Anzahl von Nutzern bedienen sollen, in Betracht ziehen müssen. Sie werden die wichtigsten Optimierungen durchlaufen, die es LLM-Anbietern ermöglichen, Modelle effizient an viele Kunden zu liefern, einschließlich Strategien für die Arbeit mit mehreren fein abgestimmten Modellen gleichzeitig. In diesem Kurs werden Sie: 1. Lernen Sie, wie auto-regressive große Sprachmodelle Text Token für Token generieren. 2. Implementierung der grundlegenden Elemente eines modernen LLM-Inferenzstapels in Code, einschließlich KV-Caching, kontinuierliches Batching und Modellquantisierung, und Benchmarking ihrer Auswirkungen auf den Inferenzdurchsatz und die Latenzzeit. 3. Erforschen Sie die Details der Funktionsweise von LoRA-Adaptern und lernen Sie, wie durch Batching-Techniken verschiedene LoRA-Adapter gleichzeitig an mehrere Kunden ausgeliefert werden können. 4. Lernen Sie den LoRAX-Framework-Inferenzserver von Predibase kennen, um zu sehen, wie diese Optimierungstechniken in einem realen LLM-Inferenzserver implementiert werden. Wenn Sie mehr über die Funktionsweise von LLM-Servern wissen, wird Ihr Verständnis für die Möglichkeiten, die Sie haben, um die Leistung und Effizienz Ihrer LLM-gestützten Anwendungen zu steigern, erheblich verbessert.

Dozent

Travis Addair

DeepLearning.AI

1 Kurs395 Lernende

von

DeepLearning.AI

Was Sie beim Lernen erwartet

Praktisches, projektbasiertes Lernen
Üben Sie die Anwendung neuer Kompetenzen, indem Sie berufsbezogene Aufgaben anhand von detaillierten Anweisungen lösen.
Keine Downloads oder Installation erforderlich
Greifen Sie in einer Cloud-Umgebung auf die Tools und Ressourcen zu.
Nur für Desktop verfügbar
Dieses Projekt ist für die Bearbeitung an einem Laptop oder Desktop-Computer mit stabiler Internetverbindung konzipiert und nicht für Mobilgeräte.

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018

„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020

„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021

„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Ihnen könnte auch Folgendes gefallen:

IBM
Grundlagen der KI-Agenten mit RAG und LangChain
Kurs
IESE Business School
Wie man ein effektives Dienstleistungsunternehmen aufbaut
Kurs
DeepLearning.AI
Funktionen, Tools und Agenten mit LangChain
Projekt
DeepLearning.AI
Datenspeicherung und Abfragen
Kurs

Neue Karrieremöglichkeiten mit Coursera Plus

Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten

Mehr erfahren

Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.

Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online

Erkunden Sie die Abschlüsse

Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.

Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.

Mehr erfahren

Häufig gestellte Fragen

Bei Projekten absolvieren Sie eine Aktivität oder ein Szenario, indem Sie in einer interaktiven, praxisnahen Umgebung eine Reihe von Anweisungen befolgen. Projekte werden in einer echten Cloud-Umgebung und in echten Instanzen verschiedener Produkte bearbeitet, nicht in einer Simulation oder Demo-Umgebung.

Mit dem Kauf eines Projekts erhalten Sie alles, was Sie zum Abschluss des Projekts benötigen, einschließlich des vorübergehenden Zugriffs auf jedes Produkt, das zum Abschluss des Projekts nötig ist.

Auch wenn Projekte theoretisch auf Mobilgeräten verfügbar sind, empfehlen wir Ihnen dringend, sie nur auf einem Laptop oder Desktop-Computer zu bearbeiten.

Weitere Fragen

Besuchen Sie die das Hilfe-Center für Kursteilnehmer.

Effiziente Betreuung von LLMs

Was Sie lernen werden

Kompetenzen, die Sie festigen

Wichtige Details

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Lernen, üben und anwenden von berufsrelevanten Fähigkeiten in weniger als 2 Stunden

Über dieses Projekt

Dozent

von

Was Sie beim Lernen erwartet

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Ihnen könnte auch Folgendes gefallen:

Grundlagen der KI-Agenten mit RAG und LangChain

Wie man ein effektives Dienstleistungsunternehmen aufbaut

Funktionen, Tools und Agenten mit LangChain

Datenspeicherung und Abfragen

Neue Karrieremöglichkeiten mit Coursera Plus

Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.

Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.

Häufig gestellte Fragen

Wie ist die Lernerfahrung bei Projekten?

Was bekomme ich, wenn ich ein Projekt kaufe?

Sind Projekte auf dem Desktop und auf Mobilgeräten verfügbar?

Weitere Fragen