Développement d'applications cloud accélérées par FPGA avec SDAccel : Théorie

Saisissez l'occasion de faire des économies ! Bénéficiez de 40 % de réduction sur 3 mois de Coursera Plus et d'un accès complet à des milliers de cours.

Développement d'applications cloud accélérées par FPGA avec SDAccel : Théorie

Instructeur : Marco Domenico Santambrogio

4 163 déjà inscrits

Inclus avec

6 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

77 avis

niveau Intermédiaire

Expérience recommandée

2 semaines à compléter

à 10 heures par semaine

Planning flexible

Apprenez à votre propre rythme

6 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

77 avis

niveau Intermédiaire

Expérience recommandée

2 semaines à compléter

à 10 heures par semaine

Planning flexible

Apprenez à votre propre rythme

Ce que vous apprendrez

La théorie sur la façon de développer des applications accélérées par FPGA avec SDAccel.

Compétences que vous acquerrez

Catégorie : Development Environment
Catégorie : System Design and Implementation
Catégorie : Cloud Infrastructure
Catégorie : Application Specific Integrated Circuits
Catégorie : Hardware Architecture
Catégorie : Computer Architecture
Catégorie : Programming Principles
Catégorie : Cloud Development
Catégorie : Performance Tuning

Outils que vous découvrirez

Catégorie : Amazon Web Services
Catégorie : Amazon Elastic Compute Cloud
Catégorie : Cloud Applications

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

7 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

En savoir plus sur Coursera pour les affaires

logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Il y a 6 modules dans ce cours

Ce cours s'adresse à toute personne passionnée par le développement d'applications accélérées par FPGA avec SDAccel ! Nous entrons dans une ère où le progrès technologique induit des changements de paradigme dans l'informatique ! En tant que compromis entre les deux caractéristiques extrêmes du GPP et de l'ASIC, nous pouvons trouver un nouveau concept, une nouvelle idée de l'informatique... l'informatique reconfigurable, qui a combiné les avantages des deux mondes précédents. Dans ce contexte, nous pouvons dire que l'informatique reconfigurable aura un impact large, omniprésent et progressif sur la vie humaine. Il est donc temps de se concentrer sur la manière dont l'informatique reconfigurable et les techniques de conception de systèmes reconfigurables doivent être utilisées pour construire des applications. D'une part, l'informatique reconfigurable peut offrir de meilleures performances par rapport à une mise en œuvre logicielle, mais cela se paie en termes de temps de mise en œuvre. Dans ce contexte, les outils SDx de Xilinx, y compris l'environnement SDAccel, l'environnement SDSoC et Vivado HLS, offrent une expérience prête à l'emploi aux programmeurs de systèmes qui cherchent à partitionner des éléments d'une application logicielle pour les exécuter dans un élément matériel basé sur un FPGA, et à faire en sorte que ce matériel fonctionne de manière transparente avec le reste de l'application exécutée dans un processeur ou un processeur embarqué.

L'expérience prête à l'emploi fournira des résultats intéressants et, disons-le, "suffisamment bons" pour de nombreuses applications. Cependant, ce n'est peut-être pas le cas pour vous, vous recherchez peut-être de meilleures performances, un meilleur débit de données, une latence réduite, ou une réduction de l'utilisation des ressources... Ce cours se concentre exactement sur ce point. Après vous avoir présenté les FPGA, nous allons approfondir les détails de l'utilisation de Xilinx SDAccel en vous fournissant des exemples pratiques sur la façon d'optimiser la logique matérielle pour obtenir le meilleur de vos implémentations matérielles. Dans ce cas, certains attributs, directives ou pragmas peuvent être utilisés pour diriger la compilation et la synthèse du noyau matériel, ou pour optimiser la fonction du transfert de données opérant entre le processeur et la logique matérielle. En outre, dans ce cours, nous allons nous concentrer sur les infrastructures distribuées et hétérogènes, en présentant comment donner vie à vos solutions en utilisant les instances F1 d'Amazon EC2.

Depuis le milieu des années 1980, l'informatique reconfigurable est devenue un domaine populaire grâce aux progrès de la technologie FPGA. Un FPGA est un dispositif semi-conducteur contenant des composants logiques programmables et des interconnexions programmables, mais pas de récupération d'instructions au moment de l'exécution, c'est-à-dire que les FPGA n'ont pas de compteur de programme. Dans la plupart des FPGA, les composants logiques peuvent être programmés pour reproduire la fonctionnalité des portes logiques de base ou des propriétés intellectuelles (IP) fonctionnelles. Les FPGA comprennent également des éléments de mémoire composés de simples bascules ou de blocs de mémoire plus complexes. Ainsi, les FPGA ont rendu possible l'exécution et la configuration dynamiques du matériel et du logiciel sur une seule puce. Ce module fournit une description détaillée des technologies FPGA, depuis une description générale jusqu'à la discussion sur les détails de configuration de bas niveau de ces dispositifs, en passant par la composition du flux binaire et la description des registres de configuration.

Inclus

9 vidéos2 devoirs

9 vidéos Total 57 minutes

Technologies informatiques reconfigurables et FPGA 5 minutes
Systèmes à base de FPGA et reconfiguration 4 minutes
Système sur puce programmable 8 minutes
Système sur puce programmable 4 minutes
Principaux éléments constitutifs des FPGA 7 minutes
Comment programmer un FPGA : flux binaire et configuration 6 minutes
Comment programmer un FPGA : description du système et conception physique 8 minutes
Outils de CAO pour la conception de systèmes basés sur des FPGA 6 minutes
Une introduction à l'environnement de développement SDx 9 minutes

2 devoirs Total 70 minutes

QUIZ 1 40 minutes
QUIZ 2 30 minutes

L'environnement de développement SDAccel de Xilinx permet à l'utilisateur d'exprimer des noyaux en OpenCL C, C++ et RTL (par exemple SystemVerilog, Verilog ou VHDL) pour les exécuter sur les plates-formes programmables de Xilinx. La plate-forme programmable est composée (1) du compilateur de code ouvert SDAccel Xilinx (XOCC), (2) d'une archive de support de dispositif (DSA) qui décrit la plate-forme matérielle, (3) d'une plate-forme logicielle, (4) d'une carte accélératrice, et5. enfin et surtout, du moteur d'exécution SDAccel OpenCL. Dans ce module, après une introduction à OpenCL, nous allons voir comment ce langage a été utilisé dans SDAccel et les principaux "composants" de cette chaîne d'outils.

Inclus

7 vidéos1 lecture1 devoir

7 vidéos Total 37 minutes

Flux de conception du matériel 6 minutes
Introduction à SDAccel et au flux basé sur OpenCL 6 minutes
Modèle de calcul OpenCL : tailles globales et locales 4 minutes
Pas seulement OpenCL ! La raison d'être des flux RTL et C 5 minutes
Modèle de mémoire SDAccel 5 minutes
Émulations SDAccel 5 minutes
Temps d'exécution SDAccel 5 minutes

1 lecture Total 120 minutes

Guide du programmeur de l'environnement SDAccel 120 minutes

1 devoir Total 30 minutes

QUIZ 3 30 minutes

Dans ce module, avant d'aborder l'optimisation, nous allons d'abord comprendre comment fonctionne un FPGA, également d'un point de vue informatique. Bien que le flux de conception traditionnel d'un FPGA soit plus proche d'un circuit intégré classique que d'un processeur, un FPGA offre des avantages significatifs en termes de coûts par rapport à l'effort de développement d'un circuit intégré et offre le même niveau de performance dans la plupart des cas. Un autre avantage du FPGA par rapport au circuit intégré est sa capacité à être reconfiguré dynamiquement. Ce processus, qui est identique au chargement d'un programme dans un processeur, peut affecter une partie ou la totalité des ressources disponibles dans le tissu FPGA. Par rapport aux architectures de processeurs, les structures qui composent le tissu FPGA permettent un haut degré de parallélisme dans l'exécution des applications. L'architecture de traitement personnalisée générée par SDAccel pour un noyau OpenCL présente un paradigme d'exécution différent. Ceci doit être pris en compte lorsque l'on décide de porter une application d'un processeur vers un FPGA. Pour mieux comprendre un tel scénario, nous allons brièvement comparer l'exécution séquentielle d'un processeur avec la nature parallèle intrinsèque d'une implémentation FPGA. En outre, dans ce module, nous allons nous familiariser avec le flux d'optimisation de l'application. L'environnement SDAccel de Xilinx est un environnement de développement logiciel complet, pour créer, compiler et optimiser les applications OpenCL avec l'objectif d'être accélérées sur les FPGA de Xilinx. Du point de vue du concepteur, nous pouvons organiser le flux d'optimisation d'une application dans l'environnement SDAccel en trois phases. Ces trois phases sont les suivantes (1) la définition de base des fonctionnalités et des performances, (2) l'optimisation du mouvement des données et (3) l'optimisation du calcul du noyau

Inclus

5 vidéos1 lecture1 devoir

5 vidéos Total 37 minutes

Introduction 6 minutes
Parallélisme du FPGA et architecture du processeur 1/2 7 minutes
Parallélisme du FPGA et architecture du processeur 2/2 8 minutes
Ordonnancement, pipeline et flux de données 8 minutes
Flux d'optimisation de l'application 7 minutes

1 lecture Total 90 minutes

Guide d'optimisation et de profilage de l'environnement SDAccel 90 minutes

1 devoir Total 30 minutes

QUIZ 4 30 minutes

Les optimisations présentées ne sont pas les seules disponibles, mais il s'agit plutôt d'une liste de recommandations pour optimiser les performances d'une application OpenCL qui doit être utilisée comme point de départ pour des idées à considérer ou à étudier plus avant. Dans ce contexte, nous organiserons ces "recommandations" en trois ensembles d'optimisations : (1) optimisations arithmétiques, (2) optimisations liées aux données, et enfin (3) optimisations liées à la mémoire.

Inclus

6 vidéos2 lectures1 devoir

6 vidéos Total 34 minutes

Une vue d'ensemble des optimisations de SDAccel 9 minutes
Optimisation des interfaces : Contexte général et aperçu d'une architecture cible typique 6 minutes
Optimisation des interfaces : un premier exemple 6 minutes
Transfert de données en rafale 4 minutes
Utilisation de la largeur de données AXI complète 5 minutes
Utilisation de plusieurs banques de mémoire 3 minutes

2 lectures Total 210 minutes

Guide d'optimisation et de profilage de l'environnement SDAccel 120 minutes
Sources Codes 90 minutes

1 devoir Total 30 minutes

QUIZ 5 30 minutes

Après une description générale des optimisations possibles, nous nous concentrerons dans ce module sur quatre optimisations spécifiques (1) loop unrolling, (2) loop pipelining, (3) array partitioning et (4) the host optimisations. Tout d'abord, nous décrirons le loop unrolling, qui consiste à dérouler les itérations de la boucle de sorte que le nombre d'itérations de la boucle soit réduit et que le corps de la boucle effectue un calcul supplémentaire. Cette technique permet d'exposer un parallélisme supplémentaire au niveau des instructions que Vivado HLS peut exploiter pour mettre en œuvre la conception matérielle finale. Ensuite, nous présenterons l'optimisation du pipelining des boucles, où nous passerons d'une exécution séquentielle des itérations de boucle à une exécution pipelinée dans laquelle les itérations de boucle se chevauchent dans le temps. Ensuite, nous présenterons l'optimisation du partitionnement des tableaux qui permet d'optimiser l'utilisation des ressources BRAM afin d'améliorer les performances du noyau. Enfin, à la fin de ce module, nous allons discuter des optimisations liées au système hôte qui est responsable du transfert des données vers et depuis la carte FPGA, ainsi que de l'envoi de la commande pour démarrer l'exécution d'un noyau.

Inclus

6 vidéos2 lectures1 devoir

6 vidéos Total 43 minutes

Optimisation du noyau : déroulement de la boucle 1/2 6 minutes
Optimisation du noyau : déroulement de la boucle 2/2 6 minutes
Optimisation du noyau : pipelining des boucles 10 minutes
Optimisation du noyau : partitionnement des tableaux 1/2 8 minutes
Optimisation du noyau : partitionnement des tableaux 2/2 7 minutes
Optimisation de l'hébergement 6 minutes

2 lectures Total 180 minutes

Guide d'optimisation et de profilage de l'environnement SDAccel 90 minutes
Codes sources 90 minutes

1 devoir Total 30 minutes

QUIZ 6 30 minutes

Inclus

3 vidéos1 lecture1 devoir

Instructeur

Évaluations de l’enseignant

(16 évaluations)

Marco Domenico Santambrogio

Politecnico di Milano

5 Cours 24 281 apprenants

Offert par

Politecnico di Milano

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018

’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020

’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021

’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Avis des étudiants

5 stars
76,62 %
4 stars
22,07 %
3 stars
0 %
2 stars
1,29 %
1 star
0 %

Affichage de 3 sur 77

Révisé le 20 juin 2020

It is a good course to know the basic of Xilinx sdaccel with a bit more inclination towards the history of the development of FPGA.

Révisé le 23 mars 2020

It was less about how to code more about theory and in this course they mainly talked about high level synthesis.

Révisé le 30 nov. 2020

An amazing course and Instructor. The course provides brief insights about accelerating the Cloud applications using the Xilinx SDAccel tool.

Voir plus d’avis

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Découvrir les diplômes

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions

Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.

Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la spécialisation et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.

Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien de demande sur la page de description.