L'apprentissage supervisé aide les entreprises à relever des défis et à mieux utiliser les données. Découvrez sa définition, ses algorithmes, ses applications réelles et ses différences avec l'apprentissage non supervisé.
Read in English (Lire en Anglais).
L'apprentissage supervisé est une catégorie du domaine de l'apprentissage automatique définie par l'utilisation de modèles qui s'entraînent avec des données étiquetées pour faire des prédictions ou classer de nouvelles données. Dans les données étiquetées, les caractéristiques existent en tant qu'entrées et les cibles existent en tant que sorties. Avec ces entrées et sorties, le modèle s'entraîne afin de découvrir la correspondance entre elles pour faire des prédictions précises sur d'autres ensembles de données.
Diverses applications utilisent largement l'apprentissage supervisé. Cet article explore plus en détail ce qu'est l'apprentissage supervisé et ses nombreuses utilisations dans le monde d'aujourd'hui.
L'apprentissage supervisé est une catégorie de l'apprentissage automatique qui implique l'utilisation d'ensembles de données étiquetées pour former des modèles et des algorithmes permettant de prédire les caractéristiques de nouvelles données inédites. Chaque sortie correspond à une entrée, ce qui signifie qu'il existe une étiquette de sortie correspondante pour chaque caractéristique d'entrée présente dans les données étiquetées. Le modèle d'apprentissage supervisé vise à comprendre et à commencer à cartographier la relation globale entre les entrées et les sorties afin d'élaborer un algorithme capable de déterminer une prévision précise sur de nouvelles données d'entrée.
La collecte des données, la sélection des caractéristiques et des modèles, la formation des modèles, l'évaluation des modèles et la prédiction sont quelques-uns des éléments cruciaux du processus d'apprentissage supervisé. Dans des secteurs tels que la vision artificielle et la finance, l'apprentissage supervisé est utilisé de diverses manières. Les exemples incluent l'analyse des sentiments, l'identification des images et les prédictions boursières.
L'exploration de données consiste à utiliser des techniques pour analyser de grands ensembles de données dans le but de découvrir des tendances dans les données. Dans le contexte de l'apprentissage supervisé, l'exploration de données identifie les caractéristiques ou les variables pertinentes à utiliser comme données d'entrée pour le modèle. Il existe différents algorithmes et techniques de data mining qui permettent de passer au crible de vastes ensembles de données afin d'obtenir des résultats significatifs.
L'objectif de la régression, une forme d'apprentissage supervisé, est de prévoir une valeur de sortie numérique continue à partir d'un ensemble de données d'entrée. Dans la régression, le modèle apprend à faire correspondre les données d'entrée à une variable de sortie continue, par exemple en prédisant le prix d'une action ou d'un logement sur la base de caractéristiques telles que l'emplacement, la taille et l'âge.
La classification est une forme différente d'apprentissage supervisé, qui vise à prévoir une variable de sortie catégorique à partir de caractéristiques d'entrée. Dans la classification, le modèle apprend à faire correspondre les données d'entrée à un ensemble de catégories de sortie discrètes, comme prédire si un email est un spam ou non sur la base de caractéristiques telles que l'expéditeur, l'objet et le contenu.
Ces algorithmes sont un ensemble de méthodes informatiques utilisées pour construire et former des modèles permettant de faire des prévisions précises sur la base de données étiquetées. Voici quelques algorithmes standard d'apprentissage supervisé :
Le réseau neuronal est un modèle d'apprentissage automatique qui utilise plusieurs couches de nœuds connectés. Ces nœuds apprennent à cartographier les données d'entrée et à les relier à des sorties sous la forme d'une prédiction. Le processus global se caractérise par la propagation vers l'avant et la rétropropagation. Le modèle ressemble au cerveau humain par son fonctionnement et sa structure. Les réseaux neuronaux ont donné des résultats impressionnants dans des domaines tels que le traitement du langage naturel et la reconnaissance d'images.
Cette structure arborescente est un outil utile pour faire des prédictions basées sur des caractéristiques d'entrée. Les données d'entrée des arbres de décision sont divisées de manière répétée en groupes plus petits en fonction des propriétés les plus utiles jusqu'à ce qu'une prédiction se produise aux nœuds feuilles de l'arbre. Les applications des arbres de décision comprennent l'évaluation du risque de crédit et le diagnostic médical.
En utilisant le théorème de Bayes pour ajuster la probabilité d'une hypothèse à la lumière de nouvelles données, la logique bayésienne est une méthode probabiliste d'apprentissage automatique. Les utilisations et les applications de la logique bayésienne comprennent la recherche de probabilités conditionnelles liées au risque relatif d'un client dans un contexte financier et le calcul de l'exactitude des résultats médicaux.
Plusieurs arbres de décision se combinent dans les forêts aléatoires, une technique d'apprentissage d'ensemble, pour augmenter la fiabilité et la précision des prédictions. Ces arbres décisionnels s'entraînent sur divers sous-ensembles des données d'entrée et des caractéristiques pour créer des forêts aléatoires, qui combinent ensuite les prédictions des différents arbres pour produire une prédiction finale.
L'analyse discriminante linéaire (LDA) permet de distinguer et d'identifier des modèles entre deux classes de données. Elle peut également s'avérer utile pour classer des modèles multiples. Cette méthode statistique trouve une combinaison linéaire de caractéristiques qui permet de séparer au mieux deux classes ou plus dans les données d'entrée. LDA est utile dans le prétraitement et dans des applications telles que la reconnaissance faciale.
L'apprentissage par similarité implique la formation d'un modèle pour apprendre une fonction de similarité entre des paires de données d'entrée. L'objectif de l'apprentissage par similarité est de faire correspondre des points de données similaires à des points proches dans un espace à faible dimension et des points de données dissemblables à des points éloignés. L'apprentissage par similarité est utile dans diverses applications, notamment les recommandations de produits dans le commerce électronique et la récupération et la classification d'images.
Il existe de nombreux exemples d'apprentissage supervisé dans divers domaines et industries. Voici quelques exemples spécifiques d'apprentissage supervisé dans le monde d'aujourd'hui, dans un large éventail de domaines et d'utilisations :
L'analyse de sentiment des clients se concentre sur l'analyse des commentaires des clients, tels que les critiques de produits ou les messages sur les réseaux sociaux, afin de déterminer le sentiment du message. Les données d'entrée sont des données textuelles et les étiquettes de sortie sont les catégories de sentiment, telles que positif, négatif ou neutre.
Les algorithmes de régression, en particulier la régression logistique, sont utiles pour l'analyse du sentiment des clients. D'autres exemples d'algorithmes applicables dans ce cas incluent les machines à vecteurs de support, qui sont utiles pour traiter la similarité non linéaire, et les réseaux neuronaux, qui peuvent apprendre des fonctions complexes.
La détection de spampermet d'identifier les emails indésirables en analysant le contenu et les antécédents de l'expéditeur de chaque email. Diverses techniques d'apprentissage automatique et d'apprentissage profond ont montré leur capacité à déterminer si un email est un spam ou non. Parmi les exemples d'algorithmes pertinents pour la détection des spams, on peut citer K-Nearest Neighbor (KNN), les réseaux neuronaux convolutifs profonds (Deep CNN) et les Bayes naïfs.
L'analyse prédictive est une utilisation courante de l'apprentissage supervisé, qui consiste à utiliser des données historiques pour prévoir ce qui pourrait se produire à l'avenir. Par exemple, un prêteur peut utiliser l'apprentissage supervisé pour prédire quels clients sont susceptibles de ne pas rembourser leurs prêts en fonction de facteurs tels que leurs antécédents en matière de crédit. Les données d'entrée sont des données historiques et les étiquettes de sortie sont des valeurs binaires indiquant si l'événement en question s'est produit ou non. Les modèles se répartissent en trois catégories : La classification, les séries temporelles et le regroupement.
L'apprentissage supervisé et l'apprentissage non supervisé diffèrent dans la manière dont les données sont étiquetées et dans la manière dont l'apprentissage a lieu. Voici quelques similitudes et différences entre les deux :
Similitudes :
Les deux algorithmes d'apprentissage forment des modèles pour faire des prédictions ou découvrir des patterns dans les données.
Ils utilisent tous deux des techniques statistiques et des algorithmes pour obtenir des informations à partir d'ensembles de données afin de prévoir ou de classer les données.
Ils ont tous deux pour objectif ultime d'extraire des informations significatives des données.
Différences :
L'apprentissage supervisé nécessite des données étiquetées, ce qui signifie que les données d'apprentissage ont déjà reçu une étiquette avec la valeur de sortie correcte. En revanche, l'apprentissage non supervisé fonctionne avec des données non étiquetées sans valeurs de sortie prédéfinies.
L'apprentissage non supervisé permet de trouver des tendances cachées dans les données elles-mêmes, tandis que l'apprentissage supervisé est généralement utile pour prévoir des événements futurs sur la base de données historiques.
Un modèle s'entraîne sur des données étiquetées pour créer des prévisions sur de nouvelles données dans le cadre de l'apprentissage supervisé. Cela diffère de l'apprentissage non supervisé, où le modèle s'entraîne sur des données non étiquetées pour découvrir des modèles et des relations qui ne sont pas immédiatement visibles.
La régression logistique, les réseaux neuronaux et les arbres de décision sont des algorithmes courants qui relèvent de l'apprentissage supervisé. Les algorithmes d'apprentissage non supervisé comprennent le regroupement, la réduction de la dimensionnalité et l'extraction de règles d'association.
Apprenez-en plus sur l'apprentissage supervisé et l'apprentissage automatique en suivant un cours ou en obtenant un certificat pertinent. Sur Coursera, vous trouverez certains des meilleurs cours d'apprentissage automatique au monde.
Par exemple, consultez la Spécialisation en Apprentissage Automatique de Stanford et DeepLearning.AI. Ce cours couvre les compétences et les concepts clés liés à l'apprentissage automatique et à l'IA, ce qui vous permet d'acquérir une expérience précieuse pour commencer votre carrière. Le programme comprend la construction de modèles d'apprentissage automatique et de réseaux neuronaux, ainsi que la formation de modèles supervisés et l'utilisation de processus d'apprentissage non supervisés.
Le Certificat Professionnel IBM Machine Learning est un autre cours pertinent qui vaut la peine d'être exploré pour vous mettre au défi. En l'espace de quelques mois, ce cours vous permettra d'acquérir les compétences nécessaires pour occuper des postes dans le domaine de l'apprentissage automatique. Vous apprendrez les subtilités de divers algorithmes d'apprentissage automatique, comment former correctement un réseau neuronal et les bases du filtrage collaboratif, entre autres concepts.
Équipe éditoriale
L’équipe éditoriale de Coursera est composée de rédacteurs, de rédacteurs et de vérificateurs de fai...
Ce contenu a été mis à disposition à des fins d'information uniquement. Il est conseillé aux étudiants d'effectuer des recherches supplémentaires afin de s'assurer que les cours et autres qualifications suivis correspondent à leurs objectifs personnels, professionnels et financiers.