Études de cas : Analyse des sentiments et prédiction des défauts de paiement Dans notre étude de cas sur l'analyse des sentiments, vous créerez des modèles qui prédisent une classe (sentiment positif/négatif) à partir de caractéristiques d'entrée (texte des avis, informations sur le profil de l'utilisateur,...). Dans notre deuxième étude de cas pour ce cours, la prédiction de défaut de paiement, vous allez traiter des données financières, et prédire quand un prêt est susceptible d'être risqué ou sûr pour la banque. Ces tâches sont des exemples de classification, l'un des domaines les plus utilisés de l'apprentissage automatique, avec un large éventail d'applications, y compris le ciblage publicitaire, la détection de spam, le diagnostic médical et la classification d'images.
Dans ce cours, vous créerez des classificateurs qui fournissent des performances de pointe dans une variété de tâches. Vous vous familiariserez avec les techniques les plus performantes et les plus utilisées dans la pratique, notamment la régression logistique, les arbres de décision et le boosting. En outre, vous serez en mesure de concevoir et d'implémenter les algorithmes sous-jacents qui peuvent apprendre ces modèles à grande échelle, en utilisant l'ascension stochastique du gradient. Vous mettrez en œuvre ces techniques sur des tâches réelles d'apprentissage automatique à grande échelle. Vous aborderez également des tâches importantes auxquelles vous serez confrontés dans les applications réelles de l'apprentissage automatique, y compris la gestion des données manquantes et la mesure de la précision et du rappel pour évaluer un classificateur. Ce cours est pratique, plein d'action et rempli de visualisations et d'illustrations de la façon dont ces techniques se comportent sur des données réelles. Nous avons également inclus du contenu optionnel dans chaque module, couvrant des sujets avancés pour ceux qui veulent aller encore plus loin !
Objectifs d'apprentissage : A la fin de ce cours, vous serez capable de : -Décrire l'entrée et la sortie d'un modèle de classification -Traiter les problèmes de classification binaire et multiclasse -Mettre en œuvre un modèle de régression logistique pour la classification à grande échelle -Créer un modèle non linéaire à l'aide d'une décision d'un expert -Mettre en œuvre un modèle de régression logistique pour la classification à grande échelle.
-Créer un modèle non linéaire à l'aide d'arbres de décision -Améliorer les performances de n'importe quel modèle à l'aide du boosting -Mettre à l'échelle vos méthodes à l'aide de l'ascension stochastique du gradient -Décrire les limites de décision sous-jacentes.
-Construire un modèle de classification pour prédire le sentiment dans un ensemble de données d'évaluation de produits.
-Analyser des données financières pour prédire les défauts de paiement -Utiliser des techniques pour traiter les données manquantes -Evaluer vos modèles en utilisant des métriques de précision-rappel -Mettre en œuvre ces techniques en Python (ou dans le langage de votre choix, bien que Python soit fortement recommandé).