Il s'agit du troisième cours de la spécialisation IBM IA Enterprise Flux de travail Certification. Vous êtes FORTEMENT encouragé à suivre ces cours dans l'ordre, car il ne s'agit pas de cours individuels indépendants, mais d'une partie d'un flux de travail où chaque cours s'appuie sur les précédents.
Le cours 3 vous présente la prochaine étape du flux de travail pour notre entreprise de médias hypothétique. Au cours de cette étape, vous apprendrez les meilleures pratiques en matière d'ingénierie des caractéristiques, de gestion des déséquilibres de classe et de détection des biais dans les données. Les déséquilibres de classe peuvent sérieusement affecter la validité de vos modèles d'apprentissage automatique, et la modélisation des biais dans les données est essentielle pour réduire le risque associé aux modèles biaisés. Ces sujets seront suivis de sections sur les meilleures pratiques pour la réduction des dimensions, la détection des valeurs aberrantes et les techniques d'apprentissage non supervisé pour trouver des modèles dans vos données. Les études de cas se concentreront sur la modélisation des données et la visualisation des données. À la fin de ce cours, vous serez en mesure de : 1. Utiliser les outils qui aident à résoudre les problèmes de classe et de déséquilibre de classe 2. Expliquer les considérations éthiques concernant les biais dans les données 3. Utiliser les bibliothèques open source de l'IA Fairness 360 pour détecter les biais dans les modèles 4. Employer des techniques de réduction de dimension pour les deux étapes de l'aed et des Transformateurs 5. Décrire les techniques de modélisation des sujets dans le traitement du langage naturel (NLP) 6. Utiliser la modélisation des sujets et la visualisation pour explorer les données textuelles 7. Employer les meilleures pratiques de traitement des données aberrantes dans les données de haute dimension 8. Utiliser les algorithmes de détection des données aberrantes comme outil d'assurance qualité et comme outil de modélisation 9. Employer des techniques d'apprentissage non supervisé en utilisant des pipelines dans le cadre du flux de travail de l'IA 10. Employer des algorithmes de clustering de base Qui devrait suivre ce cours ? Ce cours vise les praticiens de la science des données existants qui ont une expertise dans la construction de modèles d'apprentissage automatique, qui veulent approfondir leurs compétences sur la construction et le déploiement de l'IA dans les grandes entreprises. Si vous êtes un aspirant Data Scientist, ce cours n'est PAS pour vous car vous avez besoin d'une expertise du monde réel pour bénéficier du contenu de ces cours. Quelles compétences devez-vous avoir ? Il est supposé que vous avez suivi les cours 1 et 2 de la spécialisation IBM IA Enterprise Flux de travail et que vous avez une solide compréhension des sujets suivants avant de commencer ce cours : Compréhension fondamentale de l'algèbre linéaire ; Comprendre l'échantillonnage, la théorie des probabilités et les distributions de probabilité ; Connaissance des concepts statistiques descriptifs et déductifs ; Compréhension générale des techniques d'apprentissage automatique et des meilleures pratiques ; Compréhension pratiquée de Python et des paquets couramment utilisés en science des données : NumPy, Pandas, matplotlib, scikit-learn ; Familiarité avec IBM Watson Studio ; Familiarité avec le processus de design thinking.