Il s'agit du deuxième cours de la spécialisation IBM IA Enterprise Flux de travail Certification. Vous êtes FORTEMENT encouragé à suivre ces cours dans l'ordre, car il ne s'agit pas de cours individuels indépendants, mais d'une partie d'un flux de travail où chaque cours s'appuie sur les précédents.
Dans ce cours, vous commencerez votre travail pour une entreprise hypothétique de médias en continu en effectuant une analyse exploratoire des données (AED). Les meilleures pratiques en matière de visualisation des données, de traitement des données manquantes et de tests d'hypothèses vous seront présentées dans le cadre de votre travail. Vous apprendrez les techniques d'estimation avec des distributions de probabilités et l'extension de ces estimations pour appliquer des tests de signification de l'hypothèse nulle. Vous appliquerez ce que vous avez appris à travers deux études de cas pratiques : la visualisation des données et les tests multiples à l'aide d'un pipeline simple. À la fin de ce cours, vous devriez être en mesure de : 1. Énumérer plusieurs meilleures pratiques concernant l'AED et la visualisation des données 2. Créer un tableau de bord simple dans Watson Studio 3. Décrire des stratégies pour traiter les données manquantes 4. Expliquer la différence entre l'imputation et l'imputation multiple 5. Employer des distributions courantes pour répondre à des questions sur les probabilités d'événements 6. Expliquez le rôle d'investigation des tests d'hypothèse dans l'AED 7. Appliquer plusieurs méthodes pour traiter les tests multiples Qui devrait suivre ce cours ? Ce cours vise les praticiens de la science des données existants qui ont une expertise dans la construction de modèles d'apprentissage automatique, qui veulent approfondir leurs compétences sur la construction et le déploiement de l'IA dans les grandes entreprises. Si vous êtes un aspirant Data Scientist, ce cours n'est PAS pour vous car vous avez besoin d'une expertise du monde réel pour bénéficier du contenu de ces cours. Quelles compétences devez-vous avoir ? Il est supposé que vous avez suivi le cours 1 de la spécialisation IBM IA Enterprise Flux de travail et que vous avez une solide compréhension des sujets suivants avant de commencer ce cours : Compréhension fondamentale de l'algèbre linéaire ; Comprendre l'échantillonnage, la théorie des probabilités et les distributions de probabilité ; Connaissance des concepts statistiques descriptifs et déductifs ; Compréhension générale des techniques d'apprentissage automatique et des meilleures pratiques ; Compréhension pratiquée de Python et des paquets couramment utilisés en science des données : NumPy, Pandas, matplotlib, scikit-learn ; Familiarité avec IBM Watson Studio ; Familiarité avec le processus de design thinking.