University of Illinois Urbana-Champaign
Fondements de l'analyse des données pour la comptabilité II
University of Illinois Urbana-Champaign

Fondements de l'analyse des données pour la comptabilité II

Enseigné en Anglais

Certains éléments de contenu peuvent ne pas être traduits

3 695 déjà inscrits

Cours

Familiarisez-vous avec un sujet et apprenez les fondamentaux

Robert J. Brunner

Instructeur : Robert J. Brunner

4.4

(10 avis)

niveau Débutant
Aucune connaissance prérequise
70 heures pour terminer
3 semaines à 23 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

9 quizzes

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Placeholder
Placeholder

Obtenez un certificat professionnel

Ajoutez cette qualification à votre profil LinkedIn ou à votre CV

Partagez-le sur les réseaux sociaux et dans votre évaluation de performance

Placeholder

Il y a 9 modules dans ce cours

Vous vous familiariserez avec le cours, vos camarades de classe et notre environnement d'apprentissage. L'orientation vous aidera également à acquérir les compétences techniques requises pour le cours.

Inclus

3 vidéos5 lectures1 quiz1 sujet de discussion

Ce module jette les bases du reste du cours en présentant les concepts fondamentaux de l'apprentissage automatique et, plus particulièrement, la manière d'effectuer l'apprentissage automatique à l'aide de Python et du module d'apprentissage automatique scikit learn. Tout d'abord, vous apprendrez comment l'apprentissage automatique et l'intelligence artificielle perturbent les entreprises. Ensuite, vous découvrirez les types de base de l'apprentissage automatique et comment exploiter ces algorithmes dans un script Python. Troisièmement, vous apprendrez comment la régression linéaire peut être considérée comme un problème d'apprentissage automatique dont les paramètres doivent être déterminés de manière informatique en minimisant une fonction de coût. Enfin, vous découvrirez les algorithmes basés sur les voisins, notamment l'algorithme du plus proche voisin, qui peut être utilisé à la fois pour les tâches de classification et de régression.

Inclus

4 vidéos3 lectures1 quiz1 devoir de programmation4 laboratoires non notés

Ce module présente plusieurs des algorithmes d'apprentissage automatique les plus importants : la régression logistique, les arbres de décision et les machines à vecteurs de support. Parmi ces trois algorithmes, le premier, la régression logistique, est un algorithme de classification (malgré son nom). Les deux autres, cependant, peuvent être utilisés pour des tâches de classification ou de régression. Ainsi, ce module approfondira le concept de classification machine, où les algorithmes apprennent à partir de données existantes et étiquetées à classer de nouvelles données inédites dans des catégories spécifiques, et le concept de régression machine, où les algorithmes apprennent un modèle à partir de données pour faire des prédictions pour de nouvelles données inédites. Bien que ces algorithmes diffèrent tous par leurs fondements mathématiques, ils sont souvent utilisés pour classer des données numériques, textuelles et des images ou pour effectuer des régressions dans une variété de domaines. Ce module passera également en revue les différentes techniques permettant de quantifier les performances d'un algorithme de classification et de régression, ainsi que la manière de traiter les données d'apprentissage déséquilibrées.

Inclus

5 vidéos4 lectures1 quiz1 devoir de programmation4 laboratoires non notés

Ce module présente plusieurs concepts importants et pratiques de l'apprentissage automatique. Tout d'abord, vous découvrirez les défis inhérents à l'application de l'analyse des données (et de l'apprentissage automatique en particulier) à des ensembles de données réelles. Ce module présente également plusieurs méthodologies que vous pourriez rencontrer à l'avenir et qui dictent la manière d'aborder, de traiter et de déployer des solutions d'analyse de données. Ensuite, vous découvrirez une technique puissante permettant de combiner les prédictions de nombreux apprenants faibles afin d'obtenir une meilleure prédiction grâce à un processus connu sous le nom d'apprentissage d'ensemble. Plus précisément, ce module vous présentera deux des techniques d'apprentissage d'ensemble les plus populaires : bagging et boosting, et vous montrera comment les utiliser dans un script d'analyse de données en Python. Enfin, le concept de pipeline d'apprentissage automatique est introduit, ce qui encapsule le processus de création, de déploiement et de réutilisation des modèles d'apprentissage automatique.

Inclus

5 vidéos3 lectures1 quiz1 devoir de programmation4 laboratoires non notés

Ce module présente le concept de régularisation, les problèmes qu'elle peut causer dans les analyses d'apprentissage automatique et les techniques pour y remédier. Tout d'abord, le concept de base du surajustement est présenté, ainsi que les moyens d'identifier son occurrence. Ensuite, la technique de validation croisée est introduite, ce qui peut atténuer la probabilité que le surajustement se produise. Ensuite, l'utilisation de la validation croisée pour identifier les paramètres optimaux d'un algorithme d'apprentissage automatique formé sur un ensemble de données donné est présentée. Enfin, le concept de régularisation, qui consiste à appliquer un terme de pénalité supplémentaire lors de la détermination des meilleurs paramètres du modèle d'apprentissage automatique, est présenté et démontré pour différents algorithmes de régression et de classification.

Inclus

5 vidéos4 lectures1 quiz1 devoir de programmation4 laboratoires non notés

Ce module commence par discuter des flux de travail pratiques d'apprentissage automatique qui sont déployés dans des environnements de production, ce qui met l'accent sur la vue d'ensemble de l'apprentissage automatique. Ensuite, ce module présente deux algorithmes fondamentaux supplémentaires : Bayes naïf et les processus gaussiens. Ces algorithmes reposent tous deux sur la théorie des probabilités, mais fonctionnent selon des hypothèses très différentes. Naive Bayes est généralement utilisé pour les tâches de classification, tandis que les processus gaussiens sont généralement utilisés pour les tâches de régression. Ce module aborde également les questions pratiques liées à la construction de flux de travail d'apprentissage automatique.

Inclus

4 vidéos4 lectures1 quiz1 devoir de programmation3 laboratoires non notés

Ce module présente un concept important de l'apprentissage automatique, la sélection des caractéristiques réelles qui seront utilisées par un algorithme d'apprentissage automatique. Avec le nettoyage des données, cette étape du processus d'analyse des données est extrêmement importante, mais elle est souvent négligée en tant que méthode d'amélioration des performances globales d'une analyse. Ce module commence par une discussion sur l'éthique dans l'apprentissage automatique, en grande partie parce que la sélection des caractéristiques peut avoir des impacts (parfois) non évidents sur la performance finale d'un algorithme. Cela peut être important lorsque l'apprentissage automatique est appliqué à des données dans un secteur réglementé ou lorsque l'application incorrecte d'un algorithme peut conduire à une discrimination. Le reste de ce module présente différentes techniques de sélection des meilleures caractéristiques d'un ensemble de données ou de construction de nouvelles caractéristiques à partir d'un ensemble de caractéristiques existant.

Inclus

5 vidéos4 lectures1 quiz1 devoir de programmation4 laboratoires non notés

Ce module présente le clustering, où les points de données sont assignés à des groupes de points plus larges sur la base d'une propriété spécifique, telle que la distance spatiale ou la densité locale des points. Alors que les humains trouvent souvent facilement des grappes visuellement dans des ensembles de données donnés, le problème est plus difficile à résoudre sur le plan informatique. Ce module commence par explorer les idées de base de cette technique d'apprentissage non supervisé, ainsi que les différents domaines dans lesquels le clustering peut être utilisé par les entreprises. Ensuite, l'une des techniques de clustering les plus populaires, K-means, est présentée. Ensuite, la technique DB-SCAN basée sur la densité est présentée. Ce module se termine par l'introduction de la technique des modèles de mélange pour l'affectation probabiliste de points aux grappes.

Inclus

5 vidéos5 lectures1 quiz1 devoir de programmation4 laboratoires non notés

Ce module présente le concept d'anomalie, ou de valeur aberrante, et les différentes techniques permettant d'identifier ces points de données inhabituels. Tout d'abord, le concept général d'anomalie est discuté et démontré dans le monde des affaires par la détection de la fraude, qui, en général, devrait être une anomalie par rapport aux clients ou aux opérations normales. Ensuite, des techniques statistiques permettant d'identifier les valeurs aberrantes sont présentées. Elles impliquent souvent de simples statistiques descriptives qui peuvent mettre en évidence des données suffisamment éloignées de la norme pour un ensemble de données donné. Enfin, nous passons en revue les techniques d'apprentissage automatique qui permettent de classer les valeurs aberrantes ou d'identifier les points situés dans des zones à faible densité (ou en dehors des grappes normales) comme étant des valeurs aberrantes potentielles.

Inclus

4 vidéos4 lectures1 quiz1 devoir de programmation3 laboratoires non notés1 plugin

Instructeur

Robert J. Brunner
University of Illinois Urbana-Champaign
5 Cours12 528 apprenants

Offert par

Recommandé si vous êtes intéressé(e) par L'essentiel pour les entreprises

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Avis des étudiants

Affichage de 3 sur 10

4.4

10 avis

  • 5 stars

    80 %

  • 4 stars

    0 %

  • 3 stars

    10 %

  • 2 stars

    0 %

  • 1 star

    10 %

AD
5

Révisé le 22 juin 2019

Placeholder

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à plus de 7 000 cours de renommée internationale, à des projets pratiques et à des programmes de certificats reconnus sur le marché du travail, tous inclus dans votre abonnement

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions