Big Data Technologies émergentes

Big Data Technologies émergentes

Ce cours fait partie de Spécialisation Technologies émergentes : Des smartphones aux technologies de l'information et de la communication (IdO) en passant par les données massives (Big Data)

Instructeur : Jong-Moon Chung

33 018 déjà inscrits

Inclus avec

6 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

316 avis

niveau Débutant

Aucune connaissance prérequise

Planning flexible

3 semaines à 10 heures une semaine

Apprenez à votre propre rythme

94%

La plupart des étudiants ont apprécié ce cours

6 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

316 avis

niveau Débutant

Aucune connaissance prérequise

Planning flexible

3 semaines à 10 heures une semaine

Apprenez à votre propre rythme

94%

La plupart des étudiants ont apprécié ce cours

Compétences que vous acquerrez

Catégorie : Part de marché
Catégorie : Traitement des données
Catégorie : Apache Hadoop
Catégorie : Données en temps réel
Catégorie : Informatique distribuée
Catégorie : Business Analytics
Catégorie : Analyse statistique
Catégorie : Stratégie commerciale
Catégorie : Évolutivité
Catégorie : Analytique
Catégorie : Logiciel d'analyse des données
Catégorie : Big Data
Catégorie : SPSS
Catégorie : Apache Spark
Section Compétences masquée. Affichage de 10 compétence(s) sur 14.

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

10 affectations¹

Noté par l'IA voir l'avis de non-responsabilité

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

En savoir plus sur Coursera pour les affaires

logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation Technologies émergentes : Des smartphones aux technologies de l'information et de la communication (IdO) en passant par les données massives (Big Data)

Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.

Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable

Il y a 6 modules dans ce cours

Chaque fois que vous utilisez Google pour effectuer une recherche, chaque fois que vous utilisez Facebook, Twitter, Instagram ou tout autre SNS (service de réseau social), et chaque fois que vous achetez des produits à partir d'une liste de produits recommandés sur Amazon.com, vous utilisez un système de big data. En outre, la technologie du big data soutient chaque jour votre smartphone, votre smartwatch, Alexa, Siri et votre automobile (s'il s'agit d'un modèle plus récent). Les plus grandes entreprises du monde utilisent actuellement la technologie des big data, et toutes les entreprises ont besoin d'un soutien technologique avancé en matière de big data. En d'autres termes, la technologie big data n'est pas une option pour votre entreprise, c'est une nécessité pour sa survie et sa croissance. C'est donc le bon moment pour apprendre ce qu'est le big data et comment l'utiliser au profit de votre entreprise. Ce cours de 6 modules se concentre d'abord sur le classement des parts de marché de l'industrie mondiale du matériel, des logiciels et des services professionnels en matière de big data, puis couvre les principales lignes de produits et les types de services des grandes entreprises de big data dans le monde. Ensuite, les conférences se concentrent sur la façon dont l'analyse des big data est possible en se basant sur les trois technologies big data les plus populaires au monde : Hadoop, Spark et Storm. La dernière partie se concentre sur la fourniture d'une expérience sur l'un des systèmes d'analyse statistique de big data les plus célèbres et les plus largement utilisés dans le monde, IBM SPSS Statistics. Ce cours a été conçu pour vous préparer à mieux réussir la planification stratégique des entreprises dans l'ère du Big Data qui s'annonce. Bienvenue dans le monde étonnant des Big Data !

Le premier module "Classements et produits Big Data" se concentre sur les relations et les parts de marché du matériel, des logiciels et des services professionnels Big Data. Ces informations donnent un aperçu de la manière dont l'industrie, les produits, les services, les écoles et les organisations gouvernementales seront influencés par la technologie des big data. Pour avoir une vision plus approfondie de la ligne de produits et des types de services des big data dans le monde, l'exposé donne un aperçu des principales sociétés de big data, notamment IBM, SAP, Oracle, HPE, Splunk, Dell, Teradata, Microsoft, Cisco et AWS. Afin de comprendre la puissance de la technologie des big data, la différence entre l'analyse des big data et l'analyse traditionnelle des données est expliquée. Cette présentation est suivie d'un exposé sur les 4 grands défis de la technologie des big data, qui traitent des problèmes liés au volume, à la variété, à la vitesse et à la véracité des données massives. Sur la base de ces informations introductives, la technologie des big data utilisée par Wal-Mart, Amazon et Citibank pour ajouter des informations globales sur les investissements, aider à localiser de nouveaux magasins et usines, et exécuter des systèmes de recommandation en temps réel est présentée.

Inclus

6 vidéos2 devoirs

Le deuxième module "Big Data & Hadoop" se concentre sur les caractéristiques et les opérations de Hadoop, qui est le système original de big data utilisé par Google. Les cours expliquent la fonctionnalité de MapReduce, HDFS (Hadoop Distributed FileSystem) et le traitement des blocs de données. Ces fonctions sont exécutées sur un cluster de nœuds qui se voient attribuer le rôle de NameNode ou de DataNodes, où le traitement des données est effectué par le JobTracker et le TaskTracker, qui sont expliqués dans les cours. En outre, les caractéristiques des types de métadonnées et les différences entre les processus d'analyse des données de Hadoop et de SQL (Structured Query Language) sont expliquées. Ensuite, la série de versions Hadoop est présentée et comprend les descriptions de la technologie big data Hadoop YARN (Yet Another Resource Negotiator), HDFS Federation et HDFS HA (High Availability).

Inclus

8 vidéos2 devoirs

8 vidéos Total 68 minutes

2.1 Les Big Data en action / 2.2 Caractéristiques des Big Data 8 minutes
2.3 Les 4 Vs du Big Data / 2.4 Comment le Big Data est-il utilisé ? 9 minutes
2.5 HADOOP 11 minutes
2.6 MapReduce vs. SGBDR 6 minutes
2.7 MapReduce 10 minutes
2.8 Hadoop vs. SQL (RDBMS & RDSMS) 12 minutes
2.9 Améliorations de HDFS 4 minutes
2.10 Hadoop vs. Hadoop YARN 7 minutes

2 devoirs Total 30 minutes

Quiz non noté 30 minutes
Quiz noté 0 minutes

Le troisième module "Spark" se concentre sur les opérations et les caractéristiques de Spark, qui est actuellement la technologie big data la plus populaire au monde. La conférence couvre d'abord les différences entre les caractéristiques d'analyse de données de Spark et de Hadoop, puis les caractéristiques du traitement de big data Spark basé sur les unités centrales RDD (Resilient Distributed Datasets), Spark Core, Spark SQL, Spark Streaming, MLlib (Machine Learning Library), et GraphX. Les détails des caractéristiques des étapes Spark DAG (Directed Acyclic Graph) et des processus de pipeline qui sont formés sur la base des transformations et des actions Spark sont expliqués. En particulier, la définition et les avantages des transformations paresseuses et des opérations DAG sont décrits, ainsi que les caractéristiques des variables Spark et de la sérialisation. En outre, le processus des opérations de cluster Spark basées sur Mesos, Standalone et YARN est introduit.

Inclus

11 vidéos2 devoirs

11 vidéos Total 101 minutes

3.1 Apache Spark 5 minutes
3.2 Architecture Spark / 3.3 Famille Spark 9 minutes
3.4 Spark vs. Hadoop 12 minutes
3.5 Spark RDD 6 minutes
3.6 Spark Transformations / 3.7 Spark Actions / 3.8 Spark DAG 13 minutes
3.9 Programmation Spark 7 minutes
3.10 Spark Core / 3.11 Spark Variables & Serialization 7 minutes
3.12 Opérations Spark Cluster / 3.13 Spark Standalone / 3.14 Spark Mesos 14 minutes
3.15 Spark YARN 9 minutes
3.16 Spark SQL / 3.17 Spark GraphX 5 minutes
3.18 Base de données relationnelle et base de données graphique 13 minutes

2 devoirs

Quiz non noté 0 minutes
Quiz noté 0 minutes

Le quatrième module "Spark ML & Streaming" se concentre sur le fonctionnement de Spark ML (Machine Learning) et sur la manière dont les opérations de streaming Spark sont menées. Les algorithmes Spark ML comprennent la featurisation, les pipelines, la persistance et les utilitaires qui opèrent sur les RDD (Resilient Distributed Datasets) pour extraire des informations des énormes ensembles de données. Les conférences expliquent les caractéristiques de l'API basée sur le DataFrame, qui est la principale API ML dans le package spark.ml. Les algorithmes statistiques de base de Spark ML basés sur la corrélation et les tests d'hypothèse (valeur P) sont d'abord introduits, suivis par les algorithmes de classification et de régression de Spark ML basés sur des modèles linéaires, des Bayes naïfs et des techniques d'arbre de décision. Ensuite, les caractéristiques du streaming Spark, l'entrée et la sortie du streaming, ainsi que les types de récepteurs de streaming (qui incluent le basique, le personnalisé et l'avancé) sont expliqués, suivis par la façon dont le processus de streaming Spark et DStream (Discretized Stream) permettent des opérations de streaming de big data pour des applications en temps réel et en temps quasi-réel.

Inclus

4 vidéos2 devoirs

Le cinquième module "Storm" se concentre sur les caractéristiques et les opérations des systèmes de big data Storm. La conférence couvre d'abord les différences entre les caractéristiques d'analyse des données des technologies Storm, Spark et Hadoop. Ensuite, les caractéristiques du traitement des big data Storm basées sur le nimbus, les spouts et les bolts sont décrites, suivies des détails sur les flux Storm, le superviseur et ZooKeeper. D'autres détails sur les spouts et les bolts fiables et non fiables de Storm sont fournis, suivis des avantages de Storm DAG (Directed Acyclic Graph) et de la gestion de la file d'attente des flux de données. En outre, les avantages de l'utilisation de Storm pour les applications rapides en temps réel, qui comprennent l'analyse en temps réel, l'apprentissage automatique en ligne, le calcul continu, DRPC (Distributed Remote Procedure Call) et ETL (Extract, Transform, Load) sont présentés.

Inclus

5 vidéos2 devoirs

Le sixième et dernier module "IBM SPSS Statistics Project" se concentre sur l'acquisition d'une expérience sur l'un des systèmes d'analyse statistique des données les plus célèbres et les plus largement utilisés dans le monde. L'exposé commence par la configuration et l'utilisation d'IBM SPSS Statistics, puis décrit comment IBM SPSS Statistics peut être utilisé pour acquérir de l'expérience en matière d'analyse de données d'entreprise. Ensuite, les résultats statistiques du traitement des données de deux projets basés sur l'utilisation du système big data d'IBM SPSS Statistics sont présentés. Les projets sont menés afin que l'étudiant puisse découvrir de nouvelles façons d'utiliser, d'analyser et de dessiner des graphiques de la relation entre les ensembles de données, et aussi de comparer les résultats statistiques en utilisant IBM SPSS Statistics.

Inclus

1 vidéo1 évaluation par les pairs

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

Évaluations de l’enseignant

(90 évaluations)

Jong-Moon Chung

Yonsei University

12 Cours 405 317 apprenants

Offert par

Yonsei University

En savoir plus sur Gestion des données

Statut : Prévisualisation
Coursera
Big Data Technologies and Applications
Cours
Statut : Prévisualisation
O.P. Jindal Global University
Big Data Analytics
Cours
Statut : Essai gratuit
Illinois Tech
Big Data Technologies
Cours
Statut : Essai gratuit
Yonsei University
Emerging Technologies: From Smartphones to IoT to Big Data
Spécialisation

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018

’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020

’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021

’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Avis des étudiants

5 stars
79,55 %
4 stars
14,46 %
3 stars
2,83 %
2 stars
1,25 %
1 star
1,88 %

Affichage de 3 sur 316

Révisé le 4 sept. 2022

The lecturer explained everthing in details which is more understandable. Thank you I real enjoy the course.

Révisé le 25 sept. 2020

good course get lot of knowledge how data is processed online

Révisé le 15 juin 2021

Good for Beginners to start, gives over all picture in data industry

Voir plus d’avis

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Découvrir les diplômes

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions

Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.

Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la spécialisation et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.

Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien de demande sur la page de description.

Plus de questions

Visitez le Centre d'Aide pour les Étudiants

Aide financière disponible,

¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.