Retour à la catégorie

ARF-015
Automatique, robotique, informatique - 2023

Panorama de l'univers big data & cloud computing

Motivation, présentation et applications

BUT :

Cette formation a pour but de présenter et d’introduire les notions fondamentales de l'écosystème Big Data et du Cloud Computing et de leurs applications en science des données. Plus qu’un ensemble cohérent d'outils et de frameworks, cet écosystème répond essentiellement à des besoins de traitement et d'exploitation de données volumineuses et variées. Par ailleurs le plateforme cloud facilitent l'accès à cet écosystème. La formation a donc pour objectif de présenter et d'illustrer les notions communes   au Big Data, Cloud Computing et science des données.    

DUREE ET EMPLOI DU TEMPS :

Le stage dure 3 jours (18 heures) et comporte 12 heures de présentation des notions de Big Data, Cloud et Data Science et 6 heures de mise en application avec une mise en pratique sur le cloud via des tutoriels permettant au stagiaire de mieux appréhender les outils essentiels. Un temps de réflexion sur les données des stagiaires est prévu. 

Stage en français, supports en anglais.

ESPRIT GENERAL :

Les termes de Big Data, Data Science et Cloud sont désormais incontournables dans de nombreuses organisations. Bien qu’initialement promu par le secteur du Web, ces problématiques envahissent tous les secteurs, y compris l’aéronautique et défense. L’objet de cette courte introduction est de définir, préciser, illustrer et appliquer les notions propres au monde du Big Data ainsi que la myriade de services associées au Cloud Computing. On s’attachera à évaluer la pertinence de ces approches dans le contexte spécifique du monde aéronautique et/ou défense. En effet, loin de former un ensemble unifié, les outils et méthodes de cet univers s’appuient sur un socle de nouveaux usages informatiques accompagnant les diverses transitions numériques que connaissent les entreprises. Quelles sont les situations propres au Big Data ? Quels outils ? Pour quoi faire ? Qu’est-ce que le cloud Computing ? Cette formation tâchera de répondre à toutes ces questions et d’illustrer via des séances machines certains de ces outils.   L'objet principal de la formation est de proposer une acculturation à tout l'écosystème Big Data/Cloud/Data Science afin de fournir aux stagiaires tous les moyens de décider d'investir plus en avant dans ses technologies.

PREREQUIS :

Niveau du stage : Base/Perfectionnement

Formation ingénieur ou équivalent nécessaire, des bases en systèmes informatiques (bases de données, génie logiciel, système GNU/Linux) peuvent aider à la compréhension mais ne sont pas nécessaires.

ANIMATEUR(S) :

Dimitri BETTEBGHOR :

ONERA

SOMMAIRE :

Jour 1 BIG DATA ET BASES DE DONNEES

  • Big Data : origines, besoin et défis
    • L'ère du Big Data
    • Contexte de l'émergence des outils Big Data
    • Comparaison avec l'organisation traditionnelle des données (Datawarehouse vs. Datalake)
    • La promesse de valeur des données
    • Données structurées vs. Non structurées
  • Big Data dans l'organisation
    • Conception des systèmes à l'ère du Big Data
    • La donnée comme liant entre les différents métiers
    • Conséquence sur l'organisation
    • Aspects juridiques de la donnée (GDPR)
  • Introduction aux bases de données
    • Bases relationnelles
    • Théorème CAP
    • Mouvement NoSQL
  • Différentes solutions NoSQL
    • Entrepôts clé : valeur (e.g Redis)
    • Bases Orientées Colonnes (e.g Cassandra)
    • Bases Orientées Documents (e.g. MongoDB)
    • Bases Orientées Graphes (e.g Neo4j)
  • Mise en pratique Python/Java

Jour 2 BIG DATA ET ARCHITECTURE

  • Framework Hadoop/HDFS
    • Résilience, Tolérance aux pannes
    • Distribution et monitoring des processus
    • Pattern Map Reduce
    • Composants Hadoop
  • Architectures streaming et hybrides
    • Architecture Lambda
    • Architecture Kappa
  • Outils du Big Data et Machine Learning
    • Présentation de Apache Spark
    • SparkML
  • Mise en pratique Spark (Python ou Java) sous Databricks

Jour 3 CLOUD COMPUTING ET DEPLOIEMENT

  • Fondamentaux du Cloud
    • IaaS vs. SaaS vs. PaaS
    • Gouvernance et sécurité
  • Présentation des offres cloud
    • Azure, GCP, AWS
    • Cloud souverain ?
  • Déploiement moderne
    • Conteneurisation vs. Virtualisation
    • Docker
    • Orchestration avec Kubernetes
  • Découverte de Docker et d'un cloud provider

DATE(S) :

à PARIS : nous consulter (ancienne date : Du 11 au 13 Avril 2023)

PRIX :

1 620,00 € HT (TVA 20%) voir conditions générales

Télécharger le pdf
Imprimer
Télécharger le bulletin d'inscription
Nous contacter