Machine Learning
Une introduction
Les méthodes et algorithmes de l'apprentissage automatique (Machine Learning) pénètrent de plus en plus d'applications et de secteurs. Cette formation permettra aux auditeurs de connaître les bases et principes des algorithmes existants afin d'avoir une compréhension d'ensemble des méthodes et d'avoir un œil critique sur les offres logicielles et une vision stratégique des tendances.
Le stage dure 2 jours (14h).
Ce module propose une introduction aux algorithmes de Machine Learning et à leur pratique. A l'issue de cette formation, chaque participant saura définir les grandes familles d'algorithmes de Machine Learning supervisé, connaîtra leurs caractéristiques, enjeux, avantages et inconvénients et saura rapidement prototyper un banc d'essai à l'aide de la bibliothèque logicielle scikit-learn.
Compétences visées :
Connaître les noms des méthodes SVM, RandomForests, arbres de décision, Réseaux de neurones, Boosting et Bagging.
Connaître les principes sous-tendant ces méthodes.
Connaître les avantages comparés et les limites de chaque méthode.
Savoir mettre en œuvre ces méthodes avec scikit-learn.
Niveau du stage : Base
Ce stage s'adresse à un public large : chefs de projet, responsables de services, analystes, ingénieurs.
Il est préférable de disposer de quelques notions de mathématiques (probabilités de base, manipulation de fonctions, bases en optimisation). Quelques bases de programmation en Python (fondamentaux du langage, opérations matricielles de base avec numpy), bien que non-indispensables, pourront aider pour les travaux pratiques.
Emmanuel RACHELSON
Enseignant-chercheur ISAE-SUPAERO, responsable de la filière « Sciences de la Décision » et du parcours « Sciences des Données et Décision », chercheur en Intelligence Artificielle.
- Le workflow du Data Mining
* Paysage des problématiques traitées en Machine Learning (taxonomie, exemples et regard critique sur les problèmes abordés pendant la formation).
* Le workflow de l'analyse de données.
* Les interfaces entre data engineer, data analyst et utilisateur.
* Premier contact avec scikit-learn - Classification Bayésienne Naïve
* Le principe d'un classifieurBayésien.
* Construction pratique d'une solution de classification avec scikit-learn - La classification supervisée abordée par le problème de la séparation linéaire
* Le principe des machines à vecteurs supports (SVM).
* Classifier des données complexes à l'aide de l'astuce du noyau (kernel trick).
* Démonstrations avec scikit-learn.
* Avantages et limites des SVM - Les réseaux de neurones
* Une introduction du principe de l'apprentissage neuronal.
* Démonstrations avec scikit-learn.
* Des éléments pour aller plus loin.
* Avantages et limites des réseaux de neurones - Les arbres de décision, une méthode visuelle et intuitive
* Le principe d'apprentissage d'un arbre de classification.
* Démonstrations avec scikit-learn.
* Avantages et limites des arbres de décision - Les méthodes d'ensemble : combiner des classifieurs pour les améliorer
* Les méthodes du Boosting et du Bagging.
* Les forets aléatoires (RandomForests), étonnamment simples et compétitives.
* Démonstrations avec scikit-learn - Le paysage de la classification en Machine Learning et sujets connexes
* Avantages comparés des méthodes abordées
* Éléments pour aller plus loin
* Construction d'un benchmark complet avec scikit-learn.
* Synthèse du stage
à TOULOUSE : 25 au 26 Avril 2024
1430 € HT (TVA 20 %) Voir conditions générales