Informatique Informatique
Référence formation : 5-CLO-ML - Durée : 2 jours

Cliquez sur l'image ci-contre ou sur le lien ci-dessous
pour télécharger notre programme de formation professionnelle au format PDF
(nécessite © Acrobat Reader)

Objectifs

  • Comprendre comment organiser le traitement des données et structurer les processus de Machine Learning.

Pré-requis

  • Chefs de projet, développeurs, data scientists, architectes

Plan de cours

1. Introduction au machine learning

  • Le Big Data et le machine learning.
  • Zoom sur les données et les requêtes, attentes, des utilisateurs
  • Les étapes de la préparation des données.
  • le data munging/wrangling
  • Le rôle du data scientist

2. Le Machine Learning

  • Définition, les attentes par rapport au Machine Learning
  • Les valeurs d’observation, et les variables cibles.
  • Ingénierie des variables
  • Comment choisir l'algorithme et les variables de l'algorithme.

3. Apprentissage automatique

  • Les algorithmes d'apprentissage supervisés, non supervisés
  • Classification des données
  • Les étapes de construction d'un modèle prédictif.
  • Détecter les valeurs aberrantes et traiter les données manquantes.
  • Algorithmes : régression linéaire, k-voisins, classification naïve bayésienne, arbres de décision, etc ..

4. Les risques et écueils

  • Importance de la préparation des données.
  • L’écueil du « surapprentissage ».
  • Les limites du Machine Learning

5. La visualisation des donnés

  • L’intérêt de la visualisation.
  • Outils disponibles,

6. Machine learning en production

  • Les spécificités liées au développement d'un modèle en environnement distribué.
  • Le déploiement Big Data avec Spark et la MLlib.
  • Le Cloud : Amazon, Microsoft Azure ML, IBM Bluemix...
  • La maintenance du modèle

7. Exemples de visualisation avec R et Python

Retour haut de page