Informatique Informatique
Référence formation : 5-TEC-ML - Durée : 2 jours

 
  • Objectifs
  • Pré-requis
  • Pédagogie
Comprendre comment organiser le traitement des données et structurer les processus de Machine Learning.
Posséder une culture informatique de base.

Méthodes pédagogiques

Présentation des concepts, démonstration, exécution, synthèse et exercices pratiques d'assimilation

Modalités pédagogiques

Présentiel - Distanciel - AFEST

Moyens pédagogiques

Formateur expert du domaine - 1 ordinateur, 1 support de cours version papier ou numérique, un bloc-note et un stylo par personne - vidéo projecteur - tableau blanc

Modalités d'évaluation

Positionnement préalable oral ou écrit - Evaluation formative tout au long de la formation - Evaluation sommative faite par le formateur ou à l'aide de la certification NULL

Public concerné

Salariés - Demandeur d'emploi - Reconversion professionnelle

Si vous êtes en situation de handicap, vous pouvez joindre notre référent Handicap. Voir notre fiche Accès correspondante.

Contenu pédagogique

Introduction au machine learning

  • Le Big Data et le machine learning.
  • Zoom sur les données et les requêtes, attentes, des utilisateurs
  • Les étapes de la préparation des données.
  • le data munging/wrangling
  • Le rôle du data scientist

Le Machine Learning

  • Définition, les attentes par rapport au Machine Learning
  • Les valeurs d’observation, et les variables cibles.
  • Ingénierie des variables
  • Comment choisir l'algorithme et les variables de l'algorithme.

Apprentissage automatique

  • Les algorithmes d'apprentissage supervisés, non supervisés
  • Classification des données
  • Les étapes de construction d'un modèle prédictif.
  • Détecter les valeurs aberrantes et traiter les données manquantes.
  • Algorithmes : régression linéaire, k-voisins, classification naïve bayésienne, arbres de décision, etc ..

Les risques et écueils

  • Importance de la préparation des données.
  • L’écueil du « surapprentissage ».
  • Les limites du Machine Learning

La visualisation des donnés

  • L’intérêt de la visualisation.
  • Outils disponibles,

Machine learning en production

  • Les spécificités liées au développement d'un modèle en environnement distribué.
  • Le déploiement Big Data avec Spark et la MLlib.
  • Le Cloud : Amazon, Microsoft Azure ML, IBM Bluemix...
  • La maintenance du modèle

Exemples de visualisation avec R et Python