Informatique Informatique
Référence formation : 4-PY-MLPR - Durée : 4 jours

 
  • Objectifs
  • Pré-requis
  • Pédagogie
Utiliser R et Python dans le cadre de modèles d'apprentissage et de fonctions algorithmiques
Cette formation s’adresse au profil métier orienté Data ScientistBonnes bases de statistiques et de data mining

Méthodes pédagogiques

Présentation des concepts, démonstration, exécution, synthèse et exercices pratiques d'assimilation

Modalités pédagogiques

Présentiel - Distanciel - AFEST

Moyens pédagogiques

Formateur expert du domaine - 1 ordinateur, 1 support de cours version papier ou numérique, un bloc-note et un stylo par personne - vidéo projecteur - tableau blanc

Modalités d'évaluation

Positionnement préalable oral ou écrit - Evaluation formative tout au long de la formation - Evaluation sommative faite par le formateur ou à l'aide de la certification NULL

Public concerné

Salariés - Demandeur d'emploi - Reconversion professionnelle

Si vous êtes en situation de handicap, vous pouvez joindre notre référent Handicap. Voir notre fiche Accès correspondante.

Contenu pédagogique

Généralités

  • Présentation et installation du logiciel R
  • GUIs et IDEs
  • Prise en main et premiers pas
  • Fonctions et packages
  • Utilisation des aides

Rappel des concepts de base du Data Mining

  • Introduction à R - Concepts de base
  • Syntaxe
  • Type de données
  • Import/Export de données
  • Manipulation des librairies

Manipulation des données

  • Rappels des grandeurs statistiques de bases
  • Calcul des grandeurs statistiques de bases avec R
  • Aperçu des types de visualisation courants en Data Mining
  • Fonctions et librairies de base de visualisation avec R

Data Preprocessing

  • Data Cleaning
  • Data Reduction (Analyse en composantes principales)
  • Data Preprocessing et ACP avec R

Règles d'association

  • Rappels théoriques de l'algorithme Apriori
  • Application et exploitation des règles d'association avec R

Classification et Regression

  • Règles bayesiennes naïves
  • Rappels théoriques
  • Initiation à la librairie "e1071" de R
  • Arbre de décision CART
  • Rappels théoriques
  • Initiation à la librarie "party" de R
  • Arbre de décision RandomForest
  • Rappels théoriques
  • Initiation à la librairie "randomForest" de R
  • Régression linéaire
  • Rappels théoriques
  • Initiation à la fonction lm() de R

Clustering

  • Centroid-based clustering
  • Algorithme du K-means
  • Fonction kmeans de R
  • Hierarchical clustering
  • Concepts théoriques
  • Fonction hclust de R
  • Density-based clustering
  • Concepts théoriques
  • Application dans R

Outils de support à R

  • Data preprocessing avec Dataiku
  • Utilisation de R dans Dataiku