Informatique Informatique
Référence formation : 4-PY-MLPR - Durée : 4 jours

 
  • Objectifs
  • Pré-requis
  • Pédagogie
Utiliser R et Python dans le cadre de modèles d'apprentissage et de fonctions algorithmiques
Bonnes bases de statistiques et de data mining

Organisation

Les sessions de formation ont lieu de 9h00 à 12h30 et de 13h30 à 17h00

Profil formateur

  • Nos formateurs sont des experts dans leurs domaines d'intervention
  • Leur expérience de terrain et leurs qualités pédagogiques constituent un gage de qualité

Moyens pédagogiques

  • Réflexion de groupe et apports théoriques du formateur.
  • Travail d'échange avec les apprenants sous forme de réunion - discussion.
  • Utilisation de cas concrets issus de l'expérience professionnelle.
  • Validation des acquis par des questionnaires, des tests d'évaluation, des mises en situation et des jeux pédagogiques.
  • Alternance entre apports théoriques et exercices pratiques (en moyenne sur 30 à 50% du temps)

Modalités d'évaluation

  • Positionnement préalable oral ou écrit.
  • Feuille de présence signée en demi-journée.
  • Evaluation des acquis tout au long de la formation.
  • Questionnaire de satisfaction
  • Attestation de stage à chaque apprenant
  • Evaluation formative tout au long de la formation.
  • Evaluation sommative faite par le formateur .

Public concerné

Salariés - Demandeur d'emploi - Reconversion professionnelle

Adaptation pédagogique et matérielle

Si vous avez besoin d'adaptation matérielle ou pédagogique, merci de prendre contact avec notre référent Handicap par téléphone au 02 35 12 25 55 ou par email à handicap@xxlformation.com

Moyens techniques en formation présentielle

Accueil des apprenants dans une salle dédiée à la formation et équipée avec :

  • Ordinateurs
  • Vidéo projecteur ou Écran TV interactif
  • Tableau blanc ou Paper-Board

Moyens techniques en formation distancielle

A l'aide d'un logiciel comme ® Microsoft Teams ou Zoom, un micro et une caméra pour l'apprenant.

  • Suivez une formation en temps réel et entièrement à distance. Lors de la session en ligne, les apprenants interagissent et communiquent entre eux et avec le formateur.
  • Les formations en distanciel sont organisées en Inter-Entreprise comme en Intra-Entreprise.
  • L'accès à l'environnement d'apprentissage (support de cours, ressources formateur, fichiers d'exercices ...) ainsi qu'aux preuves de suivi et d'assiduité (émargement, évaluation) est assuré.
  • Les participants recevront une convocation avec le lien de connexion à la session de formation.
  • Pour toute question avant et pendant le parcours, une assistance technique et pédagogique est à disposition par téléphone au 02 35 12 25 55 ou par email à commercial@xxlformation.com

Contenu pédagogique

Généralités

  • Présentation et installation du logiciel R
  • GUIs et IDEs
  • Prise en main et premiers pas
  • Fonctions et packages
  • Utilisation des aides

Rappel des concepts de base du Data Mining

  • Introduction à R - Concepts de base
  • Syntaxe
  • Type de données
  • Import/Export de données
  • Manipulation des librairies

Manipulation des données

  • Rappels des grandeurs statistiques de bases
  • Calcul des grandeurs statistiques de bases avec R
  • Aperçu des types de visualisation courants en Data Mining
  • Fonctions et librairies de base de visualisation avec R

Data Preprocessing

  • Data Cleaning
  • Data Reduction (analyse en composantes principales)
  • Data Preprocessing et ACP avec R

Règles d'association

  • Rappels théoriques de l'algorithme Apriori
  • Application et exploitation des règles d'association avec R

Classification et régression

  • Règles bayésiennes naïves
  • Rappels théoriques
  • Initiation à la librairie "e1071" de R
  • Arbre de décision CART
  • Rappels théoriques
  • Initiation à la librarie "party" de R
  • Arbre de décision RandomForest
  • Rappels théoriques
  • Initiation à la librairie "randomForest" de R
  • Régression linéaire
  • Rappels théoriques
  • Initiation à la fonction lm() de R

Clustering

  • Centroid-based clustering
  • Algorithme du K-means
  • Fonction kmeans de R
  • Hierarchical clustering
  • Concepts théoriques
  • Fonction hclust de R
  • Density-based clustering
  • Concepts théoriques
  • Application dans R

Outils de support à R

  • Data preprocessing avec Dataiku
  • Utilisation de R dans Dataiku