Objectifs :
• Comprendre l'apprentissage automatique et ses objectifs
• Evaluer les avantages et désavantages des méthodes statistiques alternatives
• Utiliser les méthodes de Machine learning avec R et RStudio
Public cible :
Ce cours est conçu pour toute personne désireuse de comprendre les fondements du Machine Learning. IL propose une introduction à l'apprentissage automatique avec le logiciel R.
Le « Machine learning » a pour objectif de prédire le comportement d’une variable d’intérêt, comme les ventes ou le chiffre d’affaires, à partir de l’identification d’interactions de facteurs potentiellement pertinents (« predictors ») comme le prix, la qualité, la météo, la publicité, etc… Fondamentalement, les méthodes statistiques employées permettent un apprentissage à partir de données antérieures pour prédire la variable d’intérêt dans le futur.
Ce cours présente en premier lieu la base intuitive et l’utilité du Machine Learning pour la prédiction et la prise de décision. Ensuite, nous introduisons différentes approches statistiques telles que l’arborescence (tree-based methods). Celles-ci seront illustrées et pratiquées avec les logiciels R et RStudio sur des données réelles.
Prérequis :
Une expérience sur R et RStudio est nécesaire pour suivre ce cours (le cours de "Traitements Statistiques et Analyse de Données avec R" est recommandé)
Contenu :
Ce cursus se compose de 9 chapitres.
• Introduction au concept et au but du « machine learning »
• Régression linéaire et non linéaire (OLS, logit regression)
• Régression linéaire multiple
• Sélection et retrait des variables (lasso et ridge regression)
• Approches d’arborescence (trees, bagging, random forests)
• Validation de modèles (cross-validation)
• Evaluation de performance (out-of-sample testing)
• Application de toutes les méthodes en utilisant l’apprentissage non supervisé (k-means)
• Analyse en composantes principales (ACP)
* Se Pré-inscrire * Demander des renseignements
|