Treffer: Supervised classification methods with R and Python ; Méthodes de classification supervisée avec R et Python
Weitere Informationen
Master ; La classification supervisée est une branche fondamentale de l’apprentissage automatique (machine learning). Elle consiste à prédire la classe d’appartenance d’un nouvel échantillon en fonction de ses caractéristiques observées, en se basant sur des exemples déjà étiquetés. Elle trouve des applications dans de nombreux domaines tels que la médecine (diagnostic médical), la finance (détection des fraudes), les sciences de la vie et de la Terre (classification d’espèces), etc.Ce document propose une approche appliquée de la classification supervisée. Il se concentre sur la présentation et la comparaison de différentes méthodes de classification supervisée avec 2 langages de programmation populaires dans le domaine des sciences des données : R et Python. Ces 2 langages proposent de nombreuses librairies (packages) facilitant l’implémentation et l’évaluation de nombreux algorithmes de classification.Nous explorerons plusieurs techniques couramment utilisées :o k plus proches voisins (KNN), o modèles de régression (modèle de régression logistique et modèle de régression multinomiale), o forêts aléatoires, o machine à vecteurs de support (SVM),o réseaux de neurones. Pour ce faire, 5 jeux de données différents seront utilisés et analysés. Ils sont connus sous les noms suivants : o Iris, o Spam, o MNIST, o Titanic,o Wine. Les analyses seront présentées avec des démonstrations d'implémentation à la fois en R et en Python. Ces démonstrations sont reproductibles.Pour tout renseignement, n'hésitez pas à contacter les auteurs : Adresse e-mail de correspondance : christophe.chesneau@unicaen.fr