Treffer: Supervised classification methods with R and Python ; Méthodes de classification supervisée avec R et Python

Title:
Supervised classification methods with R and Python ; Méthodes de classification supervisée avec R et Python
Contributors:
Laboratoire de Mathématiques Nicolas Oresme (LMNO), Université de Caen Normandie (UNICAEN), Normandie Université (NU)-Normandie Université (NU)-Centre National de la Recherche Scientifique (CNRS), Université de caen
Source:
https://cel.hal.science/hal-04690630 ; Master. France. 2024.
Publisher Information:
CCSD
Publication Year:
2024
Collection:
Normandie Université: HAL
Document Type:
lecture
Language:
French
Rights:
info:eu-repo/semantics/OpenAccess
Accession Number:
edsbas.6CBDFF0D
Database:
BASE

Weitere Informationen

Master ; La classification supervisée est une branche fondamentale de l’apprentissage automatique (machine learning). Elle consiste à prédire la classe d’appartenance d’un nouvel échantillon en fonction de ses caractéristiques observées, en se basant sur des exemples déjà étiquetés. Elle trouve des applications dans de nombreux domaines tels que la médecine (diagnostic médical), la finance (détection des fraudes), les sciences de la vie et de la Terre (classification d’espèces), etc.Ce document propose une approche appliquée de la classification supervisée. Il se concentre sur la présentation et la comparaison de différentes méthodes de classification supervisée avec 2 langages de programmation populaires dans le domaine des sciences des données : R et Python. Ces 2 langages proposent de nombreuses librairies (packages) facilitant l’implémentation et l’évaluation de nombreux algorithmes de classification.Nous explorerons plusieurs techniques couramment utilisées :o k plus proches voisins (KNN), o modèles de régression (modèle de régression logistique et modèle de régression multinomiale), o forêts aléatoires, o machine à vecteurs de support (SVM),o réseaux de neurones. Pour ce faire, 5 jeux de données différents seront utilisés et analysés. Ils sont connus sous les noms suivants : o Iris, o Spam, o MNIST, o Titanic,o Wine. Les analyses seront présentées avec des démonstrations d'implémentation à la fois en R et en Python. Ces démonstrations sont reproductibles.Pour tout renseignement, n'hésitez pas à contacter les auteurs : Adresse e-mail de correspondance : christophe.chesneau@unicaen.fr