Skip to content

adcastex/fouille_de_donnees

Repository files navigation

Détection de Fraude par Apprentissage Automatique

Vous trouverez dans ce github les fichiers représentant les algorithmes utilsés:

  • Arbres de Décision

  • Forêts Aléatoires

  • Réseaux de Neurones Simples

  • Auto-encodeur

  • XGBoost

  • Forêts Aléatoires Équilibrées

  • Modèle Ensembliste

  • K-means

  • Régression Logistique

  • La fonction de perte utilisé et la fonction de Gains

Description du Projet

La détection de fraude pose un défi particulier en apprentissage automatique, en raison du déséquilibre entre les classes de fraude et de non-fraude. Ce projet vise à développer des modèles prédictifs efficaces en utilisant des algorithmes capables de traiter les problèmes de classes déséquilibrées. Nous explorons l'utilisation de différentes techniques, notamment SMOTEEN et Tomek Link, pour rééchantillonner les données avant d'appliquer divers algorithmes d'analyse de données.

Méthodologie

  1. Ré-échantillonnage des Données : Utilisation de techniques comme SMOTEEN et Tomek Link pour équilibrer les classes et améliorer la représentation des cas de fraude.

  2. Algorithmes d'Analyse de Données : Application de divers algorithmes tels que les arbres de décisions, les forêts aléatoires, les réseaux de neurones, les modèles ensemblistes, la régression logistique et les \textit{k}-means.

  3. Évaluation des Performances : Mesure des performances des modèles en utilisant la $F1$-mesure, une métrique adaptée aux problèmes de classes déséquilibrées.

Résultats

Malgré nos efforts, les performances des modèles demeurent limitées en raison du caractère fortement déséquilibré des classes de fraude. Le meilleur score obtenu se situe autour de 0.06, soulignant ainsi le défi persistant lié à la détection de fraude dans l'apprentissage automatique.

Conclusion

La détection de fraude dans un contexte de classes déséquilibrées reste un challenge significatif en apprentissage automatique. Ce projet souligne l'importance de développer des méthodes plus avancées pour améliorer la performance des modèles dans de telles situations.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published