Détection de Fraude par Apprentissage Automatique

Vous trouverez dans ce github les fichiers représentant les algorithmes utilsés:

Arbres de Décision
Forêts Aléatoires
Réseaux de Neurones Simples
Auto-encodeur
XGBoost
Forêts Aléatoires Équilibrées
Modèle Ensembliste
K-means
Régression Logistique
La fonction de perte utilisé et la fonction de Gains

Description du Projet

La détection de fraude pose un défi particulier en apprentissage automatique, en raison du déséquilibre entre les classes de fraude et de non-fraude. Ce projet vise à développer des modèles prédictifs efficaces en utilisant des algorithmes capables de traiter les problèmes de classes déséquilibrées. Nous explorons l'utilisation de différentes techniques, notamment SMOTEEN et Tomek Link, pour rééchantillonner les données avant d'appliquer divers algorithmes d'analyse de données.

Méthodologie

Ré-échantillonnage des Données : Utilisation de techniques comme SMOTEEN et Tomek Link pour équilibrer les classes et améliorer la représentation des cas de fraude.
Algorithmes d'Analyse de Données : Application de divers algorithmes tels que les arbres de décisions, les forêts aléatoires, les réseaux de neurones, les modèles ensemblistes, la régression logistique et les \textit{k}-means.
Évaluation des Performances : Mesure des performances des modèles en utilisant la $F1$-mesure, une métrique adaptée aux problèmes de classes déséquilibrées.

Résultats

Malgré nos efforts, les performances des modèles demeurent limitées en raison du caractère fortement déséquilibré des classes de fraude. Le meilleur score obtenu se situe autour de 0.06, soulignant ainsi le défi persistant lié à la détection de fraude dans l'apprentissage automatique.

Conclusion

La détection de fraude dans un contexte de classes déséquilibrées reste un challenge significatif en apprentissage automatique. Ce projet souligne l'importance de développer des méthodes plus avancées pour améliorer la performance des modèles dans de telles situations.

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
.gitignore		.gitignore
Arbre_RandomF_DeepL.ipynb		Arbre_RandomF_DeepL.ipynb
Ensembliste-voting.ipynb		Ensembliste-voting.ipynb
K_means-auto_encodeurs-Regression_logistique.ipynb		K_means-auto_encodeurs-Regression_logistique.ipynb
README.md		README.md
XGBoost-BalancedRanForest.ipynb		XGBoost-BalancedRanForest.ipynb
model.h5		model.h5

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Détection de Fraude par Apprentissage Automatique

Description du Projet

Méthodologie

Résultats

Conclusion

About

Releases

Packages

Contributors 2

Languages

adcastex/fouille_de_donnees

Folders and files

Latest commit

History

Repository files navigation

Détection de Fraude par Apprentissage Automatique

Description du Projet

Méthodologie

Résultats

Conclusion

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages