Skip to content

Safae26/text-summarization

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

27 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

📰 Text Summarization with CNN/DailyMail

Ce projet implémente un modèle de Deep Learning fine-tunée sur le dataset CNN/DailyMail pour le résumé automatique de textes journalistiques.

🚀 Fonctionnalités

  • Fine-tuning
  • Prétraitement des données (Tokenization, Nettoyage).
  • Visualisation des données (WordClouds, distribution des longueurs).
  • Évaluation avec la métrique ROUGE (Recall-Oriented Understudy for Gisting Evaluation).
  • Interface de visualisation des courbes de perte (Training vs Validation).

🛠️ Technologies

  • Python 3.10+
  • Hugging Face Transformers
  • PyTorch
  • Pandas / Matplotlib / Seaborn

📊 Résultats

Le modèle a été entraîné sur GPU (T4 x2) avec les hyperparamètres suivants :

  • Epochs: 5
  • Batch Size: 6
  • Optimizer: AdamW

📦 Installation

  1. Clonez le dépôt :
git clone [https://github.com/Safae26/text-summarization.git](https://github.com/Safae26/text-summarization.git)

About

Abstractive Text Summarization using Transformers fine-tuned on the CNN/DailyMail dataset with PyTorch & Hugging Face.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors