partages-llm

Ce référentiel contient le code utilisé pour les expériences sur des modèles de langue décodeur dans le cadre de la première phase du projet PARTAGES.

Overview

(report abstract)

Installation

# e.g. clone and install
git clone https://github.com/PARTAGES-dev/partages-llm.git
cd partages-llm
pip install -e .

Certaines dépendances supplémentaires doivent être installées pour pouvoir utiliser pleinement le code présenté ici :

Pour l'évaluation, lm-evaluation-harness
Pour la déduplication du corpus CLM, comme implémenté dans scripts/preprocess/deduplicate_clm_dataset.py, Onion

Project Structure

partages-llm/
├── configs/  # Configuration files for parameterising pipeline components
|   ├── clm-corpus-processing
|   ├── fsdp
|   ├── lm-eval
|   ├── merge
|   ├── sft-hps
|   ├── templates
|   └── train
├── scripts/  # Runnable recipes for experiments and data processing
|   ├── eda
|   ├── eval
|   ├── postprocess
|   ├── preprocess
|   └── train
|       ├── clm  # Causal Language Modelling
|       ├── sft  # Supervised Fine-Tuning
|       └── sts  # Semantic Textual Similarity
└── src/partages-llm  # Core library code

`configs/`

Description of what lives here — model configs, training hyperparameters, dataset settings, etc.

`src/`

Description of the main library modules and what they provide.

`scripts/`

`eda/`

`eval/`

Le script do-eval.sh gère le benchmarking avec lm-evaluation-harness, et mcq_inference.py l'évaluation des modèles sur la tâche MCQ de la partie étiquetée du corpus.

`postprocess/`

`preprocess/`

`train/`

Usage

Reproducing Experiments

# example command
python scripts/train/clm/run_clm_trainer.py --config configs/train/your_config.yaml

Data

liens aux repos, description basique du prep

Results

cf rapport technique...

Name		Name	Last commit message	Last commit date
Latest commit History 49 Commits
configs		configs
scripts		scripts
src/partages_llm		src/partages_llm
.gitignore		.gitignore
README.md		README.md
pyproject.toml		pyproject.toml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

partages-llm

Overview

Installation

Project Structure

`configs/`

`src/`

`scripts/`

`eda/`

`eval/`

`postprocess/`

`preprocess/`

`train/`

Usage

Reproducing Experiments

Data

Results

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

partages-llm

Overview

Installation

Project Structure

configs/

src/

scripts/

eda/

eval/

postprocess/

preprocess/

train/

Usage

Reproducing Experiments

Data

Results

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

`configs/`

`src/`

`scripts/`

`eda/`

`eval/`

`postprocess/`

`preprocess/`

`train/`

Packages