[DistillAnomaly]

This repository contains a reproducible, Slurm-based pipeline for time series anomaly detection experiments: synthetic data generation, UCR data preparation, VL model training, in-sample and out-of-sample evaluation, and aggregation into CSV summaries.

Main entry point: pipeline.sh (repository root).

Slurm is used because the project was developed and executed on an HPC environment. All intermediate and final outputs are provided so the most expensive stages do not need to be rerun.

1. Pipeline overview

The pipeline is organized into the following stages: (Each step's parameters can be specified in the scripts that are called by the main pipeline.sh)

Synthetic data generation (src/data/generate.slurm)
Writes datasets under all_data/synthetic/ (e.g., freq/, noisy-freq/) with:
- data.pkl
- csv_data/
- figs/
UCR data preparation (all_data/UCR_dataset/)
A Slurm preparation job is referenced from pipeline.sh.
Annotation processing (src/annotations/)
Produces/normalizes annotation artifacts used by training/evaluation (including explanation-related analysis). Some annotation steps require an OpenAI API key (OPENAI_API_KEY).
VL model training (train_VL/, e.g., train_clip.slurm)
Uses a local Qwen2.5-VL checkpoint configured in pipeline.sh.
Evaluation (eval/scripts/)
Writes JSONL outputs to:
- eval/json_outsample/ (out-of-sample / UCR)
- eval/json_insample/ (in-sample / synthetic)
Aggregation (eval/results/)
- aggregate_affil.py: affiliation summaries
- citation_summary.py: explanation/citation-quality + metrics summaries

2. Reference environment

Reference runs were executed on:

Slurm: 22.05.10
OS: RHEL
GPU: NVIDIA H100

3. Key directories

pipeline.sh — orchestrates Slurm jobs + aggregation
src/data/ — synthetic generation
src/annotations/ — annotation processing
all_data/synthetic/ — generated synthetic datasets
all_data/UCR_dataset/ — UCR datasets
train_VL/ — training scripts
eval/ — evaluation scripts, JSONL outputs, baselines, results
- eval/json_insample/
- eval/json_outsample/
- eval/baselines/
- eval/results/

4. Configuration

Edit configuration directly in pipeline.sh :

model paths (e.g., BASE_MODEL, ST_MODEL)
project paths (TRAIN_DIR, EVAL_DIR, etc.)
output locations

If you run annotation processing that requires OpenAI access, set:

export OPENAI_API_KEY="YOUR_KEY_HERE"

5. Run

From the repository root:

sh pipeline.sh

6. Dependencies

Install Python dependencies via:

python -m venv .venv
source .venv/bin/activate
python -m pip install --upgrade pip
pip install -r requirements.txt

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
ADBench @ 3dac822		ADBench @ 3dac822
all_data		all_data
data/adbench		data/adbench
eval		eval
results		results
src		src
train_VL		train_VL
.gitignore		.gitignore
.gitmodules		.gitmodules
README.md		README.md
claude-progress.txt		claude-progress.txt
convert_adbench_to_images.py		convert_adbench_to_images.py
download_adbench.py		download_adbench.py
download_adbench_classical.sh		download_adbench_classical.sh
eval_adbench.py		eval_adbench.py
eval_rfuni_embeddings.py		eval_rfuni_embeddings.py
eval_rfuni_transfer.py		eval_rfuni_transfer.py
eval_rfuni_transfer_local.py		eval_rfuni_transfer_local.py
evaluate_adbench_rfuni.py		evaluate_adbench_rfuni.py
feature_list.json		feature_list.json
init.sh		init.sh
pipeline.sh		pipeline.sh
requirements.txt		requirements.txt
run_evaluation.py		run_evaluation.py
test_model.py		test_model.py
training_log.txt		training_log.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

[DistillAnomaly]

1. Pipeline overview

2. Reference environment

3. Key directories

4. Configuration

5. Run

6. Dependencies

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

[DistillAnomaly]

1. Pipeline overview

2. Reference environment

3. Key directories

4. Configuration

5. Run

6. Dependencies

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages