Dynamic Neuron Pruning for Large Language Models

Paper: DART-ing Through the Drift: Dynamic Tracing of Knowledge Neurons for Adaptive Inference-Time Pruning [arXiv]

Abhishek Tyagi¹, Yunuo Cen², Shrey Dhorajiya, Bharadwaj Veeravalli, Xuanyao Fong

To cite this paper, use

@misc{tyagi2026dartingdriftdynamictracing,
      title={DART-ing Through the Drift: Dynamic Tracing of Knowledge Neurons for Adaptive Inference-Time Pruning}, 
      author={Abhishek Tyagi and Yunuo Cen and Shrey Dhorajiya and Bharadwaj Veeravalli and Xuanyao Fong},
      year={2026},
      eprint={2601.22632},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2601.22632}, 
}

If you have questions or thoughts regarding the tool or this work, please contact atygai@u.nus.edu¹ or cenyunuo@u.nus.edu².

DART.mp4

Getting Started

This project implements dynamic neuron pruning strategies for large language models with adaptive masking and knowledge drift detection.

Prerequisites

Required Packages

# Core dependencies
torch==2.2.0
transformers==4.57.3
datasets==4.4.2
numpy==1.26.4
pandas==2.2.0

# Evaluation and visualization
matplotlib==3.8.2
evaluate==0.4.6
cmcrameri==1.8

# Optional but recommended
accelerate==1.12.0

You can install all dependencies using:

pip install torch transformers datasets numpy pandas matplotlib evaluate cmcrameri accelerate

Running Experiments

The project provides two main experiment scripts:

1. Standard Pruning Experiments (`run_experiment.sh`)

For running pruning experiments with perplexity and MMLU evaluation:

# Edit configuration in run_experiment.sh
# Key parameters:
# - MODEL: Choose your model (e.g., "meta-llama/Llama-3.1-8B")
# - LAYER_TOPK: Pruning configuration per layer
# - MASKING_STEP: When to start applying masks
# - EVAL_PERPLEXITY: Enable perplexity evaluation
# - EVAL_MMLU: Enable MMLU evaluation

./run_experiment.sh

2. Knowledge Drift Analysis (`run_knowledge_drift.sh`)

For analyzing knowledge drift during generation:

# Edit configuration in run_knowledge_drift.sh
# Additional parameters:
# - KNOWLEDGE_DRIFT: Enable drift detection
# - CUSTOM_PROMPT_TEXT: Specify your prompt
# - GENERATION: Number of tokens to generate

./run_knowledge_drift.sh

Configuration Options

Both scripts support the following key parameters:

Model Configuration:

MODEL: Model name from HuggingFace (e.g., "meta-llama/Llama-3.1-8B", "gpt2")
CACHE_DIR: Directory for model weights
DEVICE: CUDA device ID

Pruning Configuration:

LAYER_TOPK: Per-layer neuron keep ratios (e.g., "all:auto" or "0:0.9,1:0.8,...")
MASKING_STEP: Step to start masking neurons
RELEASE_STEP: Step to release masks (optional)
EMA_DECAY: Exponential moving average decay factor
RANKING_METHOD: Neuron ranking method ("max", "mean", "combined", "product", "magnitude")
PRUNE_STRATEGY: Pruning strategy ("topk", "auto")
TOTAL_PRUNE_PERCENT: Target total pruning percentage

Evaluation Configuration:

EVAL_PERPLEXITY: Enable perplexity evaluation
EVAL_MMLU: Enable MMLU benchmark evaluation
EVAL_GENERAL_NLP: Enable general NLP tasks evaluation

Prompt Configuration:

PROMPT_TYPE: "custom" or "mmlu"
PROMPT_SUBJECT: Dataset/subject name
CUSTOM_PROMPT_TEXT: Custom prompt text
PROMPT_LENGTH: Maximum prompt length

Output

Results are saved to results/ directory with:

Output logs
Timing information
Configuration JSON
Perplexity scores
MMLU accuracy
Neuron masking statistics
Knowledge drift metrics (if enabled)

Example Usage

# Quick test with GPT-2 on a small dataset
DEVICE=0
MODEL="gpt2"
LAYER_TOPK="all:auto"
MASKING_STEP=10
EVAL_PERPLEXITY=true
./run_experiment.sh

# Knowledge drift analysis with custom prompt
KNOWLEDGE_DRIFT=true
CUSTOM_PROMPT_TEXT="Write about artificial intelligence"
GENERATION=500
./run_knowledge_drift.sh

Project Structure

.
├── dynamicPrune.py          # Main execution script
├── run_experiment.sh        # Standard experiment wrapper
├── run_knowledge_drift.sh   # Knowledge drift wrapper
├── src/
│   ├── neuronDefuser.py     # Core pruning logic
│   ├── perplexity_utils.py  # Perplexity evaluation
│   ├── mmlu_utils.py        # MMLU benchmark
│   ├── hook_setup.py        # Model hook registration
│   └── resultCompiler.py    # Result analysis and plotting
├── lib/                     # Additional utilities
├── datasets/                # Dataset storage
├── results/                 # Experiment outputs
└── llm_weights/            # Model cache

Tips

Memory Management: For large models, reduce batch size or use gradient checkpointing
Pruning Ratios: Start with conservative values (keep 80-90% neurons) and adjust
Adaptive Pruning: Use LAYER_TOPK="all:auto" for automatic layer-wise optimization
Logging: Check both output_*.log and timing_*.log for detailed information

License

See LICENSE file for details.

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
src		src
LICENSE		LICENSE
README.md		README.md
dynamicPrune.py		dynamicPrune.py
layer_analysis.py		layer_analysis.py
run_experiment.sh		run_experiment.sh
run_experiment_auto.sh		run_experiment_auto.sh
run_experiment_layer_topk_gen.sh		run_experiment_layer_topk_gen.sh
run_experiment_multi_subject.sh		run_experiment_multi_subject.sh
run_experiment_summary.sh		run_experiment_summary.sh
run_knowledge_drift.sh		run_knowledge_drift.sh
run_knowledge_drift_multi_prompt.sh		run_knowledge_drift_multi_prompt.sh
run_layer_analysis.sh		run_layer_analysis.sh
run_subject_layer_analysis.sh		run_subject_layer_analysis.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Dynamic Neuron Pruning for Large Language Models

Getting Started

Prerequisites

Required Packages

Running Experiments

1. Standard Pruning Experiments (`run_experiment.sh`)

2. Knowledge Drift Analysis (`run_knowledge_drift.sh`)

Configuration Options

Output

Example Usage

Project Structure

Tips

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Dynamic Neuron Pruning for Large Language Models

Getting Started

Prerequisites

Required Packages

Running Experiments

1. Standard Pruning Experiments (run_experiment.sh)

2. Knowledge Drift Analysis (run_knowledge_drift.sh)

Configuration Options

Output

Example Usage

Project Structure

Tips

License

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

1. Standard Pruning Experiments (`run_experiment.sh`)

2. Knowledge Drift Analysis (`run_knowledge_drift.sh`)

Packages