Adaptive Computation for Transformers

This repository implements adaptive transformer layers (ACT / Ponder-style) with shared KV-cache, trained on:

Synthetic arithmetic dataset (addition & multiplication)
BabyLM language modeling dataset

Repository Structure

train.py: Main training script (loads config, builds model, trains & evaluates)
train_earlyexit.py: Training script for models with early-exit heads
configs/: YAML configs for different models/datasets (e.g. babylm_act.yaml, ponder.yaml)
models/: Transformer blocks, ACT/Ponder modules, early-exit heads, shared KV-cache
dataset/: Dataset loaders for synthetic arithmetic and BabyLM
scripts/: Helper scripts (e.g. download_babylm.sh for dataset download)
Notebooks/: Demo Jupyter notebooks with sample runs, inputs and outputs

Dependencies & Installation

Tested with Python ≥ 3.9.

Clone and install:

git clone https://github.com/ACharacterInASimulation/adaptive-computation.git
cd adaptive-computation
pip install -r requirements.txt

Data

BabyLM (public dataset)

Download using the provided script:

./scripts/download_babylm.sh

This downloads BabyLM from publicly available links into the expected data/ folder (see the script for exact paths).

Synthetic arithmetic dataset

The synthetic addition/multiplication data is generated on-the-fly inside the dataset loader.

How to Run

BabyLM + ACT model:

python train.py --configs ./configs/babylm_act.yaml

Synthetic arithmetic + Ponder model:

python train.py --configs ./configs/ponder.yaml

All available experiment configs are in ./configs.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Adaptive Computation for Transformers

Repository Structure

Dependencies & Installation

Data

BabyLM (public dataset)

Synthetic arithmetic dataset

How to Run

About

Uh oh!

Releases

Packages

Contributors 3

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 26 Commits
Notebooks		Notebooks
configs		configs
dataset		dataset
models		models
scripts		scripts
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt
train.py		train.py
train_earlyexit.py		train_earlyexit.py

ACharacterInASimulation/adaptive-computation

Folders and files

Latest commit

History

Repository files navigation

Adaptive Computation for Transformers

Repository Structure

Dependencies & Installation

Data

BabyLM (public dataset)

Synthetic arithmetic dataset

How to Run

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Uh oh!

Languages

Packages