trios-trainer-igla

IGLA RACE trainer. Tracks gHashTag/trios#143. Anchor: phi^2 + phi^-2 = 3.

Champion: BPB=2.2111 (seed=43, 81K steps, AdamW, hidden=384, Railway).

Quick start

git clone https://github.com/gHashTag/trios-trainer-igla.git
cd trios-trainer-igla

# Download data
mkdir -p data
curl -sL https://raw.githubusercontent.com/karpathy/char-rnn/master/data/tinyshakespeare/input.txt \
    > data/tiny_shakespeare.txt
head -c 100000 data/tiny_shakespeare.txt > data/tiny_shakespeare_val.txt

# Build
cargo build --release

# Train single seed (best config)
./target/release/trios-train --seed=43 --steps=81000 --hidden=384 --lr=0.003 --optimizer=adamw

# Train all 3 Gate-2 seeds
for s in 42 43 44; do
  ./target/release/trios-train --seed=$s --steps=81000 --hidden=384 --lr=0.003 --optimizer=adamw
done

Railway deploy (3 seeds in parallel)

# Prerequisites
brew install railway # or: npm i -g @railway/cli
railway login

# Link project (first time)
railway link  # select "trios-trainer"

# Create services (once)
for s in 42 43 44; do
  railway add --service "igla-seed-$s"  # choose "Empty Service"
  railway variables set --service "igla-seed-$s" TRIOS_SEED=$s
done

# Deploy all 3 seeds
for s in 42 43 44; do
  railway up --service "igla-seed-$s" --detach
done

# Watch logs
railway logs --service igla-seed-42
railway logs --service igla-seed-43
railway logs --service igla-seed-44

Binaries

`trios-train` — main trainer

./target/release/trios-train [OPTIONS]

Options:
      --seed <SEED>            Seed. 0 = 3-seed sweep {43,44,45} [env: TRIOS_SEED=] [default: 43]
      --steps <STEPS>          Training steps [env: TRIOS_STEPS=] [default: 54000]
      --hidden <HIDDEN>        Hidden dim [env: TRIOS_HIDDEN=] [default: 828]
      --lr <LR>                Learning rate [env: TRIOS_LR=] [default: 0.003]
      --attn-layers <N>        Attention layers [default: 2]
      --eval-every <N>         Eval interval [default: 1000]
      --optimizer <OPT>        adamw | muon | muon-cwd [env: TRIOS_OPTIMIZER=] [default: adamw]
      --train-data <PATH>      [default: data/tiny_shakespeare.txt]
      --val-data <PATH>        [default: data/tiny_shakespeare_val.txt]
      --config <TOML>          Config file (overrides flags)
      --sweep                  3-seed sweep {43,44,45}

`trios-igla` — ledger query tool

./target/release/trios-igla <COMMAND>

Commands:
  search   Filter ledger rows (--seed, --bpb-max, --step-min, --sha)
  list     Last N rows (--last N)
  gate     Gate-2 quorum check (--target BPB)
  check    Embargo refusal for SHA
  triplet  Print R7 triplet for row index

Other binaries

Binary	Purpose
`hybrid_train`	N-gram + HybridAttn + ReLU² + Muon trainer
`seed_emit`	Emit a ledger row (--seed, --bpb, --step, --sha)
`ledger_check`	Validate ledger format
`qk_gain_check`	Check QK-gain against INV-13 (--lr, --gain)

Results (Railway, 2026-04-27)

Config	Seed 42	Seed 43	Seed 44	Avg
trios-train 81K AdamW h=384	2.222	2.211	2.218	2.217
trios-train 27K AdamW h=384	2.362	2.359	2.387	2.369
trios-train 54K Muon h=384	2.410	2.419	2.403	2.411
hybrid_train 81K Muon+NCA h=828	2.686	2.681	2.678	2.682

P1 conclusion: AdamW wins over Muon on this architecture. Stick with AdamW.

Environment variables

Var	Default	Used by
`TRIOS_SEED`	43	trios-train, entrypoint.sh
`TRIOS_STEPS`	81000	trios-train, entrypoint.sh
`TRIOS_LR`	0.003	trios-train, entrypoint.sh
`TRIOS_HIDDEN`	384	trios-train, entrypoint.sh
`TRIOS_OPTIMIZER`	adamw	trios-train, entrypoint.sh
`TRIOS_TRAIN_DATA`	tiny_shakespeare.txt	entrypoint.sh
`TRIOS_VAL_DATA`	tiny_shakespeare_val.txt	entrypoint.sh
`RUST_LOG`	info	all binaries

Docker

docker build -t trios-trainer .
docker run --rm -e TRIOS_SEED=42 -e TRIOS_STEPS=81000 trios-trainer

Tests

cargo test --release          # unit + integration (9 tests)
cargo test --release -- --ignored  # champion reproduction (long)

Gate-2 target

BPB < 1.85 on 3 seeds {42, 43, 44}, step >= 4000
Deadline: 2026-04-30 23:59 UTC
Current gap: +0.36 (BPB=2.21 → target 1.85)

Roadmap

Phase	Status	Result
P0 Audit	DONE	Champion reproduced BPB=2.24
P1 Optimizer Lab	DONE	NULL — AdamW wins
P2 muP Transfer	NEXT	Transfer LR to larger model
P3 Schedule-Free	Pending	SF/WSD vs cosine
P4 Multi-Obj + EMA	Pending	JEPA+NCA+EMA sweep
P5 Gate-2 Push	Running	BPB=2.21, need 1.85

See docs/TRAINING_FLOW_V2.md for full plan.

License

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 112 Commits
.github/workflows		.github/workflows
.trinity		.trinity
assertions		assertions
configs		configs
data		data
docs		docs
migrations		migrations
src		src
tests		tests
.dockerignore		.dockerignore
.gitignore		.gitignore
Cargo.lock		Cargo.lock
Cargo.toml		Cargo.toml
DEPLOYMENT_BLOCKER.md		DEPLOYMENT_BLOCKER.md
Dockerfile		Dockerfile
Dockerfile.scarab		Dockerfile.scarab
LICENSE		LICENSE
MIGRATION.md		MIGRATION.md
RAILWAY_BLOCKER.md		RAILWAY_BLOCKER.md
README.md		README.md
SOURCE_OF_TRUTH.md		SOURCE_OF_TRUTH.md
nixpacks-rust91.toml		nixpacks-rust91.toml
railway.json		railway.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

trios-trainer-igla

Quick start

Railway deploy (3 seeds in parallel)

Binaries

`trios-train` — main trainer

`trios-igla` — ledger query tool

Other binaries

Results (Railway, 2026-04-27)

Environment variables

Docker

Tests

Gate-2 target

Roadmap

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

trios-trainer-igla

Quick start

Railway deploy (3 seeds in parallel)

Binaries

trios-train — main trainer

trios-igla — ledger query tool

Other binaries

Results (Railway, 2026-04-27)

Environment variables

Docker

Tests

Gate-2 target

Roadmap

License

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

`trios-train` — main trainer

`trios-igla` — ledger query tool

Packages