### Tinker finetuning (SFT) — phishing classifier

This notebook takes `data/finetuning/training_data.json` and runs a **Tinker supervised fine-tune** (SFT).

It does 3 things:
1. Convert `training_data.json` → Tinker Cookbook conversation JSONL (`tinker_conversations.jsonl`).
2. Configure a supervised training run (base model + renderer + dataset builder + hyperparams).
3. Start training and show how to find the final `sampler_path` for inference.

**Prereqs**
- `TINKER_API_KEY` is set (we load `.env` if present).
- The sibling repo `tinker-cookbook` exists (typically at `../tinker-cookbook`).

**Safety**
This notebook is **safe-by-default**: it will refuse to overwrite any output files unless you set `OVERWRITE_OUTPUTS=True`.

**Outputs**
- `data/finetuning/tinker_conversations.jsonl` (or a versioned JSONL)
- Run logs under `LOG_PATH` (default: `/tmp/tinker-examples/sl_ar_phishing`)
- `sampler_path` (Tinker path) which you can use for inference (SamplingClient)


In [1]:
# Imports + environment

from __future__ import annotations

import json
import sys
from datetime import datetime
from pathlib import Path

from dotenv import load_dotenv

load_dotenv()
print("cwd:", Path.cwd())


cwd: /Users/ext-elias.melas/Documents/Gitcode/ar_finetune/notebooks


### 1) Make `tinker_cookbook` importable

We add the local `tinker-cookbook` repo to `sys.path` so we can import `tinker_cookbook` without pip-installing it.

If you already added it as a uv editable dependency (`uv add --editable <path_to>/tinker-cookbook`), you can skip this.


In [3]:
def find_tinker_cookbook_repo(start: Path) -> Path:
    candidates: list[Path] = []
    for p in [start, *start.parents]:
        candidates.append(p / "tinker-cookbook")
        candidates.append(p)

    for repo in candidates:
        if (repo / "tinker_cookbook" / "__init__.py").exists():
            return repo

    raise FileNotFoundError(
        "Could not find the tinker-cookbook repo (missing tinker_cookbook/__init__.py)."
    )

TINKER_COOKBOOK_REPO = find_tinker_cookbook_repo(Path.cwd())
if str(TINKER_COOKBOOK_REPO) not in sys.path:
    sys.path.insert(0, str(TINKER_COOKBOOK_REPO))

import tinker_cookbook  # noqa: F401
print("tinker-cookbook repo:", TINKER_COOKBOOK_REPO)
print("tinker_cookbook import ok")


tinker-cookbook repo: /Users/ext-elias.melas/Documents/Gitcode/tinker-cookbook
tinker_cookbook import ok


### 2) Convert `training_data.json` to Tinker conversation JSONL

This writes `data/finetuning/tinker_conversations.jsonl` **only if it doesn't already exist** (unless `OVERWRITE_OUTPUTS=True`).x

The training_data.json is in the form:
``
[
    {'instruction':'',
    'input':'',
    'output':''}
    ]
``

In [None]:
# Safety switches (safe-by-default)
OVERWRITE_OUTPUTS = True
RUN_TAG = 'test'

def find_ar_finetune_root(start: Path) -> Path:
    for p in [start, *start.parents]:
        if (p / "data/finetuning/training_data_spam.json").exists():
            return p
    raise FileNotFoundError("Could not find data/finetuning/training_data.json by searching upward from cwd.")

AR_FINETUNE_ROOT = find_ar_finetune_root(Path.cwd())
print("ar_finetune root:", AR_FINETUNE_ROOT)

in_path = AR_FINETUNE_ROOT / "data/finetuning/training_data_spam.json"
out_path = AR_FINETUNE_ROOT / "data/finetuning/tinker_conversations_spam.jsonl"

# Guard against accidental overwrite
if out_path.exists() and not OVERWRITE_OUTPUTS:
    raise FileExistsError(
        f"Refusing to overwrite existing file: {out_path}\n"
        f"Either set OVERWRITE_OUTPUTS=True, or change out_path (e.g. include a tag like {RUN_TAG})."
    )

data = json.loads(in_path.read_text(encoding="utf-8"))
assert isinstance(data, list)

out_path.parent.mkdir(parents=True, exist_ok=True)
with out_path.open("w", encoding="utf-8") as f:
    for ex in data:
        instruction = (ex.get("instruction") or "").strip()
        user_input = (ex.get("input") or "").strip()
        output = (ex.get("output") or "").strip()

        messages = [
            {"role": "system", "content": instruction},
            {"role": "user", "content": user_input},
            {"role": "assistant", "content": output},
        ]
        f.write(json.dumps({"messages": messages}, ensure_ascii=False) + "\n")

print("Wrote:", out_path)
print("Head:")
print(out_path.open("r", encoding="utf-8").read().splitlines()[0][:500])


ar_finetune root: /Users/ext-elias.melas/Documents/Gitcode/ar_finetune
Wrote: /Users/ext-elias.melas/Documents/Gitcode/ar_finetune/data/finetuning/tinker_conversations_spam.jsonl
Head:
{"messages": [{"role": "system", "content": "You are an email security analyst in a mobile gaming company. Your task is to classify if an email is spam or not.\n\nIf the email is spam, return \"SPAM\" for category, the reason it is spam, the reason keyword and the source.\nIf the email is not spam, return \"GENUINE\" for category, an empty string for reason, an empty string for reason_keyword and an empty list for source.\nIf unclear, return \"ASSIGN_TO_AGENT\" for category."}, {"role": "user", 


### 3) Configure the supervised training run

This matches the original notebook configuration.


In [8]:
import tinker
from tinker_cookbook import model_info
from tinker_cookbook.renderers import TrainOnWhat
from tinker_cookbook.supervised import train
from tinker_cookbook.supervised.data import FromConversationFileBuilder
from tinker_cookbook.supervised.types import ChatDatasetBuilderCommonConfig

MODEL_NAME = "meta-llama/Llama-3.1-8B"
RENDERER_NAME = model_info.get_recommended_renderer_name(MODEL_NAME)

common_config = ChatDatasetBuilderCommonConfig(
    model_name_for_tokenizer=MODEL_NAME,
    renderer_name=RENDERER_NAME,
    max_length=8192,
    batch_size=16,
    train_on_what=TrainOnWhat.ALL_ASSISTANT_MESSAGES,
)

dataset_builder = FromConversationFileBuilder(
    common_config=common_config,
    file_path=str(out_path.resolve()),
    test_size=128,
    shuffle_seed=0,
)

LOG_PATH = Path("/tmp/tinker-examples/sl_ar_phishing_spam").expanduser()

config = train.Config(
    log_path=str(LOG_PATH),
    model_name=MODEL_NAME,
    dataset_builder=dataset_builder,
    learning_rate=2e-4,
    lr_schedule="linear",
    num_epochs=1,
    eval_every=10,
    save_every=20,
)

print("Renderer:", RENDERER_NAME)
print("Dataset:", out_path.resolve())
print("Log path:", config.log_path)


  from .autonotebook import tqdm as notebook_tqdm


Renderer: role_colon
Dataset: /Users/ext-elias.melas/Documents/Gitcode/ar_finetune/data/finetuning/tinker_conversations_spam.jsonl
Log path: /tmp/tinker-examples/sl_ar_phishing_spam


### 4) Start training

Run:

```python
await train.main(config)
```


In [9]:
# Start training
await train.main(config)


tinker_cookbook.utils.ml_log:475 [[92mINFO[0m] Logging to: /tmp/tinker-examples/sl_ar_phishing_spam
tinker.lib.public_interfaces.service_client:66 [[92mINFO[0m] ServiceClient initialized for session ab71f6d1-f9b1-5f68-b387-59bb7b34c066
tinker.lib.public_interfaces.service_client:147 [[92mINFO[0m] TrainingClient initialized for model ab71f6d1-f9b1-5f68-b387-59bb7b34c066:train:0
tinker_cookbook.supervised.train:229 [[92mINFO[0m] Training for 271 batches x 1 epochs = 271 steps
tinker_cookbook.supervised.train:344 [[92mINFO[0m] Starting epoch 0
tinker_cookbook.utils.misc_utils:20 [[92mINFO[0m] Starting get_batch
tinker_cookbook.utils.misc_utils:23 [[92mINFO[0m] get_batch took 0.01 seconds
tinker_cookbook.supervised.train:259 [[92mINFO[0m] [33m<|begin_of_text|>System: You are an email security analyst in a mobile gaming company. Your task is to classify if an email is spam or not.
[0m[33m
[0m[33mIf the email is spam, return "SPAM" for category, the reason it is spam, th

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 0                     [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000200  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7479      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.003690  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 1                     [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000199  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5786      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.007380  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 2                     [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000199  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8534      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.011070  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 3                     [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000198  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m13896     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.014760  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 4                     [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000197  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m12434     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.018450  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 5                     [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000196  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7570      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.022140  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 6                     [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000196  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7128      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.025830  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 7                     [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000195  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7659      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.029520  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 8                     [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000194  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5710      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.033210  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 9                     [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000193  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6635      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.036900  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 10                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000193  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7348      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.040590  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 11                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000192  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9344      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.044280  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 12                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000191  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7019      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.047970  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 13                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000190  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7273      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.051661  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 14                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000190  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5352      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.055351  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 15                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000189  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5917      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.059041  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 16                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000188  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5343      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.062731  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 17                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000187  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9340      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.066421  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 18                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000187  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8397      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.070111  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 19                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000186  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7163      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.073801  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 20                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000185  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6961      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.077491  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 21                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000185  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7597      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.081181  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 22                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000184  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6233      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.084871  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 23                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000183  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7468      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.088561  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 24                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000182  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7764      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.092251  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 25                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000182  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8298      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.095941  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 26                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000181  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6031      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.099631  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 27                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000180  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6847      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.103321  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 28                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000179  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7524      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.107011  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 29                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000179  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8748      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.110701  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 30                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000178  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8603      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.114391  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 31                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000177  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9607      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.118081  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 32                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000176  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9975      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.121771  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 33                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000176  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m4982      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.125461  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 34                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000175  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6257      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.129151  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 35                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000174  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5785      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.132841  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 36                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000173  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m4985      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.136531  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 37                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000173  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7583      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.140221  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 38                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000172  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6389      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.143911  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 39                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000171  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7748      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.147601  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 40                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000170  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8036      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.151292  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 41                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000170  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7406      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.154982  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 42                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000169  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m13768     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.158672  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 43                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000168  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m10006     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.162362  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 44                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000168  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5900      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.166052  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 45                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000167  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7435      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.169742  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 46                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000166  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m135.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m14642     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.173432  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 47                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000165  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m4163      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.177122  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 48                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000165  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7288      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.180812  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 49                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000164  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7156      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.184502  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 50                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000163  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5483      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.188192  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 51                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000162  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8054      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.191882  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 52                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000162  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9854      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.195572  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 53                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000161  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7069      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.199262  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 54                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000160  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8598      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.202952  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 55                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000159  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5753      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.206642  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 56                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000159  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6645      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.210332  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 57                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000158  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9229      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.214022  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 58                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000157  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8062      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.217712  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 59                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000156  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6252      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.221402  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 60                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000156  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6426      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.225092  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 61                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000155  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7301      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.228782  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 62                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000154  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7930      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.232472  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 63                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000154  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m11758     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.236162  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 64                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000153  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6485      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.239852  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 65                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000152  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m12443     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.243542  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 66                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000151  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8105      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.247232  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 67                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000151  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6458      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.250923  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 68                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000150  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m10226     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.254613  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 69                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000149  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6485      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.258303  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 70                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000148  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8049      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.261993  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 71                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000148  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7041      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.265683  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 72                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000147  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6197      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.269373  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 73                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000146  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7240      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.273063  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 74                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000145  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9343      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.276753  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 75                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000145  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7220      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.280443  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 76                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000144  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m10193     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.284133  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 77                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000143  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7646      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.287823  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 78                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000142  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6661      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.291513  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 79                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000142  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5439      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.295203  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 80                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000141  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8038      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.298893  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 81                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000140  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7645      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.302583  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 82                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000139  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7501      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.306273  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 83                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000139  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7921      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.309963  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 84                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000138  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5893      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.313653  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 85                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000137  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6283      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.317343  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 86                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000137  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8636      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.321033  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 87                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000136  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7642      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.324723  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 88                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000135  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m11194     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.328413  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 89                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000134  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6142      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.332103  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 90                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000134  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9842      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.335793  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 91                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000133  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8707      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.339483  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 92                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000132  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m10397     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.343173  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 93                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000131  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6143      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.346863  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 94                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000131  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6132      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.350554  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 95                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000130  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8215      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.354244  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 96                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000129  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7775      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.357934  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 97                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000128  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6364      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.361624  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 98                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000128  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5470      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.365314  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                    Step 99                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000127  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m14533     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.369004  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 100                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000126  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6302      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.372694  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 101                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000125  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7311      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.376384  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 102                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000125  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5547      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.380074  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 103                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000124  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7212      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.383764  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 104                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000123  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7698      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.387454  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 105                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000123  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6862      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.391144  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 106                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000122  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9526      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.394834  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 107                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000121  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7978      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.398524  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 108                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000120  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7927      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.402214  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 109                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000120  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8112      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.405904  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 110                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000119  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8367      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.409594  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 111                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000118  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6386      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.413284  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 112                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000117  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m10129     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.416974  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 113                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000117  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9117      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.420664  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 114                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000116  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5507      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.424354  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 115                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000115  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8241      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.428044  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 116                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000114  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7846      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.431734  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 117                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000114  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5535      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.435424  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 118                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000113  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6808      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.439114  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 119                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000112  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6854      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.442804  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 120                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000111  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5190      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.446494  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 121                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000111  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7287      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.450185  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 122                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000110  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7951      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.453875  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 123                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000109  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5342      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.457565  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 124                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000108  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9702      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.461255  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 125                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000108  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7475      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.464945  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 126                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000107  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m135.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m18995     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.468635  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 127                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000106  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9578      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.472325  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 128                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000106  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7145      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.476015  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 129                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000105  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7751      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.479705  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 130                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000104  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7542      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.483395  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 131                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000103  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7546      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.487085  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 132                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000103  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7960      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.490775  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 133                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000102  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8245      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.494465  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 134                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000101  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6597      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.498155  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 135                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000100  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7814      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.501845  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 136                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000100  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8301      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.505535  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 137                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000099  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6921      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.509225  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 138                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000098  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7125      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.512915  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 139                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000097  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7203      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.516605  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 140                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000097  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7800      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.520295  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 141                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000096  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6221      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.523985  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 142                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000095  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7041      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.527675  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 143                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000094  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5951      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.531365  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 144                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000094  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7154      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.535055  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 145                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000093  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5987      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.538745  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 146                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000092  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m10357     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.542435  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 147                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000092  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6995      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.546125  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 148                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000091  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6976      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.549815  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 149                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000090  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8231      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.553506  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 150                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000089  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8621      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.557196  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 151                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000089  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9510      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.560886  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 152                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000088  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8734      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.564576  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 153                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000087  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6420      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.568266  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 154                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000086  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9599      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.571956  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 155                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000086  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m12958     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.575646  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 156                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000085  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7160      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.579336  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 157                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000084  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8345      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.583026  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 158                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000083  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7493      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.586716  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 159                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000083  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7629      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.590406  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 160                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000082  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m4590      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.594096  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 161                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000081  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8083      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.597786  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 162                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000080  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9869      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.601476  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 163                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000080  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7027      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.605166  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 164                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000079  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5483      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.608856  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 165                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000078  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9415      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.612546  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 166                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000077  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m10892     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.616236  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 167                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000077  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6714      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.619926  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 168                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000076  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5187      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.623616  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 169                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000075  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6272      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.627306  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 170                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000075  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7894      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.630996  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 171                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000074  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7180      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.634686  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 172                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000073  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m10857     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.638376  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 173                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000072  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7293      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.642066  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 174                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000072  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7010      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.645756  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 175                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000071  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9939      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.649446  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 176                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000070  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6398      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.653137  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 177                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000069  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8342      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.656827  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 178                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000069  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7193      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.660517  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 179                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000068  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7069      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.664207  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 180                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000067  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9205      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.667897  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 181                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000066  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9260      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.671587  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 182                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000066  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6888      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.675277  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 183                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000065  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9650      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.678967  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 184                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000064  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5772      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.682657  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 185                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000063  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7531      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.686347  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 186                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000063  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6140      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.690037  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 187                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000062  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m4974      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.693727  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 188                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000061  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6151      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.697417  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 189                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000061  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7371      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.701107  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 190                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000060  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6181      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.704797  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 191                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000059  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6172      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.708487  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 192                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000058  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6479      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.712177  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 193                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000058  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6554      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.715867  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 194                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000057  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8014      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.719557  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 195                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000056  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m11424     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.723247  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 196                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000055  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7748      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.726937  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 197                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000055  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m10242     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.730627  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 198                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000054  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6289      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.734317  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 199                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000053  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6450      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.738007  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 200                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000052  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8958      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.741697  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 201                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000052  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8452      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.745387  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 202                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000051  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6579      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.749077  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 203                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000050  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7330      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.752768  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 204                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000049  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5620      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.756458  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 205                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000049  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9590      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.760148  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 206                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000048  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5062      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.763838  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 207                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000047  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8636      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.767528  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 208                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000046  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7958      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.771218  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 209                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000046  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m4877      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.774908  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 210                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000045  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m135.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m15174     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.778598  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 211                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000044  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6091      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.782288  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 212                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000044  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8538      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.785978  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 213                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000043  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8373      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.789668  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 214                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000042  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m135.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m17329     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.793358  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 215                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000041  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6719      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.797048  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 216                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000041  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8777      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.800738  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 217                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000040  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6859      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.804428  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 218                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000039  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5371      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.808118  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 219                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000038  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5894      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.811808  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 220                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000038  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m4561      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.815498  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 221                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000037  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7173      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.819188  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 222                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000036  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8349      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.822878  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 223                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000035  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5893      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.826568  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 224                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000035  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m11077     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.830258  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 225                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000034  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6064      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.833948  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 226                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000033  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5544      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.837638  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 227                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000032  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6002      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.841328  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 228                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000032  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9253      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.845018  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 229                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000031  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7773      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.848708  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 230                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000030  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5736      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.852399  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 231                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000030  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m12117     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.856089  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 232                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000029  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7398      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.859779  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 233                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000028  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7755      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.863469  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 234                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000027  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m135.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m15531     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.867159  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 235                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000027  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9016      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.870849  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 236                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000026  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m11802     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.874539  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 237                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000025  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7054      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.878229  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 238                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000024  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6190      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.881919  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 239                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000024  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6273      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.885609  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 240                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000023  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9453      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.889299  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 241                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000022  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7429      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.892989  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 242                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000021  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m135.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m15235     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.896679  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 243                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000021  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8175      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.900369  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 244                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000020  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6562      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.904059  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 245                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000019  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8483      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.907749  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 246                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000018  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7311      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.911439  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 247                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000018  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7230      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.915129  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 248                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000017  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8016      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.918819  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 249                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000016  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5370      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.922509  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 250                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000015  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m7926      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.926199  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 251                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000015  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6423      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.929889  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 252                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000014  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6268      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.933579  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 253                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000013  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9169      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.937269  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 254                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000013  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m9334      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.940959  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 255                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000012  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m135.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m13543     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.944649  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 256                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000011  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m4997      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.948339  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 257                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000010  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m10482     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.952030  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 258                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000010  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8040      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.955720  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 259                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000009  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6499      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.959410  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 260                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000008  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5628      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.963100  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 261                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000007  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5740      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.966790  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 262                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000007  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6431      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.970480  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 263                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000006  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m5410      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.974170  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 264                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000005  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m135.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m16917     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.977860  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 265                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000004  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6355      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.981550  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 266                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000004  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m12942     [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.985240  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 267                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000003  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m6463      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.988930  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 268                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000002  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m4810      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.992620  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 269                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000001  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8184      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m0.996310  [0m[32m [0m│
│[36m [0m[36mtime/get_batch                [0m[36m [0m│[32m [0m

tinker_cookbook.utils.ml_log:195 [[92mINFO[0m] 
[3m                   Step 270                    [0m
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃[1;35m [0m[1;35mMetric                        [0m[1;35m [0m┃[1;35m [0m[1;35mValue     [0m[1;35m [0m┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│[36m [0m[36mepoch                         [0m[36m [0m│[32m [0m[32m0         [0m[32m [0m│
│[36m [0m[36mlearning_rate                 [0m[36m [0m│[32m [0m[32m0.000001  [0m[32m [0m│
│[36m [0m[36mnum_loss_tokens               [0m[36m [0m│[32m [0m[32m144.000000[0m[32m [0m│
│[36m [0m[36mnum_sequences                 [0m[36m [0m│[32m [0m[32m16        [0m[32m [0m│
│[36m [0m[36mnum_tokens                    [0m[36m [0m│[32m [0m[32m8950      [0m[32m [0m│
│[36m [0m[36mprogress                      [0m[36m [0m│[32m [0m[32m1.000000  [0m[32m [0m│
│[36m [0m[36mtest/nll                      [0m[36m [0m│[32m [0m

### 5) Get the final `sampler_path` (for inference)

After training finishes, use `checkpoints.jsonl` to grab the last `sampler_path`.


In [10]:
service_client = tinker.ServiceClient()

from tinker_cookbook.checkpoint_utils import get_last_checkpoint

ckpt_state = get_last_checkpoint(config.log_path, required_key="state_path")
ckpt_sampler = get_last_checkpoint(config.log_path, required_key="sampler_path")

print("Last state checkpoint:", ckpt_state.get("state_path") if ckpt_state else None)
print("Last sampler checkpoint:", ckpt_sampler.get("sampler_path") if ckpt_sampler else None)

if ckpt_sampler:
    sampling_client = service_client.create_sampling_client(model_path=ckpt_sampler["sampler_path"])
    print("Sampling client ready")
else:
    print("No sampler checkpoint found yet — make sure training finished and wrote checkpoints.jsonl.")


tinker.lib.public_interfaces.service_client:66 [[92mINFO[0m] ServiceClient initialized for session 52bd03d7-d96e-5289-b425-bab7b364d23f
tinker_cookbook.checkpoint_utils:24 [[92mINFO[0m] Reading checkpoints from /tmp/tinker-examples/sl_ar_phishing_spam/checkpoints.jsonl
tinker_cookbook.checkpoint_utils:46 [[92mINFO[0m] Found 14 valid checkpoints with key 'state_path' in /tmp/tinker-examples/sl_ar_phishing_spam
tinker_cookbook.checkpoint_utils:49 [[92mINFO[0m] Using last checkpoint: {'name': 'final', 'epoch': 1, 'batch': 271, 'state_path': 'tinker://ab71f6d1-f9b1-5f68-b387-59bb7b34c066:train:0/weights/final', 'sampler_path': 'tinker://ab71f6d1-f9b1-5f68-b387-59bb7b34c066:train:0/sampler_weights/final'}
tinker_cookbook.checkpoint_utils:24 [[92mINFO[0m] Reading checkpoints from /tmp/tinker-examples/sl_ar_phishing_spam/checkpoints.jsonl
tinker_cookbook.checkpoint_utils:46 [[92mINFO[0m] Found 14 valid checkpoints with key 'sampler_path' in /tmp/tinker-examples/sl_ar_phishing_spam

Last state checkpoint: tinker://ab71f6d1-f9b1-5f68-b387-59bb7b34c066:train:0/weights/final
Last sampler checkpoint: tinker://ab71f6d1-f9b1-5f68-b387-59bb7b34c066:train:0/sampler_weights/final
Sampling client ready


### 6) (Optional) Download the LoRA adapter archive

Safe-by-default: downloads to a versioned filename and refuses to overwrite unless `OVERWRITE_OUTPUTS=True`.


In [12]:
import urllib.request

if ckpt_sampler is None:
    raise RuntimeError("No sampler checkpoint available to download.")

sampler_path = ckpt_sampler["sampler_path"]
rest_client = service_client.create_rest_client()
url_resp = rest_client.get_checkpoint_archive_url_from_tinker_path(sampler_path).result()

local_tar = Path(f"./tinker_adapter_archive_{RUN_TAG}.tar").resolve()
if local_tar.exists() and not OVERWRITE_OUTPUTS:
    raise FileExistsError(
        f"Refusing to overwrite existing file: {local_tar}. Set OVERWRITE_OUTPUTS=True to overwrite."
    )

urllib.request.urlretrieve(url_resp.url, str(local_tar))
print("Downloaded to:", local_tar)


Downloaded to: /Users/ext-elias.melas/Documents/Gitcode/ar_finetune/notebooks/tinker_adapter_archive_spam.tar
