Baby Llama

Train and run a small Llama 2 model from scratch on the TinyStories dataset.

Baby Llama Code Example:

Baby Llama 105 Tokens on Colab

Iters vs Val Loss Learning Words and Grammar Visualised
105 Token Vocab

!cd llama2.c && python tinystories.py train_vocab --vocab_size=256
trainer_interface.cc(558) LOG(INFO) Alphabet size=102
Vocabulary size is smaller than required_chars. 256 vs 361.

Name		Name	Last commit message	Last commit date
Latest commit History 99 Commits
tok105		tok105
tok361		tok361
Baby_Llama_105.ipynb		Baby_Llama_105.ipynb
Baby_Llama_32K.ipynb		Baby_Llama_32K.ipynb
Baby_Llama_361.ipynb		Baby_Llama_361.ipynb
Baby_Llama_4K.ipynb		Baby_Llama_4K.ipynb
LICENSE		LICENSE
Model-Sizes.md		Model-Sizes.md
README.md		README.md
Tokens.md		Tokens.md
tok4096 max_iters val_loss.md		tok4096 max_iters val_loss.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Baby Llama

Baby Llama Code Example:

Baby Llama 105 Tokens on Colab

More Tokens & Larger Models

Ref:

About

Releases

Packages

Contributors 2

Languages

License

EN10/BabyLlama

Folders and files

Latest commit

History

Repository files navigation

Baby Llama

Baby Llama Code Example:

Baby Llama 105 Tokens on Colab

More Tokens & Larger Models

Ref:

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages