GitHub - ivfiev/ak-llm: Simple transformer-based LLM based on Andrej Karpathy's GPT tutorial.

Requires an appropriate build of PyTorch. Tested using rocm/pytorch

Training: python run_model.py --train --blocks 6 --context 128 --dimensions 256 --iterations 2500 --filename model_file_name

Running: python run_model.py --run --blocks 6 --context 128 --dimensions 256 --output 300 --filename model_file_name

(Optional) Training the BPE tokenizer: python run_tokenizer.py -v 512 -i input.txt -o tok_512

(Optional) Using the BPE tokenizer: python run_model.py ... --tokenizer tok_512

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
.gitignore		.gitignore
README.md		README.md
input.txt		input.txt
model.py		model.py
requirements.txt		requirements.txt
run_model.py		run_model.py
run_tokenizer.py		run_tokenizer.py
test_tokenizer.py		test_tokenizer.py
tokenizer.py		tokenizer.py

Provide feedback