Llama2RNN.c：一个用C语言实现的终身 RNN 模型

这是一个使用 Llama2 权重设计的循环神经网络（RNN）模型，旨在无限期运行（终身）。

llama2: 可以使用 llama2 各种版本模型的权重
rnn: 每个token的 attention sequence 长度固定，计算和内存开销不会增加，理论上支持无限长序列，可以从硬盘读取和保存记忆
.c: 可以在本地设备上运行，甚至是移动平台

如何训练

数据处理

参考README_llama2.c.md处理好数据

python3 tinystories.py download
python3 tinystories.py train_vocab --vocab_size=4096
python3 tinystories.py pretokenize --vocab_size=4096

训练

python3 train.py config/train_tinystories_token4096_memorynorm.py

保存

python3 tokenizer.py --tokenizer-model ./data/tok4096.model
export.py out_path/model_q80.bin --version 2 --mem --checkpoint out_path/ckpt.pt

其它

更多细节说明见llama2Rnn.c/README.md at main · siyuanseever/llama2Rnn.c (github.com)

许可证

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 522 Commits
.github/workflows		.github/workflows
assets		assets
config		config
doc		doc
.gitignore		.gitignore
LICENSE		LICENSE
Makefile		Makefile
README.en.md		README.en.md
README.md		README.md
README_llama2.c.md		README_llama2.c.md
attention.py		attention.py
attention_extend.py		attention_extend.py
build_msvc.bat		build_msvc.bat
configurator.py		configurator.py
data_generator.py		data_generator.py
dataset.py		dataset.py
datatask.py		datatask.py
eval.sh		eval.sh
eval_mem.sh		eval_mem.sh
eval_reverse.sh		eval_reverse.sh
eval_reverse_mem.sh		eval_reverse_mem.sh
eval_reverse_mem_infinity.sh		eval_reverse_mem_infinity.sh
export.py		export.py
jiiov.py		jiiov.py
jiiov_chat.py		jiiov_chat.py
jiiov_rephrase.py		jiiov_rephrase.py
layers.py		layers.py
model.py		model.py
modelargs.py		modelargs.py
parse_log.py		parse_log.py
position_embedding.py		position_embedding.py
requirements.txt		requirements.txt
run.c		run.c
runq.c		runq.c
runqm.c		runqm.c
sample.py		sample.py
test.c		test.c
test_all.py		test_all.py
tinystories.py		tinystories.py
tinystories_infinity.py		tinystories_infinity.py
tinystories_order.py		tinystories_order.py
tinystories_repeat.py		tinystories_repeat.py
tinystories_reverse.py		tinystories_reverse.py
tinystories_reverse_infinity.py		tinystories_reverse_infinity.py
tokenizer.bin		tokenizer.bin
tokenizer.model		tokenizer.model
tokenizer.py		tokenizer.py
train.py		train.py
ultrachat.py		ultrachat.py
wiki.py		wiki.py
wiki_zh.py		wiki_zh.py
wikipedia_en.py		wikipedia_en.py
win.c		win.c
win.h		win.h
zhihu.py		zhihu.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Llama2RNN.c：一个用C语言实现的终身 RNN 模型

如何训练

数据处理

训练

保存

其它

许可证

About

Releases

Packages

Languages

License

siyuanseever/llama2Rnn

Folders and files

Latest commit

History

Repository files navigation

Llama2RNN.c：一个用C语言实现的终身 RNN 模型

如何训练

数据处理

训练

保存

其它

许可证

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages