MergeKit to merge LLMs

mergekit is a toolkit for merging pre-trained language models. mergekit uses an out-of-core approach to perform unreasonably elaborate merges in resource-constrained situations. Merges can be run entirely on CPU or accelerated with as little as 8 GB of VRAM. Many merging algorithms are supported, with more coming as they catch my attention.

Features:

Supports Llama, Mistral, GPT-NeoX, StableLM, and more Many merge methods GPU or CPU execution Lazy loading of tensors for low memory use Interpolated gradients for parameter values (inspired by Gryphe's BlockMerge_Gradient script) Piecewise assembly of language models from layers ("Frankenmerging")

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
LazyMergekit.ipynb		LazyMergekit.ipynb
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

LazyMergekit.ipynb

LazyMergekit.ipynb

README.md

README.md

Repository files navigation

MergeKit to merge LLMs

About

Releases

Packages

Languages

SharathHebbar/merge_llms

Folders and files

Latest commit

History

LazyMergekit.ipynb

LazyMergekit.ipynb

README.md

README.md

Repository files navigation

MergeKit to merge LLMs

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages