Дообучение Qwen2.5 7B и запуск с помощью llama.cpp

Этот проект представляет собой полный цикл работы с большой языковой моделью (LLM): от дообучения (fine-tuning) с использованием техники QLoRA до конвертации в формат GGUF и запуска оптимизированной модели через библиотеку llama.cpp для быстрого инференса на локальной машине (CPU или GPU).

Описание

Репозиторий содержит два основных компонента:

Ноутбук для обучения (Обучение_Qwen2_5_7B_QLoRa.ipynb): Jupyter Notebook, предназначенный для запуска в среде с GPU (например, Google Colab). Он выполняет дообучение модели Qwen/Qwen2.5-7B на пользовательском датасете в формате JSON. Используется техника QLoRA (4-битная квантизация + LoRA), что позволяет дообучать большие модели даже на GPU с ограниченной памятью (например, NVIDIA A100, T4). Результатом ноутбука являются адаптеры LoRA, а затем и объединенная (merged) модель в стандартном формате Hugging Face.
Инструкция по сборке (instruction.md): Набор команд для сборки инструментов llama.cpp из исходного кода в Linux-окружении. Эти инструменты необходимы для конвертации дообученной модели в высокооптимизированный формат GGUF и для её дальнейшего использования (запуск в чате или в качестве сервера).

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
README.md		README.md
instruction.md		instruction.md
Обучение_Qwen2_5_7B_QLoRa.ipynb		Обучение_Qwen2_5_7B_QLoRa.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Дообучение Qwen2.5 7B и запуск с помощью llama.cpp

Описание

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Дообучение Qwen2.5 7B и запуск с помощью llama.cpp

Описание

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages