RAG (Retrieval-Augmented Generation)

RAG (Retrieval-Augmented Generation) — это техника, которая объединяет методы поиска информации с генеративными языковыми моделями. Она работает следующим образом: сначала из внешней базы знаний (например, базы данных или набора документов) извлекается релевантная информация, а затем эта извлеченная информация используется для дополнения входных данных для генеративной языковой модели. Это позволяет модели генерировать более обоснованные, точные и контекстуально релевантные ответы, особенно для задач, требующих актуальных или специфических знаний в предметной области.

Запуск модели

Скачивание образа Ollama

docker pull ollama/ollama

Запуск Ollama в Docker

docker run -d \
  --name ollama \
  -p 11434:11434 \
  -v ollama-data:/root/.ollama \
  ollama/ollama

Запуск языковой модели через Ollama

Загружает и запускает модель qwen2:0.5b-instruct

docker exec ollama ollama pull qwen2:0.5b-instruct

Сделайть файл исполняемым

chmod +x run.sh
./run.sh

Технологический стек

Python: 3.10.12
Docker: 28.3.3, build 980b856
Ubuntu: 24.04

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
backend		backend
docs		docs
frontend		frontend
README.md		README.md
docker-compose.yml		docker-compose.yml
restart.sh		restart.sh
run.sh		run.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

RAG (Retrieval-Augmented Generation)

Запуск модели

Скачивание образа Ollama

Запуск Ollama в Docker

Запуск языковой модели через Ollama

Сделайть файл исполняемым

Технологический стек

About

Uh oh!

Releases

Packages

Languages

DemonDis/rag

Folders and files

Latest commit

History

Repository files navigation

RAG (Retrieval-Augmented Generation)

Запуск модели

Скачивание образа Ollama

Запуск Ollama в Docker

Запуск языковой модели через Ollama

Сделайть файл исполняемым

Технологический стек

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages