llm-simple-rag

An experiment to build a simple RAG Application, capable of run any llamacpp-compatible LLM and any HuggingFace-compatible BERT Embedding/Sentence Transformer model. Using ChromaDB as VectorStore and Flask-SocketIO as Webserver.

How to run

Download an LLM model according to README.md in models/ folder.
Change config.py according to the chosen model.
Install Docker
Run:

In Windows run build_docker.bat and run_docker.bat
In Linux/Other run sh build_docker.sh and sh run_docker.sh

Screen shot

Screehshot

Diagrams

Sequence diagram of the App:

Class Diagram (without dependencies):

Class Diagram (with dependencies):

TODO

Pydoc documentation
Config HTML View
Split Config and make a Class with Singleton
Download LLM models automatically

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
docs		docs
models		models
src		src
.dockerignore		.dockerignore
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
build_docker.bat		build_docker.bat
build_docker.sh		build_docker.sh
build_local.sh		build_local.sh
load_things.py		load_things.py
requirements.txt		requirements.txt
run_docker.bat		run_docker.bat
run_docker.sh		run_docker.sh
run_local.sh		run_local.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

llm-simple-rag

How to run

Screen shot

Diagrams

TODO

About

Releases 1

Packages

Languages

License

erickfmm/llm-simple-rag

Folders and files

Latest commit

History

Repository files navigation

llm-simple-rag

How to run

Screen shot

Diagrams

TODO

About

Topics

Resources

License

Stars

Watchers

Forks

Releases 1

Packages 0

Languages

Packages