Antigravity: On-device LLM Inference Framework

본 프로젝트는 ARM64 기반 엣지 디바이스 및 모바일 환경에 최적화된 고성능 On-device LLM 추론 프레임워크입니다. Rust 언어로 구현되었으며, 하드웨어 가속기 활용을 위한 유연한 백엔드 구조와 메모리 효율성을 극대화한 Zero-copy 아키텍처를 지향합니다.

🚀 Key Features

ARM64 Optimized: Android 및 Linux 환경의 ARM64 SoC 성능을 최대로 활용하도록 설계되었습니다.
Zero-copy Memory Management: Galloc 및 SharedBuffer를 통해 CPU와 GPU(OpenCL)/NPU 간의 불필요한 데이터 복사를 제거했습니다.
Backend Extensibility: Backend 트레이트를 통해 CPU, OpenCL, NPU(TBD) 등 다양한 연산 엔진을 유연하게 교체 및 확장할 수 있습니다.
Quantization Support: GGML(GGUF) 호환 Q4_0, Q4_1 블록 양자화 및 FP16/BF16 타입을 지원하여 메모리 대역폭 문제를 해결합니다.
Llama 3.2 Ready: Llama 3.2 (1B) 아키텍처 및 GQA(Grouped-Query Attention)를 우선적으로 지원합니다.

📖 Documentation

시스템 아키텍처, 데이터 레이아웃, 인터페이스 정의 및 메모리 모델에 대한 상세한 내용은 아래 문서를 참조하십시오.

ARCHITECTURE.md: 하이레벨/로레벨 컴포넌트 설계, Zero-copy 메커니즘, 양자화 포맷 및 Trait 정의 상세 설명

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
.agent/skills		.agent/skills
.cargo		.cargo
benchmarks		benchmarks
eval		eval
kernels		kernels
reference/ggml-cpu		reference/ggml-cpu
scripts		scripts
src		src
.gitignore		.gitignore
ARCHITECTURE.md		ARCHITECTURE.md
Cargo.lock		Cargo.lock
Cargo.toml		Cargo.toml
PROJECT_CONTEXT.md		PROJECT_CONTEXT.md
README.md		README.md
android.source		android.source
build_log.txt		build_log.txt
build_log_2.txt		build_log_2.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Antigravity: On-device LLM Inference Framework

🚀 Key Features

📖 Documentation

About

Uh oh!

Releases

Packages

Languages

hedone21/llm_rs2

Folders and files

Latest commit

History

Repository files navigation

Antigravity: On-device LLM Inference Framework

🚀 Key Features

📖 Documentation

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages