Skip to content

elif0zbek/Academic_RAG

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Academic RAG

Hibrit LLM Destekli Akademik Araştırma & Literatür Analiz Platformu

Python 3.10+ FastAPI Qdrant Next.js 14 MIT License

Uygulama Önizlemesi

Sohbet Arayüzü Model Ayarları
Kaynak Gösterimi Terminal İşlemleri

Teknik Detaylar

Academic RAG, statik akademik makaleleri (PDF) interaktif bilgi kaynaklarına dönüştürmek için tasarlanmış yüksek performanslı bir analiz çerçevesidir. LlamaIndex orkestrasyonunu kullanarak, ham veriler ile anlamsal anlama arasındaki boşluğu doldurur. Araştırmacıların, yerel (Ollama) veya bulut (Gemini) tabanlı modeller aracılığıyla literatürle sohbet etmesini ve hassas verilerini buluta göndermeden (yerel modda) analiz yapmasını sağlar.

Anahtar Yetenekler

  • Hybrid Inference Engine: Ollama (Yerel/Gizli) ve Google Gemini (Bulut/Yüksek Kapasite) arasında anlık geçiş imkanı sunar.
  • Semantic Document Parsing: PDF makaleleri ham metin olarak değil, Markdown formatına dönüştürülerek ve anlamsal bütünlüğe (Semantic Chunking) göre parçalanarak işlenir.
  • Citation & Evidence: Üretilen her cevap, ilgili makaleden alınan kaynak metin ve benzerlik skoru ile desteklenir; halüsinasyon riski minimize edilir.
  • Vector Architecture: Qdrant veritabanı üzerinde çalışan yüksek hızlı vektör arama motoru ile milyonlarca veri parçası arasında milisaniyeler içinde erişim sağlar.
  • Multi-Language Support: Sorgu ve cevapları arka planda otomatik olarak işleyerek, İngilizce makalelerle Türkçe sohbet etme imkanı tanır.

Sistem Mimarisi

Çerçeve, analitik derinlik ve süreç izolasyonu sağlayan üç farklı katman üzerinden çalışır:

  1. RAG Engine (Backend Layer): Python/FastAPI tabanlı, makale indirme, Markdown dönüşümü ve LlamaIndex tabanlı sorgulama süreçlerini yöneten motor.
  2. Vector Store (Memory Layer): Qdrant ve HuggingFace Embeddings kullanarak verilerin matematiksel vektörler olarak saklandığı bellek katmanı.
  3. User Interface (Visual Layer): Next.js ve Tailwind CSS ile geliştirilmiş, kaynak atıflarını görselleştiren modern kullanıcı arayüzü.

Dağıtım

Sistem Gereksinimleri

  • Operating System: Linux, macOS veya Windows.
  • LLM Hardware: Yerel modeller (Ollama) için NVIDIA GPU önerilir.
  • Libraries: Python 3.10+, Node.js 18+, Qdrant.

Kurulum

Dağıtım süreci, hem backend hem de frontend ortamlarının kurulumunu kapsar:

git clone https://github.com/elif0zbek/Academic_RAG.git
cd Academic_RAG

# 1. Backend Kurulumu
cd backend
python -m venv .venv
# Windows: .venv\Scripts\activate | Mac/Linux: source .venv/bin/activate
pip install -r requirements.txt
python api.py

# 2. Frontend Kurulumu (Yeni Terminalde)
cd ../frontend
npm install
npm run dev

RAG Pipeline Protokolu

RAG Pipeline, veri işleme hattında aşağıdaki özelleştirilmiş modülleri kullanır:

Pipeline Modülleri

Module Name Responsibility Technology
The Fetcher ArXiv ve diğer kaynaklardan PDF indirme Python Requests
The Parser PDF -> Markdown dönüşümü ve temizleme LlamaParse / PyMuPDF
The Embedder Metinleri vektör uzayına yerleştirme HuggingFace (BGE)
The Reasoner Bağlam odaklı cevap üretme ve sentezleme Gemini / Llama3

Konfigrasyon

Operasyonel parametreler backend/conf.py veya config.yaml üzerinden proje ihtiyaçlarına göre düzenlenebilir:

# RAG Parametreleri
rag:
  retrieval_top_k: 5        # Getirilecek kaynak sayısı
  rerank_top_n: 3           # Yeniden sıralama sonrası sayı
  score_threshold: 0.45     # Benzerlik eşik değeri

# Model Seçimi
llm:
  default_provider: "ollama" # veya "gemini"

Lisans

Academic RAG, açık kaynaklı bir yazılımdır ve MIT License altında lisanslanmıştır.
Daha fazla detay için LICENSE dosyasını inceleyiniz.

About

Hibrit LLM Destekli Akademik Araştırma & Literatür Analiz Platformu.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors