Hibrit LLM Destekli Akademik Araştırma & Literatür Analiz Platformu
![]() |
![]() |
|---|---|
![]() |
![]() |
Academic RAG, statik akademik makaleleri (PDF) interaktif bilgi kaynaklarına dönüştürmek için tasarlanmış yüksek performanslı bir analiz çerçevesidir. LlamaIndex orkestrasyonunu kullanarak, ham veriler ile anlamsal anlama arasındaki boşluğu doldurur. Araştırmacıların, yerel (Ollama) veya bulut (Gemini) tabanlı modeller aracılığıyla literatürle sohbet etmesini ve hassas verilerini buluta göndermeden (yerel modda) analiz yapmasını sağlar.
- Hybrid Inference Engine: Ollama (Yerel/Gizli) ve Google Gemini (Bulut/Yüksek Kapasite) arasında anlık geçiş imkanı sunar.
- Semantic Document Parsing: PDF makaleleri ham metin olarak değil, Markdown formatına dönüştürülerek ve anlamsal bütünlüğe (Semantic Chunking) göre parçalanarak işlenir.
- Citation & Evidence: Üretilen her cevap, ilgili makaleden alınan kaynak metin ve benzerlik skoru ile desteklenir; halüsinasyon riski minimize edilir.
- Vector Architecture: Qdrant veritabanı üzerinde çalışan yüksek hızlı vektör arama motoru ile milyonlarca veri parçası arasında milisaniyeler içinde erişim sağlar.
- Multi-Language Support: Sorgu ve cevapları arka planda otomatik olarak işleyerek, İngilizce makalelerle Türkçe sohbet etme imkanı tanır.
Çerçeve, analitik derinlik ve süreç izolasyonu sağlayan üç farklı katman üzerinden çalışır:
- RAG Engine (Backend Layer): Python/FastAPI tabanlı, makale indirme, Markdown dönüşümü ve LlamaIndex tabanlı sorgulama süreçlerini yöneten motor.
- Vector Store (Memory Layer): Qdrant ve HuggingFace Embeddings kullanarak verilerin matematiksel vektörler olarak saklandığı bellek katmanı.
- User Interface (Visual Layer): Next.js ve Tailwind CSS ile geliştirilmiş, kaynak atıflarını görselleştiren modern kullanıcı arayüzü.
- Operating System: Linux, macOS veya Windows.
- LLM Hardware: Yerel modeller (Ollama) için NVIDIA GPU önerilir.
- Libraries:
Python 3.10+,Node.js 18+,Qdrant.
Dağıtım süreci, hem backend hem de frontend ortamlarının kurulumunu kapsar:
git clone https://github.com/elif0zbek/Academic_RAG.git
cd Academic_RAG
# 1. Backend Kurulumu
cd backend
python -m venv .venv
# Windows: .venv\Scripts\activate | Mac/Linux: source .venv/bin/activate
pip install -r requirements.txt
python api.py
# 2. Frontend Kurulumu (Yeni Terminalde)
cd ../frontend
npm install
npm run devRAG Pipeline, veri işleme hattında aşağıdaki özelleştirilmiş modülleri kullanır:
| Module Name | Responsibility | Technology |
|---|---|---|
| The Fetcher | ArXiv ve diğer kaynaklardan PDF indirme | Python Requests |
| The Parser | PDF -> Markdown dönüşümü ve temizleme | LlamaParse / PyMuPDF |
| The Embedder | Metinleri vektör uzayına yerleştirme | HuggingFace (BGE) |
| The Reasoner | Bağlam odaklı cevap üretme ve sentezleme | Gemini / Llama3 |
Operasyonel parametreler backend/conf.py veya config.yaml üzerinden proje ihtiyaçlarına göre düzenlenebilir:
# RAG Parametreleri
rag:
retrieval_top_k: 5 # Getirilecek kaynak sayısı
rerank_top_n: 3 # Yeniden sıralama sonrası sayı
score_threshold: 0.45 # Benzerlik eşik değeri
# Model Seçimi
llm:
default_provider: "ollama" # veya "gemini"Academic RAG, açık kaynaklı bir yazılımdır ve MIT License altında lisanslanmıştır.
Daha fazla detay için LICENSE dosyasını inceleyiniz.



