<a href="https://colab.research.google.com/github/cetinkarasar/Hukuk_Asistani_MLOps/blob/main/Untitled26.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [13]:
# 1. Temel kütüphaneler ve Unsloth kurulumu
!pip install -q --no-cache-dir "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.git"
!pip install -q --no-cache-dir \
    trl==0.18.2 \
    xformers \
    peft \
    accelerate \
    bitsandbytes \
    langchain \
    langchain-community \
    langchain-text-splitters \
    sentence-transformers \
    faiss-cpu \
    pypdf \
    streamlit \
    huggingface-hub==0.34.0

# 2. LocalTunnel
!npm install -g localtunnel

  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25hdone
  Preparing metadata (pyproject.toml) ... [?25l[?25hdone
[1G[0K⠙[1G[0K⠹[1G[0K⠸[1G[0K⠼[1G[0K⠴[1G[0K⠦[1G[0K⠧[1G[0K⠇[1G[0K⠏[1G[0K⠋[1G[0K⠙[1G[0K⠹[1G[0K⠸[1G[0K⠼[1G[0K⠴[1G[0K
changed 22 packages in 2s
[1G[0K⠴[1G[0K
[1G[0K⠴[1G[0K3 packages are looking for funding
[1G[0K⠴[1G[0K  run `npm fund` for details
[1G[0K⠴[1G[0K

In [14]:
# Eksik olan ve hata veren parçalayıcı paketini kuruyoruz
!pip install -q langchain-text-splitters langchain --upgrade

In [17]:
%%writefile app.py
import streamlit as st
import torch
import os
from unsloth import FastLanguageModel
from transformers import AutoTokenizer
from langchain_community.document_loaders import PyPDFLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.vectorstores import FAISS

# --- AYARLAR ---
HF_REPO_NAME = "Cetin003/hukuk_model_tck_v1_lora"
PDF_PATH = "data/tck.pdf"
FAISS_INDEX_PATH = "faiss_tck_kutuphanesi"
EMBEDDING_MODEL_NAME = "distiluse-base-multilingual-cased-v1"

ALPACA_PROMPT = """Aşağıda, bir görevi açıklayan bir talimat (instruction) ile daha fazla bağlam sağlayan bir girdi (input) bulunmaktadır. İsteği uygun şekilde tamamlayan bir yanıt (output) yazın.

### Talimat:
{}

### Girdi:
{}

### Yanıt:
{}"""

@st.cache_resource
def load_generator_model():
    model, tokenizer = FastLanguageModel.from_pretrained(
        model_name = HF_REPO_NAME,
        load_in_4bit = True,
        dtype = None,
    )
    FastLanguageModel.for_inference(model)
    return model, tokenizer

@st.cache_resource
def load_retriever():
    embeddings = HuggingFaceEmbeddings(model_name=EMBEDDING_MODEL_NAME)
    if not os.path.exists(FAISS_INDEX_PATH):
        if not os.path.exists(PDF_PATH):
             st.error(f"HATA: '{PDF_PATH}' bulunamadı! Lütfen dosyayı yükleyin.")
             return None
        loader = PyPDFLoader(PDF_PATH)
        docs = loader.load()
        text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=150)
        chunks = text_splitter.split_documents(docs)
        vector_store = FAISS.from_documents(chunks, embeddings)
        vector_store.save_local(FAISS_INDEX_PATH)
    else:
        vector_store = FAISS.load_local(FAISS_INDEX_PATH, embeddings, allow_dangerous_deserialization=True)
    return vector_store

def main():
    st.set_page_config(page_title="TCK Hukuk Asistanı", layout="wide")
    st.title("⚖️ TCK Hukuk Asistanı (RAG + Fine-Tuned LLM)")

    # Model ve kütüphane yüklenirken kullanıcıyı bilgilendir
    status_placeholder = st.empty()
    status_placeholder.warning("⚠️ Model ve Kütüphaneler Hazırlanıyor, Lütfen Bekleyin...")

    vector_store = load_retriever()
    model, tokenizer = load_generator_model()

    # Her şey hazır olduğunda mesajı değiştir
    status_placeholder.success("✅ Sistem Hazır! Sorunuzu sorabilirsiniz.")

    kullanici_sorusu = st.text_input("Sorunuzu yazın:", placeholder="Zincirleme suç nedir?")

    if kullanici_sorusu:
        with st.spinner("Cevap üretiliyor..."):
            docs = vector_store.similarity_search(kullanici_sorusu, k=3)
            context = "\n\n".join([d.page_content for d in docs])

            instruction = "Verilen bağlamdaki kanun maddelerine sadık kalarak hukuk asistanı gibi cevap ver."
            input_text = f"BAĞLAM:\n{context}\n\nKULLANICI SORUSU: {kullanici_sorusu}"
            prompt = ALPACA_PROMPT.format(instruction, input_text, "")

            inputs = tokenizer([prompt], return_tensors = "pt").to("cuda")
            outputs = model.generate(**inputs, max_new_tokens=512, temperature=0.3)
            res = tokenizer.batch_decode(outputs, skip_special_tokens=True)[0]

            answer = res.split("### Yanıt:")[-1].strip()
            st.markdown("### Asistanın Cevabı:")
            st.write(answer)
            with st.expander("Referans Alınan Kanun Maddeleri (RAG)"):
                st.info(context)

if __name__ == "__main__":
    main()

Overwriting app.py


In [20]:
!pip install pyngrok
from pyngrok import ngrok

# Buraya kopyaladığın token'ı yapıştır
ngrok.set_auth_token("33VAowwMmkNnVX0B68IWaSpRg92_3UiX9uS81aXoARFJJYiai")

# Streamlit'i arka planda başlat
import os
os.system("streamlit run app.py &")

# Tüneli aç
public_url = ngrok.connect(8501)
print(f"Hukuk Asistanı Linki: {public_url.public_url}")

Collecting pyngrok
  Downloading pyngrok-7.5.0-py3-none-any.whl.metadata (8.1 kB)
Downloading pyngrok-7.5.0-py3-none-any.whl (24 kB)
Installing collected packages: pyngrok
Successfully installed pyngrok-7.5.0
Hukuk Asistanı Linki: https://informational-principally-devora.ngrok-free.dev
