In [None]:
!pip install pandas python-dotenv langchain langchain-huggingface langchain-community faiss-cpu

In [None]:
!apt-get install libfaiss-dev

In [None]:
!pip install chromadb

In [None]:
!pip install rank_bm25

Collecting rank_bm25
  Downloading rank_bm25-0.2.2-py3-none-any.whl.metadata (3.2 kB)
Downloading rank_bm25-0.2.2-py3-none-any.whl (8.6 kB)
Installing collected packages: rank_bm25
Successfully installed rank_bm25-0.2.2


In [None]:
# Gerekli kütüphanelerin yüklenmesi
import os
import json
import pandas as pd
from dotenv import load_dotenv
from langchain_huggingface import HuggingFaceEmbeddings, HuggingFaceEndpoint
from langchain_community.vectorstores import FAISS
from langchain_core.documents import Document
from langchain_community.retrievers import BM25Retriever
from langchain_core.prompts import PromptTemplate
from langchain.schema import StrOutputParser
from langchain.schema.runnable import RunnablePassthrough

# Çevresel değişkenleri yükle
load_dotenv()

# API anahtarını ayarlayın
os.environ['HUGGINGFACE_API_KEY'] = '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'  # Buraya kendi API anahtarınızı gireceksiniz.

# 1. Adım: JSON dosyasını yükleyin ve veriyi işleyin
# JSON dosyasının yolunu belirtin
json_file_path = '/content/keskop_answer.json'  # JSON dosyanızın doğru yolunu yazın

# JSON dosyasını okuyun
with open(json_file_path, 'r', encoding='utf-8') as file:
    data = json.load(file)

# Soruları ve cevapları işlemek için boş listeler oluşturun
questions = []
answers = []

# Her bir ana soruyu ve varyasyonlarını işleme
for key, qa_list in data.items():
    for qa in qa_list:
        questions.append(qa['question'])
        answers.append(qa['answer'])

# Veriyi bir pandas DataFrame'e dönüştürmek (isteğe bağlı)
df = pd.DataFrame({'question': questions, 'answer': answers})


In [None]:
# 2. Adım: Veriyi LangChain Document formatına dönüştürme
documents = [Document(page_content=question, metadata={'answer': answer}) for question, answer in zip(questions, answers)]

In [None]:
# 3. Adım: Embeddings (Metin Gömme) ve FAISS Vektör Deposu Oluşturma
model_name = "sentence-transformers/all-mpnet-base-v2"
model_kwargs = {'device': 'cpu'}
encode_kwargs = {'normalize_embeddings': False}
embeddings = HuggingFaceEmbeddings(
    model_name=model_name,
    model_kwargs=model_kwargs,
    encode_kwargs=encode_kwargs
)

# FAISS vektör deposunu oluşturuyoruz
vector_store = FAISS.from_documents(documents, embeddings)


In [None]:
# 4. Adım: LLM Ayarları (Hugging Face Hub üzerinden Mistral-7B modeli)
llm = HuggingFaceEndpoint(
    repo_id="mistralai/Mistral-Nemo-Instruct-2407",
    huggingfacehub_api_token=os.environ['HUGGINGFACE_API_KEY'],
    temperature=0.1,
    model_kwargs={"max_length": 64}
)


The token has not been saved to the git credentials helper. Pass `add_to_git_credential=True` in this function directly or `--add-to-git-credential` if using via `huggingface-cli` if you want to set the git credential as well.
Token is valid (permission: write).
Your token has been saved to /root/.cache/huggingface/token
Login successful


In [None]:
# 5. Adım: BM25Retriever ile Alıcı (Retriever) Oluşturma
retriever = BM25Retriever.from_documents(documents)

In [None]:
# 6. Adım: Özel bir prompt template oluşturma
custom_prompt = PromptTemplate.from_template(
    "Aşağıdaki talimatları takip ederek soruyu yanıtla:\n\n"
    "{instructions}\n\n"
    "Soru: {question}\n"
    "Bağlam: {context}\n\n"
    "Yanıt:"
)

In [None]:
# 7. Adım: Retrieval-Augmented Generation (RAG) QA Zinciri Oluşturma
rag_chain = (
    {
        "context": retriever,  # Kullanıcının sorusuna en uygun cevabı bulmak için retriever
        "question": RunnablePassthrough(),  # Kullanıcının sorusunu geçirin
        "instructions": lambda _: "Aşağıdaki talimatları takip ederek soruyu yanıtlayın:"  # Talimatlar (sabit veya özelleştirilebilir)
    }
    | custom_prompt  # Prompt şablonuyla birleştirme
    | llm  # LLM ile yanıt üretme
    | StrOutputParser()  # Yanıtı işleyip döndürme
)


In [None]:
# Soru sormak için fonksiyon
def ask_question(query):
    try:
        result = rag_chain.invoke(query)  # RAG zincirini çalıştırarak kullanıcıdan gelen soruya yanıt üretme
        return result  # Üretilen yanıtı döndür
    except Exception as e:
        return f"Bir hata oluştu: {str(e)}"  # Hata durumunda hatayı döndür

# Ana fonksiyon: Soru sorma
if __name__ == "__main__":
    query = "İpotek verebilecek bir gayrimenkulum olmadığı için ne yapmam gerekiyor?"  # Örnek bir soru
    answer = ask_question(query)  # Soruyu RAG zinciri ile yanıtla
    print(answer)  # Yanıtı yazdır


 Adınıza kayıtlı gayrimenkul yoksa, başka birine ait gayrimenkul ipoteği verebilirsiniz.
