# AKBANK GENAI BOOTCAMP PROJESİ: BİYOMEDİKAL RAG CHATBOT FİNAL VERSİYON

**Proje Amacı:** Biyomedikal mühendisliği ve tıbbi cihazlar hakkında soruları, spesifik bir veri setine dayandırarak (RAG Mimarisi ile) yanıtlamak.

---

In [None]:
# Gerekli kütüphaneleri kuruyoruz.
!pip install -q -U wikipedia langchain-community chromadb sentence-transformers openai

# Gerekli modülleri içeri aktarıyoruz.
import wikipedia
from langchain.text_splitter import CharacterTextSplitter
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.vectorstores import Chroma
from langchain_community.llms import OpenAI
from langchain.chains import RetrievalQA
import os
import openai

# =======================================================================
# API ANAHTARI VE GÜVENLİK (MENTOR TALİMATINA UYGUN)
# =======================================================================
# ÖNEMLİ: Mentor talimatına uygun olarak API anahtarı doğrudan koda gömülmemiştir.
# Mentorler, bu kodu Colab'da çalıştırırken kendi API anahtarlarını Colab Secrets'a veya sistem değişkenine eklemelidir.
# Biz, kodun doğru çalıştığını göstermek için anahtarı sistem değişkeninden okumayı deniyoruz.

OPENAI_API_KEY = os.environ.get("OPENAI_API_KEY") 

if OPENAI_API_KEY:
    openai.api_key = OPENAI_API_KEY
    print("API Anahtarı başarıyla sistemden okundu. LLM servisi başlatılacak.")
else:
    print("HATA NOTU: API Anahtarı bulunamadı. Lütfen anahtarınızı sistem değişkenlerine ekleyin.")
    # Test amaçlı olarak kısıtlı bir placeholder değer atıyoruz.
    openai.api_key = "SK-PLACEHOLDER"


# =======================================================================
# RAG MİMARİSİ OLUŞTURMA
# =======================================================================

# Adım 1: Veri Setini Wikipedia'dan Çekme (Daha kapsamlı Medical device sorgusu)
wikipedia.set_lang("en")
query = "Medical device" 
raw_text = None
try:
    wiki_page = wikipedia.page(query, auto_suggest=False)
    raw_text = wiki_page.content
    print("\nVeri başarıyla 'Medical device' sayfasından çekildi.")
except Exception as e:
    raw_text = None
    print(f"Hata: Wikipedia'dan veri çekilemedi. {e}")


if raw_text:
    # Adım 2: Çekilen Metni Parçalara Ayırma
    text_splitter = CharacterTextSplitter(separator="\n\n", chunk_size=1000, chunk_overlap=200, length_function=len)
    documents = text_splitter.split_text(raw_text)
    print(f"Metin toplam {len(documents)} parçaya ayrıldı.")

    # Adım 3: Vektör Veri Tabanını Kurma
    embedding_model = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")
    vector_store = Chroma.from_texts(texts=documents, embedding=embedding_model)
    print("Vektör veri tabanı başarıyla oluşturuldu ve veriler eklendi.")

    # Adım 4: OpenAI Entegrasyonu ve Soru-Cevap
    llm = OpenAI(model_name="gpt-3.5-turbo-instruct", temperature=0, openai_api_key=OPENAI_API_KEY)
    
    qa = RetrievalQA.from_chain_type(llm=llm, chain_type="stuff", retriever=vector_store.as_retriever(k=3))
    
    def query_vector_db(query_text):
        try:
            return qa.run(query_text)
        except Exception as e:
            # API kotası dolduğunda bu hata yakalanır.
            return f"[KOTA HATASI TEYİDİ]: API sorgusu başarısız oldu. Hata: {e}"

    # Chatbot'u test ediyoruz.
    question = "What are the three main classes of medical devices?"
    response = query_vector_db(question)
    print("\nOpenAI'nin Cevabı (Test Sorusu 1):")
    print(response)

    question_2 = "Who regulates medical devices in the US?"
    response_2 = query_vector_db(question_2)
    print("\nOpenAI'nin Cevabı (Test Sorusu 2):")
    print(response_2)

else:
    print("Veri çekilemediği için RAG zinciri oluşturulamadı.")