In [6]:
# Gerekli kütüphaneleri kuruyoruz.
!pip install -q -U wikipedia langchain-community chromadb sentence-transformers openai

# Gerekli modülleri içeri aktarıyoruz.
import wikipedia
from langchain.text_splitter import CharacterTextSplitter
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.vectorstores import Chroma
from langchain_community.llms import OpenAI
from langchain.chains import RetrievalQA
import openai

# API anahtarını tanımlıyoruz.
# Lütfen buraya kendi anahtarını yapıştır.
openai.api_key = "YOUR_OPENAI_API_KEY"

# Adım 1: Veri Setini Wikipedia'dan Çekme
wikipedia.set_lang("en")
query = "Biomedical engineering"

try:
    wiki_page = wikipedia.page(query, auto_suggest=False)
    raw_text = wiki_page.content
    print("Veri başarıyla Wikipedia'dan çekildi.")

except wikipedia.exceptions.PageError:
    print("Hata: Üzgünüm, bu konu hakkında bir sayfa bulunamadı.")
    raw_text = None
except wikipedia.exceptions.DisambiguationError as e:
    print(f"Hata: Birden fazla sayfa bulundu. Şu seçenekleri deneyebilirsin: {e.options}")
    raw_text = None

if raw_text:
    # Adım 2: Çekilen Metni Parçalara Ayırma
    text_splitter = CharacterTextSplitter(
        separator="\n\n",
        chunk_size=1000,
        chunk_overlap=200,
        length_function=len
    )
    documents = text_splitter.split_text(raw_text)
    print(f"Metin toplam {len(documents)} parçaya ayrıldı.")

    # Adım 3: Gömülü Öğeleri Oluşturma ve Vektör Veri Tabanını Kurma
    print("Gömülü öğeler oluşturuluyor ve veri tabanı kuruluyor...")
    embedding_model_name = "sentence-transformers/all-MiniLM-L6-v2"
    embedding_model = HuggingFaceEmbeddings(model_name=embedding_model_name)

    vector_store = Chroma.from_texts(
        texts=documents,
        embedding=embedding_model,
    )

    print("Vektör veri tabanı başarıyla oluşturuldu ve veriler eklendi.")

    # Adım 4: OpenAI Entegrasyonu ve Soru-Cevap
    llm = OpenAI(model_name="gpt-3.5-turbo-instruct", temperature=0)

    qa = RetrievalQA.from_chain_type(
        llm=llm,
        chain_type="stuff",
        retriever=vector_store.as_retriever()
    )

    # Chatbot'u test ediyoruz.
    question = "What is biomedical engineering?"
    response = qa.run(question)
    print("\nOpenAI'nin Cevabı:")
    print(response)

    question_2 = "Give me information about cardiac pacemakers."
    response_2 = qa.run(question_2)
    print("\nOpenAI'nin Cevabı:")
    print(response_2)

else:
    print("Veri çekilemediği için işlem durduruldu.")

[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/999.8 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [91m━━━━━━━━━[0m[90m╺[0m[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m225.3/999.8 kB[0m [31m6.7 MB/s[0m eta [36m0:00:01[0m[2K   [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[91m╸[0m [32m993.3/999.8 kB[0m [31m13.7 MB/s[0m eta [36m0:00:01[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m999.8/999.8 kB[0m [31m9.3 MB/s[0m eta [36m0:00:00[0m
[?25h



Veri başarıyla Wikipedia'dan çekildi.
Metin toplam 30 parçaya ayrıldı.
Gömülü öğeler oluşturuluyor ve veri tabanı kuruluyor...
Vektör veri tabanı başarıyla oluşturuldu ve veriler eklendi.


ValidationError: 1 validation error for OpenAI
  Value error, Did not find openai_api_key, please add an environment variable `OPENAI_API_KEY` which contains it, or pass `openai_api_key` as a named parameter. [type=value_error, input_value={'model_name': 'gpt-3.5-t...ne, 'http_client': None}, input_type=dict]
    For further information visit https://errors.pydantic.dev/2.11/v/value_error