In [2]:
# -*- coding: utf-8 -*-
# INVENTORYAI - 5. h√©t: RAG integr√°ci√≥ √©s k√©rd√©s-v√°lasz modell (GPT-5)
# Notebook neve: inventoryAI_week5_RAG_integration.ipynb

# -------------------------------
# 1Ô∏è‚É£ K√∂rnyezet √©s csomagok import√°l√°sa
# -------------------------------
import os
from dotenv import load_dotenv
import pandas as pd
from qdrant_client import QdrantClient
from openai import OpenAI

# -------------------------------
# 2Ô∏è‚É£ .env bet√∂lt√©se √©s OpenAI kulcs ellen≈ërz√©se
# -------------------------------
load_dotenv()
api_key = os.getenv("OPENAI_API_KEY")
if not api_key:
    raise RuntimeError("‚ùå Nincs be√°ll√≠tva az OPENAI_API_KEY k√∂rnyezeti v√°ltoz√≥!")

client_openai = OpenAI(api_key=api_key)

# -------------------------------
# 3Ô∏è‚É£ Qdrant kliens inicializ√°l√°sa
# -------------------------------
qdrant_client = QdrantClient(url="http://localhost:6333")

# -------------------------------
# 4Ô∏è‚É£ Large modell √©s kollekci√≥ be√°ll√≠t√°sa
# -------------------------------
model_name = "text-embedding-3-large"
collection_name = "leltar_text_embedding_3_large_all_columns"

# -------------------------------
# 5Ô∏è‚É£ Ellen≈ërizz√ºk, hogy a kollekci√≥ l√©tezik
# -------------------------------
if not qdrant_client.collection_exists(collection_name=collection_name):
    raise RuntimeError(f"‚ùå A kollekci√≥ '{collection_name}' nem tal√°lhat√≥! T√∂ltsd fel a 3. heti notebookb√≥l.")

print(f"‚úÖ Kollekci√≥ k√©szen √°ll: {collection_name}")

# -------------------------------
# 6Ô∏è‚É£ Felhaszn√°l√≥i k√©rd√©s bek√©r√©se
# -------------------------------
# Konzolr√≥l vagy notebook cell√°b√≥l is adhatjuk
user_question = input("√çrd be a k√©rd√©sed az inventoryhoz: ")

# -------------------------------
# 7Ô∏è‚É£ K√©rd√©s embedding gener√°l√°sa a large modellel
# -------------------------------
response = client_openai.embeddings.create(
    model=model_name,
    input=user_question
)
query_embedding = response.data[0].embedding

# -------------------------------
# 8Ô∏è‚É£ Legrelev√°nsabb rekordok lek√©r√©se Qdrantb√≥l
# -------------------------------
search_results = qdrant_client.query_points(
    collection_name=collection_name,
    query=query_embedding,
    limit=5  # Top 5 tal√°lat
)

# -------------------------------
# 9Ô∏è‚É£ Kontextus el≈ëk√©sz√≠t√©se GPT-5 sz√°m√°ra
# -------------------------------
context_lines = []
for hit in search_results.points:
    # Minden payload mez≈ët sz√∂vegesen √∂sszef≈±z√ºnk
    line = " | ".join([f"{col}: {val}" for col, val in hit.payload.items()])
    context_lines.append(line)

context_text = "\n".join(context_lines)

# -------------------------------
# üîü GPT-5 h√≠v√°s a v√°lasz gener√°l√°s√°ra
# -------------------------------
chat_response = client_openai.chat.completions.create(
    model="gpt-5",
    messages=[
        {"role": "system", "content": "Seg√≠ts√©get ny√∫jtok inventory k√©rd√©sekre."},
        {"role": "user", "content": f"K√©rd√©s: {user_question}\nRelev√°ns adatok:\n{context_text}"}
    ]
)

# -------------------------------
# 1Ô∏è‚É£1Ô∏è‚É£ K√©rd√©s ki√≠r√°sa
# -------------------------------
print("\n‚ùì K√©rd√©s:")
print(user_question)

# -------------------------------
# 1Ô∏è‚É£2Ô∏è‚É£ AI v√°lasz ki√≠r√°sa
# -------------------------------
answer = chat_response.choices[0].message.content
print("\nüìù AI v√°lasz:")
print(answer)

‚úÖ Kollekci√≥ k√©szen √°ll: leltar_text_embedding_3_large_all_columns

‚ùì K√©rd√©s:
van el√©rhet≈ë matlab szoftver?

üìù AI v√°lasz:
Igen. Az √°llom√°nyban k√©t MATLAB-hoz kapcsol√≥d√≥ t√©tel szerepel:

- Eszk√∂z 1000113 ‚Äì ‚Äûszoftver matlab 25 felhaszn√°l√≥s szh-1/08‚Äù
  - Lelt√°rsz√°m: 14376
  - Telephely: nikszf4421
- Eszk√∂z 1000169 ‚Äì ‚Äû10 svite (matlab, simulink) szh-18/08‚Äù
  - Lelt√°rsz√°m: 17922
  - Telephely: nikami4410

Ha megmondod, melyik telephelyen √©s milyen c√©lra kell, tudok pontos√≠tani vagy jelezni a felel≈ës√∂k fel√© a hozz√°f√©r√©s/telep√≠t√©s √ºgy√©ben.


# InventoryAI ‚Äì Week 5: K√©rd√©s-v√°lasz modell kipr√≥b√°l√°sa (GPT-5)

## 1. K√∂rnyezet el≈ëk√©sz√≠t√©se

- Bet√∂ltj√ºk a sz√ºks√©ges k√∂nyvt√°rakat (pl. OpenAI kliens, Qdrant kliens).
- Ellen≈ërizz√ºk, hogy a **OpenAI API kulcs** be van-e √°ll√≠tva a `.env` f√°jlban.
- Inicializ√°ljuk a **Qdrant klienst**, amely a vektoralap√∫ keres√©shez sz√ºks√©ges.

---

## 2. Kollekci√≥ ellen≈ërz√©se

- A 3. heti feladat sor√°n felt√∂lt√∂tt **`leltar_text_embedding_3_large_all_columns`** kollekci√≥t haszn√°ljuk.
- Ellen≈ërizz√ºk, hogy a kollekci√≥ l√©tezik, mert innen ker√ºlnek lek√©r√©sre a relev√°ns rekordok.

---

## 3. Felhaszn√°l√≥i k√©rd√©s bek√©r√©se

- A felhaszn√°l√≥ be√≠rja a k√©rd√©s√©t az inventory adatokkal kapcsolatban.
- P√©ld√°ul:
  `"Melyik telephelyen van a MATLAB szoftver?"`

---

## 4. K√©rd√©s embedding gener√°l√°sa

- A felhaszn√°l√≥ k√©rd√©s√©t a **`text-embedding-3-large`** modell seg√≠ts√©g√©vel **numerikus vektorr√° alak√≠tjuk** (embedding).
- Ez a vektor reprezent√°lja a k√©rd√©s jelent√©s√©t a magas dimenzi√≥s t√©rben.
- Ez a l√©p√©s sz√ºks√©ges ahhoz, hogy a Qdrantban relev√°ns rekordokat kereshess√ºnk.

---

## 5. Legrelev√°nsabb rekordok lek√©r√©se Qdrantb√≥l

- A gener√°lt embedding alapj√°n a Qdrant **Cosine similarity** haszn√°lat√°val visszaadja a legrelev√°nsabb rekordokat.
- P√©ld√°ul a **top 5 tal√°lat** ker√ºl kiv√°laszt√°sra a k√©rd√©shez legk√∂zelebb √°ll√≥ vektorok alapj√°n.

---

## 6. Kontextus el≈ëk√©sz√≠t√©se a GPT-5 sz√°m√°ra

- A lek√©rt rekordokb√≥l sz√∂veges kontextust k√©sz√≠t√ºnk: minden rekord mez≈ëit √∂sszef≈±zz√ºk, pl. `Eszk√∂z: 1000113 | Telephely: nikszf4421`.
- A kontextus lesz a GPT-5 **prompt r√©sze**, amely alapj√°n a modell √∂sszef√ºgg≈ë, term√©szetes nyelv≈± v√°laszt ad.

---

## 7. GPT-5 h√≠v√°s √©s v√°lasz gener√°l√°s

- A GPT-5 chat API-j√°t h√≠vjuk meg, ahol:
  - `system` szerep: "Seg√≠ts√©get ny√∫jtok inventory k√©rd√©sekre."
  - `user` szerep: felhaszn√°l√≥i k√©rd√©s + relev√°ns kontextus a Qdrantb√≥l.
- A GPT-5 feldolgozza az inform√°ci√≥kat √©s **√©rthet≈ë, term√©szetes nyelv≈± v√°laszt gener√°l** a k√©rd√©sre.

---

## 8. K√©rd√©s √©s AI v√°lasz ki√≠r√°sa

- A felhaszn√°l√≥i k√©rd√©s √©s a GPT-5 v√°lasza ki√≠r√°sra ker√ºl a notebookban vagy konzolon.
- Ez lehet≈ëv√© teszi, hogy **√°ttekinthet≈ë legyen a k√©rd√©s-v√°lasz p√°r**, √©s ellen≈ërizhetj√ºk a rendszer pontoss√°g√°t.


---

Ez a pipeline biztos√≠tja, hogy a felhaszn√°l√≥ **egy k√©rd√©sre kapjon konkr√©t, relev√°ns v√°laszt**, az inventory adatb√°zis alapj√°n.
