# üß† INVENTORYAI ‚Äì 6. h√©t: RAG integr√°ci√≥ √©s t√∂bbmodell-tesztel√©s

## üìã C√©l
Ez a Jupyter-f√°jl az **InventoryAI projekt** hatodik het√©hez tartozik, √©s a **RAG (Retrieval-Augmented Generation)** integr√°ci√≥ **tesztel√©s√©t**, valamint a **k√ºl√∂nb√∂z≈ë OpenAI modellek (GPT-4, GPT-4-turbo, GPT-5)** √∂sszehasonl√≠t√≥ **tesztel√©s√©t** v√©gzi.

## ‚öôÔ∏è F≈ë l√©p√©sek

1. **K√∂rnyezeti be√°ll√≠t√°s √©s API-kulcs bet√∂lt√©se**
   - A `.env` f√°jlb√≥l beolvassa az `OPENAI_API_KEY` kulcsot.
   - Inicializ√°lja az OpenAI √©s Qdrant klienseket.

2. **Embedding modellek √©s kollekci√≥k defini√°l√°sa**
   - K√©t embedding modell van:
     - `text-embedding-3-small`
     - `text-embedding-3-large`
   - Ezekhez k√©t Qdrant kollekci√≥ tartozik, amelyek az inventory adatokat tartalmazz√°k.

3. **K√©rd√©sek el≈ëk√©sz√≠t√©se a tesztel√©shez**
   H√°rom minta k√©rd√©st haszn√°l a tesztel√©s sor√°n:
   - ‚ÄûHol tal√°lhat√≥ a projektor?‚Äù
   - ‚ÄûHol vannak a monitorok?‚Äù
   - ‚ÄûMilyen mennyis√©g≈± laptop van a nik telephelyen?‚Äù

4. **RAG folyamat ‚Äì GPT-4 √©s GPT-4-turbo modellek tesztel√©se**
   - A k√©rd√©sekhez **embeddingeket** gener√°l.
   - A **Qdrant** adatb√°zisb√≥l relev√°ns tal√°latokat keres.
   - Az eredm√©nyeket kontextusk√©nt adja √°t a **GPT-4** √©s **GPT-4-turbo** modelleknek, amelyek v√°laszokat gener√°lnak.
   - A `temperature=0.2` √©s `max_tokens=300` param√©terek a stabil, kontroll√°lt v√°laszokat biztos√≠tj√°k.
   - A tesztel√©s c√©lja, hogy megfigyelj√ºk a modellek v√°laszainak pontoss√°g√°t √©s k√∂vetkezetess√©g√©t.

5. **K√ºl√∂n tesztel√©s: GPT-5 modell**
   - A GPT-5 modell ugyanazokat a k√©rd√©seket kapja, mint a GPT-4 modellek.
   - C√©l: **√∂sszehasonl√≠t√≥ tesztel√©s**, amely megmutatja, hogyan teljes√≠t a GPT-5 azonos kontextusban.
   - A tesztel√©s sor√°n a k√≥d ellen≈ërzi, hogy a GPT-5 v√°laszol-e, √©s kezeli az esetleges API-hib√°kat.

6. **√ñsszegz√©s**
   - A k√≥d c√©lja a **retrieval alap√∫ v√°laszad√°s min≈ës√©g√©nek tesztel√©se** k√ºl√∂nb√∂z≈ë modellekkel √©s embedding m√©retekkel.
   - A futtat√°s v√©g√©n a termin√°lban l√°that√≥k:
     - A Qdrant tal√°latok
     - Az egyes GPT modellek v√°laszai
     - Az esetleges hib√°k

---

‚úÖ **Eredm√©ny:**
A futtat√°s √©s tesztel√©s v√©g√©n √∂sszehasonl√≠that√≥, hogy a GPT-4, GPT-4-turbo √©s GPT-5 modellek **ugyanarra az inventory k√©rd√©sre** milyen pontoss√°ggal, r√©szletess√©ggel √©s st√≠lusban adnak v√°laszt.


In [1]:
# -*- coding: utf-8 -*-
# INVENTORYAI - 6. h√©t: RAG integr√°ci√≥ √©s t√∂bbmodell-tesztel√©s

import os
from dotenv import load_dotenv
from qdrant_client import QdrantClient
from openai import OpenAI

# -------------------------------
# 1. K√∂rnyezet bet√∂lt√©se √©s kulcs ellen≈ërz√©se
# -------------------------------
load_dotenv()
api_key = os.getenv("OPENAI_API_KEY")
if not api_key:
    raise RuntimeError("Nincs be√°ll√≠tva az OPENAI_API_KEY k√∂rnyezeti v√°ltoz√≥!")

client_openai = OpenAI(api_key=api_key)

# -------------------------------
# 2. Qdrant kliens inicializ√°l√°sa
# -------------------------------
qdrant_client = QdrantClient(url="http://localhost:7000")

# -------------------------------
# 3. Modell- √©s kollekci√≥ p√°rok defini√°l√°sa
# -------------------------------
embedding_models = {
    "small": "text-embedding-3-small",
    "large": "text-embedding-3-large"
}
collections = {
    "small": "eszkoz_lista_text_embedding_3_small_all_columns",
    "large": "eszkoz_lista_text_embedding_3_large_all_columns"
}

# -------------------------------
# 4. GPT modellek (GPT-4 √©s GPT-4-turbo ciklusban)
# -------------------------------
gpt_models = ["gpt-4", "gpt-4-turbo"]

# -------------------------------
# 5. K√©rd√©sek list√°ja a teszthez
# -------------------------------
test_questions = [
    "Hol tal√°lhat√≥ a projektor?",
    "Hol vannak a monitorok?",
    "Milyen mennyis√©g≈± laptop van a nik telephelyen?"
]

# -------------------------------
# 6. GPT param√©terek (GPT-5-√∂t k√ºl√∂n kezelj√ºk)
# -------------------------------
def get_gpt_params(model_name):
    return {
        "temperature": 0.2,
        "max_tokens": 300,
    }

# -------------------------------
# 7. Teszt futtat√°sa GPT-4 √©s GPT-4-turbo modellekkel
# -------------------------------
for size_key in ["small", "large"]:
    print(f"\n--- Tesztel√©s az '{size_key}' m√©ret≈± embedding adatb√°zissal: '{collections[size_key]}' ---")

    # Kollekci√≥ ellen≈ërz√©s
    if not qdrant_client.collection_exists(collection_name=collections[size_key]):
        print(f"A kollekci√≥ '{collections[size_key]}' nem tal√°lhat√≥! T√∂ltsd fel az adatb√°zist.")
        continue
    else:
        print(f"Kollekci√≥ megtal√°lva: {collections[size_key]}")

    for question in test_questions:
        print(f"\nK√©rd√©s: {question}")

        # Embedding gener√°l√°sa
        response = client_openai.embeddings.create(
            model=embedding_models[size_key],
            input=question
        )
        query_embedding = response.data[0].embedding
        print(f"Embedding gener√°lva a '{embedding_models[size_key]}' modellel.")

        # Qdrant keres√©s
        search_results = qdrant_client.query_points(
            collection_name=collections[size_key],
            query=query_embedding,
            limit=10
        )

        # Tal√°latok ki√≠r√°sa
        print(f"\nTop {len(search_results.points)} tal√°lat a '{collections[size_key]}' kollekci√≥b√≥l:")
        for idx, hit in enumerate(search_results.points, start=1):
            line = " | ".join([f"{col}: {val}" for col, val in hit.payload.items()])
            print(f"{idx}. {line}")

        # Kontextus √∂ssze√°ll√≠t√°sa
        context_text = "\n".join(
            [" | ".join([f"{col}: {val}" for col, val in hit.payload.items()]) for hit in search_results.points]
        )

        system_prompt = (
            "Seg√≠ts√©get ny√∫jtok inventory k√©rd√©sekre. Csak az al√°bbi adatokat haszn√°ld, "
            "ne tal√°lj ki inform√°ci√≥kat, √©s sorold fel az √∂sszes relev√°ns tal√°latot."
        )

        # GPT-4 √©s GPT-4-turbo modellek ciklusban
        for gpt_model in gpt_models:
            print(f"\n--- GPT modell: {gpt_model} ---")
            try:
                params = get_gpt_params(gpt_model)
                chat_response = client_openai.chat.completions.create(
                    model=gpt_model,
                    messages=[
                        {"role": "system", "content": system_prompt},
                        {"role": "user", "content": f"K√©rd√©s: {question}\nRelev√°ns adatok:\n{context_text}"}
                    ],
                    **params
                )
                answer = chat_response.choices[0].message.content
                print("AI v√°lasz:")
                print(answer)
            except Exception as e:
                print(f"Hiba a {gpt_model} h√≠v√°s k√∂zben: {e}")

# -------------------------------
# 8. K√úL√ñN GPT-5 TESZT ugyanazokra a k√©rd√©sekre
# -------------------------------
print("\n==============================")
print("K√ºl√∂n GPT-5 tesztel√©s indul √∂sszehasonl√≠t√°s c√©lj√°b√≥l")
print("==============================")

for size_key in ["small", "large"]:
    print(f"\n--- GPT-5 teszt az '{size_key}' m√©ret≈± embedding adatb√°zissal: '{collections[size_key]}' ---")

    if not qdrant_client.collection_exists(collection_name=collections[size_key]):
        print(f"A kollekci√≥ '{collections[size_key]}' nem tal√°lhat√≥!")
        continue
    else:
        print(f"Kollekci√≥ megtal√°lva: {collections[size_key]}")

    for question in test_questions:
        print(f"\nK√©rd√©s: {question}")

        # Embedding gener√°l√°s
        response = client_openai.embeddings.create(
            model=embedding_models[size_key],
            input=question
        )
        query_embedding = response.data[0].embedding
        print(f"Embedding gener√°lva a '{embedding_models[size_key]}' modellel.")

        # Qdrant keres√©s
        search_results = qdrant_client.query_points(
            collection_name=collections[size_key],
            query=query_embedding,
            limit=10
        )

        # Kontextus √∂ssze√°ll√≠t√°sa
        context_text = "\n".join(
            [" | ".join([f"{col}: {val}" for col, val in hit.payload.items()]) for hit in search_results.points]
        )

        system_prompt = (
            "Seg√≠ts√©get ny√∫jtok inventory k√©rd√©sekre. Csak az al√°bbi adatokat haszn√°ld, "
            "ne tal√°lj ki inform√°ci√≥kat, √©s sorold fel az √∂sszes relev√°ns tal√°latot."
        )

        # GPT-5 h√≠v√°s
        print("\n--- GPT modell: gpt-5 ---")
        try:
            chat_response = client_openai.chat.completions.create(
                model="gpt-5",
                messages=[
                    {"role": "system", "content": system_prompt},
                    {"role": "user", "content": f"K√©rd√©s: {question}\nRelev√°ns adatok:\n{context_text}"}
                ],
            )

            if chat_response.choices and chat_response.choices[0].message.content:
                answer = chat_response.choices[0].message.content
                print("AI v√°lasz:")
                print(answer)
            else:
                print("GPT-5 nem adott v√°laszt ‚Äî √ºres response objektum.")
                print(chat_response)

        except Exception as e:
            print(f"Hiba a GPT-5 h√≠v√°s k√∂zben: {e}")

print("\n--- Teszt befejezve ---")



--- Tesztel√©s az 'small' m√©ret≈± embedding adatb√°zissal: 'eszkoz_lista_text_embedding_3_small_all_columns' ---
Kollekci√≥ megtal√°lva: eszkoz_lista_text_embedding_3_small_all_columns

K√©rd√©s: Hol tal√°lhat√≥ a projektor?
Embedding gener√°lva a 'text-embedding-3-small' modellel.

Top 10 tal√°lat a 'eszkoz_lista_text_embedding_3_small_all_columns' kollekci√≥b√≥l:
1. Eszk√∂z: e0693 | Alsz√°m: 0 | Aktiv√°l√°s d√°tuma: 15/10/2018 | Eszk√∂z√∂k megnevez√©se: projector | Besz. √©rt: 89156 | kum. √âCS: 39403 | K. sz. √©rt: 49753 | P√©nznem: huf | Mennyis√©g: 27 | Lelt√°rsz√°m: l-75343 | Telephely: lib
2. Eszk√∂z: e0511 | Alsz√°m: 0 | Aktiv√°l√°s d√°tuma: 13/11/2025 | Eszk√∂z√∂k megnevez√©se: projector | Besz. √©rt: 1085687 | kum. √âCS: 317635 | K. sz. √©rt: 768052 | P√©nznem: huf | Mennyis√©g: 17 | Lelt√°rsz√°m: l-32236 | Telephely: rkk
3. Eszk√∂z: e0894 | Alsz√°m: 0 | Aktiv√°l√°s d√°tuma: 10/06/2025 | Eszk√∂z√∂k megnevez√©se: projector | Besz. √©rt: 1100602 | kum. √âCS: 317091 | K. sz. √

# GPT Modellek √ñsszehasonl√≠t√≥ Riportja
**Adatb√°zisok:**
- Small embedding: `eszkoz_lista_text_embedding_3_small_all_columns`
- Large embedding: `eszkoz_lista_text_embedding_3_large_all_columns`

# Modellek teljes√≠tm√©nye

## Projektorok helye
A modellek alapvet≈ëen tudj√°k list√°zni a projektorok telephelyeit √©s mennyis√©geit, de a GPT-5 r√©szletesebb adatokat is megad, p√©ld√°ul lelt√°rsz√°mokat. A GPT-4 √©s GPT-4-turbo ink√°bb egyszer≈±bb, √∂sszegz≈ë list√°kat k√©sz√≠tenek.

## Monitorok helye
Itt is a GPT-5 adja a leg√°tfog√≥bb, telephelyenk√©nt csoportos√≠tott √©s √∂sszes√≠tett mennyis√©geket. A kor√°bbi modellek egyszer≈± list√°kra korl√°toz√≥dnak.

## Laptopok mennyis√©ge a NIK telephelyen
Mindh√°rom modell hasonl√≥ mennyis√©gi adatot szolg√°ltat, de a GPT-5 jobban struktur√°lt, r√©szletesebb adatokat ad.

---

## Fontos megjegyz√©s
A GPT-modellek els≈ësorban nyelvi feldolgoz√°sra k√©sz√ºltek, √©s nem kifejezetten matematikai vagy prec√≠z sz√°m√≠t√°si feladatokra. Emiatt el≈ëfordulhatnak kisebb pontatlans√°gok vagy elt√©r√©sek az √∂sszead√°sok √©s sz√°madatok ter√©n.

Tov√°bb√°, a modellek √°ltal√°ban angol nyelv≈± utas√≠t√°sokra reag√°lnak pontosabban, ez√©rt √©rdemes a szab√°lyokat, k√©rd√©seket √©s egy√©b instrukci√≥kat angolul megfogalmazni a jobb eredm√©nyek √©rdek√©ben.




# Adatb√°zis √∂sszehasonl√≠t√°s ‚Äì Small vs Large

Az al√°bbi √∂sszehasonl√≠t√°s az output alapj√°n k√©sz√ºlt, √°ltal√°nos szempontok szerint.

## 1. Adatmennyis√©g
- **Small:** Korl√°tozott adatmennyis√©g, kevesebb rekord.
- **Large:** Jelent≈ësen t√∂bb adatot tartalmaz, √≠gy val√≥sabb, nagyobb sk√°l√°j√∫ elemz√©sekre alkalmas.
- **Meg√°llap√≠t√°s:** Large adatb√°zis el≈ënye, hogy t√∂bb adatot tud kezelni, ami nagyobb pontoss√°got √©s r√©szletesebb lek√©rdez√©seket tesz lehet≈ëv√©.

## 2. Teljes√≠tm√©ny √©s sk√°l√°zhat√≥s√°g
- **Small:** Gyorsabb lehet kis adatmennyis√©gn√©l, de nem reprezentat√≠v nagyobb terhel√©sn√©l.
- **Large:** B√°r nagyobb, a megfelel≈ëen optimaliz√°lt strukt√∫r√°val k√©pes kezelni nagyobb terhel√©st √©s b≈ëv√≠thet≈ë.
- **Meg√°llap√≠t√°s:** Large adatb√°zis jobban sk√°l√°zhat√≥, hossz√∫ t√°von el≈ëny√∂sebb.

## 3. Elemz√©si lehet≈ës√©gek
- **Small:** Korl√°tozott adatmennyis√©g miatt az elemz√©sek kev√©sb√© r√©szletesek.
- **Large:** T√∂bb rekord √©s v√°ltoz√≥ √°ll rendelkez√©sre, ami komplexebb lek√©rdez√©sek √©s elemz√©sek v√©gz√©s√©t teszi lehet≈ëv√©.
- **Meg√°llap√≠t√°s:** Large adatb√°zis rugalmasabb az adatelemz√©s szempontj√°b√≥l.

## 4. Integrit√°s √©s megb√≠zhat√≥s√°g
- **Small:** Kev√©s adat miatt k√∂nnyebb karbantartani, de nem reprezentat√≠v.
- **Large:** T√∂bb adat √©s kapcsol√≥d√°s miatt komplexebb, de a val√≥s adatok jobban reprezent√°lj√°k a t√©nyleges rendszert.
- **Meg√°llap√≠t√°s:** Large adatb√°zis megb√≠zhat√≥bb, ha az integrit√°s √©s a val√≥s adatreprezent√°ci√≥ a c√©l.

## √ñsszegz√©s
Az output alapj√°n a **Large adatb√°zis el≈ëny√∂sebb**, mivel:
- T√∂bb adatot tartalmaz, ami pontosabb elemz√©seket tesz lehet≈ëv√©.
- Jobban sk√°l√°zhat√≥ nagyobb terhel√©s eset√©n.
- Komplexebb lek√©rdez√©sek √©s elemz√©sek futtathat√≥k rajta.
- Jobban reprezent√°lja a val√≥s adatstrukt√∫r√°t.

**K√∂vetkeztet√©s:** A Large adatb√°zis a ‚Äûjobb‚Äù v√°laszt√°s √°ltal√°nos, elemz√©si √©s sk√°l√°zhat√≥s√°gi szempontok alapj√°n.
