# üöÄ Iteracja 1: Podstawowe promptowanie (Zero-shot)

**Czas:** ~35 minut  
**Poziom:** Wej≈õciowy

---

## Cel iteracji

Nauczyƒá siƒô wysy≈Çaƒá zapytania do modelu jƒôzykowego przez API i klasyfikowaƒá recenzje przy u≈ºyciu **zero-shot promptowania** - bez podawania przyk≈Çad√≥w.

---

## Teoria: Anatomia promptu

Prompt to instrukcja, kt√≥rƒÖ wysy≈Çamy do modelu. Sk≈Çada siƒô z dw√≥ch kluczowych czƒô≈õci:

| Rola | Opis | Kiedy u≈ºywaƒá |
|------|------|--------------|
| `system` | Definiuje rolƒô i zasady modelu | Instrukcje og√≥lne, persona, ograniczenia |
| `user` | Konkretne zadanie do wykonania | Dane do przetworzenia, pytania |

**Dlaczego rozdzielamy `system` od `user`?**

- Separacja odpowiedzialno≈õci - `system` to "kto jest model", `user` to "co ma zrobiƒá"
- Pozwala na ≈Çatwe reuznanie tej samej konfiguracji modelu z r√≥≈ºnymi danymi wej≈õciowymi
- Modele sƒÖ trenowane z tym podzia≈Çem - daje lepsze wyniki

```python
# ‚ùå Z≈ÅE: Mieszanie roli i zadania
{"role": "user", "content": "Jeste≈õ ekspertem. Sklasyfikuj tekst."}

# ‚úÖ DOBRE: Separacja
{"role": "system", "content": "Jeste≈õ ekspertem od analizy tekstu."}
{"role": "user", "content": "Sklasyfikuj poni≈ºszy tekst."}
```

---

## Zero-shot promptowanie

**Zero-shot** = model klasyfikuje bez ≈ºadnych przyk≈Çad√≥w. Polegamy wy≈ÇƒÖcznie na wiedzy modelu i jako≈õci naszych instrukcji.

**Zalety:** Prosto, szybko, nie wymaga przygotowania przyk≈Çad√≥w  
**Wady:** Mniejsza dok≈Çadno≈õƒá, model mo≈ºe interpretowaƒá kategorie po swojemu

## ‚öôÔ∏è Setup - ≈õrodowisko

Ta kom√≥rka wykrywa czy jeste≈õ w **Google Colab** czy lokalnie, a nastƒôpnie:
1. Klonuje repozytorium z GitHub (tylko Colab)
2. Instaluje wymagane biblioteki
3. Konfiguruje ≈õcie≈ºki import√≥w

In [None]:
import sys
import subprocess
from pathlib import Path

# Wykryj ≈õrodowisko
try:
    import google.colab
    IN_COLAB = True
except ImportError:
    IN_COLAB = False

print(f"{'üü° Google Colab' if IN_COLAB else 'üíª Lokalne ≈õrodowisko'}")

# ============================================================
# KONFIGURACJA REPO (zmie≈Ñ URL na w≈Ça≈õciwe przed warsztatami)
# ============================================================
REPO_URL = "https://github.com/JSerek/techland-genai-workshop.git"
REPO_DIR = Path("/content/szkolenie_techland") if IN_COLAB else Path(".").resolve().parent
# ============================================================

if IN_COLAB:
    if not REPO_DIR.exists():
        print(f"üì• Klonujƒô repo...")
        subprocess.run(["git", "clone", REPO_URL, str(REPO_DIR)], check=True)
        print("‚úÖ Repo sklonowane")
    else:
        print("üîÑ Aktualizujƒô repo (git pull)...")
        subprocess.run(["git", "-C", str(REPO_DIR), "pull"], check=True)

    # Dodaj repo do sys.path
    sys.path.insert(0, str(REPO_DIR))

    # Zainstaluj zale≈ºno≈õci
    print("üì¶ Instalujƒô biblioteki...")
    subprocess.run(
        [sys.executable, "-m", "pip", "install", "-r", str(REPO_DIR / "requirements.txt"), "-q"],
        check=True
    )
    print("‚úÖ Biblioteki zainstalowane")
else:
    # Lokalnie: dodaj root projektu do sys.path
    sys.path.insert(0, str(REPO_DIR))
    print(f"üìÇ ≈öcie≈ºka projektu: {REPO_DIR}")

print("\n‚úÖ Setup zako≈Ñczony")

In [None]:
# ============================================================
# üîë Konfiguracja API
# W Google Colab: dodaj sekrety w menu po lewej (üîë ikona)
#   Nazwy sekret√≥w: VERTEX_AI_API_KEY, VERTEX_AI_BASE_URL, MODEL_NAME
#
# Lokalnie: ustaw zmienne ≈õrodowiskowe lub wpisz warto≈õci bezpo≈õrednio
# ============================================================

if IN_COLAB:
    from google.colab import userdata
    API_KEY   = userdata.get("VERTEX_AI_API_KEY")
    BASE_URL  = userdata.get("VERTEX_AI_BASE_URL")
    MODEL_NAME = userdata.get("MODEL_NAME") or "google/gemini-2.5-flash-lite"
else:
    import os
    API_KEY   = os.environ.get("VERTEX_AI_API_KEY", "TODO: wklej API key")
    BASE_URL  = os.environ.get("VERTEX_AI_BASE_URL", "TODO: wklej endpoint URL")
    MODEL_NAME = os.environ.get("MODEL_NAME", "google/gemini-2.5-flash-lite")

# Walidacja
if not API_KEY or API_KEY == "TODO: wklej API key":
    print("‚ùå Brak API_KEY! Dodaj sekret 'VERTEX_AI_API_KEY' w Colab Secrets.")
elif not BASE_URL or BASE_URL == "TODO: wklej endpoint URL":
    print("‚ùå Brak BASE_URL! Dodaj sekret 'VERTEX_AI_BASE_URL' w Colab Secrets.")
else:
    print(f"‚úÖ API skonfigurowane: {MODEL_NAME}")
    print(f"   Endpoint: {BASE_URL[:60]}...")

In [None]:
# Konfiguracja klienta LLM - dane pobrane z Secrets w kom√≥rce powy≈ºej
from src.utils.llm_client import create_client, LLMProvider

PROVIDER = LLMProvider.VERTEX_AI  # Zmie≈Ñ je≈õli u≈ºywasz innego providera

client = create_client(
    provider=PROVIDER,
    api_key=API_KEY,
    base_url=BASE_URL,
)
print(f"‚úÖ Klient LLM gotowy: {PROVIDER.value} / {MODEL_NAME}")

## üìÇ ≈Åadowanie danych

In [None]:
import json
import pandas as pd
from pathlib import Path

# ≈öcie≈ºki do danych (wzglƒôdem root repo)
DATA_DIR = REPO_DIR / "data"

# Pr√≥bka recenzji
df = pd.read_csv(DATA_DIR / "processed" / "workshop_sample.csv")
review_texts = df["review_text"].tolist()
print(f"‚úÖ Za≈Çadowano {len(review_texts)} recenzji")

# Golden dataset
golden_path = DATA_DIR / "evaluation" / "golden_dataset.json"
if golden_path.exists():
    with open(golden_path) as f:
        golden_data = json.load(f)
    golden_texts = [item["review_text"] for item in golden_data]
    golden_labels = [item["labels"] for item in golden_data]
    print(f"‚úÖ Golden dataset: {len(golden_data)} przyk≈Çad√≥w")
else:
    golden_texts, golden_labels = [], []
    print("‚ö†Ô∏è  Golden dataset nie znaleziony - ewaluacja niedostƒôpna")

In [None]:
# Wczytaj golden dataset (je≈õli gotowy)
# ============================================================
# TODO: Uzupe≈Çnij po przygotowaniu golden dataset
# ============================================================
GOLDEN_DATASET_PATH = "../data/evaluation/golden_dataset.json"  # TODO

golden_path = Path(GOLDEN_DATASET_PATH)
if golden_path.exists():
    with open(golden_path) as f:
        golden_data = json.load(f)
    golden_texts = [item["review_text"] for item in golden_data]
    golden_labels = [item["labels"] for item in golden_data]
    print(f"‚úÖ Golden dataset: {len(golden_data)} przyk≈Çad√≥w")
else:
    print("‚ö†Ô∏è  Golden dataset nie znaleziony - ewaluacja niedostƒôpna")
    golden_texts, golden_labels = [], []

## üéØ Zadanie: Napisz prompt klasyfikujƒÖcy

### Twoje zadanie:

Napisz prompt, kt√≥ry klasyfikuje recenzjƒô gry do jednej lub wiƒôcej kategorii tematycznych.

> üöß **TODO:** Uzupe≈Çnij kategorie po analizie danych

**Wskaz√≥wki do dobrego promptu:**
- Podaj dok≈Çadny format odpowiedzi (co model ma zwr√≥ciƒá)
- Zdefiniuj kategorie precyzyjnie - model musi wiedzieƒá co oznaczajƒÖ
- Ogranicz model tylko do zdefiniowanych kategorii
- Testuj na kilku przyk≈Çadach zanim pu≈õcisz na ca≈Çym zbiorze

In [None]:
# ============================================================
# KONFIGURACJA kategorii
# TODO: Uzupe≈Çnij po analizie danych
# ============================================================
CATEGORIES = [
    # Przyk≈Çadowy format - zmie≈Ñ na w≈Ça≈õciwe kategorie:
    # "performance",    # Problemy z wydajno≈õciƒÖ, FPS, loading
    # "bug",            # B≈Çƒôdy, crashe, glitche
    # "story",          # Fabu≈Ça, narracja, postacie
    # "gameplay",       # Mechaniki rozgrywki, sterowanie
    # "graphics",       # Grafika, oprawa wizualna
    # "audio",          # Muzyka, d≈∫wiƒôki, dubbing
    # "price",          # Cena, warto≈õƒá za pieniƒÖdze
    # "other",          # Inne
]

categories_str = ", ".join(f'"{c}"' for c in CATEGORIES)
print(f"Dostƒôpne kategorie: {categories_str or '‚ö†Ô∏è  Brak - uzupe≈Çnij CATEGORIES'}")

In [None]:
# ============================================================
# üñäÔ∏è  ƒÜWICZENIE: Napisz sw√≥j prompt
# Zmodyfikuj poni≈ºszy szablon - zmie≈Ñ tre≈õƒá, dodaj/usu≈Ñ instrukcje
# ============================================================

SYSTEM_PROMPT = """Jeste≈õ ekspertem od analizy recenzji gier komputerowych.
Twoim zadaniem jest klasyfikacja tematyczna recenzji.

Dostƒôpne kategorie: {categories}

Zasady:
- Mo≈ºesz przypisaƒá jednƒÖ lub wiƒôcej kategorii
- U≈ºywaj tylko kategorii z powy≈ºszej listy
- Odpowiedz WY≈ÅƒÑCZNIE listƒÖ kategorii oddzielonych przecinkami, bez ≈ºadnego komentarza

Przyk≈Çad formatu odpowiedzi: bug, performance""".format(categories=categories_str)

USER_PROMPT_TEMPLATE = """Sklasyfikuj poni≈ºszƒÖ recenzjƒô gry:

Recenzja: {review_text}

Kategorie:"""

print("SYSTEM PROMPT:")
print(SYSTEM_PROMPT)
print("\nUSER PROMPT TEMPLATE:")
print(USER_PROMPT_TEMPLATE)

## üß™ Test na jednej recenzji

Zawsze najpierw przetestuj na jednym przyk≈Çadzie!

In [None]:
def classify_review(review_text: str) -> list[str]:
    """Klasyfikuje recenzjƒô do kategorii tematycznych."""
    response = client.chat.completions.create(
        model=MODEL_NAME,
        messages=[
            {"role": "system", "content": SYSTEM_PROMPT},
            {"role": "user", "content": USER_PROMPT_TEMPLATE.format(review_text=review_text)},
        ],
        temperature=0.0,  # 0 = deterministyczny output (lepsza reprodukowalno≈õƒá)
    )

    raw_output = response.choices[0].message.content.strip()

    # Parsuj odpowied≈∫: "bug, performance" ‚Üí ["bug", "performance"]
    labels = [label.strip().lower() for label in raw_output.split(",") if label.strip()]
    return labels


# Test na pierwszej recenzji
test_review = review_texts[0]
print(f"Recenzja: '{test_review[:300]}...'")
print()

result = classify_review(test_review)
print(f"Klasyfikacja: {result}")

## üìä Klasyfikacja ca≈Çego zbioru

Uruchom klasyfikacjƒô na ca≈Çym golden dataset (lub pr√≥bce).

In [None]:
from tqdm.notebook import tqdm

# U≈ºyj golden dataset (lub pr√≥bki je≈õli golden nie gotowy)
texts_to_classify = golden_texts if golden_texts else review_texts[:10]

print(f"Klasyfikujƒô {len(texts_to_classify)} recenzji...")

predictions = []
errors = []

for i, text in enumerate(tqdm(texts_to_classify)):
    try:
        labels = classify_review(text)
        predictions.append(labels)
    except Exception as e:
        print(f"B≈ÇƒÖd dla recenzji {i}: {e}")
        predictions.append([])  # pusta lista = brak klasyfikacji
        errors.append(i)

print(f"\n‚úÖ Klasyfikacja zako≈Ñczona. B≈Çƒôdy: {len(errors)}/{len(texts_to_classify)}")

## üìà Ewaluacja wynik√≥w

In [None]:
if golden_labels:
    trial1 = evaluate_trial(
        trial_name=f"{MODEL_NAME} + zero-shot v1",
        model=MODEL_NAME,
        prompt_variant="zero-shot v1",
        predictions=predictions,
        expected=golden_labels,
        review_texts=golden_texts,
        strategy=MatchStrategy.CONTAINS_ALL,
    )

    # Wy≈õwietl wyniki
    trial1.display()

    # Zapisz wyniki do por√≥wnania w kolejnych iteracjach
    print(f"\nüíæ Accuracy Iteracja 1: {trial1.summary.accuracy:.1%}")
else:
    print("‚ö†Ô∏è  Golden dataset nie jest gotowy - pokazujƒô tylko predykcje:")
    for text, pred in zip(texts_to_classify[:5], predictions[:5]):
        print(f"  Recenzja: '{text[:100]}...'")
        print(f"  Kategorie: {pred}")
        print()

## üí° ƒÜwiczenie dla uczestnik√≥w

### Zadanie:
Zmodyfikuj `SYSTEM_PROMPT` i `USER_PROMPT_TEMPLATE` tak, ≈ºeby poprawiƒá accuracy klasyfikacji.

**Pomys≈Çy do eksperymentowania:**
1. Dodaj definicje kategorii (co dok≈Çadnie nale≈ºy do ka≈ºdej)
2. Zmie≈Ñ format odpowiedzi (np. JSON zamiast CSV)
3. Dodaj instrukcjƒô "If unsure, use 'other'"
4. Zmie≈Ñ jƒôzyk promptu (angielski vs polski)
5. Dodaj/usu≈Ñ przyk≈Çady formatu odpowiedzi

**Pytania do refleksji:**
- Kt√≥re recenzje model klasyfikuje najgorzej?
- Czy model nadaje zbyt wiele kategorii, czy za ma≈Ço?
- Jak wp≈Çywa zmiana temperatury (0.0 ‚Üí 0.7) na wyniki?

In [None]:
# Miejsce na Tw√≥j eksperyment - skopiuj i zmodyfikuj prompty powy≈ºej
MY_SYSTEM_PROMPT = """
# TODO: Wpisz sw√≥j system prompt tutaj
"""

MY_USER_PROMPT_TEMPLATE = """
# TODO: Wpisz sw√≥j user prompt tutaj
"""

# Gdy gotowy - uruchom klasyfikacjƒô i ewaluacjƒô:
# ...
print("Zmodyfikuj prompty powy≈ºej i uruchom klasyfikacjƒô!")

---

## ‚úÖ Podsumowanie Iteracji 1

**Czego siƒô nauczy≈Çe≈õ:**
- Struktura promptu: `system` + `user` i dlaczego to wa≈ºne
- Zero-shot classificationvia API
- Parsowanie surowego stringa z odpowiedziƒÖ modelu
- Ewaluacja accuracy z golden dataset

**Problem do rozwiƒÖzania w Iteracji 2:**  
Surowy string z modelu jest trudny do parsowania i mo≈ºe mieƒá r√≥≈ºne formaty.  
‚Üí RozwiƒÖzanie: **Structured Output z Pydantic**