## Krok 1: Import bibliotek

In [1]:
# Importujemy pandas - do pracy z danymi (Excel w Pythonie)
import pandas as pd

# Importujemy PyCaret - do wczytania modelu i predykcji
from pycaret.classification import *

# Importujemy json - do wczytania ustawie≈Ñ modelu (threshold)
import json

print("‚úÖ Biblioteki zaimportowane!")

‚úÖ Biblioteki zaimportowane!


## Krok 2: Przygotowanie "nowych" klient√≥w

### SkƒÖd bierzemy nowych klient√≥w?
W prawdziwej produkcji dosta≈Çby≈õ plik CSV z nowymi klientami od systemu CRM.

**Tutaj symulujemy to** wybierajƒÖc 20 losowych klient√≥w z oryginalnego datasetu.

### Co robimy?
1. Wczytujemy oryginalny dataset
2. Losujemy 20 klient√≥w (wiƒôcej = bardziej zr√≥≈ºnicowana pr√≥bka)
3. **Usuwamy kolumnƒô Churn** (w prawdziwej produkcji jej nie ma!)
4. Zapisujemy jako `data/new_customers.csv`

In [10]:
# Wczytujemy oryginalny dataset
df_original = pd.read_csv('data/WA_Fn-UseC_-Telco-Customer-Churn.csv')

print(f"üìä Oryginalny dataset: {len(df_original)} klient√≥w")

# Losujemy 20 klient√≥w (wiƒôcej = bardziej zr√≥≈ºnicowana pr√≥bka)
# sample(20) - wylosuj 20 wierszy
# random_state=123 - "ziarnko losowo≈õci" dla powtarzalnych wynik√≥w
# UWAGA: Zmienili≈õmy z random_state=42 na 123, bo akurat 42 wylosowa≈Ço samych klient√≥w wysokiego ryzyka!
new_customers = df_original.sample(20, random_state=123)

# WA≈ªNE: Usuwamy kolumnƒô Churn
# W prawdziwej produkcji nowi klienci NIE MAJƒÑ tej kolumny
# (nie wiemy jeszcze czy odejdƒÖ - to w≈Ça≈õnie chcemy przewidzieƒá!)
new_customers = new_customers.drop('Churn', axis=1)

# Zapisujemy do pliku CSV
new_customers.to_csv('data/new_customers.csv', index=False)

print(f"\n‚úÖ Przygotowano {len(new_customers)} nowych klient√≥w")
print("üíæ Zapisano jako: data/new_customers.csv")
print(f"üìã Kolumny: {len(new_customers.columns)} (bez Churn!)")

# Wy≈õwietlamy pierwszych 3 klient√≥w
print("\nüîç Pierwsi 3 klienci:")
new_customers.head(3)

üìä Oryginalny dataset: 7043 klient√≥w

‚úÖ Przygotowano 20 nowych klient√≥w
üíæ Zapisano jako: data/new_customers.csv
üìã Kolumny: 20 (bez Churn!)

üîç Pierwsi 3 klienci:


Unnamed: 0,customerID,gender,SeniorCitizen,Partner,Dependents,tenure,PhoneService,MultipleLines,InternetService,OnlineSecurity,OnlineBackup,DeviceProtection,TechSupport,StreamingTV,StreamingMovies,Contract,PaperlessBilling,PaymentMethod,MonthlyCharges,TotalCharges
941,0811-GSDTP,Female,0,No,Yes,13,No,No phone service,DSL,No,Yes,No,No,No,No,Month-to-month,No,Electronic check,30.15,382.2
1404,1970-KKFWL,Female,0,No,No,35,Yes,Yes,No,No internet service,No internet service,No internet service,No internet service,No internet service,No internet service,Two year,No,Bank transfer (automatic),23.3,797.1
5515,2892-GESUL,Female,0,Yes,Yes,18,Yes,No,No,No internet service,No internet service,No internet service,No internet service,No internet service,No internet service,Two year,No,Mailed check,19.35,309.25


## Krok 3: Wczytanie zapisanego modelu

In [11]:
# Wczytujemy model kt√≥ry zapisali≈õmy w train.ipynb
# load_model odczytuje plik .pkl i przywraca model do pamiƒôci
# To jak odtworzenie gry z zapisu - model jest gotowy do u≈ºycia!

print("üìÇ Wczytywanie modelu z pliku...")

# Wczytujemy model (PyCaret automatycznie doda rozszerzenie .pkl)
model = load_model('models/churn_model')

print("‚úÖ Model wczytany!")
print(f"üìä Typ modelu: {type(model).__name__}")
print("üîß Model zawiera: wytrenowany algorytm + preprocessing pipeline")

üìÇ Wczytywanie modelu z pliku...
Transformation Pipeline and Model Successfully Loaded
‚úÖ Model wczytany!
üìä Typ modelu: Pipeline
üîß Model zawiera: wytrenowany algorytm + preprocessing pipeline


## Krok 4: Wczytanie metadanych (ustawie≈Ñ modelu)

In [34]:
# Wczytujemy metadata.json - ustawienia modelu
# Zawiera: threshold (pr√≥g decyzyjny), optymalizacjƒô, informacje biznesowe

print("üìÇ Wczytywanie metadanych...")

# Otwieramy plik JSON i wczytujemy do s≈Çownika Python
with open('models/metadata.json', 'r', encoding='utf-8') as f:
    metadata = json.load(f)

print("\n‚úÖ Metadata wczytane!")
print("\nüìã Ustawienia modelu:")
print(json.dumps(metadata, indent=2, ensure_ascii=False))

# WyciƒÖgamy threshold - bƒôdziemy go u≈ºywaƒá do podjƒôcia decyzji
threshold = metadata['threshold']
print(f"\nüéØ Threshold: {threshold}")
print(f"üí° Znaczenie: Je≈õli prawdopodobie≈Ñstwo >= {threshold}, to przewidujemy 'Churn = Yes'")

üìÇ Wczytywanie metadanych...

‚úÖ Metadata wczytane!

üìã Ustawienia modelu:
{
  "threshold": 0.5,
  "optimized_for": "recall",
  "business_reason": "false negatives are costly",
  "model_type": "LogisticRegression",
  "train_date": "2026-01-07 20:26:39"
}

üéØ Threshold: 0.5
üí° Znaczenie: Je≈õli prawdopodobie≈Ñstwo >= 0.5, to przewidujemy 'Churn = Yes'


## Krok 5: Wczytanie nowych klient√≥w

In [35]:
# Wczytujemy plik z nowymi klientami
# W prawdziwej produkcji dosta≈Çby≈õ taki plik z systemu CRM, bazy danych, API, itp.

print("üìÇ Wczytywanie nowych klient√≥w...")

customers = pd.read_csv('data/new_customers.csv')

print(f"\n‚úÖ Wczytano {len(customers)} klient√≥w")
print(f"üìã Kolumny: {len(customers.columns)}")
print(f"üîç Brak kolumny 'Churn' - to w≈Ça≈õnie bƒôdziemy przewidywaƒá!")

# Wy≈õwietlamy dane
print("\nüë• Klienci do oceny:")
customers

üìÇ Wczytywanie nowych klient√≥w...

‚úÖ Wczytano 20 klient√≥w
üìã Kolumny: 20
üîç Brak kolumny 'Churn' - to w≈Ça≈õnie bƒôdziemy przewidywaƒá!

üë• Klienci do oceny:


Unnamed: 0,customerID,gender,SeniorCitizen,Partner,Dependents,tenure,PhoneService,MultipleLines,InternetService,OnlineSecurity,OnlineBackup,DeviceProtection,TechSupport,StreamingTV,StreamingMovies,Contract,PaperlessBilling,PaymentMethod,MonthlyCharges,TotalCharges
0,0811-GSDTP,Female,0,No,Yes,13,No,No phone service,DSL,No,Yes,No,No,No,No,Month-to-month,No,Electronic check,30.15,382.2
1,1970-KKFWL,Female,0,No,No,35,Yes,Yes,No,No internet service,No internet service,No internet service,No internet service,No internet service,No internet service,Two year,No,Bank transfer (automatic),23.3,797.1
2,2892-GESUL,Female,0,Yes,Yes,18,Yes,No,No,No internet service,No internet service,No internet service,No internet service,No internet service,No internet service,Two year,No,Mailed check,19.35,309.25
3,2842-BCQGE,Male,0,No,No,43,Yes,Yes,Fiber optic,No,No,No,No,No,No,Month-to-month,Yes,Credit card (automatic),75.35,3161.4
4,4807-IZYOZ,Female,0,No,No,51,Yes,No,No,No internet service,No internet service,No internet service,No internet service,No internet service,No internet service,Two year,No,Bank transfer (automatic),20.65,1020.75
5,9451-WLYRI,Female,0,Yes,No,53,Yes,No,No,No internet service,No internet service,No internet service,No internet service,No internet service,No internet service,One year,No,Credit card (automatic),19.05,990.45
6,1767-TGTKO,Female,0,Yes,Yes,8,Yes,No,DSL,No,No,No,No,No,No,Month-to-month,Yes,Electronic check,45.45,411.75
7,8033-VCZGH,Male,0,Yes,No,50,Yes,Yes,Fiber optic,Yes,No,Yes,No,Yes,Yes,One year,Yes,Electronic check,103.95,5231.3
8,6689-VRRTK,Female,1,No,No,44,Yes,Yes,Fiber optic,Yes,Yes,Yes,No,Yes,Yes,One year,Yes,Credit card (automatic),109.8,4860.35
9,6997-UVGOX,Male,0,Yes,Yes,71,Yes,No,DSL,Yes,Yes,Yes,Yes,Yes,Yes,Two year,No,Bank transfer (automatic),85.45,6029.9


## Krok 6: Wykonanie predykcji

### Co siƒô dzieje podczas predykcji?

1. **Preprocessing** - PyCaret automatycznie:
   - Konwertuje `TotalCharges` na liczby
   - Normalizuje cechy numeryczne
   - Koduje cechy kategoryczne (Yes/No ‚Üí 1/0)

2. **Model oblicza prawdopodobie≈Ñstwa**:
   - Patrzy na cechy klienta (tenure, MonthlyCharges, Contract, itp.)
   - Oblicza prawdopodobie≈Ñstwo dla ka≈ºdej klasy (Yes i No)
   - U≈ºywa threshold z metadata.json do podjƒôcia decyzji

3. **Zwraca wyniki**:
   - `prediction_label` - ostateczna decyzja (Yes/No) z zastosowaniem threshold
   - `prediction_score` - **prawdopodobie≈Ñstwo dla predicted class** (nie zawsze dla "Yes"!)

In [36]:
# Wykonujemy predykcje dla nowych klient√≥w
# predict_model bierze model i dane, zwraca te same dane + kolumny z przewidywaniami

print("üîÆ Wykonywanie predykcji...\n")

# WA≈ªNE: Przekazujemy threshold z metadata.json!
# Bez tego PyCaret u≈ºy≈Çby domy≈õlnego threshold = 0.5
# probability_threshold m√≥wi: "je≈õli prawdopodobie≈Ñstwo >= threshold, to Yes"
print(f"üéØ U≈ºywam threshold z metadata.json: {threshold}")

# Predykcje - PyCaret dodaje kolumny: prediction_label i prediction_score
predictions = predict_model(model, data=customers, probability_threshold=threshold)

print("\n‚úÖ Predykcje zako≈Ñczone!")
print("\nüìä Dodane kolumny:")
print("   - prediction_label: Decyzja modelu z threshold={threshold} (Yes/No)")
print("   - prediction_score: Prawdopodobie≈Ñstwo dla predicted class (0.0-1.0)")

üîÆ Wykonywanie predykcji...

üéØ U≈ºywam threshold z metadata.json: 0.5

‚úÖ Predykcje zako≈Ñczone!

üìä Dodane kolumny:
   - prediction_label: Decyzja modelu z threshold={threshold} (Yes/No)
   - prediction_score: Prawdopodobie≈Ñstwo dla predicted class (0.0-1.0)


## Krok 7: Wy≈õwietlenie wynik√≥w predykcji

In [37]:
# Wybieramy najwa≈ºniejsze kolumny do wy≈õwietlenia
# customerID - identyfikator klienta
# tenure - ile miesiƒôcy jest klientem
# MonthlyCharges - miesiƒôczny rachunek
# Contract - typ umowy
# prediction_score - prawdopodobie≈Ñstwo odej≈õcia
# prediction_label - decyzja (Yes/No)

result_columns = ['customerID', 'tenure', 'MonthlyCharges', 'Contract', 
                  'prediction_score', 'prediction_label']

results = predictions[result_columns].copy()

# ZaokrƒÖglamy prawdopodobie≈Ñstwo do 4 miejsc po przecinku
results['prediction_score'] = results['prediction_score'].round(4)

print("\n" + "="*80)
print("üìä WYNIKI PREDYKCJI")
print("="*80)

results


üìä WYNIKI PREDYKCJI


Unnamed: 0,customerID,tenure,MonthlyCharges,Contract,prediction_score,prediction_label
0,0811-GSDTP,13,30.15,Month-to-month,0.6416,No
1,1970-KKFWL,35,23.299999,Two year,0.9845,No
2,2892-GESUL,18,19.35,Two year,0.9797,No
3,2842-BCQGE,43,75.349998,Month-to-month,0.6829,No
4,4807-IZYOZ,51,20.65,Two year,0.9949,No
5,9451-WLYRI,53,19.049999,One year,0.9921,No
6,1767-TGTKO,8,45.450001,Month-to-month,0.6182,No
7,8033-VCZGH,50,103.949997,One year,0.7288,No
8,6689-VRRTK,44,109.800003,One year,0.7213,No
9,6997-UVGOX,71,85.449997,Two year,0.9931,No


## Krok 8: Analiza wynik√≥w predykcji

### üîç Jak dzia≈Ça prediction_score?

**WA≈ªNE:** `prediction_score` to **prawdopodobie≈Ñstwo dla predicted class**, NIE zawsze dla "Yes"!

**Przyk≈Çady:**
- Klient A: `prediction_label = Yes`, `prediction_score = 0.85` ‚Üí 85% szans ≈ºe **odejdzie**
- Klient B: `prediction_label = No`, `prediction_score = 0.73` ‚Üí 73% szans ≈ºe **zostanie**

**Model ju≈º zastosowa≈Ç threshold (z metadata.json) i zwr√≥ci≈Ç decyzjƒô w `prediction_label`.**

Nie musimy rƒôcznie stosowaƒá threshold - PyCaret to ju≈º zrobi≈Ç!

### Dlaczego threshold = 0.5?
- Standardowy pr√≥g (50% szans)
- Balans miƒôdzy wykrywaniem odchodzƒÖcych a fa≈Çszywymi alarmami
- W projekcie 06 przeanalizowali≈õmy r√≥≈ºne thresholdy (0.3, 0.5, 0.7)

In [38]:
# U≈ºywamy prediction_label - PyCaret ju≈º zastosowa≈Ç threshold
# prediction_label zawiera ostatecznƒÖ decyzjƒô modelu (Yes/No)

print(f"üéØ Model u≈ºy≈Ç threshold: {threshold}")
print("\nüìä Wyja≈õnienie kolumn:")
print("\nKolumny:")
print("  - prediction_label: Ostateczna decyzja modelu (Yes/No)")
print("  - prediction_score: Prawdopodobie≈Ñstwo dla predicted class (0.0-1.0)")
print("\nüí° UWAGA: prediction_score to prawdopodobie≈Ñstwo dla tej klasy kt√≥rƒÖ model wybra≈Ç!")
print("   Je≈õli prediction_label = No, to score = prawdopodobie≈Ñstwo ≈ºe ZOSTANIE")
print("   Je≈õli prediction_label = Yes, to score = prawdopodobie≈Ñstwo ≈ºe ODEJDZIE")

# Dodajemy kolumnƒô z wyja≈õnieniem
results['explanation'] = results.apply(
    lambda row: f"Model przewiduje: {row['prediction_label']} (pewno≈õƒá: {row['prediction_score']:.2%})",
    axis=1
)

print("\n" + "="*80)
print("üîç SZCZEG√ì≈ÅOWE WYNIKI Z WYJA≈öNIENIAMI")
print("="*80)

results[['customerID', 'prediction_label', 'prediction_score', 'explanation']]

üéØ Model u≈ºy≈Ç threshold: 0.5

üìä Wyja≈õnienie kolumn:

Kolumny:
  - prediction_label: Ostateczna decyzja modelu (Yes/No)
  - prediction_score: Prawdopodobie≈Ñstwo dla predicted class (0.0-1.0)

üí° UWAGA: prediction_score to prawdopodobie≈Ñstwo dla tej klasy kt√≥rƒÖ model wybra≈Ç!
   Je≈õli prediction_label = No, to score = prawdopodobie≈Ñstwo ≈ºe ZOSTANIE
   Je≈õli prediction_label = Yes, to score = prawdopodobie≈Ñstwo ≈ºe ODEJDZIE

üîç SZCZEG√ì≈ÅOWE WYNIKI Z WYJA≈öNIENIAMI


Unnamed: 0,customerID,prediction_label,prediction_score,explanation
0,0811-GSDTP,No,0.6416,Model przewiduje: No (pewno≈õƒá: 64.16%)
1,1970-KKFWL,No,0.9845,Model przewiduje: No (pewno≈õƒá: 98.45%)
2,2892-GESUL,No,0.9797,Model przewiduje: No (pewno≈õƒá: 97.97%)
3,2842-BCQGE,No,0.6829,Model przewiduje: No (pewno≈õƒá: 68.29%)
4,4807-IZYOZ,No,0.9949,Model przewiduje: No (pewno≈õƒá: 99.49%)
5,9451-WLYRI,No,0.9921,Model przewiduje: No (pewno≈õƒá: 99.21%)
6,1767-TGTKO,No,0.6182,Model przewiduje: No (pewno≈õƒá: 61.82%)
7,8033-VCZGH,No,0.7288,Model przewiduje: No (pewno≈õƒá: 72.88%)
8,6689-VRRTK,No,0.7213,Model przewiduje: No (pewno≈õƒá: 72.13%)
9,6997-UVGOX,No,0.9931,Model przewiduje: No (pewno≈õƒá: 99.31%)


## Krok 9: Podsumowanie statystyk

In [39]:
# Liczymy ile klient√≥w model sklasyfikowa≈Ç jako "odejdzie" vs "zostanie"

churn_yes = (results['prediction_label'] == 'Yes').sum()
churn_no = (results['prediction_label'] == 'No').sum()

print("\n" + "="*80)
print("üìä PODSUMOWANIE")
print("="*80)

print(f"\nüë• Liczba klient√≥w: {len(results)}")
print(f"\nüî¥ Przewidywane ODEJ≈öCIA (Churn = Yes): {churn_yes} ({churn_yes/len(results)*100:.1f}%)")
print(f"üü¢ Przewidywane POZOSTANIE (Churn = No): {churn_no} ({churn_no/len(results)*100:.1f}%)")

# Statystyki prawdopodobie≈Ñstw - tylko dla klient√≥w z ryzykiem odej≈õcia
at_risk = results[results['prediction_label'] == 'Yes']
if len(at_risk) > 0:
    print(f"\nüìà Statystyki pewno≈õci dla klient√≥w z ryzykiem odej≈õcia:")
    print(f"   ≈örednia pewno≈õƒá: {at_risk['prediction_score'].mean():.4f}")
    print(f"   Minimum: {at_risk['prediction_score'].min():.4f}")
    print(f"   Maximum: {at_risk['prediction_score'].max():.4f}")

print("\n" + "="*80)


üìä PODSUMOWANIE

üë• Liczba klient√≥w: 20

üî¥ Przewidywane ODEJ≈öCIA (Churn = Yes): 3 (15.0%)
üü¢ Przewidywane POZOSTANIE (Churn = No): 17 (85.0%)

üìà Statystyki pewno≈õci dla klient√≥w z ryzykiem odej≈õcia:
   ≈örednia pewno≈õƒá: 0.6254
   Minimum: 0.5896
   Maximum: 0.6575



## Krok 10: Rekomendacje akcji (co zrobiƒá z wynikami)

In [26]:
# Dla klient√≥w z wysokim ryzykiem odej≈õcia - generujemy rekomendacje
# 
# WA≈ªNE: Poziomy ryzyka stosujemy TYLKO dla klient√≥w z prediction_label = Yes
# Dla nich prediction_score = prawdopodobie≈Ñstwo ODEJ≈öCIA, wiƒôc mo≈ºemy oceniƒá ryzyko:
#   HIGH RISK = prawdopodobie≈Ñstwo >= 0.7 (70%) - bardzo pewne ≈ºe odejdzie
#   MEDIUM RISK = prawdopodobie≈Ñstwo 0.5-0.7 (50-70%) - ≈õrednie ryzyko
#   LOW RISK = klienci z prediction_label = No (zostajƒÖ)

def get_risk_level(prob):
    """Okre≈õla poziom ryzyka na podstawie prawdopodobie≈Ñstwa ODEJ≈öCIA."""
    if prob >= 0.7:
        return "üî¥ HIGH RISK"
    elif prob >= 0.5:
        return "üü° MEDIUM RISK"
    else:
        return "üü¢ LOW RISK"

def get_action(prob):
    """Rekomenduje akcjƒô na podstawie ryzyka."""
    if prob >= 0.7:
        return "PILNE: Natychmiastowy kontakt z dzia≈Çem retencji + oferta specjalna"
    elif prob >= 0.5:
        return "Kontakt telefoniczny + analiza przyczyn niezadowolenia"
    else:
        return "Monitoring - brak pilnych dzia≈Ça≈Ñ"

# Stosujemy poziomy ryzyka TYLKO dla prediction_label = Yes
# W tym przypadku prediction_score = prawdopodobie≈Ñstwo ≈ºe ODEJDZIE (mo≈ºemy oceniƒá jak bardzo)
# Dla prediction_label = No ‚Üí automatycznie LOW RISK (klient zostaje)
results['risk_level'] = results.apply(
    lambda row: get_risk_level(row['prediction_score']) if row['prediction_label'] == 'Yes' else 'üü¢ LOW RISK',
    axis=1
)
results['recommended_action'] = results.apply(
    lambda row: get_action(row['prediction_score']) if row['prediction_label'] == 'Yes' else 'Monitoring - brak pilnych dzia≈Ça≈Ñ',
    axis=1
)

print("\n" + "="*80)
print("üéØ REKOMENDACJE AKCJI")
print("="*80)

# Wy≈õwietlamy tylko klient√≥w z ryzykiem (prediction_label = Yes)
at_risk = results[results['prediction_label'] == 'Yes'].copy()

if len(at_risk) > 0:
    print(f"\n‚ö†Ô∏è KLIENCI WYMAGAJƒÑCY UWAGI: {len(at_risk)}\n")
    
    for idx, row in at_risk.iterrows():
        print(f"üë§ Klient: {row['customerID']}")
        print(f"   Prawdopodobie≈Ñstwo: {row['prediction_score']:.2%}")
        print(f"   Poziom ryzyka: {row['risk_level']}")
        print(f"   Akcja: {row['recommended_action']}")
        print()
else:
    print("\n‚úÖ Brak klient√≥w z wysokim ryzykiem odej≈õcia!")


üéØ REKOMENDACJE AKCJI

‚ö†Ô∏è KLIENCI WYMAGAJƒÑCY UWAGI: 3

üë§ Klient: 1602-IJQQE
   Prawdopodobie≈Ñstwo: 65.75%
   Poziom ryzyka: üü° MEDIUM RISK
   Akcja: Kontakt telefoniczny + analiza przyczyn niezadowolenia

üë§ Klient: 8066-POXGX
   Prawdopodobie≈Ñstwo: 58.96%
   Poziom ryzyka: üü° MEDIUM RISK
   Akcja: Kontakt telefoniczny + analiza przyczyn niezadowolenia

üë§ Klient: 0616-ATFGB
   Prawdopodobie≈Ñstwo: 62.92%
   Poziom ryzyka: üü° MEDIUM RISK
   Akcja: Kontakt telefoniczny + analiza przyczyn niezadowolenia



## Krok 11: Zapisanie wynik√≥w do pliku

In [27]:
# Zapisujemy kompletne wyniki do pliku CSV
# W prawdziwej produkcji m√≥g≈Çby≈õ to wys≈Çaƒá:
# - Do bazy danych
# - Do systemu CRM
# - Na email dla zespo≈Çu retencji
# - Do dashboardu BI

output_file = 'data/predictions_results.csv'

# Zapisujemy pe≈Çne wyniki (wszystkie kolumny)
predictions.to_csv(output_file, index=False)

print(f"üíæ Zapisano wyniki do pliku: {output_file}")
print(f"üìä Plik zawiera {len(predictions)} klient√≥w z pe≈Çnymi danymi + predykcjami")

# Zapisujemy te≈º podsumowanie (tylko najwa≈ºniejsze kolumny)
summary_file = 'data/predictions_summary.csv'
results.to_csv(summary_file, index=False)

print(f"üíæ Zapisano podsumowanie do: {summary_file}")
print(f"üìã Zawiera: ID, prawdopodobie≈Ñstwo, decyzja, rekomendacje")

print("\n‚úÖ Wszystkie wyniki zapisane!")

üíæ Zapisano wyniki do pliku: data/predictions_results.csv
üìä Plik zawiera 20 klient√≥w z pe≈Çnymi danymi + predykcjami
üíæ Zapisano podsumowanie do: data/predictions_summary.csv
üìã Zawiera: ID, prawdopodobie≈Ñstwo, decyzja, rekomendacje

‚úÖ Wszystkie wyniki zapisane!


## üéâ Podsumowanie

### Co zrobili≈õmy?

1. ‚úÖ Przygotowali≈õmy 20 "nowych" klient√≥w (bez kolumny Churn)
2. ‚úÖ Wczytali≈õmy zapisany model z `train.ipynb`
3. ‚úÖ Za≈Çadowali≈õmy metadata.json (threshold, ustawienia)
4. ‚úÖ Wykonali≈õmy predykcje z **threshold z metadata.json** (`probability_threshold=threshold`)
5. ‚úÖ Zrozumieli≈õmy ≈ºe `prediction_score` = prawdopodobie≈Ñstwo dla **predicted class**
6. ‚úÖ Wygenerowali≈õmy rekomendacje akcji dla klient√≥w z ryzykiem odej≈õcia
7. ‚úÖ Zapisali≈õmy wyniki do plik√≥w CSV

### üîç Jak dzia≈Ça prediction_score?

**KLUCZOWE:** `prediction_score` NIE jest zawsze prawdopodobie≈Ñstwem odej≈õcia!

```
Je≈õli prediction_label = Yes ‚Üí prediction_score = prawdopodobie≈Ñstwo ODEJ≈öCIA
Je≈õli prediction_label = No  ‚Üí prediction_score = prawdopodobie≈Ñstwo POZOSTANIA
```

**Przyk≈Çady:**
- Klient A: `prediction_label=Yes`, `score=0.85` ‚Üí 85% pewno≈õci ≈ºe **ODEJDZIE** ‚Üí HIGH RISK
- Klient B: `prediction_label=No`, `score=0.73` ‚Üí 73% pewno≈õci ≈ºe **ZOSTANIE** ‚Üí LOW RISK

### Co dalej?

W prawdziwej produkcji:
1. **Automatyzacja** - skrypt uruchamiany codziennie/co tydzie≈Ñ
2. **Integracja** - wyniki do CRM, bazy danych, dashboardu
3. **Akcje** - automatyczne emaile do zespo≈Çu retencji
4. **Monitoring** - ≈õledzenie skuteczno≈õci (ile klient√≥w zatrzymano)

### üí° Kluczowe pliki wyj≈õciowe:
- `predictions_results.csv` - pe≈Çne dane + predykcje
- `predictions_summary.csv` - podsumowanie z rekomendacjami

**Model jest w produkcyjnym u≈ºyciu! üöÄ**