## Krok 1: Import bibliotek

In [1]:
# Importujemy pandas - bibliotekƒô do pracy z danymi (jak Excel w Pythonie)
import pandas as pd

# Importujemy PyCaret - narzƒôdzie AutoML, kt√≥re automatyzuje proces uczenia maszynowego
from pycaret.classification import *

# Importujemy numpy - bibliotekƒô do oblicze≈Ñ numerycznych
import numpy as np

print("‚úÖ Biblioteki zaimportowane!")

‚úÖ Biblioteki zaimportowane!


## Krok 2: Wczytanie danych

In [2]:
# Wczytujemy dane o klientach firmy telekomunikacyjnej z pliku CSV
# CSV to format pliku, gdzie dane sƒÖ oddzielone przecinkami (jak tabela w Excelu)
df = pd.read_csv('data/WA_Fn-UseC_-Telco-Customer-Churn.csv')

# Wy≈õwietlamy informacje o danych
print(f"üìä Liczba klient√≥w w bazie: {len(df)}")
print(f"üìã Liczba kolumn (cech): {len(df.columns)}")

# Pokazujemy pierwsze 5 wierszy, ≈ºeby zobaczyƒá jak wyglƒÖdajƒÖ dane
print("\nüîç Pierwsze 5 wierszy danych:")
df.head()

üìä Liczba klient√≥w w bazie: 7043
üìã Liczba kolumn (cech): 21

üîç Pierwsze 5 wierszy danych:


Unnamed: 0,customerID,gender,SeniorCitizen,Partner,Dependents,tenure,PhoneService,MultipleLines,InternetService,OnlineSecurity,...,DeviceProtection,TechSupport,StreamingTV,StreamingMovies,Contract,PaperlessBilling,PaymentMethod,MonthlyCharges,TotalCharges,Churn
0,7590-VHVEG,Female,0,Yes,No,1,No,No phone service,DSL,No,...,No,No,No,No,Month-to-month,Yes,Electronic check,29.85,29.85,No
1,5575-GNVDE,Male,0,No,No,34,Yes,No,DSL,Yes,...,Yes,No,No,No,One year,No,Mailed check,56.95,1889.5,No
2,3668-QPYBK,Male,0,No,No,2,Yes,No,DSL,Yes,...,No,No,No,No,Month-to-month,Yes,Mailed check,53.85,108.15,Yes
3,7795-CFOCW,Male,0,No,No,45,No,No phone service,DSL,Yes,...,Yes,Yes,No,No,One year,No,Bank transfer (automatic),42.3,1840.75,No
4,9237-HQITU,Female,0,No,No,2,Yes,No,Fiber optic,No,...,No,No,No,No,Month-to-month,Yes,Electronic check,70.7,151.65,Yes


In [3]:
# Sprawdzamy kolumny w danych
print("\nüìã Kolumny w danych:")
print(df.columns.tolist())

# Informacje o typach danych
print("\nüîç Typy danych:")
print(df.info())


üìã Kolumny w danych:
['customerID', 'gender', 'SeniorCitizen', 'Partner', 'Dependents', 'tenure', 'PhoneService', 'MultipleLines', 'InternetService', 'OnlineSecurity', 'OnlineBackup', 'DeviceProtection', 'TechSupport', 'StreamingTV', 'StreamingMovies', 'Contract', 'PaperlessBilling', 'PaymentMethod', 'MonthlyCharges', 'TotalCharges', 'Churn']

üîç Typy danych:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7043 entries, 0 to 7042
Data columns (total 21 columns):
 #   Column            Non-Null Count  Dtype  
---  ------            --------------  -----  
 0   customerID        7043 non-null   object 
 1   gender            7043 non-null   object 
 2   SeniorCitizen     7043 non-null   int64  
 3   Partner           7043 non-null   object 
 4   Dependents        7043 non-null   object 
 5   tenure            7043 non-null   int64  
 6   PhoneService      7043 non-null   object 
 7   MultipleLines     7043 non-null   object 
 8   InternetService   7043 non-null   object 
 9   Onli

## Krok 3: Przygotowanie danych

In [4]:
# Usuwamy kolumnƒô customerID, bo to tylko numer identyfikacyjny
# Nie pomaga w przewidywaniu (jak numer PESEL - nic nie m√≥wi o zachowaniu klienta)
df = df.drop('customerID', axis=1)

# Sprawdzamy czy sƒÖ brakujƒÖce warto≈õci (puste kom√≥rki w danych)
print("üîç Sprawdzanie brakujƒÖcych warto≈õci...")
missing = df.isnull().sum()
print(f"\nLiczba brakujƒÖcych warto≈õci: {missing.sum()}")

# Sprawdzamy rozk≈Çad kolumny Churn (ile klient√≥w odesz≈Ço, ile zosta≈Ço)
print("\nüìä Rozk≈Çad targetu (Churn):")
print(df['Churn'].value_counts())
print(f"\nProcent klient√≥w, kt√≥rzy odeszli: {(df['Churn'] == 'Yes').sum() / len(df) * 100:.1f}%")

üîç Sprawdzanie brakujƒÖcych warto≈õci...

Liczba brakujƒÖcych warto≈õci: 0

üìä Rozk≈Çad targetu (Churn):
Churn
No     5174
Yes    1869
Name: count, dtype: int64

Procent klient√≥w, kt√≥rzy odeszli: 26.5%


In [5]:
# TotalCharges powinno byƒá liczbƒÖ, ale mo≈ºe byƒá tekstem z spacjami
# Sprawdzamy i naprawiamy
print("\nüîß Naprawiamy kolumnƒô TotalCharges...")

# Konwertujemy na liczby, nieprawid≈Çowe warto≈õci zastƒôpujemy NaN
df['TotalCharges'] = pd.to_numeric(df['TotalCharges'], errors='coerce')

# Sprawdzamy ile mamy NaN
nan_count = df['TotalCharges'].isnull().sum()
print(f"Znaleziono {nan_count} nieprawid≈Çowych warto≈õci w TotalCharges")

if nan_count > 0:
    # Wype≈Çniamy NaN zerem (nowi klienci majƒÖ tenure=0, wiƒôc TotalCharges=0 ma sens)
    df['TotalCharges'].fillna(0, inplace=True)
    print("‚úÖ Wype≈Çniono zerami (nowi klienci bez historii p≈Çatno≈õci)")


üîß Naprawiamy kolumnƒô TotalCharges...
Znaleziono 11 nieprawid≈Çowych warto≈õci w TotalCharges
‚úÖ Wype≈Çniono zerami (nowi klienci bez historii p≈Çatno≈õci)


## Krok 4: Konfiguracja PyCaret

In [6]:
# Inicjalizujemy PyCaret - przygotowujemy ≈õrodowisko do uczenia maszynowego
# data = nasze dane
# target = kolumna, kt√≥rƒÖ chcemy przewidzieƒá (czy klient odejdzie: Yes/No)
# session_id = ustawienie ziarna losowo≈õci (dla powtarzalno≈õci wynik√≥w)
# train_size = 80% danych do treningu, 20% do testu (jak nauka do egzaminu)
# fold = 5-fold cross-validation (dzielimy dane na 5 czƒô≈õci i testujemy na ka≈ºdej)
# normalize = normalizujemy dane numeryczne (wszystkie warto≈õci w podobnej skali)

clf_setup = setup(
    data=df,
    target='Churn',
    session_id=123,
    train_size=0.8,
    fold=5,
    normalize=True,
    verbose=False
)

print("\n‚úÖ PyCaret skonfigurowany i gotowy do pracy!")


‚úÖ PyCaret skonfigurowany i gotowy do pracy!


## Krok 5: Por√≥wnanie modeli i wyb√≥r najlepszego

In [7]:
# Por√≥wnujemy r√≥≈ºne algorytmy ML (Gradient Boosting, Random Forest, itd.)
# sort='AUC' - sortujemy modele wed≈Çug AUC (najlepsza metryka dla churn)
# n_select=1 - wybieramy tylko najlepszy model

print("üîÑ Por√≥wnujemy ~15 r√≥≈ºnych algorytm√≥w ML...")
print("To zajmie kilka minut - testujemy ka≈ºdy algorytm na 5 foldach!\n")

# Por√≥wnujemy wszystkie dostƒôpne modele
best_model = compare_models(sort='AUC', n_select=1)

print("\n‚úÖ Najlepszy model wybrany!")

üîÑ Por√≥wnujemy ~15 r√≥≈ºnych algorytm√≥w ML...
To zajmie kilka minut - testujemy ka≈ºdy algorytm na 5 foldach!



Unnamed: 0,Model,Accuracy,AUC,Recall,Prec.,F1,Kappa,MCC,TT (Sec)
gbc,Gradient Boosting Classifier,0.7993,0.8463,0.7993,0.7903,0.7924,0.4534,0.4578,0.394
lr,Logistic Regression,0.8039,0.8457,0.8039,0.7967,0.7985,0.472,0.4753,1.114
ada,Ada Boost Classifier,0.8019,0.8441,0.8019,0.7936,0.7953,0.4617,0.4661,0.232
ridge,Ridge Classifier,0.8003,0.8373,0.8003,0.7908,0.7921,0.4508,0.4571,0.124
lda,Linear Discriminant Analysis,0.7971,0.8372,0.7971,0.7906,0.7927,0.4586,0.4607,0.122
lightgbm,Light Gradient Boosting Machine,0.79,0.8359,0.79,0.7811,0.7837,0.4321,0.4352,0.306
rf,Random Forest Classifier,0.7913,0.8248,0.7913,0.7802,0.7823,0.4242,0.4302,0.224
svm,SVM - Linear Kernel,0.7815,0.8202,0.7815,0.7803,0.7805,0.4351,0.4358,0.136
nb,Naive Bayes,0.6926,0.8193,0.6926,0.7965,0.7105,0.3795,0.4258,0.848
et,Extra Trees Classifier,0.7746,0.7984,0.7746,0.763,0.7663,0.3839,0.388,0.222



‚úÖ Najlepszy model wybrany!


## Krok 6: Zapisanie wynik√≥w PRZED tuningiem

In [8]:
# Trenujemy najlepszy model jeszcze raz, ≈ºeby zobaczyƒá szczeg√≥≈Çowe wyniki
# fold=5 - testujemy na 5 r√≥≈ºnych podzbi√≥r danych (cross-validation)

print("üìä Trenujemy najlepszy model i zapisujemy wyniki PRZED tuningiem...\n")

# Tworzymy model (ten sam algorytm co wybrany w compare_models)
model_before = create_model(best_model, fold=5)

# Pobieramy wyniki cross-validation (≈õrednie wyniki z 5 test√≥w)
# pull() pobiera ostatniƒÖ tabelƒô wynik√≥w
results_before = pull()

# Zapisujemy kluczowe metryki PRZED tuningiem
# loc['Mean'] - bierzemy wiersz ze ≈õrednimi wynikami
accuracy_before = results_before.loc['Mean', 'Accuracy']
auc_before = results_before.loc['Mean', 'AUC']
recall_before = results_before.loc['Mean', 'Recall']
precision_before = results_before.loc['Mean', 'Prec.']

print("\n‚úÖ Wyniki PRZED tuningiem zapisane!")
print(f"\nüìà Kluczowe metryki PRZED tuningiem:")
print(f"   - Accuracy (dok≈Çadno≈õƒá og√≥lna): {accuracy_before:.4f}")
print(f"   - AUC (zdolno≈õƒá rozr√≥≈ºniania): {auc_before:.4f}")
print(f"   - Recall (% wykrytych odej≈õƒá): {recall_before:.4f}")
print(f"   - Precision (% trafnych alert√≥w): {precision_before:.4f}")

üìä Trenujemy najlepszy model i zapisujemy wyniki PRZED tuningiem...



Unnamed: 0_level_0,Accuracy,AUC,Recall,Prec.,F1,Kappa,MCC
Fold,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
0,0.7924,0.8331,0.7924,0.7853,0.7879,0.4461,0.4477
1,0.7968,0.8504,0.7968,0.7861,0.7883,0.4399,0.4455
2,0.7986,0.8418,0.7986,0.7899,0.7925,0.4548,0.458
3,0.7941,0.8431,0.7941,0.7853,0.7881,0.4434,0.4464
4,0.8144,0.8634,0.8144,0.805,0.8051,0.4827,0.4913
Mean,0.7993,0.8463,0.7993,0.7903,0.7924,0.4534,0.4578
Std,0.0079,0.0101,0.0079,0.0075,0.0066,0.0155,0.0173



‚úÖ Wyniki PRZED tuningiem zapisane!

üìà Kluczowe metryki PRZED tuningiem:
   - Accuracy (dok≈Çadno≈õƒá og√≥lna): 0.7993
   - AUC (zdolno≈õƒá rozr√≥≈ºniania): 0.8463
   - Recall (% wykrytych odej≈õƒá): 0.7993
   - Precision (% trafnych alert√≥w): 0.7903


## Krok 7: Tuning modelu (optymalizacja)

In [None]:
# Tunujemy model - szukamy najlepszych ustawie≈Ñ (hiperparametr√≥w)
# To jak regulacja silnika w samochodzie - szukamy optymalnych ustawie≈Ñ
# optimize='AUC' - optymalizujemy pod kƒÖtem AUC (najwa≈ºniejsza metryka dla churn)
# do optymalizacji u≈ºywamy domy≈õlnego scikit-optimize (w tym przypadku nie modyfikujemy tego podej≈õcia)
# n_iter=20 - testujemy 20 r√≥≈ºnych kombinacji ustawie≈Ñ

print("üîß Rozpoczynamy tuning modelu...")
print("Szukamy najlepszych ustawie≈Ñ algorytmu (hiperparametr√≥w)")
print("To zajmie kilka minut - testujemy 20 r√≥≈ºnych konfiguracji!\n")

# Tunujemy model
model_after = tune_model(model_before, optimize='AUC', n_iter=20)

# Pobieramy wyniki PO tuningu
results_after = pull()

# Zapisujemy kluczowe metryki PO tuningu
accuracy_after = results_after.loc['Mean', 'Accuracy']
auc_after = results_after.loc['Mean', 'AUC']
recall_after = results_after.loc['Mean', 'Recall']
precision_after = results_after.loc['Mean', 'Prec.']

print("\n‚úÖ Tuning zako≈Ñczony!")
print(f"\nüìà Kluczowe metryki PO tuningu:")
print(f"   - Accuracy (dok≈Çadno≈õƒá og√≥lna): {accuracy_after:.4f}")
print(f"   - AUC (zdolno≈õƒá rozr√≥≈ºniania): {auc_after:.4f}")
print(f"   - Recall (% wykrytych odej≈õƒá): {recall_after:.4f}")
print(f"   - Precision (% trafnych alert√≥w): {precision_after:.4f}")

üîß Rozpoczynamy tuning modelu...
Szukamy najlepszych ustawie≈Ñ algorytmu (hiperparametr√≥w)
To zajmie kilka minut - testujemy 20 r√≥≈ºnych konfiguracji!



Unnamed: 0_level_0,Accuracy,AUC,Recall,Prec.,F1,Kappa,MCC
Fold,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
0,0.7933,0.8359,0.7933,0.78,0.7718,0.3834,0.4087
1,0.7959,0.8545,0.7959,0.7851,0.7717,0.3813,0.4136
2,0.7959,0.8474,0.7959,0.7829,0.7768,0.398,0.42
3,0.7844,0.8463,0.7844,0.7685,0.7611,0.3537,0.379
4,0.8011,0.8622,0.8011,0.7939,0.7755,0.3912,0.4296
Mean,0.7941,0.8493,0.7941,0.7821,0.7714,0.3815,0.4102
Std,0.0055,0.0088,0.0055,0.0082,0.0055,0.0151,0.0171


Fitting 5 folds for each of 20 candidates, totalling 100 fits

‚úÖ Tuning zako≈Ñczony!

üìà Kluczowe metryki PO tuningu:
   - Accuracy (dok≈Çadno≈õƒá og√≥lna): 0.7941
   - AUC (zdolno≈õƒá rozr√≥≈ºniania): 0.8493
   - Recall (% wykrytych odej≈õƒá): 0.7941
   - Precision (% trafnych alert√≥w): 0.7821


## Krok 8: Por√≥wnanie wynik√≥w PRZED vs PO tuningu

In [10]:
# Obliczamy r√≥≈ºnice miƒôdzy wynikami przed i po tuningu
# R√≥≈ºnica w punktach procentowych (p.p.) pokazuje realnƒÖ poprawƒô

print("\n" + "="*60)
print("üìä POR√ìWNANIE: MODEL PRZED vs PO TUNINGU")
print("="*60)

# Obliczamy r√≥≈ºnice (w punktach procentowych)
accuracy_diff = (accuracy_after - accuracy_before) * 100
auc_diff = (auc_after - auc_before) * 100
recall_diff = (recall_after - recall_before) * 100
precision_diff = (precision_after - precision_before) * 100

# Wy≈õwietlamy szczeg√≥≈Çowe por√≥wnanie
print(f"\n1Ô∏è‚É£ ACCURACY (Dok≈Çadno≈õƒá og√≥lna):")
print(f"   Przed: {accuracy_before:.4f} ({accuracy_before*100:.2f}%)")
print(f"   Po:    {accuracy_after:.4f} ({accuracy_after*100:.2f}%)")
print(f"   Zmiana: {accuracy_diff:+.2f} punkt√≥w procentowych")

print(f"\n2Ô∏è‚É£ AUC (Zdolno≈õƒá rozr√≥≈ºniania klas):")
print(f"   Przed: {auc_before:.4f}")
print(f"   Po:    {auc_after:.4f}")
print(f"   Zmiana: {auc_diff:+.2f} punkt√≥w procentowych")

print(f"\n3Ô∏è‚É£ RECALL (Ile % odchodzƒÖcych klient√≥w wykrywamy):")
print(f"   Przed: {recall_before:.4f} ({recall_before*100:.2f}%)")
print(f"   Po:    {recall_after:.4f} ({recall_after*100:.2f}%)")
print(f"   Zmiana: {recall_diff:+.2f} punkt√≥w procentowych")

print(f"\n4Ô∏è‚É£ PRECISION (Ile % naszych alert√≥w jest trafnych):")
print(f"   Przed: {precision_before:.4f} ({precision_before*100:.2f}%)")
print(f"   Po:    {precision_after:.4f} ({precision_after*100:.2f}%)")
print(f"   Zmiana: {precision_diff:+.2f} punkt√≥w procentowych")

print("\n" + "="*60)


üìä POR√ìWNANIE: MODEL PRZED vs PO TUNINGU

1Ô∏è‚É£ ACCURACY (Dok≈Çadno≈õƒá og√≥lna):
   Przed: 0.7993 (79.93%)
   Po:    0.7941 (79.41%)
   Zmiana: -0.52 punkt√≥w procentowych

2Ô∏è‚É£ AUC (Zdolno≈õƒá rozr√≥≈ºniania klas):
   Przed: 0.8463
   Po:    0.8493
   Zmiana: +0.30 punkt√≥w procentowych

3Ô∏è‚É£ RECALL (Ile % odchodzƒÖcych klient√≥w wykrywamy):
   Przed: 0.7993 (79.93%)
   Po:    0.7941 (79.41%)
   Zmiana: -0.52 punkt√≥w procentowych

4Ô∏è‚É£ PRECISION (Ile % naszych alert√≥w jest trafnych):
   Przed: 0.7903 (79.03%)
   Po:    0.7821 (78.21%)
   Zmiana: -0.82 punkt√≥w procentowych



## Krok 9: Analiza biznesowa - Czy tuning ma sens?

In [12]:
# Obliczamy czy poprawa jest istotna biznesowo
# Zak≈Çadamy bazƒô 10,000 klient√≥w, z czego 27% chce odej≈õƒá (2,700 klient√≥w)

total_customers = 10000  # Ca≈Çkowita liczba klient√≥w
churn_rate = 0.27  # 27% klient√≥w odchodzi (na podstawie naszych danych)
churning_customers = int(total_customers * churn_rate)  # Klienci faktycznie odchodzƒÖcy

# Koszt retencji (pr√≥ba zatrzymania klienta) - np. telefon + oferta specjalna
retention_cost = 50  # 50 z≈Ç za pr√≥bƒô zatrzymania

# Warto≈õƒá klienta - ile tracimy gdy klient odejdzie
customer_value = 500  # 500 z≈Ç rocznie (≈õredni przych√≥d)

print("\n" + "="*60)
print("üí∞ ANALIZA BIZNESOWA - CZY TUNING SIƒò OP≈ÅACA?")
print("="*60)

print(f"\nüìä Za≈Ço≈ºenia:")
print(f"   - Baza klient√≥w: {total_customers:,}")
print(f"   - Klienci odchodzƒÖcy: {churning_customers:,} ({churn_rate*100:.0f}%)")
print(f"   - Koszt pr√≥by zatrzymania: {retention_cost} z≈Ç")
print(f"   - Warto≈õƒá klienta rocznie: {customer_value} z≈Ç")

# Ile klient√≥w wykrywamy PRZED tuningiem
detected_before = int(churning_customers * recall_before)
# Ile klient√≥w wykrywamy PO tuningu
detected_after = int(churning_customers * recall_after)
# Ile wiƒôcej klient√≥w wykrywamy dziƒôki tuningowi
additional_detected = detected_after - detected_before

print(f"\nüéØ Wykrywanie klient√≥w:")
print(f"   - Przed tuningiem: {detected_before:,} klient√≥w")
print(f"   - Po tuningu: {detected_after:,} klient√≥w")
print(f"   - DODATKOWO wykrytych: {additional_detected:,} klient√≥w")

# Zak≈Çadamy, ≈ºe 30% wykrytych klient√≥w uda siƒô zatrzymaƒá
retention_success_rate = 0.30

# Ile klient√≥w zatrzymamy dodatkowo dziƒôki tuningowi
additional_retained = int(additional_detected * retention_success_rate)

# Dodatkowy koszt (wiƒôcej pr√≥b = wiƒôcej koszt√≥w)
additional_cost = additional_detected * retention_cost

# Dodatkowy przych√≥d (zatrzymani klienci = zachowany przych√≥d)
additional_revenue = additional_retained * customer_value

# Zysk netto z tuningu
net_benefit = additional_revenue - additional_cost

print(f"\nüíº Skutki biznesowe (przy 30% skuteczno≈õci retencji):")
print(f"   - Dodatkowo zatrzymanych klient√≥w: {additional_retained:,}")
print(f"   - Dodatkowy koszt retencji: {additional_cost:,} z≈Ç")
print(f"   - Dodatkowy przych√≥d (zatrzymani): {additional_revenue:,} z≈Ç")
if net_benefit > 0:
    print(f"   - ZYSK NETTO Z TUNINGU: {net_benefit:,} z≈Ç rocznie")
else:
    print(f"   - STRATA NETTO Z TUNINGU: {net_benefit:,} z≈Ç rocznie")

print("\n" + "="*60)


üí∞ ANALIZA BIZNESOWA - CZY TUNING SIƒò OP≈ÅACA?

üìä Za≈Ço≈ºenia:
   - Baza klient√≥w: 10,000
   - Klienci odchodzƒÖcy: 2,700 (27%)
   - Koszt pr√≥by zatrzymania: 50 z≈Ç
   - Warto≈õƒá klienta rocznie: 500 z≈Ç

üéØ Wykrywanie klient√≥w:
   - Przed tuningiem: 2,158 klient√≥w
   - Po tuningu: 2,144 klient√≥w
   - DODATKOWO wykrytych: -14 klient√≥w

üíº Skutki biznesowe (przy 30% skuteczno≈õci retencji):
   - Dodatkowo zatrzymanych klient√≥w: -4
   - Dodatkowy koszt retencji: -700 z≈Ç
   - Dodatkowy przych√≥d (zatrzymani): -2,000 z≈Ç
   - STRATA NETTO Z TUNINGU: -1,300 z≈Ç rocznie



## Krok 10: Wnioski ko≈Ñcowe dla biznesu

In [13]:
# Podsumowanie - czy tuning ma sens?
# Oceniamy na podstawie poprawy metryk i zysku netto

print("\n" + "="*60)
print("üéØ WNIOSKI - CZY TUNING MA SENS BIZNESOWY?")
print("="*60)

# Sprawdzamy czy AUC siƒô poprawi≈Ç o wiƒôcej ni≈º 0.5%
if auc_diff > 0.5:
    print("\n‚úÖ TUNING DA≈Å REALNƒÑ POPRAWƒò TECHNICZNƒÑ!")
    print(f"   AUC wzr√≥s≈Ç o {auc_diff:.2f} punkt√≥w procentowych")
    print(f"   To znaczƒÖca poprawa zdolno≈õci modelu do rozr√≥≈ºniania klient√≥w")
elif auc_diff > 0:
    print("\n‚ö†Ô∏è TUNING DA≈Å NIEWIELKƒÑ POPRAWƒò TECHNICZNƒÑ")
    print(f"   AUC wzr√≥s≈Ç o {auc_diff:.2f} punkt√≥w procentowych")
    print(f"   Poprawa jest minimalna, model niewiele zyska≈Ç")
else:
    print("\n‚ùå TUNING NIE POPRAWI≈Å MODELU")
    print(f"   AUC zmieni≈Ç siƒô o {auc_diff:.2f} punkt√≥w procentowych")
    print(f"   Model nie zyska≈Ç na tuningu")

# Sprawdzamy czy recall siƒô poprawi≈Ç (czy wykrywamy wiƒôcej klient√≥w)
if recall_diff > 1.0:
    print("\n‚úÖ WYKRYWAMY ZNACZNIE WIƒòCEJ ODCHODZƒÑCYCH KLIENT√ìW!")
    print(f"   Recall wzr√≥s≈Ç o {recall_diff:.2f} punkt√≥w procentowych")
    print(f"   Wykrywamy {additional_detected:,} wiƒôcej klient√≥w zagro≈ºonych odej≈õciem")
elif recall_diff > 0:
    print("\n‚úÖ WYKRYWAMY TROCHƒò WIƒòCEJ ODCHODZƒÑCYCH KLIENT√ìW")
    print(f"   Recall wzr√≥s≈Ç o {recall_diff:.2f} punkt√≥w procentowych")
    print(f"   Wykrywamy {additional_detected:,} wiƒôcej klient√≥w zagro≈ºonych odej≈õciem")
else:
    print("\n‚ö†Ô∏è NIE WYKRYWAMY WIƒòCEJ KLIENT√ìW")
    print(f"   Recall zmieni≈Ç siƒô o {recall_diff:.2f} punkt√≥w procentowych")

# Analiza zysku netto
print("\nüí∞ ANALIZA FINANSOWA:")
if net_benefit > 10000:
    print(f"   ‚úÖ TUNING MA DU≈ªY SENS BIZNESOWY!")
    print(f"   Roczny zysk: {net_benefit:,} z≈Ç")
    print(f"   ROI: {(net_benefit/additional_cost)*100:.0f}% (≈õwietny zwrot z inwestycji!)")
elif net_benefit > 0:
    print(f"   ‚úÖ TUNING MA SENS BIZNESOWY")
    print(f"   Roczny zysk: {net_benefit:,} z≈Ç")
    print(f"   ROI: {(net_benefit/additional_cost)*100:.0f}% (op≈Çaca siƒô!)")
else:
    print(f"   ‚ùå TUNING NIE MA SENSU BIZNESOWEGO")
    print(f"   Strata: {abs(net_benefit):,} z≈Ç rocznie")
    print(f"   Koszt retencji przewy≈ºsza korzy≈õci")

# Ostateczna rekomendacja
print("\nüéØ REKOMENDACJA:")
if net_benefit > 5000 and auc_diff > 0.3:
    print("   üåü ZDECYDOWANIE WDRA≈ªAJ MODEL PO TUNINGU!")
    print("   Tuning da≈Ç realnƒÖ poprawƒô technicznƒÖ i biznesowƒÖ")
    print("   Model bƒôdzie lepiej wykrywa≈Ç klient√≥w zagro≈ºonych odej≈õciem")
elif net_benefit > 0:
    print("   ‚úÖ WARTO WDRO≈ªYƒÜ MODEL PO TUNINGU")
    print("   Tuning da≈Ç niewielkƒÖ, ale pozytywnƒÖ poprawƒô")
    print("   Model bƒôdzie generowa≈Ç dodatkowy zysk")
else:
    print("   ‚ö†Ô∏è ZOSTA≈É PRZY MODELU PODSTAWOWYM")
    print("   Tuning nie da≈Ç poprawy lub okaza≈Ç siƒô nawet gorszy")
    print("   Model podstawowy jest wystarczajƒÖcy")

print("\n" + "="*60)


üéØ WNIOSKI - CZY TUNING MA SENS BIZNESOWY?

‚ö†Ô∏è TUNING DA≈Å NIEWIELKƒÑ POPRAWƒò TECHNICZNƒÑ
   AUC wzr√≥s≈Ç o 0.30 punkt√≥w procentowych
   Poprawa jest minimalna, model niewiele zyska≈Ç

‚ö†Ô∏è NIE WYKRYWAMY WIƒòCEJ KLIENT√ìW
   Recall zmieni≈Ç siƒô o -0.52 punkt√≥w procentowych

üí∞ ANALIZA FINANSOWA:
   ‚ùå TUNING NIE MA SENSU BIZNESOWEGO
   Strata: 1,300 z≈Ç rocznie
   Koszt retencji przewy≈ºsza korzy≈õci

üéØ REKOMENDACJA:
   ‚ö†Ô∏è ZOSTA≈É PRZY MODELU PODSTAWOWYM
   Tuning nie da≈Ç poprawy lub okaza≈Ç siƒô nawet gorszy
   Model podstawowy jest wystarczajƒÖcy



## Krok 11: Zapisanie najlepszego modelu

In [15]:
# Zapisujemy model przed tuningiem lub po tuningu do pliku (w zale≈ºno≈õci od wybranej ostatecznej opcji)
# Dziƒôki temu mo≈ºemy go p√≥≈∫niej u≈ºyƒá bez ponownego trenowania

print("üíæ Zapisywanie modelu...")

# Zapisujemy model do folderu 'models'. Wybieramy model przed tuningiem bo by≈Ç wystarczajƒÖcy a nawet lepszy
save_model(model_before, 'models/churn_best_model')

print("‚úÖ Model zapisany w folderze 'models/churn_model'!")
print("\nüìù Mo≈ºesz go p√≥≈∫niej wczytaƒá u≈ºywajƒÖc: load_model('models/churn_model')")

üíæ Zapisywanie modelu...
Transformation Pipeline and Model Successfully Saved
‚úÖ Model zapisany w folderze 'models/churn_model'!

üìù Mo≈ºesz go p√≥≈∫niej wczytaƒá u≈ºywajƒÖc: load_model('models/churn_model')


## üìö Podsumowanie - Co to wszystko znaczy?

### Co zrobili≈õmy?
1. **Wytrenowali≈õmy model** - algorytm uczƒÖcy siƒô przewidywaƒá odej≈õcia klient√≥w
2. **Zoptymalizowali≈õmy go (tuning)** - szukali≈õmy najlepszych ustawie≈Ñ
3. **Por√≥wnali≈õmy wyniki** - przed i po tuningu
4. **Ocenili≈õmy warto≈õƒá biznesowƒÖ** - czy to siƒô op≈Çaca finansowo

### Kluczowe metryki wyja≈õnione:
- **Accuracy** = Ile % wszystkich przewidywa≈Ñ jest prawid≈Çowych
- **AUC** = Jak dobrze model rozr√≥≈ºnia klient√≥w (0.5 = losowanie, 1.0 = perfekcja)
- **Recall** = Ile % odchodzƒÖcych klient√≥w wykrywamy
- **Precision** = Ile % naszych alert√≥w "klient odejdzie" jest trafnych

### Co to znaczy w praktyce?
- **Recall 80%** = Na 100 klient√≥w, kt√≥rzy odejdƒÖ, wykryjemy 80
- **Precision 75%** = Na 100 alert√≥w, 75 bƒôdzie prawdziwych, 25 fa≈Çszywych

### Czy tuning siƒô op≈Çaca?
Sprawd≈∫ wyniki powy≈ºej! Model sam obliczy czy poprawa jest warta czasu i pieniƒôdzy.