# Inicjalizacja kontekstu u≈ºytkownika

**Cel**: Konfiguracja ≈õrodowiska i izolacja zasob√≥w.

Skrypt realizuje strategiƒô **Catalog Isolation** (rekomendowana):
1.  Tworzy dedykowany katalog dla u≈ºytkownika: `ecommerce_platform_<user_slug>` (np. `ecommerce_platform_kzb`).
2.  WewnƒÖtrz katalogu tworzy standardowe schematy warstw: `bronze`, `silver`, `gold`.
3.  Ustawia zmienne globalne (`CATALOG`, `BRONZE_SCHEMA` itp.) u≈ºywane w notebookach.

*Je≈õli u≈ºytkownik nie ma uprawnie≈Ñ do tworzenia katalog√≥w, skrypt automatycznie prze≈ÇƒÖczy siƒô na tryb izolacji schematami w katalogu `ecommerce_platform`.*

**Uruchom tƒô kom√≥rkƒô raz na poczƒÖtku sesji.**

## üìÅ Architektura danych w szkoleniu

Szkolenie u≈ºywa **dw√≥ch podej≈õƒá do przechowywania danych** w zale≈ºno≈õci od dnia:

### Dzie≈Ñ 1-2: Lokalne pliki ‚Üí Delta Tables
- **≈πr√≥d≈Ço**: Folder `dataset/` (CSV, JSON, Parquet)
- **Zmienna**: `DATASET_BASE_PATH` 
- **Cel**: Za≈Çadowanie do Delta tables w schematach Bronze/Silver/Gold
- **Przyk≈Çad**: `spark.read.csv(f"{DATASET_BASE_PATH}/customers/customers.csv")`

### Dzie≈Ñ 3: Unity Catalog Volumes
- **≈πr√≥d≈Ço**: Unity Catalog Volumes (`/Volumes/ecommerce_platform_<user>/default/kion_datasets`)
- **Zmienna**: `VOLUMES_BASE_PATH` (opcjonalne dla Dzie≈Ñ 3)
- **Cel**: Demonstracja zaawansowanych feature'√≥w UC (DLT, Lakeflow, Governance)
- **Przyk≈Çad**: `spark.read.csv("/Volumes/ecommerce_platform_kzb/default/kion_datasets/customers.csv")`

### Dlaczego dwa podej≈õcia?
- **Progresja edukacyjna**: Od prostych plik√≥w (Dzie≈Ñ 1) ‚Üí Delta Lake (Dzie≈Ñ 2) ‚Üí Unity Catalog (Dzie≈Ñ 3)
- **Real-world scenarios**: W produkcji czƒôsto u≈ºywa siƒô Volumes dla managed data access w UC
- **Best practices**: Dzie≈Ñ 3 pokazuje, jak zarzƒÖdzaƒá danymi w enterprise environment

---

In [0]:
# === Konfiguracja katalog√≥w i schemat√≥w ===
# Pobierz aktualnego u≈ºytkownika (dla ≈õrodowiska produkcyjnego)
# raw_user = spark.sql("SELECT current_user()").first()[0]
raw_user = "trainer"  # Dla ≈õrodowiska szkoleniowego

import re
user_slug = re.sub(
    r'[^a-z0-9]', 
    '_', 
    raw_user.lower()
)

print(f"User slug: {user_slug}")

# --- KONFIGURACJA ARCHITEKTURY ---
# Wyb√≥r strategii izolacji: 'CATALOG' (rekomendowana) lub 'SCHEMA' (fallback)
ISOLATION_MODE = 'CATALOG' 

if ISOLATION_MODE == 'CATALOG':
    # Opcja 1: Izolacja Katalogami (Czysty kod: FROM bronze.orders)
    # Wymaga uprawnie≈Ñ CREATE CATALOG
    CATALOG = f"ecommerce_platform_{user_slug}"
    BRONZE_SCHEMA = "bronze"
    SILVER_SCHEMA = "silver"
    GOLD_SCHEMA   = "gold"
else:
    # Opcja 2: Izolacja Schematami (Wsp√≥lny katalog: FROM user_bronze.orders)
    # ≈Åatwiejsze uprawnienia
    CATALOG = "ecommerce_platform"
    BRONZE_SCHEMA = f"{user_slug}_bronze"
    SILVER_SCHEMA = f"{user_slug}_silver"
    GOLD_SCHEMA   = f"{user_slug}_gold"

# === ≈öcie≈ºka do dataset√≥w ===
# Dla lokalnego ≈õrodowiska - ≈õcie≈ºka do folderu dataset w tym repo
#import os
#DATASET_BASE_PATH = os.path.abspath("../dataset")

 #Dla Databricks ≈õrodowiska - Unity Catalog Volume:
# Zak≈Çadamy, ≈ºe dane ≈∫r√≥d≈Çowe sƒÖ we wsp√≥lnym katalogu 'training_sources' lub podobnym
# Tutaj dla uproszczenia u≈ºywamy katalogu u≈ºytkownika, ale w realnym scenariuszu by≈Çby to read-only shared volume
DATASET_BASE_PATH = f"/Volumes/{CATALOG}/default/kion_datasets"


print(f"Dataset base path: {DATASET_BASE_PATH}")

# === Tworzenie katalog√≥w i schemat√≥w (tylko w Databricks) ===
try:
    if ISOLATION_MODE == 'CATALOG':
        print(f"Creating/Using Catalog: {CATALOG}...")
        spark.sql(f"CREATE CATALOG IF NOT EXISTS {CATALOG}")
    
    spark.sql(f'USE CATALOG {CATALOG}')
    
    for s in [BRONZE_SCHEMA, SILVER_SCHEMA, GOLD_SCHEMA]:
        spark.sql(f'CREATE SCHEMA IF NOT EXISTS {CATALOG}.{s}')
    
    # Opcjonalnie: Utw√≥rz wolumen na dane je≈õli nie istnieje (dla cel√≥w szkoleniowych)
    spark.sql(f"CREATE SCHEMA IF NOT EXISTS {CATALOG}.default")
    # spark.sql(f"CREATE VOLUME IF NOT EXISTS {CATALOG}.default.kion_datasets") 
    
    spark.sql(f'USE SCHEMA {BRONZE_SCHEMA}')
    print("‚úì Unity Catalog resources created successfully")
except Exception as e:
    print(f"‚ö† Error configuring Unity Catalog: {e}")
    print("Ensure you have CREATE CATALOG or CREATE SCHEMA permissions.")

# === Wy≈õwietl informacje o katalogu ===
print("\n=== Informacje o katalogu ===")
display(
    spark.sql(f"DESCRIBE CATALOG EXTENDED {CATALOG}")
)

# === Podsumowanie konfiguracji u≈ºytkownika ===")
display(
    spark.createDataFrame(
        [
            (
                raw_user, 
                f'{CATALOG}.{BRONZE_SCHEMA}', 
                f'{CATALOG}.{SILVER_SCHEMA}', 
                f'{CATALOG}.{GOLD_SCHEMA}',
                DATASET_BASE_PATH
            )
        ],
        ['user', 'bronze_schema', 'silver_schema', 'gold_schema', 'dataset_path']
    )
)

print("\n‚úì Inicjalizacja zako≈Ñczona pomy≈õlnie!")
print(f"‚úì Tryb izolacji: {ISOLATION_MODE}")
print(f"‚úì Katalog roboczy: {CATALOG}")
print(f"‚úì Schematy: {BRONZE_SCHEMA}, {SILVER_SCHEMA}, {GOLD_SCHEMA}")
