# ƒÜwiczenie: Wdro≈ºenie DataBota z uwierzytelnieniem u≈ºytkownik√≥w

**Czas trwania:** 45 minut

**Cel ƒáwiczenia:** W tym ƒáwiczeniu stworzymy prostƒÖ aplikacjƒô webowƒÖ udostƒôpniajƒÖcƒÖ DataBota u≈ºytkownikom, skonfigurujemy uwierzytelnianie u≈ºytkownik√≥w z wykorzystaniem Azure AD/EntraID i zintegrujemy backend DataBota z interfejsem.

## 1. Wprowadzenie do udostƒôpniania modeli LLM w organizacji

Aby modele jƒôzykowe, takie jak nasz DataBot, mog≈Çy byƒá efektywnie wykorzystywane w organizacji, musimy zapewniƒá odpowiedni interfejs dostƒôpu dla u≈ºytkownik√≥w ko≈Ñcowych. Istnieje kilka kluczowych aspekt√≥w, kt√≥re nale≈ºy wziƒÖƒá pod uwagƒô:

- **Metody dostƒôpu**: REST API, aplikacje webowe, integracja z aplikacjami biurowymi (Teams, Slack)
- **Bezpiecze≈Ñstwo**: Uwierzytelnianie u≈ºytkownik√≥w, autoryzacja dostƒôpu do danych, szyfrowanie komunikacji
- **Wydajno≈õƒá**: Optymalizacja koszt√≥w, r√≥wnowa≈ºenie obciƒÖ≈ºenia, buforowanie czƒôsto zadawanych pyta≈Ñ
- **UX (User Experience)**: Intuicyjny interfejs, obs≈Çuga historii konwersacji, formatowanie odpowiedzi
- **Monitorowanie**: ≈öledzenie u≈ºycia, analiza zapyta≈Ñ, zbieranie feedbacku od u≈ºytkownik√≥w

W tym ƒáwiczeniu skupimy siƒô na tworzeniu aplikacji webowej z wykorzystaniem Streamlit, kt√≥ra zapewni przyjazny interfejs dla DataBota, oraz na implementacji uwierzytelniania u≈ºytkownik√≥w przy u≈ºyciu Azure AD/EntraID.

## 2. Przygotowanie ≈õrodowiska dla aplikacji

Zamiast lokalnie instalowaƒá ≈õrodowisko i uruchamiaƒá backend, sugerujemy:

### üîß Wariant 1 ‚Äì uruchomienie backendu jako job w Databricks:
1. Przejd≈∫ do zak≈Çadki **Workflows** > **Jobs**.
2. Utw√≥rz nowy Job z notatnikiem zawierajƒÖcym backend lub FastAPI.
3. Ustaw parametr `uvicorn app:app --host 0.0.0.0 --port 8000` je≈õli u≈ºywasz `%sh`.

### üîß Wariant 2 ‚Äì wdro≈ºenie frontendu poza Databricks (zalecane):
1. U≈ºyj **Azure App Service** lub **Static Web Apps**.
2. Sekrety i endpointy mogƒÖ byƒá zarzƒÖdzane przez Databricks Secrets + REST API.


In [None]:
# ‚õîÔ∏è Instalacja rƒôczna bibliotek
# %pip install fastapi uvicorn msal

Zamiast instalacji lokalnej, dodaj biblioteki do klastra Databricks:

1. Przejd≈∫ do zak≈Çadki **Compute** > wybierz sw√≥j klaster.
2. Kliknij **Libraries** > **Install New** > **PyPI**.
3. Wpisz nazwƒô biblioteki, np. `fastapi`, `uvicorn`, `msal`.


## 3. Rejestracja aplikacji w Azure AD/EntraID

Aby aplikacja frontendowa mog≈Ça korzystaƒá z modelu, nale≈ºy zarejestrowaƒá jƒÖ w Azure:

### üîß Kroki:
1. Przejd≈∫ do [portal.azure.com](https://portal.azure.com), wybierz **Microsoft Entra ID**.
2. Wybierz **App registrations** ‚Üí **New registration**.
3. Wprowad≈∫ nazwƒô i URI aplikacji (np. http://localhost:8000 lub URL aplikacji w Azure).
4. Po rejestracji:
   - Skopiuj `Application (client) ID`
   - Skonfiguruj `Redirect URI`
   - Utw√≥rz `Client secret` i zapisz go jako sekret w Databricks (`Secrets` ‚Üí `Create Secret Scope`).

Model mo≈ºe byƒá chroniony przez weryfikacjƒô tokena przes≈Çanego przez klienta.


In [None]:
# Konfiguracja po≈õwiadcze≈Ñ aplikacji Azure AD
# W ≈õrodowisku produkcyjnym te warto≈õci powinny byƒá przechowywane w Azure Key Vault lub Databricks Secrets

# Warto≈õci z rejestracji aplikacji w Azure AD
CLIENT_ID = "YOUR_APPLICATION_CLIENT_ID"  # ID aplikacji
CLIENT_SECRET = "YOUR_APPLICATION_CLIENT_SECRET"  # Sekret aplikacji
TENANT_ID = "YOUR_TENANT_ID"  # ID katalogu (tenant)
AUTHORITY = f"https://login.microsoftonline.com/{TENANT_ID}"
REDIRECT_URI = "http://localhost:8501"  # URI przekierowania, taki sam jak przy rejestracji aplikacji

# Zakres uprawnie≈Ñ
SCOPE = ["https://graph.microsoft.com/.default"]

# Zapisanie jako zmienne ≈õrodowiskowe
os.environ["AZURE_CLIENT_ID"] = CLIENT_ID
os.environ["AZURE_CLIENT_SECRET"] = CLIENT_SECRET
os.environ["AZURE_TENANT_ID"] = TENANT_ID
os.environ["AZURE_AUTHORITY"] = AUTHORITY
os.environ["AZURE_REDIRECT_URI"] = REDIRECT_URI

print("Skonfigurowano po≈õwiadczenia aplikacji Azure AD")

## 4. Tworzenie frontendu DataBota z u≈ºyciem Streamlit

Streamlit to biblioteka Python, kt√≥ra umo≈ºliwia szybkie tworzenie interaktywnych aplikacji webowych. Jest idealna do prototypowania interfejs√≥w dla modeli ML/AI.

In [None]:
# Przyk≈Çadowy kod frontendu Streamlit
# Plik: databot_app.py

streamlit_code = '''
import streamlit as st
import requests
import json
import os
import uuid
from msal import ConfidentialClientApplication, PublicClientApplication
import time

# Konfiguracja aplikacji
st.set_page_config(
    page_title="Enterprise DataBot",
    page_icon="ü§ñ",
    layout="wide"
)

# Parametry uwierzytelniania Azure AD
CLIENT_ID = os.environ.get("AZURE_CLIENT_ID")
CLIENT_SECRET = os.environ.get("AZURE_CLIENT_SECRET")
TENANT_ID = os.environ.get("AZURE_TENANT_ID")
AUTHORITY = os.environ.get("AZURE_AUTHORITY")
REDIRECT_URI = os.environ.get("AZURE_REDIRECT_URI")
SCOPE = ["https://graph.microsoft.com/.default"]

# Endpoint DataBota (mo≈ºna zastƒÖpiƒá rzeczywistym endpointem API)
DATABOT_API_ENDPOINT = "http://localhost:5000/api/databot/query"

# Funkcja do uwierzytelniania u≈ºytkownika
def authenticate_user():
    # Inicjalizacja aplikacji MSAL
    app = ConfidentialClientApplication(
        client_id=CLIENT_ID,
        client_credential=CLIENT_SECRET,
        authority=AUTHORITY
    )
    
    # Generowanie URL do logowania
    auth_url = app.get_authorization_request_url(
        scopes=SCOPE,
        state=str(uuid.uuid4()),
        redirect_uri=REDIRECT_URI
    )
    
    # Przekierowanie u≈ºytkownika do logowania
    st.markdown(f"[Login with Microsoft]({auth_url})")
    
    # Oczekiwanie na kod autoryzacji (w rzeczywistej aplikacji by≈Çoby to obs≈Çugiwane przez backend)
    auth_code = st.text_input("Po zalogowaniu wklej kod autoryzacji z URL:", type="password")
    
    if auth_code:
        try:
            # Wymiana kodu autoryzacji na token dostƒôpu
            result = app.acquire_token_by_authorization_code(
                code=auth_code,
                scopes=SCOPE,
                redirect_uri=REDIRECT_URI
            )
            
            if "access_token" in result:
                st.session_state["access_token"] = result["access_token"]
                st.session_state["user_info"] = result.get("id_token_claims", {})
                st.success("Zalogowano pomy≈õlnie!")
                time.sleep(1)  # Kr√≥tkie op√≥≈∫nienie przed od≈õwie≈ºeniem
                st.experimental_rerun()  # Od≈õwie≈ºenie strony
            else:
                st.error(f"B≈ÇƒÖd uwierzytelniania: {result.get('error_description', 'Nieznany b≈ÇƒÖd')}")
        except Exception as e:
            st.error(f"WystƒÖpi≈Ç b≈ÇƒÖd: {str(e)}")

# Funkcja do wysy≈Çania zapyta≈Ñ do DataBota
def query_databot(query, access_token):
    # W rzeczywistej aplikacji tutaj by≈Çoby wywo≈Çanie API DataBota
    # Na potrzeby demonstracji u≈ºywamy symulowanej odpowiedzi
    
    # Symulacja op√≥≈∫nienia odpowiedzi
    with st.spinner("DataBot przetwarza zapytanie..."):
        time.sleep(1.5)  # Symulacja czasu przetwarzania
    
    # Symulowana odpowied≈∫
    if "azure" in query.lower() or "microsoft" in query.lower():
        return "Azure to chmura obliczeniowa Microsoftu oferujƒÖca szeroki zakres us≈Çug, w tym obliczenia, analitykƒô, przechowywanie i sieci. Azure umo≈ºliwia tworzenie, wdra≈ºanie i zarzƒÖdzanie aplikacjami w globalnej sieci centr√≥w danych Microsoft."
    elif "databricks" in query.lower():
        return "Databricks to ujednolicona platforma analityczna oparta na Apache Spark, kt√≥ra umo≈ºliwia zespo≈Çom wsp√≥≈Çpracƒô nad danymi, uczeniem maszynowym i analitykƒÖ w jednym miejscu. ≈ÅƒÖczy najlepsze cechy hurtowni danych i jezior danych w jednƒÖ architekturƒô Lakehouse."
    elif "databot" in query.lower():
        return "DataBot to inteligentny asystent AI, kt√≥ry ≈ÇƒÖczy modele jƒôzykowe z dostƒôpem do danych organizacyjnych. Wykorzystuje architekturƒô RAG (Retrieval Augmented Generation) do dostarczania odpowiedzi opartych na wewnƒôtrznych danych firmy."
    else:
        # Domy≈õlna odpowied≈∫ dla innych zapyta≈Ñ
        return f"Zrozumia≈Çem twoje pytanie: '{query}'. W rzeczywistej implementacji DataBot otrzyma≈Çby odpowied≈∫ z backendu, kt√≥ry wykona≈Çby wyszukiwanie w danych organizacyjnych i wykorzysta≈Ç model LLM do wygenerowania odpowiedzi."

# G≈Ç√≥wny interfejs aplikacji
def main():
    # Nag≈Ç√≥wek aplikacji
    st.title("Enterprise DataBot ü§ñ")
    st.markdown("---")
    
    # Inicjalizacja stanu sesji, je≈õli nie istnieje
    if "chat_history" not in st.session_state:
        st.session_state.chat_history = []
    
    if "access_token" not in st.session_state:
        # U≈ºytkownik nie jest zalogowany, poka≈º formularz logowania
        st.subheader("Zaloguj siƒô, aby korzystaƒá z Enterprise DataBot")
        authenticate_user()
    else:
        # U≈ºytkownik jest zalogowany, poka≈º interfejs chatu
        user_info = st.session_state.get("user_info", {})
        user_name = user_info.get("name", "U≈ºytkownik")
        
        # Panel boczny z informacjami o u≈ºytkowniku
        with st.sidebar:
            st.subheader("Profil u≈ºytkownika")
            st.write(f"Zalogowano jako: **{user_name}**")
            
            # Przycisk wylogowania
            if st.button("Wyloguj"):
                # Usuniƒôcie danych sesji przy wylogowaniu
                for key in ["access_token", "user_info", "chat_history"]:
                    if key in st.session_state:
                        del st.session_state[key]
                st.experimental_rerun()
            
            st.markdown("---")
            st.subheader("O aplikacji")
            st.info(
                "Enterprise DataBot to inteligentny asystent AI, kt√≥ry ≈ÇƒÖczy modele jƒôzykowe z "
                "dostƒôpem do danych organizacyjnych. Mo≈ºesz zadawaƒá pytania dotyczƒÖce firmowych "
                "dokument√≥w, danych i procedur."
            )
        
        # G≈Ç√≥wny obszar chatu
        chat_container = st.container()
        
        # Wy≈õwietlenie historii chatu
        with chat_container:
            for i, (role, text) in enumerate(st.session_state.chat_history):
                if role == "user":
                    st.markdown(f"**üë§ {user_name}:** {text}")
                else:  # role == "assistant"
                    st.markdown(f"**ü§ñ DataBot:** {text}")
                
                # Dodanie separatora miƒôdzy wiadomo≈õciami, ale nie po ostatniej
                if i < len(st.session_state.chat_history) - 1:
                    st.markdown("---")
        
        # Formularz do nowego zapytania
        with st.form(key="query_form"):
            query = st.text_area("Zadaj pytanie DataBotowi:", height=100)
            submit_button = st.form_submit_button(label="Wy≈õlij")
            
            if submit_button and query.strip():
                # Dodanie zapytania u≈ºytkownika do historii
                st.session_state.chat_history.append(("user", query))
                
                # Wys≈Çanie zapytania do DataBota
                access_token = st.session_state["access_token"]
                response = query_databot(query, access_token)
                
                # Dodanie odpowiedzi DataBota do historii
                st.session_state.chat_history.append(("assistant", response))
                
                # Od≈õwie≈ºenie strony, aby wy≈õwietliƒá nowe wiadomo≈õci
                st.experimental_rerun()

# Uruchomienie aplikacji
if __name__ == "__main__":
    main()
'''

# Zapisanie kodu do pliku
app_file_path = "databot_app.py"
with open(app_file_path, "w") as f:
    f.write(streamlit_code)

print(f"Kod aplikacji Streamlit zosta≈Ç zapisany do pliku: {app_file_path}")

Przeanalizujmy g≈Ç√≥wne elementy kodu aplikacji:

1. **Konfiguracja aplikacji Streamlit**: Ustawienia strony, tytu≈Ç, ikona i uk≈Çad
2. **Uwierzytelnianie u≈ºytkownika**: Wykorzystanie biblioteki MSAL do uwierzytelniania z Azure AD
3. **Obs≈Çuga sesji**: Przechowywanie tokenu dostƒôpu i informacji o u≈ºytkowniku w st.session_state
4. **Interfejs chatu**: Panel boczny z informacjami o u≈ºytkowniku i g≈Ç√≥wny obszar konwersacji
5. **Przetwarzanie zapyta≈Ñ**: Funkcja query_databot do wysy≈Çania zapyta≈Ñ i odbierania odpowiedzi

## 5. Tworzenie backendu do obs≈Çugi zapyta≈Ñ DataBota

Teraz stworzymy backend, kt√≥ry bƒôdzie odpowiedzialny za przetwarzanie zapyta≈Ñ od frontendu, weryfikacjƒô tokenu uwierzytelniania i komunikacjƒô z modelem DataBota.

In [None]:
# Przyk≈Çadowy kod backendu z Flask
# Plik: databot_api.py

flask_code = '''
from flask import Flask, request, jsonify
import jwt
import requests
import os
import json
from functools import wraps

# Inicjalizacja aplikacji Flask
app = Flask(__name__)

# Konfiguracja Azure AD
CLIENT_ID = os.environ.get("AZURE_CLIENT_ID")
TENANT_ID = os.environ.get("AZURE_TENANT_ID")
JWKS_URI = f"https://login.microsoftonline.com/{TENANT_ID}/discovery/v2.0/keys"

# Funkcja pobierajƒÖca klucze publiczne z Azure AD
def get_jwks():
    response = requests.get(JWKS_URI)
    if response.status_code == 200:
        return response.json()["keys"]
    else:
        raise Exception(f"Nie uda≈Ço siƒô pobraƒá kluczy JWT: {response.status_code}")

# Dekorator do weryfikacji tokenu JWT
def verify_token(f):
    @wraps(f)
    def decorated(*args, **kwargs):
        # Pobranie tokenu z nag≈Ç√≥wka Authorization
        auth_header = request.headers.get("Authorization")
        if not auth_header or not auth_header.startswith("Bearer "):
            return jsonify({"error": "Brak tokenu uwierzytelniajƒÖcego"}), 401
        
        token = auth_header.split(" ")[1]
        
        try:
            # Dekodowanie tokenu bez weryfikacji (by pobraƒá kid)
            header = jwt.get_unverified_header(token)
            
            # Pobranie klucza publicznego odpowiadajƒÖcego kid
            jwks = get_jwks()
            public_key = None
            for key in jwks:
                if key["kid"] == header["kid"]:
                    public_key = jwt.algorithms.RSAAlgorithm.from_jwk(json.dumps(key))
                    break
            
            if not public_key:
                return jsonify({"error": "Nie znaleziono odpowiedniego klucza publicznego"}), 401
            
            # Weryfikacja tokenu
            payload = jwt.decode(
                token,
                public_key,
                algorithms=["RS256"],
                audience=CLIENT_ID,
                options={"verify_exp": True}
            )
            
            # Dodanie informacji o u≈ºytkowniku do kontekstu ≈ºƒÖdania
            request.user = payload
            
            return f(*args, **kwargs)
        except jwt.ExpiredSignatureError:
            return jsonify({"error": "Token wygas≈Ç"}), 401
        except jwt.InvalidTokenError as e:
            return jsonify({"error": f"Nieprawid≈Çowy token: {str(e)}"}), 401
    
    return decorated

# Symulacja modelu DataBota (w rzeczywistej aplikacji tutaj by≈Çoby wywo≈Çanie modelu)
def process_query(query, user_info):
    # W rzeczywistej implementacji tutaj by≈Çoby wywo≈Çanie modelu DataBota
    # Na potrzeby demonstracji zwracamy symulowanƒÖ odpowied≈∫
    user_name = user_info.get("name", "u≈ºytkownik")
    
    if "azure" in query.lower() or "microsoft" in query.lower():
        return f"Cze≈õƒá {user_name}! Azure to chmura obliczeniowa Microsoftu oferujƒÖca szeroki zakres us≈Çug, w tym obliczenia, analitykƒô, przechowywanie i sieci. Azure umo≈ºliwia tworzenie, wdra≈ºanie i zarzƒÖdzanie aplikacjami w globalnej sieci centr√≥w danych Microsoft."
    elif "databricks" in query.lower():
        return f"Cze≈õƒá {user_name}! Databricks to ujednolicona platforma analityczna oparta na Apache Spark, kt√≥ra umo≈ºliwia zespo≈Çom wsp√≥≈Çpracƒô nad danymi, uczeniem maszynowym i analitykƒÖ w jednym miejscu. ≈ÅƒÖczy najlepsze cechy hurtowni danych i jezior danych w jednƒÖ architekturƒô Lakehouse."
    elif "databot" in query.lower():
        return f"Cze≈õƒá {user_name}! DataBot to inteligentny asystent AI, kt√≥ry ≈ÇƒÖczy modele jƒôzykowe z dostƒôpem do danych organizacyjnych. Wykorzystuje architekturƒô RAG (Retrieval Augmented Generation) do dostarczania odpowiedzi opartych na wewnƒôtrznych danych firmy."
    else:
        # Domy≈õlna odpowied≈∫ dla innych zapyta≈Ñ
        return f"Cze≈õƒá {user_name}! Zrozumia≈Çem twoje pytanie: '{query}'. W rzeczywistej implementacji DataBot wykona≈Çby wyszukiwanie w danych organizacyjnych i wykorzysta≈Ç model LLM do wygenerowania odpowiedzi."

# Endpoint do przetwarzania zapyta≈Ñ
@app.route("/api/databot/query", methods=["POST"])
@verify_token
def query_databot():
    # Pobranie danych z ≈ºƒÖdania
    data = request.json
    if not data or "query" not in data:
        return jsonify({"error": "Brak zapytania w ≈ºƒÖdaniu"}), 400
    
    query = data["query"]
    user_info = request.user
    
    # Przetworzenie zapytania przez model DataBota
    response = process_query(query, user_info)
    
    return jsonify({
        "response": response,
        "user": user_info.get("name", "unknown"),
        "timestamp": "2023-06-20T12:34:56Z"  # W rzeczywistej aplikacji by≈Çby aktualny czas
    })

# Endpoint healthcheck
@app.route("/health", methods=["GET"])
def health_check():
    return jsonify({"status": "ok"})

# Uruchomienie aplikacji
if __name__ == "__main__":
    app.run(host="0.0.0.0", port=5000, debug=True)
'''

# Zapisanie kodu do pliku
api_file_path = "databot_api.py"
with open(api_file_path, "w") as f:
    f.write(flask_code)

print(f"Kod API backendu zosta≈Ç zapisany do pliku: {api_file_path}")

Kluczowe elementy backendu to:

1. **Weryfikacja token√≥w JWT**: Bezpieczna weryfikacja token√≥w u≈ºywanych do uwierzytelniania u≈ºytkownik√≥w
2. **Pobieranie informacji o u≈ºytkowniku**: Ekstrakcja danych o u≈ºytkowniku z tokenu JWT
3. **Przetwarzanie zapyta≈Ñ**: Funkcja process_query, kt√≥ra w rzeczywistej implementacji wywo≈Çywa≈Çaby model DataBota
4. **Endpoint REST API**: /api/databot/query do obs≈Çugi zapyta≈Ñ od frontendu
5. **Healthcheck**: Prosty endpoint /health do monitorowania stanu aplikacji

## 6. Integracja frontendu z backendem DataBota

Teraz zmodyfikujemy naszƒÖ aplikacjƒô Streamlit, aby komunikowa≈Ça siƒô z backendem Flask.

In [None]:
# Zmodyfikowany fragment kodu Streamlit do integracji z backendem
# Plik: databot_app_integrated.py

integration_code = '''
# Funkcja do wysy≈Çania zapyta≈Ñ do API DataBota
def query_databot(query, access_token):
    headers = {
        "Authorization": f"Bearer {access_token}",
        "Content-Type": "application/json"
    }
    
    data = {
        "query": query
    }
    
    try:
        # Wys≈Çanie zapytania do backendu
        with st.spinner("DataBot przetwarza zapytanie..."):
            response = requests.post(
                DATABOT_API_ENDPOINT,
                headers=headers,
                json=data,
                timeout=30  # Timeout w sekundach
            )
        
        if response.status_code == 200:
            result = response.json()
            return result["response"]
        elif response.status_code == 401:
            st.error("Sesja wygas≈Ça. Proszƒô zalogowaƒá siƒô ponownie.")
            # Usuniƒôcie tokenu z sesji
            if "access_token" in st.session_state:
                del st.session_state["access_token"]
            st.experimental_rerun()
            return None
        else:
            st.error(f"B≈ÇƒÖd API: {response.status_code} - {response.text}")
            return f"Przepraszam, wystƒÖpi≈Ç b≈ÇƒÖd podczas przetwarzania zapytania (kod {response.status_code})."
    except requests.exceptions.RequestException as e:
        st.error(f"B≈ÇƒÖd po≈ÇƒÖczenia z API: {str(e)}")
        return "Przepraszam, nie mogƒô po≈ÇƒÖczyƒá siƒô z backendem DataBota. Proszƒô spr√≥bowaƒá ponownie p√≥≈∫niej."
'''

print("Fragment kodu integracji frontendu z backendem")
print(integration_code)

Ten fragment kodu zastƒôpuje symulowanƒÖ funkcjƒô `query_databot` w naszej aplikacji Streamlit. Nowa wersja:

1. Wysy≈Ça ≈ºƒÖdanie HTTP POST do backendu z tokenem dostƒôpu w nag≈Ç√≥wku Authorization
2. Obs≈Çuguje r√≥≈ºne kody odpowiedzi (200 - sukces, 401 - brak autoryzacji, inne - b≈ÇƒÖd)
3. Wy≈õwietla informacje o postƒôpie i b≈Çƒôdach u≈ºytkownikowi
4. Obs≈Çuguje problemy z po≈ÇƒÖczeniem i limity czasowe

## 7. Wdro≈ºenie aplikacji w Databricks

Aplikacjƒô mo≈ºemy wdro≈ºyƒá na kilka sposob√≥w, ale jednym z najprostszych jest u≈ºycie Databricks Apps.

In [None]:
# Instrukcje wdra≈ºania aplikacji w Databricks
deployment_instructions = """
### Wdra≈ºanie aplikacji w Databricks

#### Metoda 1: Wdra≈ºanie przez interfejs u≈ºytkownika
1. Przejd≈∫ do workspace Databricks
2. Wybierz sekcjƒô "Repos" (Repozytoria)
3. Utw√≥rz nowe repozytorium lub u≈ºyj istniejƒÖcego
4. Prze≈õlij pliki aplikacji (databot_app.py i inne) do repozytorium
5. Przejd≈∫ do sekcji "Apps" (Aplikacje)
6. Kliknij "Create App" (Utw√≥rz aplikacjƒô)
7. Wybierz typ aplikacji: Streamlit
8. Wska≈º ≈õcie≈ºkƒô do g≈Ç√≥wnego pliku aplikacji (databot_app.py)
9. Skonfiguruj zasoby (rozmiar klastra)
10. Kliknij "Create" (Utw√≥rz)

#### Metoda 2: Wdra≈ºanie przez API Databricks (przyk≈Çadowy kod)
"""

print(deployment_instructions)

# Przyk≈Çadowy kod do wdra≈ºania aplikacji przez API Databricks
deployment_code = '''
from databricks.sdk import WorkspaceClient
from databricks.sdk.service import apps

# Inicjalizacja klienta Workspace
client = WorkspaceClient()

# Definicja aplikacji
app_definition = apps.AppCreate(
    name="DataBot",
    app_type="STREAMLIT",
    file_path="/Repos/your_username/databot_app/databot_app.py",
    cluster_settings=apps.ClusterSettings(
        cluster_size="Small"
    )
)

# Utworzenie aplikacji
try:
    app = client.apps.create(app_definition)
    print(f"Aplikacja utworzona pomy≈õlnie. App ID: {app.app_id}")
    
    # Pobranie URL aplikacji
    app_info = client.apps.get(app.app_id)
    print(f"URL aplikacji: {app_info.app_url}")
except Exception as e:
    print(f"B≈ÇƒÖd podczas tworzenia aplikacji: {str(e)}")
'''

print(deployment_code)

## 8. Filtrowanie danych po roli u≈ºytkownika

Wa≈ºnym aspektem DataBota w organizacji jest kontrola dostƒôpu do danych. Poni≈ºej przyk≈Çad implementacji mechanizmu filtrowania danych w zale≈ºno≈õci od roli u≈ºytkownika.

In [None]:
# Przyk≈Çadowy kod do filtrowania danych po roli u≈ºytkownika
# Plik: databot_access_control.py

access_control_code = '''
# Definicja uprawnie≈Ñ dla r√≥≈ºnych r√≥l
ROLE_PERMISSIONS = {
    "User": ["read:public"],
    "Analyst": ["read:public", "read:department", "read:analytics"],
    "Admin": ["read:public", "read:department", "read:analytics", "read:confidential", "write:data"]
}

# Funkcja do pobierania roli u≈ºytkownika z token√≥w
def get_user_role(user_info):
    # W rzeczywistej aplikacji role by≈Çyby pobierane z token√≥w lub z bazy danych
    # Na potrzeby demonstracji przypisujemy role na podstawie identyfikatora u≈ºytkownika
    user_id = user_info.get("oid", "")  # object ID u≈ºytkownika w Azure AD
    
    # Przyk≈Çadowe mapowanie identyfikator√≥w u≈ºytkownik√≥w na role
    # W rzeczywistej aplikacji by≈Çoby to pobierane z bazy danych lub serwisu autoryzacji
    user_roles = {
        "user1-id": "Admin",
        "user2-id": "Analyst",
        # Domy≈õlna rola dla pozosta≈Çych u≈ºytkownik√≥w
        "default": "User"
    }
    
    return user_roles.get(user_id, user_roles["default"])

# Funkcja do sprawdzania, czy u≈ºytkownik ma uprawnienia do konkretnego zasobu
def has_permission(user_info, required_permission):
    role = get_user_role(user_info)
    permissions = ROLE_PERMISSIONS.get(role, [])
    return required_permission in permissions

# Przyk≈Çad u≈ºycia w procesie przetwarzania zapytania
def process_query_with_access_control(query, user_info):
    # Okre≈õlenie wymaganych uprawnie≈Ñ na podstawie tre≈õci zapytania
    required_permission = "read:public"  # Domy≈õlne uprawnienie
    
    # Analiza zapytania pod kƒÖtem wra≈ºliwych danych
    if any(keyword in query.lower() for keyword in ["poufne", "tajne", "confidential", "sensitive"]):
        required_permission = "read:confidential"
    elif any(keyword in query.lower() for keyword in ["finanse", "przychody", "bud≈ºet", "finance", "revenue"]):
        required_permission = "read:analytics"
    
    # Sprawdzenie uprawnie≈Ñ
    if not has_permission(user_info, required_permission):
        return "Przepraszam, nie masz uprawnie≈Ñ do dostƒôpu do tych informacji. Skontaktuj siƒô z administratorem, aby uzyskaƒá dostƒôp."
    
    # Przetworzenie zapytania (tutaj by≈Çoby wywo≈Çanie w≈Ça≈õciwego modelu DataBota)
    # ...
    
    # Przyk≈Çadowa odpowied≈∫
    return f"Przetworzono zapytanie z uprawnieniem {required_permission}. W rzeczywistej aplikacji DataBot dostarczy≈Çby odpowiedzi dostosowane do Twojego poziomu dostƒôpu."
'''

# Zapisanie kodu do pliku
access_control_file_path = "databot_access_control.py"
with open(access_control_file_path, "w") as f:
    f.write(access_control_code)

print(f"Kod kontroli dostƒôpu zosta≈Ç zapisany do pliku: {access_control_file_path}")

Ten kod implementuje mechanizm kontroli dostƒôpu, kt√≥ry:

1. Definiuje r√≥≈ºne role u≈ºytkownik√≥w i ich uprawnienia
2. Przypisuje role u≈ºytkownikom na podstawie ich identyfikator√≥w
3. Sprawdza, czy u≈ºytkownik ma wymagane uprawnienia do konkretnych danych
4. Analizuje tre≈õƒá zapytania, aby okre≈õliƒá wymagany poziom dostƒôpu
5. Zwraca odpowiednie odpowiedzi w zale≈ºno≈õci od uprawnie≈Ñ u≈ºytkownika

## 9. Lokalne uruchomienie aplikacji

Dla cel√≥w testowych i demonstracyjnych mo≈ºemy uruchomiƒá aplikacjƒô lokalnie.

In [None]:
# Instrukcje uruchomienia aplikacji lokalnie (dla cel√≥w demonstracyjnych)
local_run_instructions = """
### Uruchomienie aplikacji lokalnie (dla cel√≥w demonstracyjnych)

#### Frontend (Streamlit)
```bash
streamlit run databot_app.py
```

#### Backend (Flask)
```bash
python databot_api.py
```

Po uruchomieniu obu aplikacji, frontend Streamlit bƒôdzie dostƒôpny pod adresem http://localhost:8501
"""

print(local_run_instructions)

Pamiƒôtaj, ≈ºe w ≈õrodowisku produkcyjnym powinni≈õmy u≈ºywaƒá zarzƒÖdzanych us≈Çug, takich jak Azure App Service, Azure Container Apps lub Databricks Apps, kt√≥re zapewniajƒÖ lepsze bezpiecze≈Ñstwo, skalowalno≈õƒá i niezawodno≈õƒá.

## 10. Zadania do wykonania

1. Zaimplementuj mechanizm b≈Çƒôdnej obs≈Çugi token√≥w (np. wygasanie, od≈õwie≈ºanie)
2. Dodaj mo≈ºliwo≈õƒá eksportu historii konwersacji do pliku
3. Zaimplementuj mechanizm oceny odpowiedzi przez u≈ºytkownik√≥w (thumbs up/down)
4. Rozszerz kontrolƒô dostƒôpu o dodatkowe role i uprawnienia

## Zadania dodatkowe

Je≈õli masz wiƒôcej czasu, mo≈ºesz spr√≥bowaƒá:

1. Dodanie funkcjonalno≈õci ≈õledzenia historii konwersacji w bazie danych
2. Implementacja mechanizmu oceny odpowiedzi przez u≈ºytkownik√≥w (feedback)
3. Dodanie wizualizacji danych w odpowiedziach DataBota
4. Implementacja mechanizmu eksportu konwersacji do pliku

## ≈πr√≥d≈Ça i zasoby dodatkowe

Poni≈ºej znajdujƒÖ siƒô linki do dodatkowych zasob√≥w, kt√≥re mogƒÖ byƒá przydatne:

1. [Dokumentacja Microsoft Identity Platform](https://learn.microsoft.com/pl-pl/azure/active-directory/develop/)
2. [Wprowadzenie do Streamlit](https://docs.streamlit.io/library/get-started)
3. [Dokumentacja Databricks Apps](https://docs.databricks.com/applications/index.html)
4. [Przewodnik po uwierzytelnianiu w Azure](https://learn.microsoft.com/pl-pl/azure/active-directory/authentication/overview-authentication)
5. [Wzorce projektowe dla us≈Çug AI](https://learn.microsoft.com/pl-pl/azure/architecture/patterns/)