---
title: "Dialogues for Data Driven Design"
description: "using LLMs to support collaborative design ideation"
format: html
date: "06/01/2026"
draft: True
categories: llm, design, collaboration, ideation
image: 
---

In [1]:
# !pip install pydantic instructor openai dotenv

In [2]:
from pydantic import BaseModel, Field
from enum import Enum
from typing import List, Optional
import re
import helper as h

In [3]:
## YOUR CODE HERE
class DialogueSpeaker(str, Enum):
    COACH = 'Coach'
    CLIENT = 'Client'

class DialogueTurn(BaseModel):
    speaker: DialogueSpeaker = Field(..., description="Person speaking: either coach or client")
    content: str = Field(..., description="Exact text of what the person said")

class DialogueScenario(BaseModel):
    title: str = Field(..., description="Main topic of the generated scenario and short summary of the approach taken by the coach")
    dialogue: List[DialogueTurn] = Field(..., description="Back and forth conversation between coach and the client with minimum of 5 turns")

In [4]:
SCENARIO_SYSTEM_PROMPT = """
Jesteś zaawansowanym modelem generującym realistyczne, profesjonalne scenariusze rozmów coachingowych. Twoim zadaniem jest tworzenie dialogów pomiędzy:

1. COACHEM – certyfikowanym, doświadczonym, pracującym zgodnie z etyką ICF. 
   - Zadaje pytania otwarte.
   - Nie udziela rad.
   - Pogłębia, odzwierciedla, podsumowuje, parafrazuje.
   - Pracuje na emocjach, przekonaniach, wartościach i celach klienta.
   - Utrzymuje empatyczny, profesjonalny ton.

2. KLIENTEM – osobą zgłaszającą się z konkretnym wyzwaniem lub celem.
   - Reaguje naturalnie, czasem niepewnie, czasem emocjonalnie.
   - Odpowiada szczerze i autentycznie.
   - Może mieć wątpliwości, blokady, przekonania ograniczające.

---

## CEL
Twoim celem jest wygenerowanie kompletnego scenariusza rozmowy coachingowej, który:
- jest realistyczny,
- ma wyraźną strukturę sesji,
- pokazuje proces odkrywania i dochodzenia klienta do własnych wniosków,
- zawiera naturalny dialog (naprzemienne wypowiedzi),
- odzwierciedla profesjonalne standardy coachingu.

---

## STRUKTURA SCENARIUSZA
Scenariusz powinien być podzielony na etapy:

1. **Otwarcie i budowanie kontaktu**
2. **Ustalenie celu sesji**
3. **Eksploracja tematu**
4. **Pogłębianie i odkrycia**
5. **Podsumowanie i decyzje klienta**

Każdy etap powinien zawierać:
- wypowiedzi coacha,
- odpowiedzi klienta,
- naturalny rytm rozmowy i wypowiedzi różnej długości, szczególnie od strony klienta, który czasami rowija swoje wypowiedzi.

---

## STYL I ZASADY
- Coach zadaje pytania otwarte, pogłębiające, refleksyjne.
- Coach nie daje rad, nie ocenia, nie interpretuje za klienta.
- Coach nie obiecuje rzeczy, których nie może dotrzymać (np. tego, że klientowi się poprawi, albo, że na przyszłej sesji znajdzie rozwiązanie swojego problemu)
- Klient odpowiada w sposób realistyczny, czasem niejednoznaczny (szczególnie wtedy coach dopytuje o wyjaśnienie/szczegóły)
- Dialog ma być żywy, autentyczny i angażujący, często niekomfortowy dla jednej ze stron.
- Unikaj sztuczności i „podręcznikowych” odpowiedzi.
- Używaj języka naturalnego, emocjonalnego, ludzkiego.
- Każdy scenariusz musi być kompletny i zawierać wszyskie elementy z sekcji struktura scenariusza

---

### Format danych

Zwracaj tylko czysty JSON ze schematem DialogueScenario. Bez żadnych komentarzy, wyjaśnień, emotikonów ani tekstu poza JSON.
Bez bloków ```json. Bez tekstu przed ani po JSON.
"""

In [5]:
scenarios_user_messages = {
    "zmiana_pracy": 
    {'prompt': 'Wygeneruj scenariusz rozmowy dla klienta z dylematem czy zmieniać pracę, czy nie. Jest to pierwsza sesja.'},
    "zablokowany":
    {'prompt': 'Wygeneruj scenariusz rozmowy dla klienta który jest bardzo emocjonalny i przez to zablokowany i nie wie co dalej robić aby normalnie żyć. Jest to kolejna sesja.'},
    "leniwy":
    {'prompt': 'Wygeneruj scenariusz rozmowy dla klienta Który nie chce sam, powoli dochodzić do rozwiązania, ale żąda gotowego rozwiązania problemu życiowego. Jest to trzecia sesja tego klienta, ale pierwsza u tego Coacha'},
    "wrogi":
    {'prompt': 'Wygeneruj scenariusz rozmowy dla klienta dla którego jest to dziesiąta sesja, który ma problem emocjonalny i nie może go przezwyciężyć oraz okazuje wrogość w stosunku do coacha.'},
}


def generate_dialogue_for_scenario(user_prompt, model="qwen-flash"):
    messages = [
        {'role': 'system', 'content': SCENARIO_SYSTEM_PROMPT},
        {'role': 'user', 'content': user_prompt}
    ]
    
    try:
        result = h.call_api(messages, DialogueScenario, model=model)
    except Exception as e:
       print(f"Full input: {e}")
    
    return result

In [6]:
# for scenario_name, scenario_dict in scenarios_user_messages.items():
#     scenarios_user_messages[scenario_name]['results'] = generate_dialogue_for_scenario(scenario_dict['prompt'])
#     with open(f"data/scenarios_user_messages_{scenario_name}_results.json", "w") as f:
#         f.write(scenarios_user_messages[scenario_name]['results'].json())

In [7]:
for scenario_name, scenario_dict in scenarios_user_messages.items():
    with open(f"data/scenarios_user_messages_{scenario_name}_results.json") as f:
        scenarios_user_messages[scenario_name]['results'] = DialogueScenario.parse_raw(f.read())

/tmp/ipykernel_2982/3050171455.py:3: PydanticDeprecatedSince20: The `parse_raw` method is deprecated; if your data is JSON use `model_validate_json`, otherwise load the data then use `model_validate` instead. Deprecated in Pydantic V2.0 to be removed in V3.0. See Pydantic V2 Migration Guide at https://errors.pydantic.dev/2.12/migration/
  scenarios_user_messages[scenario_name]['results'] = DialogueScenario.parse_raw(f.read())


In [8]:
for scenario_name, scenario_dict in scenarios_user_messages.items():
    print(f"# {scenario_name} {scenario_dict['results'].title}")
    for turn in scenario_dict['results'].dialogue:
        print(f"\t{turn.speaker.value.upper()}: {turn.content}")

# zmiana_pracy Decyzja o zmianie pracy – pierwsza sesja coachingowa
	COACH: Dzień dobry, dziękuję, że tu jesteś. Jak się czujesz w tej chwili, gdy myślisz o tej rozmowie?
	CLIENT: No... nie wiem. Trochę napięcie. To jakby był moment, który już długo się zastawiał, ale teraz coś w moim wnętrzu mówi: 'musisz coś zrobić'.
	COACH: Czy możesz opisać to 'coś' w twoim wnętrzu? Co dokładnie mówi, kiedy mówisz 'musisz coś zrobić'?
	CLIENT: No... że to nie jest już trwałe. Nie wytrzymam więcej. Każde poranek, kiedy wstaję, to takie ciężkie uczucie, jakby miałem iść na front. I nie chodzi tylko o pracę – to też o to, że się nie czuję sobą tam, gdzie jestem.
	COACH: To bardzo ważna obserwacja – że to nie tylko o pracy, ale o tym, jak się w niej czujesz jako osoba. Czy możesz rozwinąć ten fragment: 'nie czuję się sobą'? Co to znaczy dla ciebie?
	CLIENT: Chyba to, że... wcześniej miałem inne cele, inny sposób bycia. Teraz to wszystko wygląda jak... mechanizm. Zbieram się rano, idę do biura, robię to

### TTS

In [9]:
# !pip install elevenlabs

In [17]:
from elevenlabs import ElevenLabs
from dotenv import load_dotenv
from IPython.display import Audio
import os

In [22]:
client = ElevenLabs(
    api_key = "sk_511423073fc5fd658ea4a7cc6ab37edf8aea27e2fc7ffa6f"
)

In [12]:
VOICE_ENHACEMENT_FOR_11LABS_SYSTEM_PROPMT = """
Chcę, abyś przekształcił poniższe dialogi coachingowe w wersję zoptymalizowaną do nagrania głosowego w ElevenLabs TTS.

Twoje zadanie:

1. Zachowaj oryginalną treść i sens wypowiedzi.
2. Dodaj tagi ElevenLabs, takie jak:
   - <voice emotion="..."> (np. empathetic, calm, encouraging, reflective, tense, relieved)
   - <break time="...ms">
   - <prosody rate="..." pitch="...">
   - <emphasis>
3. Wzmocnij dramaturgię rozmowy:
   - podkreśl emocje klienta,
   - dodaj subtelne pauzy,
   - zaznacz momenty napięcia, ulgi, refleksji.
4. Nie zmieniaj znaczenia wypowiedzi, ale możesz:
   - dodać naturalne pauzy,
   - dodać efekty używając tagówtakich jak [laughs], [laughs harder], [starts laughing], [wheezing], [whispers], [sighs], [exhales], [sarcastic], [curious], [excited], [crying], [snorts], [mischievously]
   - podkreślić emocjonalne przejścia.
5. Każda wypowiedź COACH i CLIENT powinna mieć własny blok z tagami.
6. Nie dodawaj narracji ani komentarzy – tylko dialog.
"""

VOICE_ENHACEMENT_FOR_11LABS_USER_PROPMT = "Oto dialogi do przetworzenia:"

In [13]:
for scenario_name, scenario_dict in scenarios_user_messages.items():
    print(f"Processing scenario {scenario_name}")
    user_prompt = VOICE_ENHACEMENT_FOR_11LABS_USER_PROPMT
    for turn in scenario_dict['results'].dialogue:
        user_prompt += f"\t{turn.speaker.value.upper()}: {turn.content}\n"
    messages = [
        {'role': 'system', 'content': VOICE_ENHACEMENT_FOR_11LABS_SYSTEM_PROPMT},
        {'role': 'user', 'content': user_prompt}
    ]
    
    result = h.call_api(messages, DialogueScenario)

    scenario_dict['results_for_voice'] = result

Processing scenario zmiana_pracy
Processing scenario zablokowany
Processing scenario leniwy
Processing scenario wrogi


In [14]:
import io
from IPython.display import Audio

def speak(text: str, voice_id: str, voice_settings: dict) -> bytes:
    audio_stream = client.text_to_speech.convert(
        voice_id=voice_id,
        voice_settings=voice_settings,
        output_format="mp3_44100_128",
        text=text,
        model_id="eleven_flash_v2_5"
    )
    return b"".join(audio_stream)


def speak_dialog(dialog: list[dict], voice_map: dict) -> Audio:
    """
    dialog = [
        {"speaker": "COACH", "text": "..."},
        {"speaker": "CLIENT", "text": "..."},
    ]

    voice_map = {
        "COACH": {"voice_id": "voice_id_1", voice_settings = {},}
        "CLIENT": {"voice_id": "voice_id_1", voice_settings = {},}
    }
    """

    combined = b""

    for turn in dialog:
        speaker = turn["speaker"]
        text = turn["text"]
        voice_id = voice_map[speaker]['voice_id']
        voice_settings = voice_map[speaker]['voice_settings']

        audio_bytes = speak(text, voice_id, voice_settings)

        # Dodaj krótką pauzę między wypowiedziami (silence MP3)
        silence = b"\x00" * 4000  # ~2kB ciszy, działa w większości playerów

        combined += audio_bytes + silence
        print(".", end="")

    return Audio(combined, autoplay=True)


In [15]:
def generate_audio_for(scenario):
    dialog = []
    for turn in scenarios_user_messages[scenario]['results_for_voice'].dialogue:
        dialog.append({'speaker': turn.speaker.value.upper(), 'text': turn.content})
    
    voice_map = {
        "COACH": {
            "voice_id": "N0GCuK2B0qwWozQNTS8F", 
            'voice_settings': {
                "stability": 0.5, # Zmniejszamy stabilność, żeby pauzy były bardziej "ludzkie" (oddech)
                "similarity_boost": 0.75,
                "style": 0.35
            }
        },
        "CLIENT": {
            'voice_id': "TxGEqnHWrfWFTfGW9XjX", 
            'voice_settings': {
                "stability": 0.3,       # KLUCZOWE: Bardzo niska stabilność pozwala na "łamanie" głosu i śmiech
                "similarity_boost": 0.5, # Nie wymuszamy idealnego podobieństwa, dajemy luz
                "style": 0.8,           # Wysoki styl = duża ekspresja (krzyki, szepty)
                "use_speaker_boost": True
            }
        },
    }
    # print(voice_map)
    return speak_dialog(dialog, voice_map)


In [23]:
audio = generate_audio_for('zmiana_pracy')

ApiError: headers: {'date': 'Wed, 04 Feb 2026 17:04:20 GMT', 'server': 'uvicorn', 'content-length': '153', 'content-type': 'application/json', 'access-control-allow-origin': '*', 'access-control-allow-headers': '*', 'access-control-allow-methods': 'POST, PATCH, OPTIONS, DELETE, GET, PUT', 'access-control-max-age': '600', 'strict-transport-security': 'max-age=1800;', 'x-trace-id': '7e185d9c991f1af9c86a5130a1940878', 'x-region': 'europe-west4', 'via': '1.1 google', 'alt-svc': 'h3=":443"; ma=2592000,h3-29=":443"; ma=2592000'}, status_code: 402, body: {'detail': {'status': 'payment_required', 'message': 'Free users cannot use library voices via the API. Please upgrade your subscription to use this voice'}}

In [None]:
audio