In [1]:
%%capture
pip install -r requirements.txt

In [2]:
import re
import numpy as np
import pandas as pd
from pathlib import Path
from typing import Any
from IPython.display import display
from sklearn.preprocessing import StandardScaler
from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score
from sklearn.decomposition import PCA
import ipywidgets as widgets
from ipywidgets import Layout, Button, Box
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
from src.model_loader import LocalModel

<h3>ETAPA 0 - Leitura do CSV (com checagens)</h3>

In [3]:
%%capture
CSV_PATH = Path("input.csv")

assert CSV_PATH.exists(), f"Arquivo não encontrado: {CSV_PATH.resolve()}"

# Tentativas de leitura com encodings comuns
encodings_to_try = ["utf-8", "utf-8-sig", "latin-1"]
last_err = None
df = None
for enc in encodings_to_try:
    try:
        df = pd.read_csv(CSV_PATH, encoding=enc)
        print(f"[OK] Lido com encoding: {enc}")
        break
    except Exception as e:
        last_err = e

if df is None:
    raise RuntimeError(f"Falha ao ler CSV. Último erro: {last_err}")

# Mostra um resumo rápido
print("\n[INFO] Formato do DataFrame:", df.shape)
print("[INFO] Primeiras colunas:", list(df.columns[:10]))
print("\n[INFO] Amostra (5 linhas):")
print(df.head(5))

# Helper para localizar colunas mesmo com sufixos (ex.: 'Type (Remove)')
def find_col(cols, key):
    key = key.lower()
    for c in cols:
        if key in c.lower():
            return c
    return None

# Detecta as colunas principais (só para conferência visual nesta etapa)
col_name = find_col(df.columns, "Name")
col_type  = find_col(df.columns, "Type")
col_env   = find_col(df.columns, "Environment")
col_cr    = find_col(df.columns, "CR")
col_size  = find_col(df.columns, "Size")

print("\n[DETECÇÃO DE COLUNAS]")
print("Type:", col_type)
print("Environment:", col_env)
print("CR:", col_cr)
print("Size:", col_size)

<h3>ETAPA 1 - Seleção de colunas essenciais</h3>

In [4]:
%%capture
# Dicionário com nomes detectados (da etapa anterior)
ESSENTIALS = {
    "name": col_name,
    "type": col_type,
    "env": col_env,
    "cr": col_cr,
    "size": col_size
}

print("\n[INFO] Colunas essenciais selecionadas:")
for k, v in ESSENTIALS.items():
    print(f"  {k:>8} -> {v}")

# Cria uma cópia só com essas colunas
df_work = df[[v for v in ESSENTIALS.values() if v is not None]].copy()

print("\n[INFO] DataFrame de trabalho criado.")
print("[INFO] Formato:", df_work.shape)
print("[INFO] Colunas:", list(df_work.columns))
print("\nPrévia:")
print(df_work.head(10))


<h3>ETAPA 2 - Limpeza e transformação dos dados</h3>

In [5]:
%%capture
print("\nETAPA 2 - Iniciando Limpeza e Transformação...")

# Funções Auxiliares
def parse_cr(x):
    # converter valores de CR para float
    s = str(x).strip()
    if s in ("nan", "", "—", "-", "None"):
        return np.nan
    if "/" in s:
        try:
            a, b = s.split("/", 1)
            return float(a) / float(b)
        except:
            pass
    try:
        return float(s)
    except:
        return np.nan

def clean_text_basic(s):
    # Remove parenteses e normaliza o caps
    s = re.sub(r"\(.*?\)", "", str(s))
    s = re.sub(r"\s+", " ", s)
    return s.strip().title()

def normalize_env(env_str):
    # padronizar ambientes (environment)
    parts = [p.strip().title() for p in str(env_str).split(",") if p.strip()]
    if not parts:
        return "Unknown"
    seen, out = set(), []
    for p in parts:
        if p not in seen:
            seen.add(p)
            out.append(p)
    return ", ".join(out)

#Aplicando limpeza
df_work["Type"] = df_work["Type"].apply(clean_text_basic)
df_work["Size"] =  df_work["Size"].apply(clean_text_basic)
df_work["Environment"] = df_work["Environment"].apply(normalize_env)
df_work["CR_float"] = df_work["CR"].apply(parse_cr)

#Tratando valores faltantes
df_work["CR_float"] = df_work["CR_float"].fillna(0.0)
df_work["Environment"] = df_work["Environment"].replace("", "Unknown")
df_work["Type"] = df_work["Type"].replace("", "Unknown")


# Eliminar duplicatas
before = len(df_work)
df_work.drop_duplicates(inplace=True)
after = len(df_work)

print(f"[INFO] Duplicatas removidas: {before - after}")
print("[INFO] Visualização dos dados limpos:")
print(df_work.head(10))

<h3>ETAPA 3 - Transformação (one-hot e multi-one-hot)</h3>

In [6]:
%%capture
print("\nETAPA 3 - Iniciando Transformação (one-hot e multi-one-hot)...")

#ID estavel apos a limpeza
df_work= df_work.reset_index(drop=True)
df_work.insert(0, "MonsterID", df_work.index + 1)

#One-hot de 'Type' e 'Size'
type_dummies = pd.get_dummies(df_work["Type"], prefix="Type")
size_dummies = pd.get_dummies(df_work["Size"], prefix="Size")

#Multi-one-hot de 'Environment'
known_envs = ["Arctic", "Cave" , "Desert", "Dungeon", "Forest", "Hell", "Mountain", "Plains", "Sky", "Underground", "Urban", "Water", "Unknown"]

def env_one_hot(env_str):
    envs = [e.strip() for e in env_str.split(",") if e.strip()]
    return {f"env_{e}": int(e in envs) for e in known_envs}

env_dummies = df_work["Environment"].apply(env_one_hot).apply(pd.Series)

features = pd.concat([
    df_work[["MonsterID", "CR_float"]],
    type_dummies,
    size_dummies,
    env_dummies
], axis=1)

print("[INFO] Preview das features:",features.shape)
print(features.head(5))

<h3>Exportação final</h3>

In [7]:
print("\nETAPA 4 - Exportação final...")

OUT_DIR = Path("outputs")
OUT_DIR.mkdir(exist_ok=True)

monsters_clean_path = OUT_DIR / "monsters_clean.csv"
monsters_train_path = OUT_DIR / "monsters_train.csv"

if "Name (Remove)" in df_work.columns:
    df_work = df_work.rename(columns={"Name (Remove)": "Name"})

if "Name (Remove)" in df_work.columns:
    df_work = df_work.rename(columns={"Name (Remove)": "Name"})

df_clean = df_work[["MonsterID", "Name", "Type", "Environment", "Size", "CR", "CR_float"]]
df_clean.to_csv("outputs/monsters_clean.csv", index=False)

features.to_csv(monsters_train_path, index=False)

print(f"[INFO] Arquivos exportados:")
print(f"  - Limpo -> {monsters_clean_path.resolve()}")
print(f"  - Treino -> {monsters_train_path.resolve()}")


ETAPA 4 - Exportação final...
[INFO] Arquivos exportados:
  - Limpo -> /home/arthur/UFSJ/IA/Kraken/outputs/monsters_clean.csv
  - Treino -> /home/arthur/UFSJ/IA/Kraken/outputs/monsters_train.csv


<h3>Etapa 4 - Construção da IA</h3>
Usaremos K-Means (Clusterização)

In [8]:
# Carregar o dataset de treino
df_train = pd.read_csv("outputs/monsters_train.csv")

# identificar os argumentos
monster_ids = df_train["MonsterID"]
cols_temat = [c for c in df_train.columns if any(c.lower().startswith(x) for x in ["type_", "env_", "size_"])]
X = df_train[cols_temat].copy()

print(f"[INFO] Número de features usadas para clustering temático: {len(X.columns)}")

# remover colunas raras (monstros únicos em ambientes exóticos)
rare_cols = [c for c in X.columns if X[c].sum() < 3]
if rare_cols:
    print(f"[INFO] Removendo {len(rare_cols)} colunas raras (menos de 3 ocorrências): {rare_cols[:10]}")
    X = X.drop(columns=rare_cols)

scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

#K-means clustering
kmeans_thematic = KMeans(n_clusters=4, random_state=42, n_init="auto")
labels_thematic = kmeans_thematic.fit_predict(X_scaled)

df_clusters_thematic = pd.DataFrame({
    "MonsterID": monster_ids,
    "cluster": labels_thematic
})

# Ligar dados para leitura
df_clean = pd.read_csv("outputs/monsters_clean.csv")

df_final_refined = df_clean.merge(df_clusters_thematic, on="MonsterID", how="left")

# Amostra dos clusters
for c in sorted(df_final_refined["cluster"].unique()):
    print(f"\n=== Cluster {c} (amostra) ===")
    display(
        df_final_refined[df_final_refined["cluster"] == c]
        .sample(min(5, len(df_final_refined[df_final_refined["cluster"] == c])))
        [["Type", "Environment", "Size", "CR", "CR_float"]]
    )

print("\n[INFO] Novo clustering concluído — sem CR_float nas features.")


[INFO] Número de features usadas para clustering temático: 39
[INFO] Removendo 7 colunas raras (menos de 3 ocorrências): ['Type_Fiend Fiend', 'Type_Humanoid Humanoid', 'Type_Temp', 'Size_Varies', 'env_Arctic', 'env_Desert', 'env_Unknown']

=== Cluster 0 (amostra) ===


Unnamed: 0,Type,Environment,Size,CR,CR_float
541,Construct,"Dungeon, Urban",Large,2.0,2.0
621,Ooze,"Cave, Dungeon",Large,2.0,2.0
283,Aberration,"Dungeon, Sky, Underground",Small,0.13,0.13
343,Construct,"Dungeon, Urban",Medium,5.0,5.0
692,Ooze,"Cave, Dungeon, Water",Medium,3.0,3.0



=== Cluster 1 (amostra) ===


Unnamed: 0,Type,Environment,Size,CR,CR_float
272,Humanoid,"Forest, Plains, Urban",Medium,2.0,2.0
353,Humanoid,"Forest, Plains, Urban",Small,0.25,0.25
323,Humanoid,"Forest, Plains, Urban",Medium,10.0,10.0
569,Humanoid,"Forest, Plains, Urban",Medium,3.0,3.0
242,Humanoid,"Forest, Plains, Urban",Medium,2.0,2.0



=== Cluster 2 (amostra) ===


Unnamed: 0,Type,Environment,Size,CR,CR_float
159,Fiend,Hell,Medium,13.0,13.0
120,Fiend,Hell,Large,16.0,16.0
162,Fiend,"Hell, Sky",Large,20.0,20.0
144,Fiend,"Hell, Sky",Large,21.0,21.0
57,Fiend,"Hell, Sky",Medium,5.0,5.0



=== Cluster 3 (amostra) ===


Unnamed: 0,Type,Environment,Size,CR,CR_float
738,Plant,Forest,Medium,0.5,0.5
367,Monstrosity,"Forest, Mountain, Sky",Large,1.0,1.0
314,Giant,"Forest, Plains",Huge,5.0,5.0
766,Monstrosity,"Forest, Mountain",Large,4.0,4.0
276,Monstrosity,"Forest, Mountain",Medium,2.0,2.0



[INFO] Novo clustering concluído — sem CR_float nas features.


<h3>Etapa 5 - Heurística para calcular valor do grupo e do encontro</h3>

In [9]:
#Calcula o valor do grupo baseado em uma heuristica simples
def calcular_valor_grupo(niveis_jogadores):
    qtd_jogadores = len(niveis_jogadores)
    soma_niveis = sum(niveis_jogadores)
    nivel_medio = soma_niveis / qtd_jogadores

    if nivel_medio >= 5:
        valor_grupo = soma_niveis / 2
    else:
        valor_grupo = soma_niveis / 4

    return {
        "qtd_jogadores": qtd_jogadores,
        "soma_niveis": soma_niveis,
        "nivel_medio": nivel_medio,
        "valor_grupo": valor_grupo
    }

#Avalia a dificuldade do encontro baseado na soma dos ND dos monstros
def avaliar_encontro(monstros_df, valor_grupo):
    if "CR_float" in monstros_df.columns:
        soma_nd = monstros_df["CR_float"].sum()
    else:
        soma_nd = 0.0

    if soma_nd >= valor_grupo:
        classe = "impossivel"
    elif soma_nd >= 0.7 * valor_grupo:
        classe = "difícil"
    elif soma_nd >= 0.4 * valor_grupo:
        classe = "médio"
    else:
        classe = "fácil"

    return {
        "soma_nd_monstros": soma_nd,
        "valor_grupo": valor_grupo,
        "avaliacao_encontro": classe
    }

# Seleciona monstros com base no CR alvo
def escolher_por_cr_alvo(df_filtrado, cr_alvo, quantidade_oponentes):
    if "CR_float" not in df_filtrado.columns or df_filtrado["CR_float"].isna().all():
        # fallback: sorteia puro, com repetição se necessário
        if len(df_filtrado) >= quantidade_oponentes:
            return df_filtrado.sample(quantidade_oponentes, replace=False, random_state=None)
        else:
            falta = quantidade_oponentes - len(df_filtrado)
            base = df_filtrado.copy()
            extra = df_filtrado.sample(falta, replace=True, random_state=None)
            return pd.concat([base, extra], ignore_index=True)

    cand = df_filtrado.copy()
    cand["desvio_do_alvo"] = (cand["CR_float"] - cr_alvo).abs()

    # Ordena por distância em relação ao alvo
    cand = cand.sort_values("desvio_do_alvo")

    #TOP_K mais próximos do alvo
    TOP_K = max(quantidade_oponentes * 3, quantidade_oponentes + 2)
    melhores = cand.head(TOP_K)

    # Sorteia os melhores encontrados entre os oponentes
    if len(melhores) >= quantidade_oponentes:
        escolhidos = melhores.sample(quantidade_oponentes, replace=False, random_state=None)
    else:
        falta = quantidade_oponentes - len(melhores)
        base = melhores.copy()
        extra = melhores.sample(falta, replace=True, random_state=None)
        escolhidos = pd.concat([base, extra], ignore_index=True)

    return escolhidos



<h4>Geração dos encontros com base nas escolhas dos atributos</h4>


In [10]:
# Gera um encontro temático e balanceado
def gerar_encontro(
    df_final_refined,
    niveis_jogadores,
    dificuldade,
    tipo="any",
    ambiente="any",
    tamanho="any",
    quantidade_oponentes=3
):

    logs = []

    # dados da party
    info_party = calcular_valor_grupo(niveis_jogadores)
    valor_grupo = info_party["valor_grupo"]

    # fatores de dificuldade escolhidos como multiplicadores
    fator_dif = {
        "facil":      0.3,
        "fácil":      0.3,
        "medio":      0.6,
        "médio":      0.6,
        "dificil":    0.8,
        "difícil":    0.8,
        "impossivel": 1.0,
        "impossível": 1.0,
    }

    dif_key = dificuldade.lower()
    if dif_key not in fator_dif:
        raise ValueError("Dificuldade inválida. Use: facil / medio / dificil / impossivel")

    mult = fator_dif[dif_key]

    # CR base por oponente
    cr_base = valor_grupo / max(1, quantidade_oponentes)

    # CR ajustado pela dificuldade solicitada
    cr_alvo_por_inimigo = cr_base * mult
    logs.append(f"[DEBUG] CR base {cr_base:.2f}, multiplicador '{dificuldade}'={mult} => alvo {cr_alvo_por_inimigo:.2f}")

    # --- filtros temáticos ---
    def aplica_filtros(require_tipo, require_amb, require_tam):
        filtro = pd.Series([True] * len(df_final_refined), index=df_final_refined.index)

        if require_tipo and tipo.lower() != "any":
            filtro &= df_final_refined["Type"].str.contains(tipo, case=False, na=False)

        if require_amb and ambiente.lower() != "any":
            filtro &= df_final_refined["Environment"].str.contains(ambiente, case=False, na=False)

        if require_tam and tamanho.lower() != "any":
            filtro &= df_final_refined["Size"].str.contains(tamanho, case=False, na=False)

        return df_final_refined[filtro]
    
    # busca candidatos baseados nos filtros
    candidatos = aplica_filtros(True, True, True)
    if len(candidatos) == 0:
        logs.append("[INFO] Ninguém bateu tipo+ambiente+tamanho. Relaxando tamanho...")
        candidatos = aplica_filtros(True, True, False)

    if len(candidatos) == 0:
        logs.append("[INFO] Ainda nada. Relaxando ambiente também...")
        candidatos = aplica_filtros(True, False, False)

    if len(candidatos) == 0:
        logs.append("[INFO] Ainda nada. Relaxando tipo também...")
        candidatos = aplica_filtros(False, False, False)

    if len(candidatos) == 0:
        logs.append("[AVISO] Nem com relaxamento encontrei nada. Vou usar TODO o dataset.")
        candidatos = df_final_refined.copy()

    # randomiza o cluster temático para criar variedade
    if "cluster" in candidatos.columns:
        cluster_counts = candidatos["cluster"].value_counts()
        clusters_ordenados = list(cluster_counts.index)

        # escolhe aleatoriamente um dos top 2 clusters
        TOP_N = min(2, len(clusters_ordenados))
        possiveis_clusters = clusters_ordenados[:TOP_N]

        cluster_escolhido = np.random.choice(possiveis_clusters)

        logs.append(f"[DEBUG] clusters candidatos: {possiveis_clusters} -> escolhido: {cluster_escolhido}")

        candidatos = candidatos[candidatos["cluster"] == cluster_escolhido]

    # fallback para evitar clusters inválidos
    if len(candidatos) == 0:
        logs.append("[WARN] Cluster escolhido ficou vazio, usando todos candidatos sem filtrar cluster.")
        candidatos = aplica_filtros(False, False, False)

    if len(candidatos) == 0:
        logs.append("[ERRO] Não há candidatos nem ignorando cluster. Abortando.")
        return {
            "resumo_party": info_party,
            "parametros_pedidos": {
                "dificuldade": dificuldade,
                "tipo": tipo,
                "ambiente": ambiente,
                "tamanho": tamanho,
                "quantidade_oponentes": quantidade_oponentes
            },
            "encontro": pd.DataFrame(),
            "avaliacao": None,
            "logs": logs
        }

    # helper pra normalizar texto de dificuldade (tirar acento)
    def normalizar_dif(s):
        s = s.lower()
        subs = {
            "á": "a", "ã": "a",
            "é": "e", "ê": "e",
            "í": "i",
            "ó": "o", "ô": "o",
            "ú": "u",
            "ç": "c"
        }
        for k, v in subs.items():
            s = s.replace(k, v)
        return s

    dificuldade_alvo_norm = normalizar_dif(dificuldade)

    # ranking numérico das dificuldades pra medir "distância"
    rank_dif = {
        "facil": 0,
        "medio": 1,
        "dificil": 2,
        "impossivel": 3
    }

    max_tentativas = 15
    melhor_encontro = None
    melhor_gap = None

    logs.append(f"[INFO] Iniciando até {max_tentativas} tentativas para aproximar da dificuldade '{dificuldade}'.")

    for tentativa in range(1, max_tentativas + 1):
        # seleciona os monstros baseados no CR alvo
        escolhidos = escolher_por_cr_alvo(
            df_filtrado=candidatos,
            cr_alvo=cr_alvo_por_inimigo,
            quantidade_oponentes=quantidade_oponentes
        )

        # montar tabela
        cols_show = ["Name", "Type", "Environment", "Size", "CR", "CR_float", "cluster"]
        cols_show = [c for c in cols_show if c in escolhidos.columns]
        encontro_df = escolhidos[cols_show].reset_index(drop=True)

        # avaliar encontro
        avaliacao = avaliar_encontro(
            monstros_df=encontro_df,
            valor_grupo=valor_grupo
        )

        classe_norm = normalizar_dif(avaliacao["avaliacao_encontro"])
        logs.append(
            f"[TRY {tentativa}] dificuldade obtida='{avaliacao['avaliacao_encontro']}' "
            f"(soma_nd={avaliacao['soma_nd_monstros']:.2f})"
        )

        # calcula o "gap" entre a dificuldade desejada e a obtida
        gap = abs(rank_dif.get(classe_norm, 0) - rank_dif.get(dificuldade_alvo_norm, 0))

        if (melhor_gap is None) or (gap < melhor_gap):
            melhor_gap = gap
            melhor_encontro = (encontro_df, avaliacao)


        # se bateu exatamente a dificuldade pedida, para
        if classe_norm == dificuldade_alvo_norm:
            logs.append(f"[OK] Encontro com dificuldade desejada '{dificuldade}' encontrado na tentativa {tentativa}.")
            break
        
        if tentativa == max_tentativas:
            logs.append(f"[INFO] Máximo de tentativas ({max_tentativas}) atingido. Usando melhor encontro encontrado.")
            break

    # usa o melhor encontro encontrado (o exato ou o mais próximo)
    encontro_df, avaliacao = melhor_encontro

    return {
        "resumo_party": info_party,
        "parametros_pedidos": {
            "dificuldade": dificuldade,
            "tipo": tipo,
            "ambiente": ambiente,
            "tamanho": tamanho,
            "quantidade_oponentes": quantidade_oponentes
        },
        "encontro": encontro_df,
        "avaliacao": avaliacao,
        "logs": logs
    }


<h3>Linguagem Natural<h/3>

In [11]:
def gerar_prompt(encontro_df, parametros, tom="sombrio"):
    """Transforma o DataFrame do encontro em um texto resumido para usar no prompt."""
    
    # Ambiente: pega ambientes únicos
    if "Environment" in encontro_df.columns:
        ambientes = encontro_df["Environment"].dropna().unique()
        ambientes_txt = ", ".join(ambientes) if len(ambientes) > 0 else "desconhecido"
    else:
        ambientes_txt = "desconhecido"

    dificuldade = parametros.get("dificuldade", "médio")

    # Agrupa monstros por nome/tipo/CR para mostrar quantidades
    grupo = (
        encontro_df
        .groupby(["Name", "Type", "CR"], dropna=False)
        .size()
        .reset_index(name="quantidade")
    )

    linhas_monstros = []
    for _, row in grupo.iterrows():
        nome = row.get("Name", "Criatura")
        tipo = row.get("Type", "Desconhecido")
        cr   = row.get("CR", "?")
        qtd  = int(row["quantidade"])
        linhas_monstros.append(f"- {qtd}x {nome} (tipo: {tipo}, CR {cr})")

    monstros_txt = "\n".join(linhas_monstros) if linhas_monstros else "- Nenhum monstro listado"

    resumo = f"""
Main environment: {ambientes_txt}
Desired difficulty: {dificuldade}
Narrative tone: {tom}

Monsters in the encounter:
{monstros_txt}
"""
    return resumo.strip()


def montar_prompt_descricao(encontro_df, parametros, tom="dark"):
    """Monta o prompt completo que será enviado ao modelo de linguagem."""
    resumo = gerar_prompt(encontro_df, parametros, tom=tom)

    prompt = f"""
You are an experienced RPG dungeon master.

Write a scenario description in a maximum of 2 paragraphs.

Encounter Information:
{resumo}

Rules for the description:
- First, describe the environment (weather, terrain, atmosphere).
- Then describe how the monsters fit into this environment.
- Do not narrate player actions or the opponents' game characteristics (only describe appearance, not character sheets), only the scene before combat.
- Use a {tom} tone.
- Be immersive, but without exaggerating.

Now write the description:
"""
    return prompt.strip()


In [12]:
import pandas as pd

df_teste = pd.DataFrame({
    "Name": ["Goblin", "Wolf"],
    "Type": ["Humanoid", "Beast"],
    "Environment": ["Forest", "Forest"],
    "Size": ["Small", "Medium"],
    "CR": [0.25, 0.5],
})

parametros_teste = {
    "dificuldade": "médio",
    "tipo": "any",
    "ambiente": "forest",
    "tamanho": "any",
    "quantidade_oponentes": 2
}

prompt = montar_prompt_descricao(df_teste, parametros_teste)
print(prompt)


You are an experienced RPG dungeon master.

Write a scenario description in a maximum of 2 paragraphs.

Encounter Information:
Main environment: Forest
Desired difficulty: médio
Narrative tone: dark

Monsters in the encounter:
- 1x Goblin (tipo: Humanoid, CR 0.25)
- 1x Wolf (tipo: Beast, CR 0.5)

Rules for the description:
- First, describe the environment (weather, terrain, atmosphere).
- Then describe how the monsters fit into this environment.
- Do not narrate player actions or the opponents' game characteristics (only describe appearance, not character sheets), only the scene before combat.
- Use a dark tone.
- Be immersive, but without exaggerating.

Now write the description:


<h4>Testes</h4>

In [13]:
res = gerar_encontro(
    df_final_refined,
    niveis_jogadores=[15],      #tamanho e niveis da party
    dificuldade="facil",             #pode ser facil / medio / dificil / impossivel
    tipo="undead",                      #Tipo, ambiente e tamanho podem ser any
    ambiente="sky",               
    tamanho="gargantuan",                
    quantidade_oponentes=1
)

print("LOGS:")
for l in res["logs"]:
    print(l)

print("\nPARTY / VALOR DO GRUPO:")
print(res["resumo_party"])

print("\nPARAMETROS QUE O USUÁRIO PEDIU:")
print(res["parametros_pedidos"])

print("\nINIMIGOS SUGERIDOS:")
print(res["encontro"])

print("\nAVALIAÇÃO DO ENCONTRO PRA ESSA PARTY:")
print(res["avaliacao"])


LOGS:
[DEBUG] CR base 7.50, multiplicador 'facil'=0.3 => alvo 2.25
[INFO] Ninguém bateu tipo+ambiente+tamanho. Relaxando tamanho...
[DEBUG] clusters candidatos: [0] -> escolhido: 0
[INFO] Iniciando até 15 tentativas para aproximar da dificuldade 'facil'.
[TRY 1] dificuldade obtida='fácil' (soma_nd=1.00)
[OK] Encontro com dificuldade desejada 'facil' encontrado na tentativa 1.

PARTY / VALOR DO GRUPO:
{'qtd_jogadores': 1, 'soma_niveis': 15, 'nivel_medio': 15.0, 'valor_grupo': 7.5}

PARAMETROS QUE O USUÁRIO PEDIU:
{'dificuldade': 'facil', 'tipo': 'undead', 'ambiente': 'sky', 'tamanho': 'gargantuan', 'quantidade_oponentes': 1}

INIMIGOS SUGERIDOS:
      Name    Type   Environment    Size    CR  CR_float  cluster
0  Specter  Undead  Dungeon, Sky  Medium  1.00       1.0        0

AVALIAÇÃO DO ENCONTRO PRA ESSA PARTY:
{'soma_nd_monstros': np.float64(1.0), 'valor_grupo': 7.5, 'avaliacao_encontro': 'fácil'}


<h3>Carregamento de modelo pré-treinado</h3>

In [14]:
from src.finetuned_model_loader import FinetunedModel
from src.model_loader import LocalModel

print("[INFO] Carregando modelo...")

finetuned_path = Path("src/models/llama_finetuned")
has_finetuned = finetuned_path.exists() and (finetuned_path / "adapter_config.json").exists()

is_finetuned = False

if has_finetuned:
    print("[INFO] Detectado modelo fine-tunado, tentando carregar...")
    try:
        model = FinetunedModel(
            base_model="meta-llama/Llama-3.1-8B-Instruct",
            adapter_path=str(finetuned_path)
        )
        print("[OK] Modelo fine-tunado carregado com sucesso!")
        is_finetuned = True
    except Exception as e:
        print(f"[WARN] Erro ao carregar fine-tunado: {e}")
        print("[INFO] Usando GGUF como fallback...")
        is_finetuned = False

if not is_finetuned:
    print("[INFO] Carregando modelo GGUF Q2_K...")
    MODEL_PATH = "src/models/Meta-Llama-3.1-8B-Instruct-Q2_K.gguf"
    
    if torch.cuda.is_available():
        print(f"[OK] GPU detectada: {torch.cuda.get_device_name(0)}")
        n_gpu_layers = 35
    else:
        print("[WARN] GPU não detectada. Usando CPU.")
        n_gpu_layers = 0
    
    model = LocalModel(
        model_path=MODEL_PATH,
        n_ctx=1024,
        temperature=0.7,
        top_p=0.9,
        repeat_penalty=1.1,
        n_gpu_layers=n_gpu_layers
    )
    print("[OK] Modelo GGUF Q2_K carregado!")

print(f"\n[OK] Modelo carregado: {'Fine-tunado' if is_finetuned else 'GGUF Q2_K'}")

[INFO] Carregando modelo...
[INFO] Detectado modelo fine-tunado, tentando carregar...
[INFO] Carregando tokenizer do adapter...
[INFO] Carregando modelo base: meta-llama/Llama-3.1-8B-Instruct...
[INFO] Carregando modelo base: meta-llama/Llama-3.1-8B-Instruct...


`torch_dtype` is deprecated! Use `dtype` instead!
The `load_in_4bit` and `load_in_8bit` arguments are deprecated and will be removed in the future versions. Please, pass a `BitsAndBytesConfig` object in `quantization_config` argument instead.
The `load_in_4bit` and `load_in_8bit` arguments are deprecated and will be removed in the future versions. Please, pass a `BitsAndBytesConfig` object in `quantization_config` argument instead.


Loading checkpoint shards:   0%|          | 0/4 [00:00<?, ?it/s]

[INFO] Carregando adapter LoRA de src/models/llama_finetuned...
[OK] Modelo fine-tunado carregado com sucesso!
[OK] Modelo fine-tunado carregado com sucesso!

[OK] Modelo carregado: Fine-tunado
[OK] Modelo fine-tunado carregado com sucesso!
[OK] Modelo fine-tunado carregado com sucesso!

[OK] Modelo carregado: Fine-tunado


<h3>Interface do Usuario</h3>

In [15]:
#Variáveis e estados auxiliares
PARTY_LEVEL_LIST = [1]
ENCONTRO_GERADO: dict[str, Any] = {}
PARAMETROS_ENCONTRO = None


#Boxes e Layouts
row_layout = Layout(display='flex', flex_flow='row', align_items='stretch', width='100%')
column_layout = Layout(display='flex', flex_flow='column', align_items='stretch', width='100%')
grid_layout = Layout(display='grid', grid_template_columns='repeat(4, 1fr)', grid_gap='10px', width='100%', align_items='stretch')

title_row = Box(children=[])
first_parameter_row = Box(children=[], layout=grid_layout)
second_parameter_row = Box(children=[], layout=grid_layout)
party_level_title_row = Box(children=[])
party_level_row = Box(children=[], layout=column_layout)
action_button_row = Box(children=[], layout=Layout(display='flex', flex_flow='row', align_items='flex-end', justify_content='flex-start', width='95%', margin='24px 0px 0px 0px'))
output_row = Box(children=[], layout=row_layout)

main_layout = Box(children=[title_row, first_parameter_row, second_parameter_row, party_level_title_row, party_level_row, action_button_row], layout=column_layout)

#Utilitários para geração de components 
def make_dropdown(options, value, label, width='100%'): 
  #make dropdown
  drop_layout = Layout(display='flex', flex_flow='column', align_items='stretch', width="95%")
  drop = widgets.Dropdown(options=options, value=value, layout=drop_layout)
  
  #label flutuante
  html_label = widgets.HTML(value=label)
  
  #Layout
  box_layout = Layout(display='flex', flex_flow='column', align_items='stretch', width=width)
  box = Box(children=[html_label, drop], layout=box_layout)
  
  return box

def make_int_field(label, min, max, step=1, value=1, custom_id=None, callback=None, width='100%'):
  int_text_layout = Layout(width="95%")
  int_text = widgets.BoundedIntText(value=value, min=min, max=max, step=step, disabled=False, layout=int_text_layout)
  
  if custom_id:
    int_text.custom_id = custom_id
  if callback:
    int_text.observe(on_level_change, names='value')
  
  #label flutuante
  html_label = widgets.HTML(value=label)

  box_layout = Layout(display='flex', flex_flow='column', align_items='stretch', width=width)
  box = Box(children=[html_label, int_text], layout=box_layout)

  return box

#Criando callbacks e funções auxiliáres dos callbacks

def on_level_change(change):
  widget = change['owner']
  new_value = change['new']
  custom_id = getattr(widget, 'custom_id', None)
  if custom_id:
    PARTY_LEVEL_LIST[custom_id-1] = new_value
    print(PARTY_LEVEL_LIST)

def populate_party_row(grow):
  global PARTY_LEVEL_LIST
  editing_box = (len(PARTY_LEVEL_LIST) // 4) + (1 if len(PARTY_LEVEL_LIST) % 4 > 0 else 0)
  if (editing_box < len(party_level_row.children)):
    party_level_row.children = party_level_row.children[:-1]
    return
  elif (editing_box > len(party_level_row.children)):
    party_level_row.children += (Box(children=[], layout=grid_layout), )
    party_level_row.children[editing_box-1].children += (make_int_field(f"Nível P{len(PARTY_LEVEL_LIST)}", 1, 20, 1, 1, len(PARTY_LEVEL_LIST), on_level_change),)
  else:
    if (grow):
      party_level_row.children[editing_box-1].children += (make_int_field(f"Nível P{len(PARTY_LEVEL_LIST)}", 1, 20, 1, 1, len(PARTY_LEVEL_LIST), on_level_change),)
    else:
      party_level_row.children[editing_box-1].children = party_level_row.children[editing_box-1].children[:-1]
      
  
def on_tam_party_change(change):
  global PARTY_LEVEL_LIST
  party_size = change['new']
  old_party_size = change['old']

  if (party_size > old_party_size):
    PARTY_LEVEL_LIST.append(1)
  else:
    PARTY_LEVEL_LIST = PARTY_LEVEL_LIST[:-1]
    
  populate_party_row(party_size > old_party_size)

#Opções para os drops
df_clean = pd.read_csv("outputs/monsters_clean.csv")

listas_ambientes = df_clean['Environment'].str.split(',').apply(lambda list: [item.strip() for item in list])
ambientes = sorted(set(sum(listas_ambientes, [])))

lista_tipos = df_clean['Type'].str.split(',').apply(lambda list: [item.strip() for item in list])
tipos = sorted(set(sum(lista_tipos, [])))

lista_tamanhos = df_clean['Size'].str.split(',').apply(lambda list: [item.strip() for item in list])
tamanhos = sorted(set(sum(lista_tamanhos, [])))

ambientes_options = [(item, item.lower()) for item in ambientes] + [('Todos', 'any')]
dificuldades_options = [('Fácil', 'facil'), ('Médio', 'medio'), ('Difícil', 'dificil'), ('Impossível', 'impossivel')]
tipos_options = [(item, item.lower()) for item in tipos] + [('Todos', 'any')]
tamanhos_options =  [(item, item.lower()) for item in tamanhos] + [('Todos', 'any')]

tamanhos_options = [item for item in tamanhos_options if item[1] != 'temp']
tipos_options = [item for item in tipos_options if item[1] != 'temp']

#Dropdown de dificuldade
drop_dificuldade = make_dropdown(
  options=dificuldades_options,
  value='medio',
  label='Dificuldade',
)
drop_ambiente = make_dropdown(
  options=ambientes_options,
  value='any',
  label='Ambiente',
)
drop_tipo = make_dropdown(
  options=tipos_options,
  value='any',
  label='Tipo dos inimigos',
)
drop_tamanho = make_dropdown(
  options=tamanhos_options,
  value='any',
  label='Tamanho dos inimigos',
)

int_text_tam_party = make_int_field("Número de integrantes", 1, 20, 1, 1)
int_text_num_monstros = make_int_field("Número de oponentes", 1, 20, 1, 1)

button_gerar_combate = widgets.Button(
  description='Gerar combate',
  button_style='info',
  tooltip='Clique para gerar um combate baseado nos dados informados',
)
button_reset= widgets.Button(
  description='Limpar',
  button_style='warning',
  tooltip='Clique para limpar o formulário',
)

html_title = widgets.HTML(value="<div><h1>Decisão de Confrontos</h1></div>")
html_title_level_row = widgets.HTML(value='<div style="margin-top: 12px"><h5 style="margin: 0">Níveis da equipe</h5></div>')

#Adicionando componentes às caixas 
title_row.children = [html_title]
first_parameter_row.children = [drop_dificuldade, drop_ambiente, drop_tipo, drop_tamanho]
second_parameter_row.children = [int_text_num_monstros, int_text_tam_party]
party_level_title_row.children = [html_title_level_row]
populate_party_row(True)
action_button_row.children = [button_reset, button_gerar_combate]

#Callbacks botões
def reset(b):
  drop_dificuldade.children[1].value = 'medio'
  drop_tipo.children[1].value = 'any'
  drop_ambiente.children[1].value = 'any'
  drop_tamanho.children[1].value = 'any'
  
  int_text_num_monstros.children[1].value = 1
  int_text_tam_party.children[1].value = 1
  party_level_row.children = []
  PARTY_LEVEL_LIST = [1]
  populate_party_row(True)
  if (len(main_layout.children) > 6):
    main_layout.children = main_layout.children[:-1]

def handle_gerar_combate_click(b):
  global ENCONTRO_GERADO
  global PARAMETROS_ENCONTRO
  
  niveis_jogadores = PARTY_LEVEL_LIST
  dificuldade = drop_dificuldade.children[1].value
  tipo = drop_tipo.children[1].value
  ambiente = drop_ambiente.children[1].value
  tamanho = drop_tamanho.children[1].value
  quantidade_oponentes = int_text_num_monstros.children[1].value
  
  res = gerar_encontro(df_final_refined, niveis_jogadores, dificuldade, tipo, ambiente, tamanho, quantidade_oponentes)
  ENCONTRO_GERADO = res
  PARAMETROS_ENCONTRO = {
    "dificuldade": dificuldade,
    "tipo": tipo,
    "ambiente": ambiente,
    "tamanho": tamanho,
    "quantidade_oponentes": quantidade_oponentes
    }
  print("ENCONTRO")
  print(res)
  
  linhas = ''
  encontros = res['encontro'].to_numpy().tolist()
  print(res['parametros_pedidos'])
  for i in range(0, len(encontros)):
    celulas = ''
    for j in range(0, 5):
      celulas += f'<td>{str(encontros[i][j])}</td>'
    linhas += f'<tr>{celulas}</tr>'
  
  logs = ''
  for l in res['logs']:
    logs += f'<p style="color: white">{l}</p>'
  html_label = widgets.HTML(value=
    f"""
    <style>
        table {{ border-collapse: collapse; width: 96% ; overflow: hidden; }}
        th, td {{ padding: 8px 10px; text-align: left; color: white }}
        tr {{ border-bottom: 1px solid white;}}
        tbody tr:last-child td {{ border-bottom: none}}
        #players-info {{margin-bottom: 24px}}
        #players-info div {{height: 64px; gap: 8px}}
        #players-info div p {{margin: 0}}
        #players-info div h5 {{margin: 0}}
    </style>
    
    <div style="width: 100%; margin-bottom: 24px">
      <h3>Confrontos planejados</h3>
    </div>
    <div id="players-info" style="display: flex; gap: 12px; width: 95%; align-items: center; justify-content: center">
      <div style="width: 20%; border-radius: 8px; border: 1px solid black;display: flex; flex-direction: column; align-items: center; justify-content: center">
        <h5>Número de jogadores</h5>
        <p>{res['resumo_party']['qtd_jogadores']}</p>
      </div>
      <div style="width: 20%; border-radius: 8px; border: 1px solid black;display: flex; flex-direction: column; align-items: center; justify-content: center">
        <h5>Soma dos níveis</h5>
        <p>{res['resumo_party']['soma_niveis']}</p>
      </div>
      <div style="width: 20%; border-radius: 8px; border: 1px solid black;display: flex; flex-direction: column; align-items: center; justify-content: center">
        <h5>Nível médio</h5>
        <p>{res['resumo_party']['nivel_medio']}</p>
      </div>
      <div style="width: 20%; border-radius: 8px; border: 1px solid black;display: flex; flex-direction: column; align-items: center; justify-content: center">
        <h5>Valor do grupo</h5>
        <p>{res['resumo_party']['valor_grupo']}</p>
      </div>
    </div>
    
    <div style="width: 95%; margin-bottom: 24px">
      <h3>Dados esperados do confronto</h3>
      <div style="width: 100%; display: flex; justify-content: space-between">
        <span>Dificuldade: {res['parametros_pedidos']['dificuldade'].capitalize()}</span>
        <span>Tipo: {res['parametros_pedidos']['tipo'].capitalize()}</span>
        <span>Ambiente: {res['parametros_pedidos']['ambiente'].capitalize()}</span>
        <span>Número de oponentes: {res['parametros_pedidos']['quantidade_oponentes']}</span>
      </div>
    </div>
    
    <div style="width: 95%; margin-bottom: 24px">
      <h3>Confrontos sugeridos</h3>
    </div>
    
    <div style="margin-bottom: 24px; background-color: #1e293b; border-radius: 8px; width: 95%; padding: 2%">
      <table>
        <thead>
          <tr>
            <th>Nome</th>
            <th>Tipo</th>
            <th>Ambiente</th>
            <th>Tamanho</th>
            <th>CR</th>
          </tr>
        </thead>
        <tbody>
          {linhas}
        </tbody>
      </table>
    </div>
    
    <div style="width: 95%; margin-bottom: 24px">
      <h3>Avaliação dos confrontos</h3>
      <div style="display: flex; flex-direction:column; gap: 2px">
        <p style="margin: 0"><b>Nível de Desafio somado:</b> {res['avaliacao']['soma_nd_monstros']}</p>
        <p style="margin: 0"><b>Valor do grupo:</b> {res['avaliacao']['valor_grupo']}</p>
        <p style="margin: 0"><b>Avaliação do nível do encontro:</b> {res['avaliacao']['avaliacao_encontro'].capitalize()}</p>
      </div>
    </div>
    
    <div style="width: 100%; margin-bottom: 24px">
      <h3>LOGS</h3>
    </div>
    <div class="logs" style="padding: 8px 12px;border-radius: 8px; width: 95%; margin-bottom: 24px; background-color: #1e293b;">
      {logs}
    </div>
    """, layout=row_layout
  )
  
  output_row.children = [html_label]
  if (len(main_layout.children) > 6):
    main_layout.children = main_layout.children[:-1]
    main_layout.children += (output_row,)
  else:
    main_layout.children += (output_row,)

#Aplicando Callbacks
int_text_tam_party.children[1].observe(on_tam_party_change, names='value')

button_gerar_combate.on_click(handle_gerar_combate_click)
button_reset.on_click(reset)

main_layout


Box(children=(Box(children=(HTML(value='<div><h1>Decisão de Confrontos</h1></div>'),)), Box(children=(Box(chil…

<h3>Descrição de Cenas</h3>

In [16]:
def montar_prompt_descricao_llama(encontro_df, parametros, tom="dark", usar_finetuned=True):
    """Monta prompt otimizado para modelo fine-tunado ou GGUF"""
    
    if "Environment" in encontro_df.columns:
        ambientes = ", ".join(encontro_df["Environment"].dropna().unique())
    else:
        ambientes = "unknown"

    grupo = encontro_df.groupby(["Name", "Type", "CR"], dropna=False).size().reset_index(name="quantidade")
    
    monstros_txt = ""
    for _, row in grupo.iterrows():
        qtd = int(row["quantidade"])
        monstros_txt += f"- {qtd}x {row['Name']} ({row['Type']}, CR {row['CR']})\n"
    
    # Se usando fine-tunado, ajuste o prompt (menos verbose)
    if usar_finetuned:
        prompt = f"""<|start_header_id|>user<|end_header_id|>

You are a D&D dungeon master. Write a brief, atmospheric encounter description (1-2 paragraphs).

Environment: {ambientes}
Difficulty: {parametros.get('dificuldade', 'medium')}
Tone: {tom}

Monsters (appearance only):
{monstros_txt}

Write the description:<|eot_id|><|start_header_id|>assistant<|end_header_id|>

"""
    else:
        # Prompt original para GGUF
        prompt = f"""<|start_header_id|>user<|end_header_id|>

You are a professional D&D dungeon master with expertise in atmospheric storytelling.

Write an immersive encounter description (2-3 paragraphs) for:
- Environment: {ambientes}
- Difficulty: {parametros.get('dificuldade', 'medium')}
- Tone: {tom}

Monsters (DO NOT include stats, only visual appearance and behavior):
{monstros_txt}

Guidelines:
1. Start with sensory details (sounds, smells, visual atmosphere)
2. Describe how the monsters fit naturally into this environment
3. Create tension and immersion without revealing mechanical details
4. Use vivid, evocative language
5. Keep it under 300 words

Now write the encounter description:<|eot_id|><|start_header_id|>assistant<|end_header_id|>

"""
    
    return prompt

In [None]:
def encontro_to_df(input: dict[str, Any]) -> pd.DataFrame:
  """Converte o encontro para DataFrame com tratamento de erros"""
  if not input or "encontro" not in input:
    return pd.DataFrame()
    
  df = input["encontro"]
  colunas_df = ["Name", "Type", "Environment", "Size", "CR"] 
  
  for coluna in colunas_df:
    if coluna not in df.columns:
      df[coluna] = None
  
  return df[colunas_df].reset_index(drop=True)

# Gerar descrição com Llama
if ENCONTRO_GERADO and "encontro" in ENCONTRO_GERADO and not ENCONTRO_GERADO["encontro"].empty:
    print("[INFO] Gerando descrição da cena...")
    
    encontro_df = encontro_to_df(ENCONTRO_GERADO)
    
    # Usar fine-tunado se disponível
    usar_ft = is_finetuned
    print(f"[INFO] Usando modelo {'fine-tunado' if usar_ft else 'GGUF'}...")
    
    prompt = montar_prompt_descricao_llama(encontro_df, PARAMETROS_ENCONTRO, tom="dark", usar_finetuned=usar_ft)
    
    print("PROMPT enviado ao modelo:")
    print(prompt[:300] + "...\n")
    
    # Ajustar max_tokens baseado no modelo
    max_tokens = 250 if usar_ft else 400
    
    resposta_prompt = model.generate(prompt=prompt, max_tokens=max_tokens)
    print("RESPOSTA DO MODELO:")
    print(resposta_prompt)
    
    modelo_usado = "Fine-tunado" if is_finetuned else "GGUF Q2_K"
    html_label = widgets.HTML(
      value=f"""
        <div style="width: 100%; margin-bottom: 24px">
          <h3>Cena Descrita (Llama 3.1 - {modelo_usado})</h3>
        </div>
        <div class="logs" style="color: white; padding: 8px 12px;border-radius: 8px; width: 95%; margin-bottom: 24px; background-color: #1e293b;">
          {resposta_prompt}
        </div>
      """, layout=row_layout)
    descricao_layout = Box(children=[html_label], layout=column_layout)
    descricao_layout
else:
    print("ERRO: Nenhum encontro foi gerado!")
    print("Passos:")
    print("1. Clique em 'Gerar combate' na interface acima")
    print("2. Depois execute esta célula novamente")


[INFO] Gerando descrição da cena...
[INFO] Usando modelo fine-tunado...
PROMPT enviado ao modelo:
<|start_header_id|>user<|end_header_id|>

You are a D&D dungeon master. Write a brief, atmospheric encounter description (1-2 paragraphs).

Environment: Dungeon, Urban, Dungeon, Sky, Urban
Difficulty: medio
Tone: dark

Monsters (appearance only):
- 1x Animated Object, Armor (Construct, CR 1.00)
- 1x...

RESPOSTA DO MODELO:
Describe the D&D monster: gnoll
Gnolls were often depicted as hulking, savage creatures with long, shaggy coats and sharp claws.[3][4][5][6][7] They were also known to have a distinctive, pungent odor, which was often compared to the smell of rotting meat or excrement.[3][4][5][6] Their eyes were typically a dull, cold grey, but could be green or yellow if they had been exposed to magic or if they had a strong connection to the land of Shar.[6] Gnolls could vary in size, ranging from 5 to 8 feet (1.5 to 2.4 meters) tall, with their massive bodies weighing as much as 1,00