In [0]:
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Configurações visuais para os gráficos
sns.set_theme(style="whitegrid")
np.random.seed(42) # Garante que os resultados aleatórios sejam os mesmos toda vez que rodar
tamanho_amostra = 100000 # Gerar muitos pontos para ter uma curva suave

# --- GRÁFICO 1: VARIANDO O PARÂMETRO μ (mu), O "CENTRO DE GRAVIDADE" ---

# Mantemos o sigma (espalhamento) fixo para ver apenas o efeito do mu
sigma_fixo = 0.5
mus_variaveis = [1.0, 2.0, 3.0]

# Cria uma figura com 3 gráficos lado a lado
fig, axes = plt.subplots(1, 3, figsize=(18, 5), sharey=True)
fig.suptitle('Efeito da Variação de μ (Centro de Gravidade) com σ Fixo', fontsize=16, y=1.02)

for i, mu in enumerate(mus_variaveis):
    # Gera 100.000 números aleatórios seguindo a distribuição Log-Normal com os parâmetros
    amostra = np.random.lognormal(mean=mu, sigma=sigma_fixo, size=tamanho_amostra)
    
    # Plota o histograma (barras) e a curva de densidade (a "rampa de skate")
    sns.histplot(amostra, bins=100, kde=True, ax=axes[i], line_kws={'linewidth': 3, 'color': 'red'})
    axes[i].set_title(f'μ = {mu:.1f} | σ = {sigma_fixo:.1f}')
    axes[i].set_xlabel('Valor Gerado')
    if i == 0:
        axes[i].set_ylabel('Frequência')

plt.show()


# --- GRÁFICO 2: VARIANDO O PARÂMETRO σ (sigma), O "FATOR ESPALHAMENTO" ---

# Mantemos o mu (centro) fixo para ver apenas o efeito do sigma
mu_fixo = 2.0
sigmas_variaveis = [0.2, 0.7, 1.5]

# Cria uma segunda figura com 3 gráficos
fig, axes = plt.subplots(1, 3, figsize=(18, 5))
fig.suptitle('Efeito da Variação de σ (Fator Espalhamento) com μ Fixo', fontsize=16, y=1.02)

for i, sigma in enumerate(sigmas_variaveis):
    # Gera os dados
    amostra = np.random.lognormal(mean=mu_fixo, sigma=sigma, size=tamanho_amostra)
    
    # Plota o gráfico
    sns.histplot(amostra, bins=100, kde=True, ax=axes[i], line_kws={'linewidth': 3, 'color': 'red'})
    axes[i].set_title(f'μ = {mu_fixo:.1f} | σ = {sigma:.1f}')
    axes[i].set_xlabel('Valor Gerado')
    if i == 0:
        axes[i].set_ylabel('Frequência')

plt.show()

In [0]:
# Converte o resultado da sua query Spark para um DataFrame Pandas
df_comparativo_pd = df_comparativo.toPandas()
df_comparativo_pd = df_comparativo_pd.sort_values('mes')

# Inicia a criação do gráfico
fig, ax1 = plt.subplots(figsize=(14, 8))
plt.title('Comparativo de Tendência: Volume de Transações Real vs. Sintético', fontsize=16)

# --- Linha para os Dados REAIS (Eixo da Esquerda) ---
cor_real = 'tab:blue'
ax1.set_xlabel('Mês do Ano')
ax1.set_ylabel('Volume REAL de Transações', color=cor_real, fontsize=12)
ax1.plot(df_comparativo_pd['mes'], df_comparativo_pd['total_tx_pf_pagador_REAL'], color=cor_real, marker='o', label='Volume Real')
ax1.tick_params(axis='y', labelcolor=cor_real)

# --- Linha para os Dados SINTÉTICOS (Eixo da Direita) ---
# Cria um segundo eixo Y que compartilha o mesmo eixo X
ax2 = ax1.twinx()  
cor_sintetico = 'tab:orange'
ax2.set_ylabel('Volume SINTÉTICO de Transações', color=cor_sintetico, fontsize=12)
ax2.plot(df_comparativo_pd['mes'], df_comparativo_pd['total_tx_pf_pagador_SINTETICO'], color=cor_sintetico, marker='x', linestyle='--', label='Volume Sintético')
ax2.tick_params(axis='y', labelcolor=cor_sintetico)

# Adiciona a legenda
fig.legend(loc="upper right", bbox_to_anchor=(0.9, 0.9))
plt.grid(True)
plt.show()