In [1]:
import pandas as pd
import numpy as np
import random

In [7]:
# Quantidade de casos
total_cases = 100  # Novo total de casos
superendividamento_total = 68  # Casos de Superendividamento
emprestimos_total = total_cases - superendividamento_total  # Casos de Empréstimos

df = pd.DataFrame()

# distribuicao de casos conforme emprestimo e superendividamento
date_distribution = {
    "2024-02": (7, 2),
    "2024-03": (11, 9),
    "2024-04": (11, 8),
    "2024-05": (11, 6),
    "2024-06": (3, 1),
    "2024-07": (13, 9),
    "2024-08": (15, 12),
    "2024-09": (9, 7),
    "2024-10": (14, 10),
    "2024-11": (6, 4),
}

data_cadastro = []
tipo_index = {"Empréstimos": 0, "Superendividamento": 0}

for month, (total, superendividamento) in date_distribution.items():
    start_date = pd.to_datetime(f"{month}-01")
    end_date = start_date + pd.DateOffset(days=27)  # Garante distribuição dentro do mês
    dates = pd.date_range(start=start_date, end=end_date).tolist()

    # Separar superendividamento e empréstimos
    superendividamento_dates = random.sample(dates, superendividamento)
    emprestimos_dates = random.sample([d for d in dates if d not in superendividamento_dates], total - superendividamento)

    data_cadastro.extend([(d, "Superendividamento") for d in superendividamento_dates])
    data_cadastro.extend([(d, "Empréstimos") for d in emprestimos_dates])

# Ordenar por data
data_cadastro.sort(key=lambda x: x[0])
df["Data Cadastro"] = [d[0] for d in data_cadastro]
df["Tipo"] = [d[1] for d in data_cadastro]

# 3️⃣ GERAR DATA ENCERRAMENTO (30% dos casos continuam abertos)
df["Data Encerramento"] = df["Data Cadastro"] + pd.to_timedelta(np.random.randint(30, 365, total_cases), unit="D")
df.loc[np.random.choice(df.index, size=int(0.3 * total_cases), replace=False), "Data Encerramento"] = pd.NaT

# 4️⃣ DISTRIBUIR SENTENÇAS PROFERIDAS BASEADO NAS PERCENTAGENS
sentence_types = ["Dano Moral", "Apenas Dano Material", "Apenas Obrigação de Fazer", "Improcedência", "Extinção"]
sentence_probs = [0.22, 0.04, 0.04, 0.26, 0.44]  # Soma 100%
df["Sentenças Proferidas"] = np.random.choice(sentence_types, size=total_cases, p=sentence_probs)

# 5️⃣ DISTRIBUIR UF (55% Sudeste, 45% Outras Regiões)
southeast_states = ["SP", "RJ", "MG", "ES"]
other_states = ["BA", "PE", "CE", "RS", "SC", "PR", "GO", "DF", "PA", "AM"]

southeast_probs = [0.55 / len(southeast_states)] * len(southeast_states)
other_probs = [0.45 / len(other_states)] * len(other_states)

df["UF"] = np.random.choice(southeast_states + other_states, size=total_cases, p=southeast_probs + other_probs)

# 6️⃣ SALVAR COMO CSV
output_file = "emprestimo.csv"
df.to_csv(output_file, index=False, encoding="utf-8")

print(f"✅ CSV file '{output_file}' gerado com sucesso!")


✅ CSV file 'emprestimo.csv' gerado com sucesso!
