# Teste da Classe GeradorBase
Este notebook testa o funcionamento da classe `GeradorBase` utilizando a base de teste `base_teste.csv`.

In [37]:
import sys
import os
import pandas as pd
from importlib import reload

# Adiciona o diretório do projeto ao sys.path
sys.path.append(os.path.abspath(os.path.join(os.path.dirname(''), '..')))
from hub_variaveis import GeradorParametros
reload(pd)

# 2. Carregamento da Base de Teste
base_path = os.path.join(os.path.dirname(os.path.dirname(os.path.abspath(''))), 'gerador_bases', 'base_teste.csv')
df = pd.read_csv(base_path)
df.head()

# 3. Conversão da Coluna 'anomes' para Inteiro
if df['anomes'].dtype != int:
    df['anomes'] = df['anomes'].astype(int)
df.dtypes

# 4. Instanciação do GeradorParametros
# Ajuste os nomes das variáveis conforme o JSON de configuração do seu projeto

gerador = GeradorParametros(
    grao_estrutura='squad',
    grao_periodo='mensal',
    anomes_inicio=202403,
    anomes_fim=202412,
    definir_blocos=True,
    lista_blocos=['bugs'],
    definir_variaveis=True,
    lista_variaveis=['qtde_bugs_totais', 'qtde_bugs_cancelados', 'qtde_bugs_corrigidos', 'perc_bugs_cancelados', 'perc_bugs_corrigidos'],
    definir_estruturas=False,
    lista_estruturas=[],
    gerar_relatorio=True
)

# 5. Processamento dos Dados com GeradorParametros
df_final, relatorio = gerador.processar(df)

df_final

Unnamed: 0,anomes,id_comunidade,id_release_train,id_squad,qtde_bugs_totais,qtde_bugs_cancelados,qtde_bugs_corrigidos,perc_bugs_cancelados,perc_bugs_corrigidos
0,202403,C01,RT01,S12,79,69,8,0.873418,0.101266
1,202403,C01,RT02,S07,80,49,65,0.612500,0.812500
2,202403,C01,RT02,S08,82,70,62,0.853659,0.756098
3,202403,C01,RT02,S18,41,14,32,0.341463,0.780488
4,202403,C01,RT03,S03,85,30,63,0.352941,0.741176
...,...,...,...,...,...,...,...,...,...
195,202412,C05,RT01,S06,80,41,63,0.512500,0.787500
196,202412,C05,RT02,S13,56,17,25,0.303571,0.446429
197,202412,C05,RT03,S03,21,15,13,0.714286,0.619048
198,202412,C05,RT03,S05,76,37,32,0.486842,0.421053


In [38]:
gerador.help()


|                 GeradorParametros - Ajuda                |

*** Classe para geração de bases de variáveis customizadas ***


1. Importe a classe no seu script ou notebook:
    from hub_variaveis.gerador_base import GeradorParametros

2. (Opcional) Importe o pandas para ler arquivos CSV:
    import pandas as pd
    df = pd.read_csv('caminho/para/seu_arquivo.csv')

3. Crie uma instância da classe com os parâmetros desejados:
    gerador = GeradorParametros(
        grao_estrutura='squad',
        grao_periodo='mensal',
        anomes_inicio=202401,
        anomes_fim=202412,
        definir_blocos=True,
        lista_blocos=['bugs'],
        definir_variaveis=False,
        definir_estruturas=False,
        gerar_relatorio=True
    )

4. Para processar um DataFrame local:
    df_final, relatorio = gerador.processar(df)
    print(df_final)
    print(relatorio)

5. Para processar direto do Athena (em ambiente AWS/SageMaker):
    import boto3
    boto3_session = boto3.Session()
    df_fi