## Terceiro Experimento: Comparação Triangular dos Padrões

In [None]:
print("="*70)
print("Análise 1: Buscando segmentos por Padrão de Acabamento MÉDIO")
print("="*70)

# --- ETAPA 1: CRIAÇÃO DO ALVO ORDINAL ---
mapa_padrao = {'P1': 1, 'P2': 2, 'P3': 3, 'P4': 4, 'P5': 5}
itbi['padrao_ordinal'] = itbi['padrao'].map(mapa_padrao)

# --- ETAPA 2: CONFIGURAÇÃO DO PYSUBGROUP (NUMÉRICO) ---
target_ordinal = ps.NumericTarget('padrao_ordinal')
quality_function_numeric = ps.StandardQFNumeric(a=0.5)

include = ['Bairro', 'Ano Avaliacao', 'Tipo Construtivo Preponderante', 'idade']
ignore = list(set(list(itbi)) - set(include))
search_space = ps.create_selectors(itbi, ignore=ignore)

task_ordinal = ps.SubgroupDiscoveryTask(
    itbi, target_ordinal, search_space,
    result_set_size=15, depth=3, qf=quality_function_numeric
)

result_ordinal = ps.BeamSearch().execute(task_ordinal)
df_results_ordinal = result_ordinal.to_dataframe()

# --- ETAPA 3: IMPRESSÃO E INTERPRETAÇÃO (COM TAMANHO DO SUBGRUPO) ---
media_global_indice = itbi['padrao_ordinal'].mean()
print(f"Índice de Padrão Médio da Cidade: {media_global_indice:.2f}\n")

for index, row in df_results_ordinal.iterrows():
    print(f"Qualidade: {row['quality']:.3f} | Subgrupo: {row['subgroup']}")
    # --- LINHA ADICIONADA ---
    print(f"   > Tamanho do Subgrupo: {row['size_sg']:,.0f} imóveis")
    # --- FIM DA ADIÇÃO ---
    print(f"   > Índice de Padrão Médio do Subgrupo: {row['mean_sg']:.2f}")
    impacto = ((row['mean_sg'] / media_global_indice) - 1) * 100
    print(f"   > (Impacto: {impacto:+.2f}% vs. a média da cidade)")
    print("-" * 40)

In [None]:
print("\n\n" + "="*70)
print("Análise 2: Buscando segmentos por Concentração de ALTO Padrão (P5)")
print("="*70)

# --- ETAPA 1: CRIAÇÃO DO ALVO BINÁRIO (P5) ---
itbi['eh_alto_padrao'] = (itbi['padrao'] == 'P5')

# --- ETAPA 2: CONFIGURAÇÃO DO PYSUBGROUP (BINÁRIO) ---
target_p5 = ps.BinaryTarget('eh_alto_padrao', True)
quality_function_binary = ps.WRAccQF()

task_p5 = ps.SubgroupDiscoveryTask(
    itbi, target_p5, search_space,
    result_set_size=15, depth=3, qf=quality_function_binary
)

result_p5 = ps.BeamSearch().execute(task_p5)
df_results_p5 = result_p5.to_dataframe()

# --- ETAPA 3: IMPRESSÃO E INTERPRETAÇÃO (COM CONTAGEM COMPLETA) ---
cobertura_global_p5 = itbi['eh_alto_padrao'].mean()
print(f"Concentração Global de P5: {cobertura_global_p5:.2%}\n")

for index, row in df_results_p5.iterrows():
    cobertura_subgrupo = row['positives_sg'] / row['size_sg']
    print(f"Qualidade (WRAcc): {row['quality']:.4f} | Subgrupo: {row['subgroup']}")
    # --- LINHA MODIFICADA ---
    print(f"   > Concentração de P5: {cobertura_subgrupo:.2%} ({row['positives_sg']:,.0f} de {row['size_sg']:,.0f} imóveis)")
    # --- FIM DA MODIFICAÇÃO ---
    print("-" * 40)

In [None]:
print("\n\n" + "="*70)
print("Análise 3: Buscando segmentos por Concentração de Padrão BÁSICO (P1)")
print("="*70)

# --- ETAPA 1: CRIAÇÃO DO ALVO BINÁRIO (P1) ---
itbi['eh_padrao_basico'] = (itbi['padrao'] == 'P1')

# --- ETAPA 2: CONFIGURAÇÃO DO PYSUBGROUP (BINÁRIO) ---
target_p1 = ps.BinaryTarget('eh_padrao_basico', True)
quality_function_binary = ps.WRAccQF() 

task_p1 = ps.SubgroupDiscoveryTask(
    itbi, target_p1, search_space,
    result_set_size=15, depth=3, qf=quality_function_binary
)

result_p1 = ps.BeamSearch().execute(task_p1)
df_results_p1 = result_p1.to_dataframe()

# --- ETAPA 3: IMPRESSÃO E INTERPRETAÇÃO (COM CONTAGEM COMPLETA) ---
cobertura_global_p1 = itbi['eh_padrao_basico'].mean()
print(f"Concentração Global de P1: {cobertura_global_p1:.2%}\n")

for index, row in df_results_p1.iterrows():
    cobertura_subgrupo = row['positives_sg'] / row['size_sg']
    print(f"Qualidade (WRAcc): {row['quality']:.4f} | Subgrupo: {row['subgroup']}")
    # --- LINHA MODIFICADA ---
    print(f"   > Concentração de P1: {cobertura_subgrupo:.2%} ({row['positives_sg']:,.0f} de {row['size_sg']:,.0f} imóveis)")
    # --- FIM DA MODIFICAÇÃO ---
    print("-" * 40)