In [0]:
# ==============================================================================
# DIAGNÓSTICO: VERIFICAR ESTADO DOS MODELOS NO UNITY CATALOG
# ==============================================================================
import mlflow

print("="*80)
print("DIAGNÓSTICO DO UNITY CATALOG MODEL REGISTRY")
print("="*80)

# Configurar Unity Catalog
mlflow.set_registry_uri("databricks-uc")
client = mlflow.tracking.MlflowClient()

catalog = "previsao_brasileirao"
schema = "diamond"

# ==============================================================================
# 1. VERIFICAR SE O SCHEMA EXISTE
# ==============================================================================
print("\n[1] Verificando estrutura do catálogo...")

try:
    schemas = spark.sql(f"SHOW SCHEMAS IN {catalog}").collect()
    print(f"✅ Schemas encontrados em '{catalog}':")
    for s in schemas:
        print(f"   - {s.databaseName}")
    
    if any(s.databaseName == schema for s in schemas):
        print(f"\n✅ Schema '{schema}' existe!")
    else:
        print(f"\n❌ Schema '{schema}' NÃO encontrado!")
        print(f"\nCriando schema '{schema}'...")
        spark.sql(f"CREATE SCHEMA IF NOT EXISTS {catalog}.{schema}")
        print(f"✅ Schema '{schema}' criado!")
        
except Exception as e:
    print(f"❌ Erro ao verificar schemas: {e}")

# ==============================================================================
# 2. LISTAR TODOS OS MODELOS REGISTRADOS
# ==============================================================================
print(f"\n[2] Listando modelos em '{catalog}.{schema}'...")

try:
    # Tentar listar modelos usando MLflow
    all_models = client.search_registered_models(
        filter_string=f"name LIKE '{catalog}.{schema}.%'"
    )
    
    if all_models:
        print(f"✅ Modelos encontrados: {len(all_models)}")
        for model in all_models:
            print(f"\n📦 {model.name}")
            # Listar versões
            versions = client.search_model_versions(f"name='{model.name}'")
            for v in versions:
                print(f"   - Versão {v.version}: {v.current_stage}")
    else:
        print("⚠️ Nenhum modelo encontrado no registro do Unity Catalog")
        print("\nIsso significa que você precisa:")
        print("1. Executar o notebook '04_Diamond_Model_Training_and_Evaluation'")
        print("2. Especificamente o PASSO 5 (salvar modelos)")
        
except Exception as e:
    print(f"❌ Erro ao listar modelos: {e}")
    print(f"\nDetalhes: {type(e).__name__}")

# ==============================================================================
# 3. VERIFICAR TABELAS EXISTENTES NO SCHEMA
# ==============================================================================
print(f"\n[3] Verificando tabelas em '{catalog}.{schema}'...")

try:
    tables = spark.sql(f"SHOW TABLES IN {catalog}.{schema}").collect()
    
    if tables:
        print(f"✅ Tabelas encontradas: {len(tables)}")
        for t in tables:
            table_name = t.tableName
            count = spark.table(f"{catalog}.{schema}.{table_name}").count()
            print(f"   - {table_name}: {count:,} registros")
    else:
        print("⚠️ Nenhuma tabela encontrada no schema")
        
except Exception as e:
    print(f"❌ Erro ao listar tabelas: {e}")

# ==============================================================================
# 4. VERIFICAR EXPERIMENTOS MLFLOW
# ==============================================================================
print("\n[4] Verificando experimentos MLflow...")

try:
    experiments = mlflow.search_experiments()
    
    if experiments:
        print(f"✅ Experimentos encontrados: {len(experiments)}")
        for exp in experiments:
            print(f"   - {exp.name} (ID: {exp.experiment_id})")
            
            # Listar runs do experimento
            runs = mlflow.search_runs(experiment_ids=[exp.experiment_id], max_results=5)
            if not runs.empty:
                print(f"     Runs: {len(runs)}")
    else:
        print("⚠️ Nenhum experimento encontrado")
        
except Exception as e:
    print(f"❌ Erro ao listar experimentos: {e}")

# ==============================================================================
# 5. VERIFICAR VARIÁVEIS DE TREINAMENTO
# ==============================================================================
print("\n[5] Verificando variáveis do notebook de treinamento...")

variaveis_esperadas = [
    'modelo_geral',
    'modelo_lr',
    'modelo_rf',
    'modelo_final',
    'df_labels_map'
]

for var in variaveis_esperadas:
    if var in dir():
        print(f"✅ Variável '{var}' existe na memória")
    else:
        print(f"❌ Variável '{var}' NÃO existe na memória")

print("\n" + "="*80)
print("RESUMO DO DIAGNÓSTICO")
print("="*80)

print("\n🔍 PRÓXIMOS PASSOS:")
print("\nSe NENHUM modelo foi encontrado:")
print("  1. Execute TODO o notebook '04_Diamond_Model_Training_and_Evaluation'")
print("  2. Não pule nenhuma célula")
print("  3. Aguarde cada célula terminar antes de executar a próxima")
print("\nSe os modelos foram encontrados mas não podem ser carregados:")
print("  1. Verifique os aliases com: client.get_model_version_by_alias()")
print("  2. Tente carregar pela versão: 'models:/.../modelo/1'")
print("\nSe o schema não existe:")
print("  1. Execute: spark.sql('CREATE SCHEMA IF NOT EXISTS previsao_brasileirao.diamond')")

print("\n" + "="*80)