In [0]:
from pyspark.sql import SparkSession

# =====================================================
# 1. SESS√ÉO SPARK
# =====================================================
spark = SparkSession.builder.getOrCreate()

# =====================================================
# 2. CONFIGURA√á√ïES
# =====================================================

# Origem (somente leitura)
catalogo_origem = "dataexperts"
schema_gold = "gold"

# Destino (novo, isolado)
catalogo_export = "dataexports"
schema_export = "export"
volume_export = "export_csv"

# Caminho f√≠sico final
base_destino = f"/Volumes/{catalogo_export}/{schema_export}/{volume_export}"

# =====================================================
# 3. CRIA√á√ÉO DO CAT√ÅLOGO DE EXPORTA√á√ÉO
# =====================================================
spark.sql(f"""
CREATE CATALOG IF NOT EXISTS {catalogo_export}
""")

# =====================================================
# 4. CRIA√á√ÉO DO SCHEMA DE EXPORTA√á√ÉO
# =====================================================
spark.sql(f"""
CREATE SCHEMA IF NOT EXISTS {catalogo_export}.{schema_export}
""")

# =====================================================
# 5. CRIA√á√ÉO DO VOLUME PARA CSV
# =====================================================
spark.sql(f"""
CREATE VOLUME IF NOT EXISTS
{catalogo_export}.{schema_export}.{volume_export}
""")

print("üìÅ Cat√°logo, schema e volume de exporta√ß√£o prontos.")

# =====================================================
# 6. LISTAR TODAS AS TABELAS DA GOLD
# =====================================================
tabelas_gold = (
    spark.sql(f"SHOW TABLES IN {catalogo_origem}.{schema_gold}")
         .select("tableName")
         .collect()
)

if not tabelas_gold:
    raise Exception("‚ùå Nenhuma tabela encontrada na camada GOLD.")

print("üì¶ Tabelas encontradas na GOLD:")
for t in tabelas_gold:
    print(f" - {t.tableName}")

# =====================================================
# 7. EXPORTAR CADA TABELA PARA CSV
# =====================================================
for t in tabelas_gold:
    nome_tabela = t.tableName

    print(f"\nüöÄ Exportando tabela: {nome_tabela}")

    # leitura da tabela gold
    df = spark.table(f"{catalogo_origem}.{schema_gold}.{nome_tabela}")

    # caminhos
    pasta_tabela = f"{base_destino}/{nome_tabela}"
    pasta_tmp = f"{pasta_tabela}/_tmp"

    # escrita tempor√°ria (Spark sempre cria pasta)
    (
        df.coalesce(1)
          .write
          .mode("overwrite")
          .option("header", "true")
          .csv(pasta_tmp)
    )

    # localizar o CSV gerado
    arquivos = dbutils.fs.ls(pasta_tmp)
    arquivo_csv = [f.path for f in arquivos if f.name.endswith(".csv")][0]

    # mover para nome final
    caminho_final = f"{pasta_tabela}/{nome_tabela}.csv"
    dbutils.fs.mkdirs(pasta_tabela)
    dbutils.fs.mv(arquivo_csv, caminho_final)

    # limpar pasta tempor√°ria
    dbutils.fs.rm(pasta_tmp, recurse=True)

    print(f"‚úÖ {nome_tabela}.csv exportado com sucesso.")

# =====================================================
# 8. FINALIZA√á√ÉO
# =====================================================
print("\nüéâ EXPORTA√á√ÉO FINALIZADA COM SUCESSO!")
print(f"üìÇ Arquivos dispon√≠veis em: {base_destino}")
