In [0]:
%sql
CREATE SCHEMA IF NOT EXISTS config_dev;
CREATE SCHEMA IF NOT EXISTS config_prod;

DEV

In [0]:
from pyspark.sql import functions as F
from pyspark.sql.types import StructType, StructField, StringType, ArrayType

# Zjisti prostředí: dev nebo prod
env = 'dev'

# Data pro lookup tabulku
lookup_data = [
    ("dim_agents", "silver", "dimension", ["agent_id"], "SCD2", "Historie agentů včetně jazyků a certifikací"),
    ("dim_customers", "silver", "dimension", ["customer_id"], "SCD2", "Klienti, jejich příjem, adresa a jazyk"),
    ("dim_policies", "silver", "dimension", ["policy_id"], "SCD2", "Historie pojistných smluv a typy krytí"),
    ("dim_products", "silver", "dimension", ["product_id"], "SCD1", "Statický seznam pojistných produktů"),
    ("fact_claims", "silver", "fact", ["claim_id", "policy_id"], None, "Všechny pojistné události"),
    ("fact_premium_transactions", "silver", "fact", ["transaction_id", "policy_id"], None, "Tok peněz z pojistného – platby a jejich stav")
]


# Nastavení schématu pro lookup tabulku
schema = StructType([
    StructField("table_name", StringType(), False),
    StructField("layer", StringType(), False),
    StructField("type", StringType(), False),
    StructField("keys", ArrayType(StringType()), False),
    StructField("scd_type", StringType(), True),
    StructField("description", StringType(), True)
])

# Vytvoření DataFrame
df_lookup = spark.createDataFrame(lookup_data, schema)

# Zápis do správného prostředí tj. bu+d dev nebo prod config!!!
config_schema = f"config_{env}"
output_path = f"principal_lab_db.{config_schema}.table_lookup"
df_lookup.write.format("delta").mode("overwrite").saveAsTable(output_path)

print(f"Lookup tabulka byla vytvořena jako {output_path}")


PROD

In [0]:
from pyspark.sql import functions as F
from pyspark.sql.types import StructType, StructField, StringType, ArrayType

# Zjisti prostředí: dev nebo prod
env = 'prod'

# Data pro lookup tabulku
lookup_data = [
    ("dim_agents", "silver", "dimension", ["agent_id"], "SCD2", "Historie agentů včetně jazyků a certifikací"),
    ("dim_customers", "silver", "dimension", ["customer_id"], "SCD2", "Klienti, jejich příjem, adresa a jazyk"),
    ("dim_policies", "silver", "dimension", ["policy_id"], "SCD2", "Historie pojistných smluv a typy krytí"),
    ("dim_products", "silver", "dimension", ["product_id"], "SCD1", "Statický seznam pojistných produktů"),
    ("fact_claims", "silver", "fact", ["claim_id", "policy_id"], None, "Všechny pojistné události"),
    ("fact_premium_transactions", "silver", "fact", ["transaction_id", "policy_id"], None, "Tok peněz z pojistného – platby a jejich stav")
]


# Nastavení schématu pro lookup tabulku
schema = StructType([
    StructField("table_name", StringType(), False),
    StructField("layer", StringType(), False),
    StructField("type", StringType(), False),
    StructField("keys", ArrayType(StringType()), False),
    StructField("scd_type", StringType(), True),
    StructField("description", StringType(), True)
])

# Vytvoření DataFrame
df_lookup = spark.createDataFrame(lookup_data, schema)

# Zápis do správného prostředí tj. bu+d dev nebo prod config!!!
config_schema = f"config_{env}"
output_path = f"principal_lab_db.{config_schema}.table_lookup"
df_lookup.write.format("delta").mode("overwrite").saveAsTable(output_path)

print(f"Lookup tabulka byla vytvořena jako {output_path}")
