# ================================================
# EXPORTAÇÃO FINAL PARA LOOKER STUDIO
# ================================================

In [4]:
import pandas as pd
import os

In [8]:
import os
import pandas as pd
import pandas as pd

df = pd.read_csv("DS_Proyecto_01_Datos_Properati.csv")
print("Colunas disponíveis no dataset:")
print(df.columns.tolist())

# If df not present, try to load a likely source CSV from the project
try:
    df
except NameError:
    candidate = 'DS_Proyecto_01_Datos_Properati.csv'
    if os.path.exists(candidate):
        print(f"Carregando dados de '{candidate}' como df...")
        df = pd.read_csv(candidate)
    else:
        raise SystemExit("Variável `df` não está definida e nenhum arquivo candidato foi encontrado. Carregue o dataset antes de rodar esta célula.")

# Detectar automaticamente a coluna de preço
possiveis_precos = ["price_usd", "price_aprox_usd", "price"]
coluna_preco = None
for c in possiveis_precos:
    if c in df.columns:
        coluna_preco = c
        break

if coluna_preco:
    print(f"✅ Coluna de preço encontrada: {coluna_preco}")
else:
    raise SystemExit("❌ Nenhuma coluna de preço encontrada no dataset.")

# Renomear colunas para padronizar
df = df.rename(columns={
    "l3": "cidade",
    "l2": "provincia",
    "property_type": "tipo_imovel",
    coluna_preco: "preco",
    "surface_total": "superficie_total",
    "rooms": "quartos",
    "bathrooms": "banheiros",
    "created_on": "data_publicacao"
})

# Selecionar apenas colunas essenciais
colunas_finais = [
    "tipo_imovel",
    "preco",
    "superficie_total",
    "quartos",
    "banheiros",
    "cidade",
    "provincia",
    "data_publicacao"
]

# Verificar colunas existentes
existing_cols = [c for c in colunas_finais if c in df.columns]
missing_cols = [c for c in colunas_finais if c not in df.columns]
if missing_cols:
    print(f"Aviso: as colunas faltantes serão ignoradas: {missing_cols}")

df_export = df[existing_cols].copy()

# Remover registros com preço ou localização nula
df_export = df_export.dropna(subset=[col for col in ["preco", "cidade", "provincia"] if col in df_export.columns])

# Garantir que a data esteja em formato datetime
if 'data_publicacao' in df_export.columns:
    df_export["data_publicacao"] = pd.to_datetime(df_export["data_publicacao"], errors="coerce")

# Salvar em CSV pronto para o Looker Studio
out_path = "dados_properati_tratados.csv"
df_export.to_csv(out_path, index=False, encoding="utf-8")

print(f"✅ Arquivo '{out_path}' exportado com sucesso!")
print("Total de registros exportados:", len(df_export))
print("Colunas finais exportadas:", df_export.columns.tolist())


Colunas disponíveis no dataset:
['start_date', 'end_date', 'created_on', 'lat', 'lon', 'l1', 'l2', 'l3', 'rooms', 'bedrooms', 'bathrooms', 'surface_total', 'surface_covered', 'price', 'currency', 'title', 'description', 'property_type', 'operation_type']
✅ Coluna de preço encontrada: price
✅ Arquivo 'dados_properati_tratados.csv' exportado com sucesso!
Total de registros exportados: 146660
Colunas finais exportadas: ['tipo_imovel', 'preco', 'superficie_total', 'quartos', 'banheiros', 'cidade', 'provincia', 'data_publicacao']
✅ Arquivo 'dados_properati_tratados.csv' exportado com sucesso!
Total de registros exportados: 146660
Colunas finais exportadas: ['tipo_imovel', 'preco', 'superficie_total', 'quartos', 'banheiros', 'cidade', 'provincia', 'data_publicacao']
