In [2]:
# Import library and some pre-installed modules
import os
from IPython.display import display, Markdown

In [None]:
# Sets the root directory of the project as the working directory
os.chdir('..')

In [4]:
# Get current working directory
os.getcwd()


'/Users/darlanmnunes/Dev/DSc_git/PhD_Thesis_Step3_OSM_Toponyms'

## Import the modules

In [5]:
# Reload the utils and processar_com_overpass modules to ensure any changes are reflected
import importlib
import sys

import src.utils as utils
import src.processar_com_overpass as processar_com_overpass
import src.processar_com_ohsome as processar_com_ohsome

importlib.reload(utils)
importlib.reload(processar_com_overpass)
importlib.reload(processar_com_ohsome)

#Alternativa
#importlib.reload(sys.modules["src.utils"])
#importlib.reload(sys.modules["src.processar_com_overpass"])
#importlib.reload(sys.modules["src.processar_com_ohsome"])

<module 'src.processar_com_ohsome' from '/Users/darlanmnunes/Dev/DSc_git/PhD_Thesis_Step3_OSM_Toponyms/src/processar_com_ohsome.py'>

## Retrieving data from OpenStreetMap using APIs

### Define ET-EDGV class dictionary with respective OSM tags

In [7]:
# Novo dicionário de classes ET-EDGV com respectivas tags OSM
classe_et_edgv_to_tags = {
    'edif_ensino': [
        ('amenity', 'school'), ('amenity', 'university'),
        ('building', 'school'), ('amenity', 'kindergarten')
    ],
    'edif_saude': [
        ('amenity', 'hospital'), ('amenity', 'clinic'),
        ('building', 'hospital'), ('amenity', 'doctors'),
        ('amenity', 'dentist'), ('healthcare', '*')
    ],
    'edif_desenv_social': [
        ('amenity', 'social_facility'), ('building', 'public'),
        ('social_facility', '*')
    ],
    'edif_constr_lazer': [
        ('leisure', 'park'), ('leisure', 'sports_centre'),
        ('leisure', 'stadium'), ('amenity', 'theatre'),
        ('amenity', 'library'), ('amenity', 'community_centre'),
        ('amenity', 'arts_centre'), ('amenity', 'planetarium'),
        ('building', 'grandstand'), ('building', 'stadium'),
        ('tourism', 'museum')
    ],
    'edif_pub_civil': [
        ('building', 'public'), ('amenity', 'townhall'),
        ('office', 'government')
    ],
    'edif_turistica': [
        ('tourism', 'attraction'), ('tourism', 'artwork'),
        ('tourism', 'viewpoint'), ('amenity', 'fountain'),
        ('building', 'hotel')
    ],
    'edif_metro_ferroviaria': [
        ('railway', 'station'), ('railway', 'halt'),
        ('building', 'train_station'), ('public_transport', 'station')
    ]
}
classe_et_edgv_to_tags

{'edif_ensino': [('amenity', 'school'),
  ('amenity', 'university'),
  ('building', 'school'),
  ('amenity', 'kindergarten')],
 'edif_saude': [('amenity', 'hospital'),
  ('amenity', 'clinic'),
  ('building', 'hospital'),
  ('amenity', 'doctors'),
  ('amenity', 'dentist'),
  ('healthcare', '*')],
 'edif_desenv_social': [('amenity', 'social_facility'),
  ('building', 'public'),
  ('social_facility', '*')],
 'edif_constr_lazer': [('leisure', 'park'),
  ('leisure', 'sports_centre'),
  ('leisure', 'stadium'),
  ('amenity', 'theatre'),
  ('amenity', 'library'),
  ('amenity', 'community_centre'),
  ('amenity', 'arts_centre'),
  ('amenity', 'planetarium'),
  ('building', 'grandstand'),
  ('building', 'stadium'),
  ('tourism', 'museum')],
 'edif_pub_civil': [('building', 'public'),
  ('amenity', 'townhall'),
  ('office', 'government')],
 'edif_turistica': [('tourism', 'attraction'),
  ('tourism', 'artwork'),
  ('tourism', 'viewpoint'),
  ('amenity', 'fountain'),
  ('building', 'hotel')],
 'edif

### Step 7 - Retrieval of the last toponyms by the most recent feature

#### PostGIS - Open the database connection

In [8]:
# Conexão ao Banco PostGIS
import psycopg2

# Function to load database credentials from a text file
def load_credentials_from_txt(file_path):
    credentials = {}
    try:
        with open(file_path, 'r') as f:
            for line in f:
                if '=' in line:
                    key, value = line.strip().split('=', 1)
                    credentials[key.strip()] = value.strip()
    except FileNotFoundError:
        print(f"Arquivo de credenciais não encontrado: {file_path}")
    except Exception as e:
        print(f"Erro ao ler credenciais: {e}")
    return credentials

def connect_to_postgis(txt_path='configs/db_credentials.txt'):
    creds = load_credentials_from_txt(txt_path)

    required_keys = ['DB_NAME', 'DB_USER', 'DB_PASSWORD', 'DB_HOST', 'DB_PORT']
    if not all(k in creds for k in required_keys):
        print("Credenciais incompletas no arquivo de configuração.")
        return None

    try:
        conn = psycopg2.connect(
            dbname=creds['DB_NAME'],
            user=creds['DB_USER'],
            password=creds['DB_PASSWORD'],
            host=creds['DB_HOST'],
            port=creds['DB_PORT']
        )
        print("Conexão ao PostGIS estabelecida com sucesso!")
        return conn

    except Exception as e:
        print(f" Erro ao conectar ao PostGIS: {e}")
        return None

In [9]:
# Open the database connection
conn = connect_to_postgis()

Conexão ao PostGIS estabelecida com sucesso!


#### Filter grid cells from the database with name_ratio > 0

 * Pré-filtragem SQL
 * Garantir que pelo menos uma classe tem name_ratio > 0 para cada célula da grade


In [10]:
# Function to fetch valid grid cells from the database
from shapely import wkt
import pandas as pd
import geopandas as gpd

def fetch_geometries_psycopg2(conn, classe_et_edgv_to_tags, table_name):
    """
    Recupera geometrias do PostGIS com base nos filtros name_ratio > 0 usando psycopg2.
    Retorna um GeoDataFrame.
    """
    try:
        # Garante que qualquer erro anterior seja limpo
        conn.rollback()

        # Monta cláusula WHERE
        where_clause = " OR ".join([
            f"step1_consolidado_{classe}_name_ratio > 0" for classe in classe_et_edgv_to_tags
        ])

        query = f"""
            SELECT *, ST_AsText(geom) AS wkt_geom
            FROM public.{table_name}
            WHERE {where_clause}
        """

        with conn.cursor() as cur:
            cur.execute(query)
            colnames = [desc[0] for desc in cur.description]
            rows = cur.fetchall()

        # Monta DataFrame
        df = pd.DataFrame(rows, columns=colnames)

        # Converte geometria WKT em shapely
        df["geometry"] = df["wkt_geom"].apply(wkt.loads)
        gdf = gpd.GeoDataFrame(df.drop(columns=["wkt_geom"]), geometry="geometry")

        # Define CRS padrão
        gdf.set_crs(epsg=4674, inplace=True)

        print(f"Consulta retornou {len(gdf)} registros.")
        return gdf

    except psycopg2.Error as e:
        conn.rollback()
        print("Erro ao executar a consulta SQL:")
        print(e.pgerror)
        raise

In [None]:
# Get the valid grid cell (name_ratio>0)from the database using psycopg2
gdf_cells_valid = fetch_geometries_psycopg2(conn, classe_et_edgv_to_tags, table_name="steps_consolidado_20cells_tests")
display(gdf_cells_valid.head())

In [None]:
# Verifica se as colunas estão corretas
gdf_cells_valid.columns.tolist()

#### **Request last toponyms and metadata – OHSOME API**


1. Conectar ao PostGIS para filtrar apenas células onde name_ratio > 0 para pelo menos uma classe.

2. Pré-filtragem das por células das classe com as tags do dicionário classe_et_edgv_to_tags - aumentar performance.

3. Para cada célula e classe com name_ratio > 0:

  * Extrair bbox da célula válida;

  * Uso do inflexao_data (step6) como início da janela temporal

  * Fazer chamada A API OSHOME para para recuperar a contribuição mais recente com name=*
    - Endpoint: POST /contributions/latest/geometry;

  * Respeito à data de inflexão (step6_consolidado_{classe}_inflexao_data)

  * Resgatar geometria (pontos) e metadados:
    - Metadados: @timestamp, @osmId, tags, name.

4. Paralelização por célula

5. Log detalhado e consolidação final

6. Salvar os resultados em GeoJSON incremental.

In [15]:
# Fetch metadata from the ohsome API
# This code fetches metadata from the ohsome API and handles potential JSON decoding errors.
import requests

URL = 'https://api.ohsome.org/v1/metadata'
response = requests.get(URL)

if response.status_code == 200:
    try:
        data = response.json()
        print("Dados recebidos:")
        display(data)
    except ValueError:
        print("Erro ao decodificar JSON. Conteúdo bruto:")
        display(response.text)
else:
    display(f"Erro HTTP {response.status_code}")
    print("Resposta:")
    display(response.text)

Dados recebidos:


{'attribution': {'url': 'https://ohsome.org/copyrights',
  'text': '© OpenStreetMap contributors'},
 'apiVersion': '1.10.4',
 'timeout': 600.0,
 'extractRegion': {'spatialExtent': {'type': 'Polygon',
   'coordinates': [[[-180.0, -90.0],
     [180.0, -90.0],
     [180.0, 90.0],
     [-180.0, 90.0],
     [-180.0, -90.0]]]},
  'temporalExtent': {'fromTimestamp': '2007-10-08T00:00:00Z',
   'toTimestamp': '2025-04-06T13:00Z'},
  'replicationSequenceNumber': 110142}}

##### Implementação sem módulos externos

In [None]:
# === STEP 7: Último topônimo OSM por classe usando a API OHSOME ===
# Versão final com paralelização, logs, output GeoJSON e metadados completos

# Sem módulos externos (Utils), apenas bibliotecas padrão e geopandas

# === Import necessary libraries ===
import requests
import json
from shapely.geometry import shape, mapping
import time
import math
import csv
from pathlib import Path
import pandas as pd
from concurrent.futures import ThreadPoolExecutor, as_completed
from datetime import timedelta
import threading
from tqdm import tqdm
import glob

# === CONFIGURAÇÕES GERAIS ===
output_dir = Path("data/output_code1/20cells_tests/step7_latest_name")
output_dir.mkdir(parents=True, exist_ok=True)

log_path = output_dir / "log_step7.csv"
ultimo_lote_path = output_dir / "ultimo_lote_step7.txt"
url_ohsome_latest = "https://api.ohsome.org/v1/contributions/latest/geometry"

# === INICIALIZAÇÃO DO LOG ===
if not log_path.exists():
    with open(log_path, 'w', newline='') as f:
        csv.writer(f).writerow(["lote", "mensagem", "timestamp"])

def log_mensagem(lote, mensagem):
    timestamp = time.strftime('%Y-%m-%d %H:%M:%S')
    with open(log_path, 'a', newline='') as f:
        csv.writer(f).writerow([lote, mensagem, timestamp])

# === KEEP ALIVE (com controle de término) ===
# Flag global para controle
keep_alive_running = True

def keep_alive():
    while keep_alive_running:
        time.sleep(300)
        print("Ainda trabalhando...")
        log_mensagem("keep_alive", "Ainda trabalhando...")

keep_alive_thread = threading.Thread(target=keep_alive, daemon=True)
keep_alive_thread.start()

# === FUNÇÃO PARA PROCESSAR UMA CÉLULA ===
def processar_ultima_contribuicao(cell_row):
    id_celula = cell_row["id"]
    bbox = cell_row.geometry.bounds  # (minx, miny, maxx, maxy)
    features_resultantes = []

    for classe, tags in classe_et_edgv_to_tags.items():
        ratio_col = f"step1_consolidado_{classe}_name_ratio"
        inflexao_col = f"step6_consolidado_{classe}_inflexao_data"

        if pd.isna(cell_row.get(ratio_col)) or cell_row[ratio_col] <= 0:
            continue

        data_inicio_str = cell_row.get(inflexao_col) # Uso do inflexao_data como início da janela temporal
        if not isinstance(data_inicio_str, str) or data_inicio_str.strip() == "" or data_inicio_str.lower() == "none":
            continue

        try:
            data_inicio = pd.to_datetime(data_inicio_str, errors="coerce")
            if pd.isna(data_inicio):
                continue
        except Exception as e:
            log_mensagem(id_celula, f"[ERRO] Conversão de data inflexão inválida: {data_inicio_str} - {e}")
            continue

        data_fim = pd.Timestamp("2025-04-06T13:00Z").strftime("%Y-%m-%d") # data_fim fixa de acordo com API metadata ('temporalExtent')
        data_inicio_str = data_inicio.strftime("%Y-%m-%d")

        for tag, value in tags:
            payload = {
                "bboxes": f"{bbox[0]},{bbox[1]},{bbox[2]},{bbox[3]}",
                "time": f"{data_inicio_str},{data_fim}",
                "filter": f"{tag}={value} and name=*",
                "properties": "metadata,tags",
                "clipGeometry": "false"
            }

            try:
                response = requests.post(url_ohsome_latest, data=payload)
                
                print(f"[DEBUG] Célula: {id_celula}, Classe: {classe}, Tag={tag}, Value={value}")
                print(f"[DEBUG] Payload: {json.dumps(payload)}")
                print(f"[DEBUG] Status Code: {response.status_code}")
                print(f"[DEBUG] Response Text: {response.text[:300]}")  # apenas os primeiros 300 chars

                response.raise_for_status()
                dados = response.json()

                for feat in dados.get("features", []):
                    geom_data = feat.get("geometry")
                    props = feat.get("properties", {})

                    if geom_data is None:
                        continue

                    geom = shape(geom_data)
                    if geom.geom_type in ["Polygon", "MultiPolygon"]:
                        geom = geom.centroid

                    props_clean = {
                        "id_celula": id_celula,
                        "classe": classe,
                        "tag": tag,
                        "value": value,
                        **props
                    }

                    features_resultantes.append({
                        "type": "Feature",
                        "geometry": mapping(geom),
                        "properties": props_clean
                    })

            except Exception as e:
                log_mensagem(id_celula, f"[ERRO OHSOME {classe}] {tag}={value}: {str(e)}")

    return features_resultantes

try:
    # === EXECUÇÃO EM LOTE ===
    ultimo_lote = 0
    if ultimo_lote_path.exists():
        with open(ultimo_lote_path, 'r') as f:
            ultimo_lote = int(f.read().strip())

    lote_size = 20
    total_lotes = math.ceil(len(gdf_cells_valid) / lote_size)

    for lote_index in range(ultimo_lote, total_lotes):
        start_time = time.time()
        features_final = []

        subset = gdf_cells_valid.iloc[lote_index * lote_size: (lote_index + 1) * lote_size]

        with ThreadPoolExecutor(max_workers=5) as executor:
            futures = [executor.submit(processar_ultima_contribuicao, row) for _, row in subset.iterrows()]
            for future in tqdm(as_completed(futures), total=len(futures), desc=f"Lote {lote_index + 1} (Step 7)"):
                try:
                    features_final.extend(future.result())
                except Exception as e:
                    log_mensagem(lote_index + 1, f"[FALHA GERAL]: {e}")

        # Salva lote em GeoJSON
        fc = {"type": "FeatureCollection", "features": features_final}
        out_path = output_dir / f"step7_lote{lote_index + 1}.geojson"
        with open(out_path, 'w', encoding='utf-8') as f:
            json.dump(fc, f)
        log_mensagem(lote_index + 1, f"SALVO {out_path.name}")

        # Atualiza consolidação incremental
        arquivos = sorted(output_dir.glob("step7_lote*.geojson"))
        todas_features = []
        for arquivo in arquivos:
            with open(arquivo, 'r', encoding='utf-8') as f:
                fc_parcial = json.load(f)
                todas_features.extend(fc_parcial['features'])

        final_fc = {"type": "FeatureCollection", "features": todas_features}
        with open(output_dir / "step7_consolidado.geojson", 'w', encoding='utf-8') as f:
            json.dump(final_fc, f)
        log_mensagem(lote_index + 1, "CONSOLIDADO atualizado")

        with open(ultimo_lote_path, 'w') as f:
            f.write(str(lote_index + 1))

        tempo_msg = f"Tempo lote {lote_index + 1}: {str(timedelta(seconds=int(time.time() - start_time)))}"
        print(tempo_msg)
        log_mensagem(lote_index + 1, tempo_msg)

    print("Step 7 (último topônimo por classe) finalizado com sucesso.")
    log_mensagem("step7", "Processamento finalizado")

finally:
    keep_alive_running = False
    keep_alive_thread.join(timeout=1)

##### Implementação com módulos externos

In [None]:
# === STEP 7 (OHSOME API) ===
# Com módulos utils e processar_com_ohsome

# === Import necessary libraries and modules ===
from src.utils import init_log, start_keep_alive, log_mensagem, consolidar_geojson
from src.processar_com_ohsome import processar_com_ohsome

from tqdm import tqdm
from pathlib import Path
from concurrent.futures import ThreadPoolExecutor, as_completed
from datetime import timedelta
import json, math, time

# === CONFIGURAÇÕES GERAIS ===
output_dir = Path("data/output_code1/step7_latest_name_ohsome")
output_dir.mkdir(parents=True, exist_ok=True)

log_path = output_dir / "log_step7_ohsome.csv"
ultimo_lote_path = output_dir / "ultimo_lote_step7_ohsome.txt"

# === LOG E KEEP ALIVE ===
# Flag global para controle

init_log(log_path)
keep_alive_flag = {"running": True}
keep_alive_thread = start_keep_alive(log_path, keep_alive_flag)

# === EXECUÇÃO EM LOTE ===
try:
    ultimo_lote = int(ultimo_lote_path.read_text().strip()) if ultimo_lote_path.exists() else 0
    lote_size = 20
    total_lotes = math.ceil(len(gdf_cells_valid) / lote_size)

    for lote_index in range(ultimo_lote, total_lotes):
        start_time = time.time()
        features_final = []
        subset = gdf_cells_valid.iloc[lote_index * lote_size: (lote_index + 1) * lote_size]

        with ThreadPoolExecutor(max_workers=5) as executor:
            futures = [
                executor.submit(processar_com_ohsome, row, classe_et_edgv_to_tags, log_mensagem, log_path)
                for _, row in subset.iterrows()
            ]
            for future in tqdm(as_completed(futures), total=len(futures), desc=f"Lote {lote_index + 1} (Step 7 OHSOME)"):
                try:
                    features_final.extend(future.result())
                except Exception as e:
                    log_mensagem(log_path, lote_index + 1, f"[FALHA GERAL]: {e}")

        out_path = output_dir / f"step7_lote{lote_index + 1}.geojson"
        with open(out_path, 'w', encoding='utf-8') as f:
            json.dump({"type": "FeatureCollection", "features": features_final}, f)
        log_mensagem(log_path, lote_index + 1, f"SALVO {out_path.name}")

        total_feats = consolidar_geojson(output_dir, "step7_lote*.geojson", "step7_consolidado.geojson")
        log_mensagem(log_path, lote_index + 1, f"CONSOLIDADO atualizado: {total_feats} features")

        ultimo_lote_path.write_text(str(lote_index + 1))
        print(f"Lote {lote_index + 1} concluído em {str(timedelta(seconds=int(time.time() - start_time)))}")

    print("Step 7 (OHSOME) finalizado com sucesso.")
    log_mensagem(log_path, "final", "Processamento concluído")

finally:
    keep_alive_flag["running"] = False
    keep_alive_thread.join(timeout=1)

#### **Request last toponyms and metadata – Overpass API**

 * [Overpass API](https://wiki.openstreetmap.org/wiki/Overpass_API)

##### Implementação sem módulos externos

In [None]:
# === STEP 7: Último topônimo OSM por classe (via Overpass API) ===
# Sem módulo utils

from pathlib import Path
from datetime import timedelta
from concurrent.futures import ThreadPoolExecutor, as_completed
import time, threading, math, json, csv, glob
import pandas as pd

# === CONFIGURAÇÕES GERAIS ===
output_dir = Path("data/output_code1/step7_latest_name_overpass")
output_dir.mkdir(parents=True, exist_ok=True)

log_path = output_dir / "log_step7_overpass.csv"
ultimo_lote_path = output_dir / "ultimo_lote_step7_overpass.txt"

# === INICIALIZAÇÃO DO LOG ===
if not log_path.exists():
    with open(log_path, 'w', newline='') as f:
        csv.writer(f).writerow(["lote", "mensagem", "timestamp"])

def log_mensagem(lote, mensagem):
    timestamp = time.strftime('%Y-%m-%d %H:%M:%S')
    with open(log_path, 'a', newline='') as f:
        csv.writer(f).writerow([lote, mensagem, timestamp])

# === KEEP ALIVE (com controle de término) ===
keep_alive_running = True
def keep_alive():
    while keep_alive_running:
        time.sleep(300)
        print("Ainda trabalhando...")
        log_mensagem("keep_alive", "Ainda trabalhando...")

keep_alive_thread = threading.Thread(target=keep_alive, daemon=True)
keep_alive_thread.start()

# === EXECUÇÃO EM LOTE USANDO OVERPASS ===
try:
    ultimo_lote = 0
    if ultimo_lote_path.exists():
        with open(ultimo_lote_path, 'r') as f:
            ultimo_lote = int(f.read().strip())

    lote_size = 20
    total_lotes = math.ceil(len(gdf_cells_valid) / lote_size)

    for lote_index in range(ultimo_lote, total_lotes):
        start_time = time.time()
        features_final = []

        subset = gdf_cells_valid.iloc[lote_index * lote_size: (lote_index + 1) * lote_size]

        with ThreadPoolExecutor(max_workers=5) as executor:
            futures = [executor.submit(processar_com_overpass, row, classe_et_edgv_to_tags, log_mensagem) for _, row in subset.iterrows()]
            for future in as_completed(futures):
                try:
                    features_final.extend(future.result())
                except Exception as e:
                    log_mensagem(lote_index + 1, f"[FALHA GERAL]: {e}")

        # Salva lote em GeoJSON
        fc = {"type": "FeatureCollection", "features": features_final}
        out_path = output_dir / f"step7_lote{lote_index + 1}.geojson"
        with open(out_path, 'w', encoding='utf-8') as f:
            json.dump(fc, f)
        log_mensagem(lote_index + 1, f"SALVO {out_path.name}")

        # Atualiza consolidação incremental
        arquivos = sorted(output_dir.glob("step7_lote*.geojson"))
        todas_features = []
        for arquivo in arquivos:
            with open(arquivo, 'r', encoding='utf-8') as f:
                fc_parcial = json.load(f)
                todas_features.extend(fc_parcial['features'])

        final_fc = {"type": "FeatureCollection", "features": todas_features}
        with open(output_dir / "step7_consolidado.geojson", 'w', encoding='utf-8') as f:
            json.dump(final_fc, f)
        log_mensagem(lote_index + 1, "CONSOLIDADO atualizado")

        with open(ultimo_lote_path, 'w') as f:
            f.write(str(lote_index + 1))

        tempo_msg = f"Tempo lote {lote_index + 1}: {str(timedelta(seconds=int(time.time() - start_time)))}"
        print(tempo_msg)
        log_mensagem(lote_index + 1, tempo_msg)

    print("Step 7 (último topônimo por classe - Overpass) finalizado com sucesso.")
    log_mensagem("step7_overpass", "Processamento finalizado")

finally:
    keep_alive_running = False
    keep_alive_thread.join(timeout=1)


##### Implementação com módulos externos

In [None]:
# === STEP 7 (Overpass API) ===
# Com módulos utils e processar_com_overpass

from src.utils import init_log, start_keep_alive, log_mensagem, consolidar_geojson
from src.processar_com_overpass import processar_com_overpass

from pathlib import Path
from datetime import timedelta
from concurrent.futures import ThreadPoolExecutor, as_completed
import math, json, time

# === CONFIGURAÇÃO ===
output_dir = Path("data/output_code1/step7_latest_name_overpass")
output_dir.mkdir(parents=True, exist_ok=True)
log_path = output_dir / "log_step7_overpass.csv"
ultimo_lote_path = output_dir / "ultimo_lote_step7_overpass.txt"

# === LOG E KEEP ALIVE ===
init_log(log_path)
keep_alive_flag = {"running": True}
keep_alive_thread = start_keep_alive(log_path, keep_alive_flag)

# === EXECUÇÃO EM LOTE ===
try:
    ultimo_lote = int(ultimo_lote_path.read_text().strip()) if ultimo_lote_path.exists() else 0
    lote_size = 20
    total_lotes = math.ceil(len(gdf_cells_valid) / lote_size)

    for lote_index in range(ultimo_lote, total_lotes):
        start_time = time.time()
        features_final = []
        subset = gdf_cells_valid.iloc[lote_index * lote_size: (lote_index + 1) * lote_size]

        with ThreadPoolExecutor(max_workers=5) as executor:
            futures = [
                executor.submit(processar_com_overpass, row, classe_et_edgv_to_tags, log_mensagem, log_path)
                for _, row in subset.iterrows()
            ]
            for future in tqdm(as_completed(futures), total=len(futures), desc=f"Lote {lote_index + 1} (Step 7 Overpass)"):
                try:
                    features_final.extend(future.result())
                except Exception as e:
                    log_mensagem(log_path, lote_index + 1, f"[FALHA GERAL]: {e}")

        # Salva lote
        out_path = output_dir / f"step7_lote{lote_index + 1}.geojson"
        with open(out_path, 'w', encoding='utf-8') as f:
            json.dump({"type": "FeatureCollection", "features": features_final}, f)
        log_mensagem(log_path, lote_index + 1, f"SALVO {out_path.name}")

        # Consolida incremental
        total_feats = consolidar_geojson(output_dir, "step7_lote*.geojson", "step7_consolidado.geojson")
        log_mensagem(log_path, lote_index + 1, f"CONSOLIDADO atualizado: {total_feats} features")

        # Atualiza lote
        ultimo_lote_path.write_text(str(lote_index + 1))
        print(f"Lote {lote_index + 1} concluído em {str(timedelta(seconds=int(time.time() - start_time)))}")

    print("Step 7 (Overpass) finalizado com sucesso.")
    log_mensagem(log_path, "final", "Processamento concluído")

finally:
    keep_alive_flag["running"] = False
    keep_alive_thread.join(timeout=1)

In [None]:
# === DEBUG MANUAL - PROCESSAR UMA CELULA ===

# Rodar debug manual com apenas uma célula
test_row = gdf_cells_valid.iloc[0]
features = processar_com_overpass.processar_com_overpass(test_row, classe_et_edgv_to_tags, log_mensagem, log_path)

print(json.dumps(features, indent=2))

#### PostGIS - Close the database connection

In [None]:
# Close the database connection
if conn and conn.closed == 0:
    # conexão ainda aberta
    with conn.cursor() as cur:
        ...
        cur.close()
    conn.close()
    print("Conexão com o banco de dados fechada.")
else:
    print("Conexão com o banco de dados já estava fechada ou não foi estabelecida.")
