In [2]:
# Import library and some pre-installed modules
import os
from IPython.display import display, Markdown

In [3]:
# Sets the root directory of the project as the working directory
os.chdir('..')

In [4]:
# Get current working directory
os.getcwd()


'/Users/darlanmnunes/Dev/DSc_git/PhD_Thesis_Step3_OSM_Toponyms'

## Import the modules

In [14]:
# Reload the utils and processar_com_overpass modules to ensure any changes are reflected
import importlib
import sys

import src.utils as utils
import src.processar_com_overpass as processar_com_overpass
import src.processar_com_ohsome as processar_com_ohsome

importlib.reload(utils)
importlib.reload(processar_com_overpass)
importlib.reload(processar_com_ohsome)

#Alternativa
#importlib.reload(sys.modules["src.utils"])
#importlib.reload(sys.modules["src.processar_com_overpass"])
#importlib.reload(sys.modules["src.processar_com_ohsome"])

<module 'src.processar_com_ohsome' from '/Users/darlanmnunes/Dev/DSc_git/PhD_Thesis_Step3_OSM_Toponyms/src/processar_com_ohsome.py'>

## Retrieving data from OpenStreetMap using APIs

### Define ET-EDGV class dictionary with respective OSM tags

In [6]:
# Novo dicionário de classes ET-EDGV com respectivas tags OSM
classe_et_edgv_to_tags = {
    'edif_ensino': [
        ('amenity', 'school'), ('amenity', 'university'),
        ('building', 'school'), ('amenity', 'kindergarten')
    ],
    'edif_saude': [
        ('amenity', 'hospital'), ('amenity', 'clinic'),
        ('building', 'hospital'), ('amenity', 'doctors'),
        ('amenity', 'dentist'), ('healthcare', '*')
    ],
    'edif_desenv_social': [
        ('amenity', 'social_facility'), ('building', 'public'),
        ('social_facility', '*')
    ],
    'edif_constr_lazer': [
        ('leisure', 'park'), ('leisure', 'sports_centre'),
        ('leisure', 'stadium'), ('amenity', 'theatre'),
        ('amenity', 'library'), ('amenity', 'community_centre'),
        ('amenity', 'arts_centre'), ('amenity', 'planetarium'),
        ('building', 'grandstand'), ('building', 'stadium'),
        ('tourism', 'museum')
    ],
    'edif_pub_civil': [
        ('building', 'public'), ('amenity', 'townhall'),
        ('office', 'government')
    ],
    'edif_turistica': [
        ('tourism', 'attraction'), ('tourism', 'artwork'),
        ('tourism', 'viewpoint'), ('amenity', 'fountain'),
        ('building', 'hotel')
    ],
    'edif_metro_ferroviaria': [
        ('railway', 'station'), ('railway', 'halt'),
        ('building', 'train_station'), ('public_transport', 'station')
    ]
}
classe_et_edgv_to_tags

{'edif_ensino': [('amenity', 'school'),
  ('amenity', 'university'),
  ('building', 'school'),
  ('amenity', 'kindergarten')],
 'edif_saude': [('amenity', 'hospital'),
  ('amenity', 'clinic'),
  ('building', 'hospital'),
  ('amenity', 'doctors'),
  ('amenity', 'dentist'),
  ('healthcare', '*')],
 'edif_desenv_social': [('amenity', 'social_facility'),
  ('building', 'public'),
  ('social_facility', '*')],
 'edif_constr_lazer': [('leisure', 'park'),
  ('leisure', 'sports_centre'),
  ('leisure', 'stadium'),
  ('amenity', 'theatre'),
  ('amenity', 'library'),
  ('amenity', 'community_centre'),
  ('amenity', 'arts_centre'),
  ('amenity', 'planetarium'),
  ('building', 'grandstand'),
  ('building', 'stadium'),
  ('tourism', 'museum')],
 'edif_pub_civil': [('building', 'public'),
  ('amenity', 'townhall'),
  ('office', 'government')],
 'edif_turistica': [('tourism', 'attraction'),
  ('tourism', 'artwork'),
  ('tourism', 'viewpoint'),
  ('amenity', 'fountain'),
  ('building', 'hotel')],
 'edif

### Step 7 - Retrieval of the last toponyms by the most recent feature

#### PostGIS - Open the database connection

In [7]:
# Conexão ao Banco PostGIS
import psycopg2

# Function to load database credentials from a text file
def load_credentials_from_txt(file_path):
    credentials = {}
    try:
        with open(file_path, 'r') as f:
            for line in f:
                if '=' in line:
                    key, value = line.strip().split('=', 1)
                    credentials[key.strip()] = value.strip()
    except FileNotFoundError:
        print(f"Arquivo de credenciais não encontrado: {file_path}")
    except Exception as e:
        print(f"Erro ao ler credenciais: {e}")
    return credentials

def connect_to_postgis(txt_path='configs/db_credentials.txt'):
    creds = load_credentials_from_txt(txt_path)

    required_keys = ['DB_NAME', 'DB_USER', 'DB_PASSWORD', 'DB_HOST', 'DB_PORT']
    if not all(k in creds for k in required_keys):
        print("Credenciais incompletas no arquivo de configuração.")
        return None

    try:
        conn = psycopg2.connect(
            dbname=creds['DB_NAME'],
            user=creds['DB_USER'],
            password=creds['DB_PASSWORD'],
            host=creds['DB_HOST'],
            port=creds['DB_PORT']
        )
        print("Conexão ao PostGIS estabelecida com sucesso!")
        return conn

    except Exception as e:
        print(f" Erro ao conectar ao PostGIS: {e}")
        return None

In [8]:
# Open the database connection
conn = connect_to_postgis()

Conexão ao PostGIS estabelecida com sucesso!


#### Filter grid cells from the database with name_ratio > 0

 * Pré-filtragem SQL
 * Garantir que pelo menos uma classe tem name_ratio > 0 para cada célula da grade


In [10]:
# Function to fetch valid grid cells from the database
from shapely import wkt
import pandas as pd
import geopandas as gpd

def fetch_geometries_psycopg2(conn, classe_et_edgv_to_tags, table_name):
    """
    Recupera geometrias do PostGIS com base nos filtros name_ratio > 0 usando psycopg2.
    Retorna um GeoDataFrame.
    """
    try:
        # Garante que qualquer erro anterior seja limpo
        conn.rollback()

        # Monta cláusula WHERE
        where_clause = " OR ".join([
            f"step1_consolidado_{classe}_name_ratio > 0" for classe in classe_et_edgv_to_tags
        ])

        query = f"""
            SELECT *, ST_AsText(geom) AS wkt_geom
            FROM public.{table_name}
            WHERE {where_clause}
        """

        with conn.cursor() as cur:
            cur.execute(query)
            colnames = [desc[0] for desc in cur.description]
            rows = cur.fetchall()

        # Monta DataFrame
        df = pd.DataFrame(rows, columns=colnames)

        # Converte geometria WKT em shapely
        df["geometry"] = df["wkt_geom"].apply(wkt.loads)
        gdf = gpd.GeoDataFrame(df.drop(columns=["wkt_geom"]), geometry="geometry")

        # Define CRS padrão
        gdf.set_crs(epsg=4674, inplace=True)

        print(f"Consulta retornou {len(gdf)} registros.")
        return gdf

    except psycopg2.Error as e:
        conn.rollback()
        print("Erro ao executar a consulta SQL:")
        print(e.pgerror)
        raise

In [11]:
# Get the valid grid cell (name_ratio>0)from the database using psycopg2
gdf_cells_valid = fetch_geometries_psycopg2(conn, classe_et_edgv_to_tags, table_name="steps1e6_consolidado")
display(gdf_cells_valid.head())

Consulta retornou 2265 registros.


Unnamed: 0,id,geom,fid,POP10,step1_consolidado_edif_ensino_total_count,step1_consolidado_edif_ensino_name_count,step1_consolidado_edif_ensino_name_ratio,step1_consolidado_edif_saude_total_count,step1_consolidado_edif_saude_name_count,step1_consolidado_edif_saude_name_ratio,...,step6_consolidado_edif_metro_ferroviaria_sigmoid_pct_erro,step6_consolidado_edif_metro_ferroviaria_sigmoid_a,step6_consolidado_edif_metro_ferroviaria_sigmoid_b,step6_consolidado_edif_metro_ferroviaria_sigmoid_c,step6_consolidado_edif_metro_ferroviaria_sigmoid_d,step6_consolidado_edif_metro_ferroviaria_inflexao_idx,step6_consolidado_edif_metro_ferroviaria_inflexao_data,step6_consolidado_edif_metro_ferroviaria_sigmoid_fit_overflow,step6_consolidado_edif_metro_ferroviaria_dias_desde_inflexao,geometry
0,200ME60338N90882,0106000020421200000100000001030000000100000005...,1,345,0.0,0.0,0.0,0.0,0.0,0.0,...,,,,,,,,,,"MULTIPOLYGON (((-44.06371 -19.97798, -44.06378..."
1,200ME60346N90862,0106000020421200000100000001030000000100000005...,8,202,1.0,1.0,100.0,0.0,0.0,0.0,...,,,,,,,,,,"MULTIPOLYGON (((-44.05535 -19.99568, -44.05542..."
2,200ME60348N90862,0106000020421200000100000001030000000100000005...,9,525,1.0,1.0,100.0,0.0,0.0,0.0,...,,,,,,,,,,"MULTIPOLYGON (((-44.05343 -19.99561, -44.05350..."
3,200ME60346N90864,0106000020421200000100000001030000000100000005...,11,349,1.0,1.0,100.0,0.0,0.0,0.0,...,,,,,,,,,,"MULTIPOLYGON (((-44.05542 -19.99388, -44.05548..."
4,200ME60348N90864,0106000020421200000100000001030000000100000005...,12,500,0.0,0.0,0.0,0.0,0.0,0.0,...,,,,,,,,,,"MULTIPOLYGON (((-44.05350 -19.99382, -44.05356..."


In [12]:
# Verifica se as colunas estão corretas
gdf_cells_valid.columns.tolist()

['id',
 'geom',
 'fid',
 'POP10',
 'step1_consolidado_edif_ensino_total_count',
 'step1_consolidado_edif_ensino_name_count',
 'step1_consolidado_edif_ensino_name_ratio',
 'step1_consolidado_edif_saude_total_count',
 'step1_consolidado_edif_saude_name_count',
 'step1_consolidado_edif_saude_name_ratio',
 'step1_consolidado_edif_desenv_social_total_count',
 'step1_consolidado_edif_desenv_social_name_count',
 'step1_consolidado_edif_desenv_social_name_ratio',
 'step1_consolidado_edif_constr_lazer_total_count',
 'step1_consolidado_edif_constr_lazer_name_count',
 'step1_consolidado_edif_constr_lazer_name_ratio',
 'step1_consolidado_edif_pub_civil_total_count',
 'step1_consolidado_edif_pub_civil_name_count',
 'step1_consolidado_edif_pub_civil_name_ratio',
 'step1_consolidado_edif_turistica_total_count',
 'step1_consolidado_edif_turistica_name_count',
 'step1_consolidado_edif_turistica_name_ratio',
 'step1_consolidado_edif_metro_ferroviaria_total_count',
 'step1_consolidado_edif_metro_ferrovia

#### **Request last toponyms and metadata – OHSOME API**


1. Conectar ao PostGIS para filtrar apenas células onde name_ratio > 0 para pelo menos uma classe.

2. Pré-filtragem das por células das classe com as tags do dicionário classe_et_edgv_to_tags - aumentar performance.

3. Para cada célula e classe com name_ratio > 0:

  * Extrair bbox da célula válida;

  * Uso do inflexao_data (step6) como início da janela temporal

  * Fazer chamada A API OSHOME para para recuperar a contribuição mais recente com name=*
    - Endpoint: POST /contributions/latest/geometry;

  * Respeito à data de inflexão (step6_consolidado_{classe}_inflexao_data)

  * Resgatar geometria (pontos) e metadados:
    - Metadados: @timestamp, @osmId, tags, name.

4. Paralelização por célula

5. Log detalhado e consolidação final

6. Salvar os resultados em GeoJSON incremental.

In [13]:
# Fetch metadata from the ohsome API
# This code fetches metadata from the ohsome API and handles potential JSON decoding errors.
import requests

URL = 'https://api.ohsome.org/v1/metadata'
response = requests.get(URL)

if response.status_code == 200:
    try:
        data = response.json()
        print("Dados recebidos:")
        display(data)
    except ValueError:
        print("Erro ao decodificar JSON. Conteúdo bruto:")
        display(response.text)
else:
    display(f"Erro HTTP {response.status_code}")
    print("Resposta:")
    display(response.text)

Dados recebidos:


{'attribution': {'url': 'https://ohsome.org/copyrights',
  'text': '© OpenStreetMap contributors'},
 'apiVersion': '1.10.4',
 'timeout': 600.0,
 'extractRegion': {'spatialExtent': {'type': 'Polygon',
   'coordinates': [[[-180.0, -90.0],
     [180.0, -90.0],
     [180.0, 90.0],
     [-180.0, 90.0],
     [-180.0, -90.0]]]},
  'temporalExtent': {'fromTimestamp': '2007-10-08T00:00:00Z',
   'toTimestamp': '2025-04-06T13:00Z'},
  'replicationSequenceNumber': 110142}}

##### Implementação sem módulos externos

In [None]:
# === STEP 7: Último topônimo OSM por classe usando a API OHSOME ===
# Versão final com paralelização, logs, output GeoJSON e metadados completos

# Sem módulos externos (Utils), apenas bibliotecas padrão e geopandas

# === Import necessary libraries ===
import requests
import json
from shapely.geometry import shape, mapping
import time
import math
import csv
from pathlib import Path
import pandas as pd
from concurrent.futures import ThreadPoolExecutor, as_completed
from datetime import timedelta
import threading
from tqdm import tqdm
import glob

# === CONFIGURAÇÕES GERAIS ===
output_dir = Path("data/output_code1/20cells_tests/step7_latest_name")
output_dir.mkdir(parents=True, exist_ok=True)

log_path = output_dir / "log_step7.csv"
ultimo_lote_path = output_dir / "ultimo_lote_step7.txt"
url_ohsome_latest = "https://api.ohsome.org/v1/contributions/latest/geometry"

# === INICIALIZAÇÃO DO LOG ===
if not log_path.exists():
    with open(log_path, 'w', newline='') as f:
        csv.writer(f).writerow(["lote", "mensagem", "timestamp"])

def log_mensagem(lote, mensagem):
    timestamp = time.strftime('%Y-%m-%d %H:%M:%S')
    with open(log_path, 'a', newline='') as f:
        csv.writer(f).writerow([lote, mensagem, timestamp])

# === KEEP ALIVE (com controle de término) ===
# Flag global para controle
keep_alive_running = True

def keep_alive():
    while keep_alive_running:
        time.sleep(300)
        print("Ainda trabalhando...")
        log_mensagem("keep_alive", "Ainda trabalhando...")

keep_alive_thread = threading.Thread(target=keep_alive, daemon=True)
keep_alive_thread.start()

# === FUNÇÃO PARA PROCESSAR UMA CÉLULA ===
def processar_ultima_contribuicao(cell_row):
    id_celula = cell_row["id"]
    bbox = cell_row.geometry.bounds  # (minx, miny, maxx, maxy)
    features_resultantes = []

    for classe, tags in classe_et_edgv_to_tags.items():
        ratio_col = f"step1_consolidado_{classe}_name_ratio"
        inflexao_col = f"step6_consolidado_{classe}_inflexao_data"

        if pd.isna(cell_row.get(ratio_col)) or cell_row[ratio_col] <= 0:
            continue

        data_inicio_str = cell_row.get(inflexao_col) # Uso do inflexao_data como início da janela temporal
        if not isinstance(data_inicio_str, str) or data_inicio_str.strip() == "" or data_inicio_str.lower() == "none":
            continue

        try:
            data_inicio = pd.to_datetime(data_inicio_str, errors="coerce")
            if pd.isna(data_inicio):
                continue
        except Exception as e:
            log_mensagem(id_celula, f"[ERRO] Conversão de data inflexão inválida: {data_inicio_str} - {e}")
            continue

        data_fim = pd.Timestamp("2025-04-06T13:00Z").strftime("%Y-%m-%d") # data_fim fixa de acordo com API metadata ('temporalExtent')
        data_inicio_str = data_inicio.strftime("%Y-%m-%d")

        for tag, value in tags:
            payload = {
                "bboxes": f"{bbox[0]},{bbox[1]},{bbox[2]},{bbox[3]}",
                "time": f"{data_inicio_str},{data_fim}",
                "filter": f"{tag}={value} and name=*",
                "properties": "metadata,tags",
                "clipGeometry": "false"
            }

            try:
                response = requests.post(url_ohsome_latest, data=payload)
                
                print(f"[DEBUG] Célula: {id_celula}, Classe: {classe}, Tag={tag}, Value={value}")
                print(f"[DEBUG] Payload: {json.dumps(payload)}")
                print(f"[DEBUG] Status Code: {response.status_code}")
                print(f"[DEBUG] Response Text: {response.text[:300]}")  # apenas os primeiros 300 chars

                response.raise_for_status()
                dados = response.json()

                for feat in dados.get("features", []):
                    geom_data = feat.get("geometry")
                    props = feat.get("properties", {})

                    if geom_data is None:
                        continue

                    geom = shape(geom_data)
                    if geom.geom_type in ["Polygon", "MultiPolygon"]:
                        geom = geom.centroid

                    props_clean = {
                        "id_celula": id_celula,
                        "classe": classe,
                        "tag": tag,
                        "value": value,
                        **props
                    }

                    features_resultantes.append({
                        "type": "Feature",
                        "geometry": mapping(geom),
                        "properties": props_clean
                    })

            except Exception as e:
                log_mensagem(id_celula, f"[ERRO OHSOME {classe}] {tag}={value}: {str(e)}")

    return features_resultantes

try:
    # === EXECUÇÃO EM LOTE ===
    ultimo_lote = 0
    if ultimo_lote_path.exists():
        with open(ultimo_lote_path, 'r') as f:
            ultimo_lote = int(f.read().strip())

    lote_size = 20
    total_lotes = math.ceil(len(gdf_cells_valid) / lote_size)

    for lote_index in range(ultimo_lote, total_lotes):
        start_time = time.time()
        features_final = []

        subset = gdf_cells_valid.iloc[lote_index * lote_size: (lote_index + 1) * lote_size]

        with ThreadPoolExecutor(max_workers=5) as executor:
            futures = [executor.submit(processar_ultima_contribuicao, row) for _, row in subset.iterrows()]
            for future in tqdm(as_completed(futures), total=len(futures), desc=f"Lote {lote_index + 1} (Step 7)"):
                try:
                    features_final.extend(future.result())
                except Exception as e:
                    log_mensagem(lote_index + 1, f"[FALHA GERAL]: {e}")

        # Salva lote em GeoJSON
        fc = {"type": "FeatureCollection", "features": features_final}
        out_path = output_dir / f"step7_lote{lote_index + 1}.geojson"
        with open(out_path, 'w', encoding='utf-8') as f:
            json.dump(fc, f)
        log_mensagem(lote_index + 1, f"SALVO {out_path.name}")

        # Atualiza consolidação incremental
        arquivos = sorted(output_dir.glob("step7_lote*.geojson"))
        todas_features = []
        for arquivo in arquivos:
            with open(arquivo, 'r', encoding='utf-8') as f:
                fc_parcial = json.load(f)
                todas_features.extend(fc_parcial['features'])

        final_fc = {"type": "FeatureCollection", "features": todas_features}
        with open(output_dir / "step7_consolidado.geojson", 'w', encoding='utf-8') as f:
            json.dump(final_fc, f)
        log_mensagem(lote_index + 1, "CONSOLIDADO atualizado")

        with open(ultimo_lote_path, 'w') as f:
            f.write(str(lote_index + 1))

        tempo_msg = f"Tempo lote {lote_index + 1}: {str(timedelta(seconds=int(time.time() - start_time)))}"
        print(tempo_msg)
        log_mensagem(lote_index + 1, tempo_msg)

    print("Step 7 (último topônimo por classe) finalizado com sucesso.")
    log_mensagem("step7", "Processamento finalizado")

finally:
    keep_alive_running = False
    keep_alive_thread.join(timeout=1)

##### Implementação com módulos externos

In [15]:
# === STEP 7 (OHSOME API) ===
# Com módulos utils e processar_com_ohsome

# === Import necessary libraries and modules ===
from src.utils import init_log, start_keep_alive, log_mensagem, consolidar_geojson
from src.processar_com_ohsome import processar_com_ohsome

from tqdm import tqdm
from pathlib import Path
from concurrent.futures import ThreadPoolExecutor, as_completed
from datetime import timedelta
import json, math, time

# === CONFIGURAÇÕES GERAIS ===
output_dir = Path("data/output_code1/step7_latest_name_ohsome")
output_dir.mkdir(parents=True, exist_ok=True)

log_path = output_dir / "log_step7_ohsome.csv"
ultimo_lote_path = output_dir / "ultimo_lote_step7_ohsome.txt"

# === LOG E KEEP ALIVE ===
# Flag global para controle

init_log(log_path)
keep_alive_flag = {"running": True}
keep_alive_thread = start_keep_alive(log_path, keep_alive_flag)

# === EXECUÇÃO EM LOTE ===
try:
    ultimo_lote = int(ultimo_lote_path.read_text().strip()) if ultimo_lote_path.exists() else 0
    lote_size = 20
    total_lotes = math.ceil(len(gdf_cells_valid) / lote_size)

    for lote_index in range(ultimo_lote, total_lotes):
        start_time = time.time()
        features_final = []
        subset = gdf_cells_valid.iloc[lote_index * lote_size: (lote_index + 1) * lote_size]

        with ThreadPoolExecutor(max_workers=5) as executor:
            futures = [
                executor.submit(processar_com_ohsome, row, classe_et_edgv_to_tags, log_mensagem, log_path)
                for _, row in subset.iterrows()
            ]
            for future in tqdm(as_completed(futures), total=len(futures), desc=f"Lote {lote_index + 1} (Step 7 OHSOME)"):
                try:
                    features_final.extend(future.result())
                except Exception as e:
                    log_mensagem(log_path, lote_index + 1, f"[FALHA GERAL]: {e}")

        out_path = output_dir / f"step7_lote{lote_index + 1}.geojson"
        with open(out_path, 'w', encoding='utf-8') as f:
            json.dump({"type": "FeatureCollection", "features": features_final}, f)
        log_mensagem(log_path, lote_index + 1, f"SALVO {out_path.name}")

        total_feats = consolidar_geojson(output_dir, "step7_lote*.geojson", "step7_consolidado.geojson")
        log_mensagem(log_path, lote_index + 1, f"CONSOLIDADO atualizado: {total_feats} features")

        ultimo_lote_path.write_text(str(lote_index + 1))
        print(f"Lote {lote_index + 1} concluído em {str(timedelta(seconds=int(time.time() - start_time)))}")

    print("Step 7 (OHSOME) finalizado com sucesso.")
    log_mensagem(log_path, "final", "Processamento concluído")

finally:
    keep_alive_flag["running"] = False
    keep_alive_thread.join(timeout=1)

Lote 45 (Step 7 OHSOME):  80%|████████  | 16/20 [04:56<01:26, 21.66s/it]

Ainda trabalhando...


Lote 45 (Step 7 OHSOME): 100%|██████████| 20/20 [05:57<00:00, 17.90s/it]


Lote 45 concluído em 0:05:58


Lote 46 (Step 7 OHSOME):  75%|███████▌  | 15/20 [03:23<01:14, 14.86s/it]

Ainda trabalhando...


Lote 46 (Step 7 OHSOME): 100%|██████████| 20/20 [05:39<00:00, 16.95s/it]


Lote 46 concluído em 0:05:39


Lote 47 (Step 7 OHSOME):  30%|███       | 6/20 [02:08<05:01, 21.55s/it]

Ainda trabalhando...


Lote 47 (Step 7 OHSOME): 100%|██████████| 20/20 [07:38<00:00, 22.94s/it]


Lote 47 concluído em 0:07:38


Lote 48 (Step 7 OHSOME):   0%|          | 0/20 [00:00<?, ?it/s]

Ainda trabalhando...


Lote 48 (Step 7 OHSOME):  75%|███████▌  | 15/20 [05:27<01:20, 16.14s/it]

Ainda trabalhando...


Lote 48 (Step 7 OHSOME): 100%|██████████| 20/20 [07:58<00:00, 23.94s/it]


Lote 48 concluído em 0:07:58


Lote 49 (Step 7 OHSOME):  25%|██▌       | 5/20 [02:40<06:09, 24.64s/it]

Ainda trabalhando...


Lote 49 (Step 7 OHSOME): 100%|██████████| 20/20 [07:34<00:00, 22.71s/it]


Lote 49 concluído em 0:07:34


Lote 50 (Step 7 OHSOME):   0%|          | 0/20 [00:00<?, ?it/s]

Ainda trabalhando...


Lote 50 (Step 7 OHSOME):  80%|████████  | 16/20 [05:09<01:07, 16.96s/it]

Ainda trabalhando...


Lote 50 (Step 7 OHSOME): 100%|██████████| 20/20 [05:39<00:00, 16.97s/it]


Lote 50 concluído em 0:05:39


Lote 51 (Step 7 OHSOME): 100%|██████████| 20/20 [04:24<00:00, 13.24s/it]


Lote 51 concluído em 0:04:24


Lote 52 (Step 7 OHSOME):   0%|          | 0/20 [00:00<?, ?it/s]

Ainda trabalhando...


Lote 52 (Step 7 OHSOME):  75%|███████▌  | 15/20 [04:31<03:54, 46.85s/it]

Ainda trabalhando...


Lote 52 (Step 7 OHSOME): 100%|██████████| 20/20 [05:37<00:00, 16.87s/it]


Lote 52 concluído em 0:05:37


Lote 53 (Step 7 OHSOME):  50%|█████     | 10/20 [04:25<03:28, 20.84s/it]

Ainda trabalhando...


Lote 53 (Step 7 OHSOME):  90%|█████████ | 18/20 [08:11<00:30, 15.40s/it]

Ainda trabalhando...


Lote 53 (Step 7 OHSOME): 100%|██████████| 20/20 [09:43<00:00, 29.15s/it]


Lote 53 concluído em 0:09:43


Lote 54 (Step 7 OHSOME):  80%|████████  | 16/20 [04:43<00:47, 11.93s/it]

Ainda trabalhando...


Lote 54 (Step 7 OHSOME): 100%|██████████| 20/20 [06:12<00:00, 18.64s/it]


Lote 54 concluído em 0:06:12


Lote 55 (Step 7 OHSOME):  30%|███       | 6/20 [03:12<05:32, 23.73s/it] 

Ainda trabalhando...


Lote 55 (Step 7 OHSOME): 100%|██████████| 20/20 [07:22<00:00, 22.13s/it]


Lote 55 concluído em 0:07:22


Lote 56 (Step 7 OHSOME):   0%|          | 0/20 [00:00<?, ?it/s]

Ainda trabalhando...


Lote 56 (Step 7 OHSOME): 100%|██████████| 20/20 [05:56<00:00, 17.84s/it]


Lote 56 concluído em 0:05:56


Lote 57 (Step 7 OHSOME):   0%|          | 0/20 [00:00<?, ?it/s]

Ainda trabalhando...


Lote 57 (Step 7 OHSOME):  60%|██████    | 12/20 [04:23<03:52, 29.05s/it]

Ainda trabalhando...


Lote 57 (Step 7 OHSOME): 100%|██████████| 20/20 [08:15<00:00, 24.78s/it]


Lote 57 concluído em 0:08:15


Lote 58 (Step 7 OHSOME):  25%|██▌       | 5/20 [01:47<03:15, 13.05s/it]

Ainda trabalhando...


Lote 58 (Step 7 OHSOME): 100%|██████████| 20/20 [06:31<00:00, 19.60s/it]


Lote 58 concluído em 0:06:32


Lote 59 (Step 7 OHSOME):   0%|          | 0/20 [00:00<?, ?it/s]

Ainda trabalhando...


Lote 59 (Step 7 OHSOME):  95%|█████████▌| 19/20 [05:15<00:14, 14.54s/it]

Ainda trabalhando...


Lote 59 (Step 7 OHSOME): 100%|██████████| 20/20 [06:37<00:00, 19.88s/it]


Lote 59 concluído em 0:06:37


Lote 60 (Step 7 OHSOME):  40%|████      | 8/20 [03:35<06:20, 31.72s/it]

Ainda trabalhando...


Lote 60 (Step 7 OHSOME): 100%|██████████| 20/20 [06:54<00:00, 20.71s/it]


Lote 60 concluído em 0:06:54


Lote 61 (Step 7 OHSOME):  25%|██▌       | 5/20 [01:44<03:38, 14.58s/it]

Ainda trabalhando...


Lote 61 (Step 7 OHSOME): 100%|██████████| 20/20 [06:46<00:00, 20.31s/it]


Lote 61 concluído em 0:06:46


Lote 62 (Step 7 OHSOME):   0%|          | 0/20 [00:00<?, ?it/s]

Ainda trabalhando...


Lote 62 (Step 7 OHSOME):  90%|█████████ | 18/20 [04:44<01:12, 36.50s/it]

Ainda trabalhando...


Lote 62 (Step 7 OHSOME): 100%|██████████| 20/20 [05:47<00:00, 17.37s/it]


Lote 62 concluído em 0:05:47


Lote 63 (Step 7 OHSOME):  50%|█████     | 10/20 [03:50<02:01, 12.15s/it]

Ainda trabalhando...


Lote 63 (Step 7 OHSOME): 100%|██████████| 20/20 [08:41<00:00, 26.09s/it]


Lote 63 concluído em 0:08:41


Lote 64 (Step 7 OHSOME):   0%|          | 0/20 [00:00<?, ?it/s]

Ainda trabalhando...


Lote 64 (Step 7 OHSOME):  60%|██████    | 12/20 [05:12<03:15, 24.45s/it]

Ainda trabalhando...


Lote 64 (Step 7 OHSOME): 100%|██████████| 20/20 [07:20<00:00, 22.04s/it]


Lote 64 concluído em 0:07:20


Lote 65 (Step 7 OHSOME):  35%|███▌      | 7/20 [02:42<04:25, 20.42s/it]

Ainda trabalhando...


Lote 65 (Step 7 OHSOME): 100%|██████████| 20/20 [07:07<00:00, 21.36s/it]


Lote 65 concluído em 0:07:07


Lote 66 (Step 7 OHSOME):  20%|██        | 4/20 [01:01<04:01, 15.11s/it]

Ainda trabalhando...


Lote 66 (Step 7 OHSOME):  95%|█████████▌| 19/20 [05:47<00:13, 13.79s/it]

Ainda trabalhando...


Lote 66 (Step 7 OHSOME): 100%|██████████| 20/20 [07:08<00:00, 21.40s/it]


Lote 66 concluído em 0:07:08


Lote 67 (Step 7 OHSOME):  50%|█████     | 10/20 [03:55<04:07, 24.77s/it]

Ainda trabalhando...


Lote 67 (Step 7 OHSOME): 100%|██████████| 20/20 [06:57<00:00, 20.85s/it]


Lote 67 concluído em 0:06:57


Lote 68 (Step 7 OHSOME):  35%|███▌      | 7/20 [01:44<02:04,  9.57s/it]

Ainda trabalhando...


Lote 68 (Step 7 OHSOME): 100%|██████████| 20/20 [06:53<00:00, 20.69s/it]


Lote 68 concluído em 0:06:54


Lote 69 (Step 7 OHSOME):   0%|          | 0/20 [00:00<?, ?it/s]

Ainda trabalhando...


Lote 69 (Step 7 OHSOME):  65%|██████▌   | 13/20 [04:36<02:08, 18.31s/it]

Ainda trabalhando...


Lote 69 (Step 7 OHSOME): 100%|██████████| 20/20 [07:58<00:00, 23.93s/it]


Lote 69 concluído em 0:07:58


Lote 70 (Step 7 OHSOME):   5%|▌         | 1/20 [01:31<29:00, 91.63s/it]

Ainda trabalhando...


Lote 70 (Step 7 OHSOME):  75%|███████▌  | 15/20 [06:31<01:27, 17.56s/it]

Ainda trabalhando...


Lote 70 (Step 7 OHSOME): 100%|██████████| 20/20 [10:53<00:00, 32.66s/it]


Lote 70 concluído em 0:10:53


Lote 71 (Step 7 OHSOME):  20%|██        | 4/20 [00:39<01:40,  6.25s/it]

Ainda trabalhando...


Lote 71 (Step 7 OHSOME): 100%|██████████| 20/20 [05:26<00:00, 16.30s/it]


Lote 71 concluído em 0:05:26


Lote 72 (Step 7 OHSOME):   0%|          | 0/20 [00:00<?, ?it/s]

Ainda trabalhando...


Lote 72 (Step 7 OHSOME):  85%|████████▌ | 17/20 [05:46<00:59, 19.92s/it]

Ainda trabalhando...


Lote 72 (Step 7 OHSOME): 100%|██████████| 20/20 [06:13<00:00, 18.67s/it]


Lote 72 concluído em 0:06:13


Lote 73 (Step 7 OHSOME):  45%|████▌     | 9/20 [04:31<04:06, 22.38s/it]

Ainda trabalhando...


Lote 73 (Step 7 OHSOME): 100%|██████████| 20/20 [07:48<00:00, 23.40s/it]


Lote 73 concluído em 0:07:48


Lote 74 (Step 7 OHSOME):  15%|█▌        | 3/20 [01:45<11:04, 39.10s/it]

Ainda trabalhando...


Lote 74 (Step 7 OHSOME): 100%|██████████| 20/20 [05:21<00:00, 16.07s/it]


Lote 74 concluído em 0:05:21


Lote 75 (Step 7 OHSOME):  40%|████      | 8/20 [01:24<01:48,  9.01s/it]

Ainda trabalhando...


Lote 75 (Step 7 OHSOME): 100%|██████████| 20/20 [04:56<00:00, 14.81s/it]


Lote 75 concluído em 0:04:56


Lote 76 (Step 7 OHSOME):   0%|          | 0/20 [00:00<?, ?it/s]

Ainda trabalhando...


Lote 76 (Step 7 OHSOME):  75%|███████▌  | 15/20 [06:16<01:10, 14.14s/it]

Ainda trabalhando...


Lote 76 (Step 7 OHSOME): 100%|██████████| 20/20 [08:09<00:00, 24.48s/it]


Lote 76 concluído em 0:08:09


Lote 77 (Step 7 OHSOME):  30%|███       | 6/20 [03:16<06:19, 27.14s/it]

Ainda trabalhando...


Lote 77 (Step 7 OHSOME):  95%|█████████▌| 19/20 [08:02<00:23, 23.95s/it]

Ainda trabalhando...


Lote 77 (Step 7 OHSOME): 100%|██████████| 20/20 [09:34<00:00, 28.75s/it]


Lote 77 concluído em 0:09:35


Lote 78 (Step 7 OHSOME):  30%|███       | 6/20 [03:29<05:29, 23.55s/it]

Ainda trabalhando...


Lote 78 (Step 7 OHSOME):  75%|███████▌  | 15/20 [08:15<02:07, 25.45s/it]

Ainda trabalhando...


Lote 78 (Step 7 OHSOME): 100%|██████████| 20/20 [10:42<00:00, 32.14s/it]


Lote 78 concluído em 0:10:42


Lote 79 (Step 7 OHSOME):  15%|█▌        | 3/20 [02:53<14:41, 51.88s/it]

Ainda trabalhando...


Lote 79 (Step 7 OHSOME):  80%|████████  | 16/20 [07:41<01:16, 19.22s/it]

Ainda trabalhando...


Lote 79 (Step 7 OHSOME): 100%|██████████| 20/20 [09:53<00:00, 29.65s/it]


Lote 79 concluído em 0:09:53


Lote 80 (Step 7 OHSOME):  35%|███▌      | 7/20 [02:49<04:04, 18.79s/it]

Ainda trabalhando...


Lote 80 (Step 7 OHSOME): 100%|██████████| 20/20 [07:59<00:00, 23.97s/it]


Lote 80 concluído em 0:07:59


Lote 81 (Step 7 OHSOME):   0%|          | 0/20 [00:00<?, ?it/s]

Ainda trabalhando...


Lote 81 (Step 7 OHSOME):  60%|██████    | 12/20 [04:58<02:27, 18.43s/it]

Ainda trabalhando...


Lote 81 (Step 7 OHSOME): 100%|██████████| 20/20 [08:48<00:00, 26.41s/it]


Lote 81 concluído em 0:08:48


Lote 82 (Step 7 OHSOME):   0%|          | 0/20 [00:00<?, ?it/s]

Ainda trabalhando...


Lote 82 (Step 7 OHSOME):  50%|█████     | 10/20 [03:48<01:53, 11.33s/it]

Ainda trabalhando...


Lote 82 (Step 7 OHSOME):  95%|█████████▌| 19/20 [11:16<00:34, 34.07s/it]

Ainda trabalhando...


Lote 82 (Step 7 OHSOME): 100%|██████████| 20/20 [11:27<00:00, 34.37s/it]


Lote 82 concluído em 0:11:27


Lote 83 (Step 7 OHSOME):  75%|███████▌  | 15/20 [04:16<01:59, 23.90s/it]

Ainda trabalhando...


Lote 83 (Step 7 OHSOME): 100%|██████████| 20/20 [05:59<00:00, 17.99s/it]


Lote 83 concluído em 0:06:00


Lote 84 (Step 7 OHSOME):  55%|█████▌    | 11/20 [03:09<02:47, 18.65s/it]

Ainda trabalhando...


Lote 84 (Step 7 OHSOME): 100%|██████████| 20/20 [07:01<00:00, 21.06s/it]


Lote 84 concluído em 0:07:01


Lote 85 (Step 7 OHSOME):  15%|█▌        | 3/20 [01:46<08:42, 30.74s/it]

Ainda trabalhando...


Lote 85 (Step 7 OHSOME):  85%|████████▌ | 17/20 [06:45<00:42, 14.10s/it]

Ainda trabalhando...


Lote 85 (Step 7 OHSOME): 100%|██████████| 20/20 [07:44<00:00, 23.23s/it]


Lote 85 concluído em 0:07:44


Lote 86 (Step 7 OHSOME):  35%|███▌      | 7/20 [03:08<06:20, 29.24s/it]

Ainda trabalhando...


Lote 86 (Step 7 OHSOME):  95%|█████████▌| 19/20 [08:28<00:19, 19.35s/it]

Ainda trabalhando...


Lote 86 (Step 7 OHSOME): 100%|██████████| 20/20 [09:34<00:00, 28.72s/it]


Lote 86 concluído em 0:09:34


Lote 87 (Step 7 OHSOME):  45%|████▌     | 9/20 [04:29<02:58, 16.24s/it]

Ainda trabalhando...


Lote 87 (Step 7 OHSOME): 100%|██████████| 20/20 [06:27<00:00, 19.40s/it]


Lote 87 concluído em 0:06:28


Lote 88 (Step 7 OHSOME):  35%|███▌      | 7/20 [02:44<03:26, 15.91s/it]

Ainda trabalhando...


Lote 88 (Step 7 OHSOME):  85%|████████▌ | 17/20 [08:02<01:40, 33.33s/it]

Ainda trabalhando...


Lote 88 (Step 7 OHSOME): 100%|██████████| 20/20 [08:49<00:00, 26.50s/it]


Lote 88 concluído em 0:08:50


Lote 89 (Step 7 OHSOME):  95%|█████████▌| 19/20 [04:15<00:08,  8.08s/it]

Ainda trabalhando...


Lote 89 (Step 7 OHSOME): 100%|██████████| 20/20 [04:18<00:00, 12.93s/it]


Lote 89 concluído em 0:04:18


Lote 90 (Step 7 OHSOME):  45%|████▌     | 9/20 [04:54<05:59, 32.72s/it]

Ainda trabalhando...


Lote 90 (Step 7 OHSOME): 100%|██████████| 20/20 [07:28<00:00, 22.41s/it]


Lote 90 concluído em 0:07:28


Lote 91 (Step 7 OHSOME):  25%|██▌       | 5/20 [02:07<03:07, 12.51s/it] 

Ainda trabalhando...


Lote 91 (Step 7 OHSOME): 100%|██████████| 20/20 [06:32<00:00, 19.61s/it]


Lote 91 concluído em 0:06:32


Lote 92 (Step 7 OHSOME):   0%|          | 0/20 [00:00<?, ?it/s]

Ainda trabalhando...


Lote 92 (Step 7 OHSOME):  50%|█████     | 10/20 [05:14<03:22, 20.21s/it]

Ainda trabalhando...


Lote 92 (Step 7 OHSOME): 100%|██████████| 20/20 [08:20<00:00, 25.04s/it]


Lote 92 concluído em 0:08:21


Lote 93 (Step 7 OHSOME):  20%|██        | 4/20 [02:10<07:40, 28.77s/it]

Ainda trabalhando...


Lote 93 (Step 7 OHSOME):  70%|███████   | 14/20 [07:28<03:33, 35.59s/it]

Ainda trabalhando...


Lote 93 (Step 7 OHSOME): 100%|██████████| 20/20 [09:41<00:00, 29.05s/it]


Lote 93 concluído em 0:09:41


Lote 94 (Step 7 OHSOME):  35%|███▌      | 7/20 [02:25<04:14, 19.56s/it]

Ainda trabalhando...


Lote 94 (Step 7 OHSOME):  85%|████████▌ | 17/20 [06:49<00:54, 18.03s/it]

Ainda trabalhando...


Lote 94 (Step 7 OHSOME): 100%|██████████| 20/20 [08:11<00:00, 24.59s/it]


Lote 94 concluído em 0:08:12


Lote 95 (Step 7 OHSOME):  55%|█████▌    | 11/20 [04:37<04:39, 31.05s/it]

Ainda trabalhando...


Lote 95 (Step 7 OHSOME): 100%|██████████| 20/20 [07:54<00:00, 23.71s/it]


Lote 95 concluído em 0:07:54


Lote 96 (Step 7 OHSOME):  10%|█         | 2/20 [01:12<09:25, 31.42s/it]

Ainda trabalhando...


Lote 96 (Step 7 OHSOME):  45%|████▌     | 9/20 [06:22<07:36, 41.49s/it]

Ainda trabalhando...


Lote 96 (Step 7 OHSOME):  95%|█████████▌| 19/20 [11:23<00:22, 22.41s/it]

Ainda trabalhando...


Lote 96 (Step 7 OHSOME): 100%|██████████| 20/20 [13:31<00:00, 40.60s/it]


Lote 96 concluído em 0:13:32


Lote 97 (Step 7 OHSOME):  20%|██        | 4/20 [02:48<07:21, 27.62s/it] 

Ainda trabalhando...


Lote 97 (Step 7 OHSOME):  75%|███████▌  | 15/20 [08:00<02:20, 28.00s/it]

Ainda trabalhando...


Lote 97 (Step 7 OHSOME): 100%|██████████| 20/20 [11:03<00:00, 33.16s/it]


Lote 97 concluído em 0:11:03


Lote 98 (Step 7 OHSOME):  15%|█▌        | 3/20 [02:10<10:56, 38.60s/it]

Ainda trabalhando...


Lote 98 (Step 7 OHSOME):  90%|█████████ | 18/20 [07:05<00:39, 19.76s/it]

Ainda trabalhando...


Lote 98 (Step 7 OHSOME): 100%|██████████| 20/20 [07:19<00:00, 21.96s/it]


Lote 98 concluído em 0:07:19


Lote 99 (Step 7 OHSOME):  55%|█████▌    | 11/20 [04:28<02:29, 16.63s/it]

Ainda trabalhando...


Lote 99 (Step 7 OHSOME): 100%|██████████| 20/20 [09:02<00:00, 27.13s/it]


Lote 99 concluído em 0:09:02


Lote 100 (Step 7 OHSOME):   0%|          | 0/20 [00:00<?, ?it/s]

Ainda trabalhando...


Lote 100 (Step 7 OHSOME):  85%|████████▌ | 17/20 [05:44<00:31, 10.43s/it]

Ainda trabalhando...


Lote 100 (Step 7 OHSOME): 100%|██████████| 20/20 [06:20<00:00, 19.02s/it]


Lote 100 concluído em 0:06:20


Lote 101 (Step 7 OHSOME):  75%|███████▌  | 15/20 [04:23<01:55, 23.02s/it]

Ainda trabalhando...


Lote 101 (Step 7 OHSOME): 100%|██████████| 20/20 [05:43<00:00, 17.20s/it]


Lote 101 concluído em 0:05:44


Lote 102 (Step 7 OHSOME):  25%|██▌       | 5/20 [02:20<03:22, 13.49s/it] 

Ainda trabalhando...


Lote 102 (Step 7 OHSOME):  80%|████████  | 16/20 [08:34<02:33, 38.40s/it]

Ainda trabalhando...


Lote 102 (Step 7 OHSOME): 100%|██████████| 20/20 [09:29<00:00, 28.47s/it]


Lote 102 concluído em 0:09:29


Lote 103 (Step 7 OHSOME):  35%|███▌      | 7/20 [04:07<07:39, 35.32s/it]

Ainda trabalhando...


Lote 103 (Step 7 OHSOME): 100%|██████████| 20/20 [06:59<00:00, 20.98s/it]


Lote 103 concluído em 0:06:59


Lote 104 (Step 7 OHSOME):  20%|██        | 4/20 [01:44<05:31, 20.70s/it]

Ainda trabalhando...


Lote 104 (Step 7 OHSOME): 100%|██████████| 20/20 [05:52<00:00, 17.62s/it]


Lote 104 concluído em 0:05:52


Lote 105 (Step 7 OHSOME):  20%|██        | 4/20 [01:05<03:10, 11.88s/it]

Ainda trabalhando...


Lote 105 (Step 7 OHSOME):  75%|███████▌  | 15/20 [05:46<00:57, 11.52s/it]

Ainda trabalhando...


Lote 105 (Step 7 OHSOME): 100%|██████████| 20/20 [08:26<00:00, 25.34s/it]


Lote 105 concluído em 0:08:27


Lote 106 (Step 7 OHSOME):  30%|███       | 6/20 [02:35<03:18, 14.17s/it]

Ainda trabalhando...


Lote 106 (Step 7 OHSOME): 100%|██████████| 20/20 [07:20<00:00, 22.02s/it]


Lote 106 concluído em 0:07:20


Lote 107 (Step 7 OHSOME):   0%|          | 0/20 [00:00<?, ?it/s]

Ainda trabalhando...


Lote 107 (Step 7 OHSOME):  55%|█████▌    | 11/20 [05:30<04:01, 26.80s/it]

Ainda trabalhando...


Lote 107 (Step 7 OHSOME): 100%|██████████| 20/20 [07:31<00:00, 22.59s/it]


Lote 107 concluído em 0:07:31


Lote 108 (Step 7 OHSOME): 100%|██████████| 20/20 [01:32<00:00,  4.62s/it]


Lote 108 concluído em 0:01:32


Lote 109 (Step 7 OHSOME):  15%|█▌        | 3/20 [01:29<05:48, 20.51s/it]

Ainda trabalhando...


Lote 109 (Step 7 OHSOME):  80%|████████  | 16/20 [06:10<00:52, 13.06s/it]

Ainda trabalhando...


Lote 109 (Step 7 OHSOME): 100%|██████████| 20/20 [07:13<00:00, 21.69s/it]


Lote 109 concluído em 0:07:13


Lote 110 (Step 7 OHSOME): 100%|██████████| 20/20 [02:25<00:00,  7.28s/it]


Lote 110 concluído em 0:02:25


Lote 111 (Step 7 OHSOME):  55%|█████▌    | 11/20 [01:48<01:56, 12.97s/it]

Ainda trabalhando...


Lote 111 (Step 7 OHSOME): 100%|██████████| 20/20 [04:58<00:00, 14.91s/it]


Lote 111 concluído em 0:04:58


Lote 112 (Step 7 OHSOME):   0%|          | 0/20 [00:00<?, ?it/s]

Ainda trabalhando...


Lote 112 (Step 7 OHSOME):  70%|███████   | 14/20 [06:10<02:11, 21.85s/it]

Ainda trabalhando...


Lote 112 (Step 7 OHSOME): 100%|██████████| 20/20 [09:09<00:00, 27.46s/it]


Lote 112 concluído em 0:09:09


Lote 113 (Step 7 OHSOME):  25%|██▌       | 5/20 [02:19<04:18, 17.27s/it] 

Ainda trabalhando...


Lote 113 (Step 7 OHSOME): 100%|██████████| 20/20 [06:49<00:00, 20.45s/it]


Lote 113 concluído em 0:06:49


Lote 114 (Step 7 OHSOME):  60%|██████    | 3/5 [00:44<00:21, 10.56s/it]

Ainda trabalhando...


Lote 114 (Step 7 OHSOME): 100%|██████████| 5/5 [01:28<00:00, 17.74s/it]


Lote 114 concluído em 0:01:28
Step 7 (OHSOME) finalizado com sucesso.


Ainda trabalhando...


#### **Request last toponyms and metadata – Overpass API**

 * [Overpass API](https://wiki.openstreetmap.org/wiki/Overpass_API)

##### Implementação sem módulos externos

In [None]:
# === STEP 7: Último topônimo OSM por classe (via Overpass API) ===
# Sem módulo utils

from pathlib import Path
from datetime import timedelta
from concurrent.futures import ThreadPoolExecutor, as_completed
import time, threading, math, json, csv, glob
import pandas as pd

# === CONFIGURAÇÕES GERAIS ===
output_dir = Path("data/output_code1/step7_latest_name_overpass")
output_dir.mkdir(parents=True, exist_ok=True)

log_path = output_dir / "log_step7_overpass.csv"
ultimo_lote_path = output_dir / "ultimo_lote_step7_overpass.txt"

# === INICIALIZAÇÃO DO LOG ===
if not log_path.exists():
    with open(log_path, 'w', newline='') as f:
        csv.writer(f).writerow(["lote", "mensagem", "timestamp"])

def log_mensagem(lote, mensagem):
    timestamp = time.strftime('%Y-%m-%d %H:%M:%S')
    with open(log_path, 'a', newline='') as f:
        csv.writer(f).writerow([lote, mensagem, timestamp])

# === KEEP ALIVE (com controle de término) ===
keep_alive_running = True
def keep_alive():
    while keep_alive_running:
        time.sleep(300)
        print("Ainda trabalhando...")
        log_mensagem("keep_alive", "Ainda trabalhando...")

keep_alive_thread = threading.Thread(target=keep_alive, daemon=True)
keep_alive_thread.start()

# === EXECUÇÃO EM LOTE USANDO OVERPASS ===
try:
    ultimo_lote = 0
    if ultimo_lote_path.exists():
        with open(ultimo_lote_path, 'r') as f:
            ultimo_lote = int(f.read().strip())

    lote_size = 20
    total_lotes = math.ceil(len(gdf_cells_valid) / lote_size)

    for lote_index in range(ultimo_lote, total_lotes):
        start_time = time.time()
        features_final = []

        subset = gdf_cells_valid.iloc[lote_index * lote_size: (lote_index + 1) * lote_size]

        with ThreadPoolExecutor(max_workers=5) as executor:
            futures = [executor.submit(processar_com_overpass, row, classe_et_edgv_to_tags, log_mensagem) for _, row in subset.iterrows()]
            for future in as_completed(futures):
                try:
                    features_final.extend(future.result())
                except Exception as e:
                    log_mensagem(lote_index + 1, f"[FALHA GERAL]: {e}")

        # Salva lote em GeoJSON
        fc = {"type": "FeatureCollection", "features": features_final}
        out_path = output_dir / f"step7_lote{lote_index + 1}.geojson"
        with open(out_path, 'w', encoding='utf-8') as f:
            json.dump(fc, f)
        log_mensagem(lote_index + 1, f"SALVO {out_path.name}")

        # Atualiza consolidação incremental
        arquivos = sorted(output_dir.glob("step7_lote*.geojson"))
        todas_features = []
        for arquivo in arquivos:
            with open(arquivo, 'r', encoding='utf-8') as f:
                fc_parcial = json.load(f)
                todas_features.extend(fc_parcial['features'])

        final_fc = {"type": "FeatureCollection", "features": todas_features}
        with open(output_dir / "step7_consolidado.geojson", 'w', encoding='utf-8') as f:
            json.dump(final_fc, f)
        log_mensagem(lote_index + 1, "CONSOLIDADO atualizado")

        with open(ultimo_lote_path, 'w') as f:
            f.write(str(lote_index + 1))

        tempo_msg = f"Tempo lote {lote_index + 1}: {str(timedelta(seconds=int(time.time() - start_time)))}"
        print(tempo_msg)
        log_mensagem(lote_index + 1, tempo_msg)

    print("Step 7 (último topônimo por classe - Overpass) finalizado com sucesso.")
    log_mensagem("step7_overpass", "Processamento finalizado")

finally:
    keep_alive_running = False
    keep_alive_thread.join(timeout=1)


##### Implementação com módulos externos

In [None]:
# === STEP 7 (Overpass API) ===
# Com módulos utils e processar_com_overpass

from src.utils import init_log, start_keep_alive, log_mensagem, consolidar_geojson
from src.processar_com_overpass import processar_com_overpass

from pathlib import Path
from datetime import timedelta
from concurrent.futures import ThreadPoolExecutor, as_completed
import math, json, time

# === CONFIGURAÇÃO ===
output_dir = Path("data/output_code1/step7_latest_name_overpass")
output_dir.mkdir(parents=True, exist_ok=True)
log_path = output_dir / "log_step7_overpass.csv"
ultimo_lote_path = output_dir / "ultimo_lote_step7_overpass.txt"

# === LOG E KEEP ALIVE ===
init_log(log_path)
keep_alive_flag = {"running": True}
keep_alive_thread = start_keep_alive(log_path, keep_alive_flag)

# === EXECUÇÃO EM LOTE ===
try:
    ultimo_lote = int(ultimo_lote_path.read_text().strip()) if ultimo_lote_path.exists() else 0
    lote_size = 20
    total_lotes = math.ceil(len(gdf_cells_valid) / lote_size)

    for lote_index in range(ultimo_lote, total_lotes):
        start_time = time.time()
        features_final = []
        subset = gdf_cells_valid.iloc[lote_index * lote_size: (lote_index + 1) * lote_size]

        with ThreadPoolExecutor(max_workers=5) as executor:
            futures = [
                executor.submit(processar_com_overpass, row, classe_et_edgv_to_tags, log_mensagem, log_path)
                for _, row in subset.iterrows()
            ]
            for future in tqdm(as_completed(futures), total=len(futures), desc=f"Lote {lote_index + 1} (Step 7 Overpass)"):
                try:
                    features_final.extend(future.result())
                except Exception as e:
                    log_mensagem(log_path, lote_index + 1, f"[FALHA GERAL]: {e}")

        # Salva lote
        out_path = output_dir / f"step7_lote{lote_index + 1}.geojson"
        with open(out_path, 'w', encoding='utf-8') as f:
            json.dump({"type": "FeatureCollection", "features": features_final}, f)
        log_mensagem(log_path, lote_index + 1, f"SALVO {out_path.name}")

        # Consolida incremental
        total_feats = consolidar_geojson(output_dir, "step7_lote*.geojson", "step7_consolidado.geojson")
        log_mensagem(log_path, lote_index + 1, f"CONSOLIDADO atualizado: {total_feats} features")

        # Atualiza lote
        ultimo_lote_path.write_text(str(lote_index + 1))
        print(f"Lote {lote_index + 1} concluído em {str(timedelta(seconds=int(time.time() - start_time)))}")

    print("Step 7 (Overpass) finalizado com sucesso.")
    log_mensagem(log_path, "final", "Processamento concluído")

finally:
    keep_alive_flag["running"] = False
    keep_alive_thread.join(timeout=1)

In [None]:
# === DEBUG MANUAL - PROCESSAR UMA CELULA ===

# Rodar debug manual com apenas uma célula
test_row = gdf_cells_valid.iloc[0]
features = processar_com_overpass.processar_com_overpass(test_row, classe_et_edgv_to_tags, log_mensagem, log_path)

print(json.dumps(features, indent=2))

#### PostGIS - Close the database connection

In [16]:
# Close the database connection
if conn and conn.closed == 0:
    # conexão ainda aberta
    with conn.cursor() as cur:
        ...
        cur.close()
    conn.close()
    print("Conexão com o banco de dados fechada.")
else:
    print("Conexão com o banco de dados já estava fechada ou não foi estabelecida.")


Conexão com o banco de dados fechada.
