In [11]:
# Célula 1: Importar Bibliotecas
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import time
import json # Para trabalhar com dados JSON
import pandas as pd # Para análise de dados e criação de DataFrames
import requests # Potencialmente para chamadas diretas à API
from bs4 import BeautifulSoup # Ainda útil se houver algum conteúdo estático ou como fallback

print("Bibliotecas importadas com sucesso!")

Bibliotecas importadas com sucesso!


In [12]:
# Célula 2: Configurar WebDriver e Navegar para o Site

service = Service()
options = webdriver.ChromeOptions()

# MANTENHA O MODO HEADLESS DESATIVADO PARA DEPURAR INICIALMENTE!
# Precisamos ver as requisições de rede.
# options.add_argument('--headless')
options.add_argument('--no-sandbox')
options.add_argument('--disable-dev-shm-usage')
options.add_argument('--start-maximized') # Maximiza a janela para melhor visualização

driver = webdriver.Chrome(service=service, options=options)

url = 'https://arcgis.cetesb.sp.gov.br/portal/apps/experiencebuilder/experience/?id=bdd0cbd4bf094df9a000bf663254c21f&page=Classifica%C3%A7%C3%A3o-Atual'
driver.get(url)
print(f"Navegado para: {url}")

# Dê um tempo considerável para que a aplicação do mapa carregue todo o JavaScript
time.sleep(15) # Tempo de espera aumentado para garantir o carregamento completo
print("Carregamento inicial da página concluído. A aplicação do mapa deve estar visível.")

Navegado para: https://arcgis.cetesb.sp.gov.br/portal/apps/experiencebuilder/experience/?id=bdd0cbd4bf094df9a000bf663254c21f&page=Classifica%C3%A7%C3%A3o-Atual
Carregamento inicial da página concluído. A aplicação do mapa deve estar visível.


In [13]:
# Célula 3: Obter Dados da API

api_url_base = "https://arcgis.cetesb.sp.gov.br/server/rest/services/Hosted/Praias/FeatureServer/0/query"

# Parâmetros ajustados com o nome exato do campo 'municipio'
params = {
    'f': 'json', # Formato de resposta JSON
    'where': "municipio = 'PRAIA GRANDE'", # Campo 'municipio' em minúsculas, como no JSON
    'returnGeometry': 'false',
    'spatialRel': 'esriSpatialRelIntersects',
    'outFields': '*', # Mantém para obter todos os campos (boa prática)
    'outSR': '4326',
}

print(f"Tentando buscar dados diretamente da API: {api_url_base}")
print(f"Com os parâmetros: {params}")

try:
    response = requests.get(api_url_base, params=params)
    response.raise_for_status() # Levanta uma exceção para erros HTTP
    data = response.json()

    # --- Removido o print JSON completo aqui, já que você já o inspecionou ---

    if 'features' in data:
        beach_data = []
        for feature in data['features']:
            attributes = feature.get('attributes', {})

            # Extração de atributos com os nomes EXATOS encontrados no JSON
            # e conversão de timestamp para data legível, se existirem
            data_amostra_inicio_ts = attributes.get('data_amostra_inicio')
            data_atual_ts = attributes.get('data_atual')

            # Converte timestamp (em milissegundos) para datetime
            from datetime import datetime
            data_amostra_inicio_dt = datetime.fromtimestamp(data_amostra_inicio_ts / 1000) if data_amostra_inicio_ts else 'N/A'
            data_atual_dt = datetime.fromtimestamp(data_atual_ts / 1000) if data_atual_ts else 'N/A'


            beach_info = {
                'ID_Objeto': attributes.get('objectid', 'N/A'),
                'ID_Praia': attributes.get('id_praia', 'N/A'),
                'ID_Municipio': attributes.get('id_municipio', 'N/A'),
                'Cod_Municipio_IBGE': attributes.get('cod_mun_ibge', 'N/A'),
                'Municipio': attributes.get('municipio', 'N/A'), # Nome do campo EXATO
                'Praia': attributes.get('praia', 'N/A'), # Nome do campo EXATO
                'Classificacao_Agua': attributes.get('classificacao_texto', 'N/A'), # Nome do campo EXATO
                'Data_Amostra_Inicio': data_amostra_inicio_dt,
                'Data_Atualizacao_Sistema': data_atual_dt,
                'UGRHI': attributes.get('ugrhi', 'N/A'),
                'Dist_Norte': attributes.get('dist_norte', 'N/A'),
                'Qualidade_Codigo': attributes.get('qualidade', 'N/A'), # O valor numérico da qualidade
                # Adicione outros campos que você identificou como relevantes no JSON
            }
            beach_data.append(beach_info)

        if beach_data:
            df = pd.DataFrame(beach_data)
            print("\nDados Extraídos (primeiras 5 linhas do DataFrame):")
            print(df.head())

            output_filename = 'qualidade_agua_praia_grande.csv'
            df.to_csv(output_filename, index=False, encoding='utf-8')
            print(f"\nDados salvos com sucesso em '{output_filename}'")
        else:
            print("Nenhum dado de praia encontrado para 'Praia Grande'.")
            print("Verifique se o valor 'PRAIA GRANDE' no filtro 'where' está correto (case-sensitive?).")

    else:
        print("Nenhuma 'features' (dados de atributos) encontrada na resposta da API. A estrutura da API pode ser diferente.")
        print("Resposta Completa da API (pode indicar erro ou estrutura inesperada):")
        print(json.dumps(data, indent=2))

except requests.exceptions.RequestException as e:
    print(f"Erro ao buscar dados da API: {e}")
    print("Verifique sua conexão com a internet e se a URL da API está correta.")
    print("Se a API retornar um erro HTTP, pode ser que o filtro 'where' ainda esteja incorreto.")
    if 'response' in locals() and response.text:
        print("Conteúdo da Resposta HTTP (se houver):", response.text[:500])
except json.JSONDecodeError:
    print("Erro ao decodificar a resposta JSON da API. A resposta pode não ser um JSON válido ou estar vazia.")
    if 'response' in locals() and response.text:
        print("Conteúdo da Resposta da API (primeiros 500 caracteres):", response.text[:500])
except Exception as e:
    print(f"Ocorreu um erro inesperado durante o processamento dos dados da API: {e}")
finally:
    # Opcional: manter o navegador aberto se quiser inspecionar algo manualmente após a API
    # driver.quit() # Comente ou remova esta linha se quiser manter o navegador aberto
    print("Navegador fechado (se o driver foi fechado).")

Tentando buscar dados diretamente da API: https://arcgis.cetesb.sp.gov.br/server/rest/services/Hosted/Praias/FeatureServer/0/query
Com os parâmetros: {'f': 'json', 'where': "municipio = 'PRAIA GRANDE'", 'returnGeometry': 'false', 'spatialRel': 'esriSpatialRelIntersects', 'outFields': '*', 'outSR': '4326'}

Dados Extraídos (primeiras 5 linhas do DataFrame):
   ID_Objeto ID_Praia ID_Municipio Cod_Municipio_IBGE     Municipio  \
0        134  PGCF390          558            3541000  PRAIA GRANDE   
1        135  PGBO393          558            3541000  PRAIA GRANDE   
2        138  PGJM398          558            3541000  PRAIA GRANDE   
3        144  PGFL411          558            3541000  PRAIA GRANDE   
4        137  PGAV397          558            3541000  PRAIA GRANDE   

               Praia Classificacao_Agua Data_Amostra_Inicio  \
0     CANTO DO FORTE          Imprópria          2025-05-11   
1          BOQUEIRÃO          Imprópria          2025-05-11   
2          VILA TUPI     

In [None]:
# Célula 5: Fechar o Navegador
driver.quit()
print("Navegador fechado.")