In [6]:
import os
import requests
from bs4 import BeautifulSoup
import pandas as pd
from urllib.parse import urljoin

# === CONFIGURATION ===
BASE_URL = "https://dataserver-coids.inpe.br/queimadas/queimadas/focos/csv/diario/Brasil/"
reference_date = "20250519"  # Format: YYYYMMDD
save_path = "daily_data/"  # Change this to your desired directory

# Ensure directory exists
os.makedirs(save_path, exist_ok=True)

# Step 1: Fetch and parse HTML
response = requests.get(BASE_URL)
soup = BeautifulSoup(response.content, "html.parser")

# Step 2: Find CSV links for the reference date
csv_links = [
    urljoin(BASE_URL, link.get("href"))
    for link in soup.find_all("a")
    if link.get("href", "").endswith(".csv") and reference_date in link.get("href")
]

# Step 3: Download and save the first two matching CSVs
for i, csv_url in enumerate(csv_links[:2]):
    print(f"Downloading: {csv_url}")
    df = pd.read_csv(csv_url, encoding="latin1", sep=",")
    
    # Define filename based on original URL
    filename = os.path.basename(csv_url)
    full_path = os.path.join(save_path, filename)

    # Save CSV
    df.to_csv(full_path, index=False)
    print(f"Saved to: {full_path}")


Downloading: https://dataserver-coids.inpe.br/queimadas/queimadas/focos/csv/diario/Brasil/focos_diario_br_20250519.csv
Saved to: daily_data/focos_diario_br_20250519.csv


In [1]:
import joblib

# Load the trained model
model = joblib.load("model/fire_risk_model_v1.joblib")


In [2]:
model

In [3]:
from prediction_data_preparation import prepare_daily_prediction_data

In [4]:
df_pred = prepare_daily_prediction_data()

In [5]:
df_pred.columns

Index(['lat', 'lon', 'year', 'day_of_year', 'cos_day_of_year',
       'numero_dias_sem_chuva_day_before', 'precipitacao_day_before',
       'estado_id', 'bioma_Amazônia', 'bioma_Caatinga', 'bioma_Cerrado',
       'bioma_Mata Atlântica', 'bioma_Pampa', 'bioma_Pantanal', 'estado_ACRE',
       'estado_ALAGOAS', 'estado_AMAPÁ', 'estado_AMAZONAS', 'estado_BAHIA',
       'estado_CEARÁ', 'estado_DISTRITO FEDERAL', 'estado_ESPÍRITO SANTO',
       'estado_GOIÁS', 'estado_MARANHÃO', 'estado_MATO GROSSO',
       'estado_MATO GROSSO DO SUL', 'estado_MINAS GERAIS', 'estado_PARANÁ',
       'estado_PARAÍBA', 'estado_PARÁ', 'estado_PERNAMBUCO', 'estado_PIAUÍ',
       'estado_RIO DE JANEIRO', 'estado_RIO GRANDE DO NORTE',
       'estado_RIO GRANDE DO SUL', 'estado_RONDÔNIA', 'estado_RORAIMA',
       'estado_SANTA CATARINA', 'estado_SERGIPE', 'estado_SÃO PAULO',
       'estado_TOCANTINS'],
      dtype='object')

In [6]:
model.predict(df_pred)

array([0.7200169 , 0.65095396, 0.65095396, 0.81433662, 0.69612906,
       0.61118723, 0.45088858, 0.43482246, 0.70261186, 0.43482246,
       0.61118723, 0.55239397, 0.65095396, 0.81433662, 0.65095396,
       0.70261186, 0.65095396, 0.65095396, 0.69612906, 0.65095396,
       0.55239397, 0.65095396, 0.61118723, 0.55239397, 0.65095396,
       0.45088858, 0.70261186, 0.65095396, 0.45088858, 0.45088858,
       0.65095396, 0.81433662, 0.65095396, 0.65095396, 0.43482246,
       0.69612906, 0.81433662, 0.69612906, 0.61118723, 0.43482246,
       0.65095396, 0.61118723, 0.70261186, 0.81433662, 0.65095396,
       0.65095396, 0.41826417, 0.65095396])

In [1]:
import pandas as pd

In [2]:
model = pd.read_pickle('model/fire_risk_model_v1.pkl')

UnpicklingError: STACK_GLOBAL requires str