In [1]:
import requests
import pandas as pd
import time
from datetime import datetime
from calendar import monthrange
from dotenv import load_dotenv
import os
from funciones import *

In [5]:
load_dotenv()

api_key = os.getenv("API_KEY")

In [6]:
# 🔐 Token de iNaturalist
TOKEN = os.getenv("API_TOKEN")
headers = {"Authorization": TOKEN}

**THAILAND**

In [10]:
#  Coordenadas de Tailandia
zone_thailand = {
    "nelat": 20.4,
    "nelng": 105,
    "swlat": 5.5,
    "swlng": 97
}

In [11]:
for year in range(2015, 2023):
    print(f"\n📅 Descargando {year}...")
    observations_year = []
    page = 1

    while True:
        url = "https://api.inaturalist.org/v1/observations"
        params = {
            "taxon_id": 47178,
            "per_page": 100,
            "page": page,
            "order_by": "observed_on",
            "order": "desc",
            "d1": f"{year}-01-01",
            "d2": f"{year}-12-31",
            **zone_thailand
        }

        response = get_with_retry(url, params, headers)
        if response is None:
            print(f"⛔️ Saltando año {year}, página {page} por errores repetidos")
            break

        data = response.json().get("results", [])
        if not data:
            print(f"✅ Año {year} finalizado (página {page - 1})")
            break

        for obs in data:
            coords = obs.get("geojson", {}).get("coordinates", [None, None])
            taxon = obs.get("taxon", {})
            if taxon and coords != [None, None]:
                observations_year.append({
                    "year": year,
                    "date": obs.get("observed_on"),
                    "scientific_name": taxon.get("name"),
                    "common_name": taxon.get("preferred_common_name"),
                    "latitude": coords[1],
                    "longitude": coords[0]
                })

        print(f"   ✅ Página {page} → {len(data)} observaciones")
        page += 1
        time.sleep(1)

    # Guardado anual
    pd.DataFrame(observations_year).to_csv(f"peces_thailandia_{year}.csv", index=False)
    print(f"💾 Guardado: peces_thailandia_{year}.csv")


📅 Descargando 2015...
   ✅ Página 1 → 100 observaciones


KeyboardInterrupt: 

In [None]:
current_year = datetime.today().year
current_month = datetime.today().month

for year in [2023, 2024, 2025]:
    max_month = 12 if year < current_year else current_month

    for month in range(1, max_month + 1):
        print(f"\n📆 Descargando {year}-{month:02d}...")
        observations_month = []
        page = 1
        days_in_month = monthrange(year, month)[1]
        d1 = f"{year}-{month:02d}-01"
        d2 = f"{year}-{month:02d}-{days_in_month}"

        while True:
            url = "https://api.inaturalist.org/v1/observations"
            params = {
                "taxon_id": 47178,
                "per_page": 100,
                "page": page,
                "order_by": "observed_on",
                "order": "desc",
                "d1": d1,
                "d2": d2,
                **zone_thailand
            }

            response = get_with_retry(url, params, headers)
            if response is None:
                print(f"⛔️ Saltando {year}-{month:02d}, página {page} por errores repetidos")
                break

            data = response.json().get("results", [])
            if not data:
                print(f"✅ Mes {year}-{month:02d} finalizado (página {page - 1})")
                break

            for obs in data:
                coords = obs.get("geojson", {}).get("coordinates", [None, None])
                taxon = obs.get("taxon", {})
                if taxon and coords != [None, None]:
                    observations_month.append({
                        "year": year,
                        "month": month,
                        "date": obs.get("observed_on"),
                        "scientific_name": taxon.get("name"),
                        "common_name": taxon.get("preferred_common_name"),
                        "latitude": coords[1],
                        "longitude": coords[0]
                    })

            print(f"   ✅ Página {page} → {len(data)} observaciones")
            page += 1
            time.sleep(1)

        # Guardado mensual
        pd.DataFrame(observations_month).to_csv(f"peces_thailandia_{year}_{month:02d}.csv", index=False)
        print(f"💾 Guardado: peces_thailandia_{year}_{month:02d}.csv")



📆 Descargando 2023-01...
   ✅ Página 1 → 100 observaciones
   ✅ Página 2 → 100 observaciones
   ✅ Página 3 → 100 observaciones
   ✅ Página 4 → 100 observaciones
   ✅ Página 5 → 100 observaciones
   ✅ Página 6 → 100 observaciones
   ✅ Página 7 → 100 observaciones
   ✅ Página 8 → 100 observaciones
   ✅ Página 9 → 33 observaciones
⚠️ Conexión fallida (intento 1): ('Connection aborted.', RemoteDisconnected('Remote end closed connection without response'))
⚠️ Conexión fallida (intento 2): ('Connection aborted.', RemoteDisconnected('Remote end closed connection without response'))
✅ Mes 2023-01 finalizado (página 9)
💾 Guardado: peces_thailandia_2023_01.csv

📆 Descargando 2023-02...
   ✅ Página 1 → 100 observaciones
   ✅ Página 2 → 100 observaciones
   ✅ Página 3 → 100 observaciones
   ✅ Página 4 → 100 observaciones
   ✅ Página 5 → 100 observaciones
   ✅ Página 6 → 100 observaciones
   ✅ Página 7 → 100 observaciones
   ✅ Página 8 → 100 observaciones
   ✅ Página 9 → 69 observaciones
✅ Mes 202

In [None]:
years = range(2015, 2026)

#  Descarga por año
for year in years:
    print(f"\n📅 Descargando observaciones para Tailandia - Año {year}...")
    all_obs = []
    page = 1

    while True:
        url = "https://api.inaturalist.org/v1/observations"
        params = {
            "taxon_id": 505362,
            "per_page": 100,
            "page": page,
            "order_by": "observed_on",
            "order": "desc",
            "d1": f"{year}-01-01",
            "d2": f"{year}-12-31",
            **zone_thailand
        }

        response = get_with_retry(url, params, headers)
        if response is None:
            print(f"⛔️ Error persistente en {year}, página {page}")
            break

        data = response.json().get("results", [])
        if not data:
            print(f"✅ Año {year} completado (última página: {page - 1})")
            break

        for obs in data:
            coords = obs.get("geojson", {}).get("coordinates", [None, None])
            taxon = obs.get("taxon", {})
            if taxon and coords != [None, None]:
                all_obs.append({
                    "date": obs.get("observed_on"),
                    "scientific_name": taxon.get("name"),
                    "common_name": taxon.get("preferred_common_name"),
                    "latitude": coords[1],
                    "longitude": coords[0]
                })

        print(f"   ✅ Página {page} → {len(data)} observaciones")
        page += 1
        time.sleep(1)

    df_year = pd.DataFrame(all_obs)
    df_year.to_csv(f"tiburones_tailandia_{year}.csv", index=False)
    print(f"💾 Guardado: tiburones_tailandia_{year}.csv")


📅 Descargando observaciones para Tailandia - Año 2015...
   ✅ Página 1 → 18 observaciones
✅ Año 2015 completado (última página: 1)
💾 Guardado: tiburones_tailandia_2015.csv

📅 Descargando observaciones para Tailandia - Año 2016...
   ✅ Página 1 → 20 observaciones
✅ Año 2016 completado (última página: 1)
💾 Guardado: tiburones_tailandia_2016.csv

📅 Descargando observaciones para Tailandia - Año 2017...
⚠️ Conexión fallida (intento 1): ('Connection aborted.', RemoteDisconnected('Remote end closed connection without response'))
   ✅ Página 1 → 62 observaciones
✅ Año 2017 completado (última página: 1)
💾 Guardado: tiburones_tailandia_2017.csv

📅 Descargando observaciones para Tailandia - Año 2018...
   ✅ Página 1 → 63 observaciones
✅ Año 2018 completado (última página: 1)
💾 Guardado: tiburones_tailandia_2018.csv

📅 Descargando observaciones para Tailandia - Año 2019...
   ✅ Página 1 → 44 observaciones
✅ Año 2019 completado (última página: 1)
💾 Guardado: tiburones_tailandia_2019.csv

📅 Descar

KeyboardInterrupt: 

In [23]:
years = range(2015, 2026)

# 🔽 Descarga por año
for year in years:
    print(f"\n📅 Descargando observaciones de cetáceos para Tailandia - Año {year}...")
    all_obs = []
    page = 1

    while True:
        url = "https://api.inaturalist.org/v1/observations"
        params = {
            "taxon_id": 152871,  # Cetacea
            "per_page": 100,
            "page": page,
            "order_by": "observed_on",
            "order": "desc",
            "d1": f"{year}-01-01",
            "d2": f"{year}-12-31",
            **zone_thailand
        }

        response = get_with_retry(url, params, headers)
        if response is None:
            print(f"⛔️ Error persistente en {year}, página {page}")
            break

        data = response.json().get("results", [])
        if not data:
            print(f"✅ Año {year} completado (última página: {page - 1})")
            break

        for obs in data:
            coords = obs.get("geojson", {}).get("coordinates", [None, None])
            taxon = obs.get("taxon", {})
            if taxon and coords != [None, None]:
                all_obs.append({
                    "date": obs.get("observed_on"),
                    "scientific_name": taxon.get("name"),
                    "common_name": taxon.get("preferred_common_name"),
                    "latitude": coords[1],
                    "longitude": coords[0]
                })

        print(f"   ✅ Página {page} → {len(data)} observaciones")
        page += 1
        time.sleep(1)

    df_year = pd.DataFrame(all_obs)
    df_year.to_csv(f"cetaceos_tailandia_{year}.csv", index=False)
    print(f"💾 Guardado: cetaceos_tailandia_{year}.csv")


📅 Descargando observaciones de cetáceos para Tailandia - Año 2015...
   ✅ Página 1 → 4 observaciones
✅ Año 2015 completado (última página: 1)
💾 Guardado: cetaceos_tailandia_2015.csv

📅 Descargando observaciones de cetáceos para Tailandia - Año 2016...
   ✅ Página 1 → 2 observaciones
✅ Año 2016 completado (última página: 1)
💾 Guardado: cetaceos_tailandia_2016.csv

📅 Descargando observaciones de cetáceos para Tailandia - Año 2017...
   ✅ Página 1 → 8 observaciones
✅ Año 2017 completado (última página: 1)
💾 Guardado: cetaceos_tailandia_2017.csv

📅 Descargando observaciones de cetáceos para Tailandia - Año 2018...
   ✅ Página 1 → 19 observaciones
✅ Año 2018 completado (última página: 1)
💾 Guardado: cetaceos_tailandia_2018.csv

📅 Descargando observaciones de cetáceos para Tailandia - Año 2019...
   ✅ Página 1 → 13 observaciones
✅ Año 2019 completado (última página: 1)
💾 Guardado: cetaceos_tailandia_2019.csv

📅 Descargando observaciones de cetáceos para Tailandia - Año 2020...
   ✅ Página 1

In [27]:
years = range(2015, 2026)

for year in years:
    print(f"\n📅 Descargando observaciones de tortugas marinas para Tailandia - Año {year}...")
    all_obs = []
    page = 1

    while True:
        url = "https://api.inaturalist.org/v1/observations"
        params = {
            "q": "sea turtle",
            "per_page": 100,
            "page": page,
            "order_by": "observed_on",
            "order": "desc",
            "d1": f"{year}-01-01",
            "d2": f"{year}-12-31",
            **zone_thailand
        }

        response = get_with_retry(url, params, headers)
        if response is None:
            print(f"⛔️ Error persistente en {year}, página {page}")
            break

        data = response.json().get("results", [])
        if not data:
            print(f"✅ Año {year} completado (última página: {page - 1})")
            break

        for obs in data:
            coords = obs.get("geojson", {}).get("coordinates", [None, None])
            taxon = obs.get("taxon", {})
            if taxon and coords != [None, None]:
                all_obs.append({
                    "date": obs.get("observed_on"),
                    "scientific_name": taxon.get("name"),
                    "common_name": taxon.get("preferred_common_name"),
                    "latitude": coords[1],
                    "longitude": coords[0]
                })

        print(f"   ✅ Página {page} → {len(data)} observaciones")
        page += 1
        time.sleep(1)

    df_year = pd.DataFrame(all_obs)
    df_year.to_csv(f"tortugas_tailandia_{year}.csv", index=False)
    print(f"💾 Guardado: tortugas_tailandia_{year}.csv")


📅 Descargando observaciones de tortugas marinas para Tailandia - Año 2015...
   ✅ Página 1 → 7 observaciones
✅ Año 2015 completado (última página: 1)
💾 Guardado: tortugas_tailandia_2015.csv

📅 Descargando observaciones de tortugas marinas para Tailandia - Año 2016...
   ✅ Página 1 → 8 observaciones
✅ Año 2016 completado (última página: 1)
💾 Guardado: tortugas_tailandia_2016.csv

📅 Descargando observaciones de tortugas marinas para Tailandia - Año 2017...
   ✅ Página 1 → 26 observaciones
✅ Año 2017 completado (última página: 1)
💾 Guardado: tortugas_tailandia_2017.csv

📅 Descargando observaciones de tortugas marinas para Tailandia - Año 2018...
   ✅ Página 1 → 36 observaciones
✅ Año 2018 completado (última página: 1)
💾 Guardado: tortugas_tailandia_2018.csv

📅 Descargando observaciones de tortugas marinas para Tailandia - Año 2019...
   ✅ Página 1 → 20 observaciones
✅ Año 2019 completado (última página: 1)
💾 Guardado: tortugas_tailandia_2019.csv

📅 Descargando observaciones de tortugas m

**INDONESIA**

In [24]:
# 🌏 Coordenadas generales de Indonesia
zone_indonesia = {
    "nelat": 5.9,
    "nelng": 141.0,
    "swlat": -11.0,
    "swlng": 95.0
}

In [None]:
for year in range(2015, 2023):
    print(f"\n📅 Descargando Indonesia - Año {year}...")
    observations_year = []
    page = 1

    while True:
        url = "https://api.inaturalist.org/v1/observations"
        params = {
            "taxon_id": 47178,
            "per_page": 100,
            "page": page,
            "order_by": "observed_on",
            "order": "desc",
            "d1": f"{year}-01-01",
            "d2": f"{year}-12-31",
            **zone_indonesia
        }

        response = get_with_retry(url, params, headers)
        if response is None:
            print(f"⛔️ Saltando {year}, página {page} por errores repetidos")
            break

        data = response.json().get("results", [])
        if not data:
            print(f"✅ Año {year} finalizado (página {page - 1})")
            break

        for obs in data:
            coords = obs.get("geojson", {}).get("coordinates", [None, None])
            taxon = obs.get("taxon", {})
            if taxon and coords != [None, None]:
                observations_year.append({
                    "year": year,
                    "date": obs.get("observed_on"),
                    "scientific_name": taxon.get("name"),
                    "common_name": taxon.get("preferred_common_name"),
                    "latitude": coords[1],
                    "longitude": coords[0]
                })

        print(f"   ✅ Página {page} → {len(data)} observaciones")
        page += 1
        time.sleep(1)

    # Guardar el CSV por año
    pd.DataFrame(observations_year).to_csv(f"peces_indonesia_{year}.csv", index=False)
    print(f"💾 Guardado: peces_indonesia_{year}.csv")

In [None]:
years_to_redo = [2016, 2020]

for year in years_to_redo:
    print(f"\n📅 Descargando Indonesia - Año {year} completo...")
    observations_year = []
    page = 1

    while True:
        url = "https://api.inaturalist.org/v1/observations"
        params = {
            "taxon_id": 47178,
            "per_page": 100,
            "page": page,
            "order_by": "observed_on",
            "order": "desc",
            "d1": f"{year}-01-01",
            "d2": f"{year}-12-31",
            **zone_indonesia
        }

        response = get_with_retry(url, params, headers)
        if response is None:
            print(f"⛔️ Año {year} detenido en página {page} por error persistente")
            break

        data = response.json().get("results", [])
        if not data:
            print(f"✅ Año {year} completado (última página: {page - 1})")
            break

        for obs in data:
            coords = obs.get("geojson", {}).get("coordinates", [None, None])
            taxon = obs.get("taxon", {})
            if taxon and coords != [None, None]:
                observations_year.append({
                    "year": year,
                    "date": obs.get("observed_on"),
                    "scientific_name": taxon.get("name"),
                    "common_name": taxon.get("preferred_common_name"),
                    "latitude": coords[1],
                    "longitude": coords[0]
                })

        print(f"   ✅ Página {page} → {len(data)} observaciones")
        page += 1
        time.sleep(1)

    # 💾 Guardar CSV nuevo (sobreescribís si querés)
    pd.DataFrame(observations_year).to_csv(f"peces_indonesia_{year}_completo.csv", index=False)
    print(f"💾 Guardado: peces_indonesia_{year}_completo.csv")

In [None]:
years = [2019, 2022, 2023, 2024, 2025]

for year in years:
    print(f"\n📅 Año {year} en curso...")
    for month in generate_months1(year):
        start_date = f"{month}-01"
        end_date = f"{month}-28" if month[-2:] == "02" else f"{month}-30"
        if month[-2:] in ["01", "03", "05", "07", "08", "10", "12"]:
            end_date = f"{month}-31"

        all_obs = []
        page = 1
        print(f"🔍 {month}...")

        while True:
            url = "https://api.inaturalist.org/v1/observations"
            params = {
                "taxon_id": 47178,
                "per_page": 100,
                "page": page,
                "order_by": "observed_on",
                "order": "desc",
                "d1": start_date,
                "d2": end_date,
                **zone_indonesia
            }

            response = get_with_retry(url, params, headers)
            if response is None:
                print(f"⛔️ Fallo persistente en {month}, página {page}")
                break

            data = response.json().get("results", [])
            if not data:
                print(f"✅ {month} finalizado")
                break

            for obs in data:
                coords = obs.get("geojson", {}).get("coordinates", [None, None])
                taxon = obs.get("taxon", {})
                if taxon and coords != [None, None]:
                    all_obs.append({
                        "date": obs.get("observed_on"),
                        "scientific_name": taxon.get("name"),
                        "common_name": taxon.get("preferred_common_name"),
                        "latitude": coords[1],
                        "longitude": coords[0]
                    })

            print(f"   ✅ Página {page} → {len(data)} observaciones")
            page += 1
            time.sleep(1)

        # 💾 Guardar CSV por mes
        df_month = pd.DataFrame(all_obs)
        df_month.to_csv(f"peces_indonesia_{month}.csv", index=False)
        print(f"💾 Guardado: peces_indonesia_{month}.csv")

In [None]:
for month in generate_months(2022, 2025):
    start_date = f"{month}-01"
    end_date = f"{month}-28"
    if month[-2:] in ["01", "03", "05", "07", "08", "10", "12"]:
        end_date = f"{month}-31"
    elif month[-2:] in ["04", "06", "09", "11"]:
        end_date = f"{month}-30"

    print(f"\n🔍 Descargando observaciones de {month}...")
    all_obs = []
    page = 1

    while True:
        url = "https://api.inaturalist.org/v1/observations"
        params = {
            "taxon_id": 47178,
            "per_page": 100,
            "page": page,
            "order_by": "observed_on",
            "order": "desc",
            "d1": start_date,
            "d2": end_date,
            **zone_indonesia
        }

        response = get_with_retry(url, params, headers)
        if response is None:
            print(f"⛔️ Fallo persistente en {month}, página {page}")
            break

        data = response.json().get("results", [])
        if not data:
            print(f"✅ {month} finalizado")
            break

        for obs in data:
            coords = obs.get("geojson", {}).get("coordinates", [None, None])
            taxon = obs.get("taxon", {})
            if taxon and coords != [None, None]:
                all_obs.append({
                    "date": obs.get("observed_on"),
                    "scientific_name": taxon.get("name"),
                    "common_name": taxon.get("preferred_common_name"),
                    "latitude": coords[1],
                    "longitude": coords[0]
                })

        print(f"   ✅ Página {page} → {len(data)} observaciones")
        page += 1
        time.sleep(1)

    df_month = pd.DataFrame(all_obs)
    df_month.to_csv(f"peces_indonesia_{month}.csv", index=False)
    print(f"💾 Guardado: peces_indonesia_{month}.csv")

In [None]:
years = range(2015, 2026)

#  Descarga por año
for year in years:
    print(f"\n📅 Descargando observaciones para Indonesia - Año {year}...")
    all_obs = []
    page = 1

    while True:
        url = "https://api.inaturalist.org/v1/observations"
        params = {
            "taxon_id": 505362,  # Neoselachii (tiburones + rayas)
            "per_page": 100,
            "page": page,
            "order_by": "observed_on",
            "order": "desc",
            "d1": f"{year}-01-01",
            "d2": f"{year}-12-31",
            **zone_indonesia
        }

        response = get_with_retry(url, params, headers)
        if response is None:
            print(f"⛔️ Error persistente en {year}, página {page}")
            break

        data = response.json().get("results", [])
        if not data:
            print(f"✅ Año {year} completado (última página: {page - 1})")
            break

        for obs in data:
            coords = obs.get("geojson", {}).get("coordinates", [None, None])
            taxon = obs.get("taxon", {})
            if taxon and coords != [None, None]:
                all_obs.append({
                    "date": obs.get("observed_on"),
                    "scientific_name": taxon.get("name"),
                    "common_name": taxon.get("preferred_common_name"),
                    "latitude": coords[1],
                    "longitude": coords[0]
                })

        print(f"   ✅ Página {page} → {len(data)} observaciones")
        page += 1
        time.sleep(1)

    df_year = pd.DataFrame(all_obs)
    df_year.to_csv(f"tiburones_indonesia_{year}.csv", index=False)
    print(f"💾 Guardado: tiburones_indonesia_{year}.csv")

In [25]:
years = range(2015, 2026)

# 🔽 Descarga por año
for year in years:
    print(f"\n📅 Descargando observaciones de cetáceos para Indonesia - Año {year}...")
    all_obs = []
    page = 1

    while True:
        url = "https://api.inaturalist.org/v1/observations"
        params = {
            "taxon_id": 152871,  # Cetacea
            "per_page": 100,
            "page": page,
            "order_by": "observed_on",
            "order": "desc",
            "d1": f"{year}-01-01",
            "d2": f"{year}-12-31",
            **zone_indonesia
        }

        response = get_with_retry(url, params, headers)
        if response is None:
            print(f"⛔️ Error persistente en {year}, página {page}")
            break

        data = response.json().get("results", [])
        if not data:
            print(f"✅ Año {year} completado (última página: {page - 1})")
            break

        for obs in data:
            coords = obs.get("geojson", {}).get("coordinates", [None, None])
            taxon = obs.get("taxon", {})
            if taxon and coords != [None, None]:
                all_obs.append({
                    "date": obs.get("observed_on"),
                    "scientific_name": taxon.get("name"),
                    "common_name": taxon.get("preferred_common_name"),
                    "latitude": coords[1],
                    "longitude": coords[0]
                })

        print(f"   ✅ Página {page} → {len(data)} observaciones")
        page += 1
        time.sleep(1)

    df_year = pd.DataFrame(all_obs)
    df_year.to_csv(f"cetaceos_indonesia_{year}.csv", index=False)
    print(f"💾 Guardado: cetaceos_indonesia_{year}.csv")


📅 Descargando observaciones de cetáceos para Indonesia - Año 2015...
⚠️ Conexión fallida (intento 1): ('Connection aborted.', RemoteDisconnected('Remote end closed connection without response'))
   ✅ Página 1 → 20 observaciones
✅ Año 2015 completado (última página: 1)
💾 Guardado: cetaceos_indonesia_2015.csv

📅 Descargando observaciones de cetáceos para Indonesia - Año 2016...
   ✅ Página 1 → 20 observaciones
✅ Año 2016 completado (última página: 1)
💾 Guardado: cetaceos_indonesia_2016.csv

📅 Descargando observaciones de cetáceos para Indonesia - Año 2017...
   ✅ Página 1 → 35 observaciones
✅ Año 2017 completado (última página: 1)
💾 Guardado: cetaceos_indonesia_2017.csv

📅 Descargando observaciones de cetáceos para Indonesia - Año 2018...
   ✅ Página 1 → 33 observaciones
✅ Año 2018 completado (última página: 1)
💾 Guardado: cetaceos_indonesia_2018.csv

📅 Descargando observaciones de cetáceos para Indonesia - Año 2019...
   ✅ Página 1 → 37 observaciones
✅ Año 2019 completado (última págin

In [28]:
years = range(2015, 2026)

for year in years:
    print(f"\n📅 Descargando observaciones de tortugas marinas para Indonesia - Año {year}...")
    all_obs = []
    page = 1

    while True:
        url = "https://api.inaturalist.org/v1/observations"
        params = {
            "q": "sea turtle",
            "per_page": 100,
            "page": page,
            "order_by": "observed_on",
            "order": "desc",
            "d1": f"{year}-01-01",
            "d2": f"{year}-12-31",
            **zone_indonesia
        }

        response = get_with_retry(url, params, headers)
        if response is None:
            print(f"⛔️ Error persistente en {year}, página {page}")
            break

        data = response.json().get("results", [])
        if not data:
            print(f"✅ Año {year} completado (última página: {page - 1})")
            break

        for obs in data:
            coords = obs.get("geojson", {}).get("coordinates", [None, None])
            taxon = obs.get("taxon", {})
            if taxon and coords != [None, None]:
                all_obs.append({
                    "date": obs.get("observed_on"),
                    "scientific_name": taxon.get("name"),
                    "common_name": taxon.get("preferred_common_name"),
                    "latitude": coords[1],
                    "longitude": coords[0]
                })

        print(f"   ✅ Página {page} → {len(data)} observaciones")
        page += 1
        time.sleep(1)

    df_year = pd.DataFrame(all_obs)
    df_year.to_csv(f"tortugas_indonesia_{year}.csv", index=False)
    print(f"💾 Guardado: tortugas_indonesia_{year}.csv")


📅 Descargando observaciones de tortugas marinas para Indonesia - Año 2015...
   ✅ Página 1 → 71 observaciones
✅ Año 2015 completado (última página: 1)
💾 Guardado: tortugas_indonesia_2015.csv

📅 Descargando observaciones de tortugas marinas para Indonesia - Año 2016...
   ✅ Página 1 → 73 observaciones
✅ Año 2016 completado (última página: 1)
💾 Guardado: tortugas_indonesia_2016.csv

📅 Descargando observaciones de tortugas marinas para Indonesia - Año 2017...
   ✅ Página 1 → 100 observaciones
   ✅ Página 2 → 37 observaciones
✅ Año 2017 completado (última página: 2)
💾 Guardado: tortugas_indonesia_2017.csv

📅 Descargando observaciones de tortugas marinas para Indonesia - Año 2018...
   ✅ Página 1 → 100 observaciones
   ✅ Página 2 → 100 observaciones
   ✅ Página 3 → 6 observaciones
✅ Año 2018 completado (última página: 3)
💾 Guardado: tortugas_indonesia_2018.csv

📅 Descargando observaciones de tortugas marinas para Indonesia - Año 2019...
   ✅ Página 1 → 100 observaciones
   ✅ Página 2 → 100

**FILIPINAS**

In [None]:
# Coordenadas generales de Filipinas
zone_philippines = {
    "nelat": 21.0,   # Norte de Luzón
    "nelng": 127.0,  # Mar de Filipinas
    "swlat": 4.5,    # Sur de Mindanao
    "swlng": 116.0   # Mar de Sulu
}

In [None]:
years = range(2015, 2022)

# 🔽 Descarga por año
for year in years:
    print(f"\n📅 Descargando observaciones para Filipinas - Año {year}...")
    all_obs = []
    page = 1

    while True:
        url = "https://api.inaturalist.org/v1/observations"
        params = {
            "taxon_id": 47178,
            "per_page": 100,
            "page": page,
            "order_by": "observed_on",
            "order": "desc",
            "d1": f"{year}-01-01",
            "d2": f"{year}-12-31",
            **zone_philippines
        }

        response = get_with_retry(url, params, headers)
        if response is None:
            print(f"⛔️ Error persistente en {year}, página {page}")
            break

        data = response.json().get("results", [])
        if not data:
            print(f"✅ Año {year} completado (última página: {page - 1})")
            break

        for obs in data:
            coords = obs.get("geojson", {}).get("coordinates", [None, None])
            taxon = obs.get("taxon", {})
            if taxon and coords != [None, None]:
                all_obs.append({
                    "date": obs.get("observed_on"),
                    "scientific_name": taxon.get("name"),
                    "common_name": taxon.get("preferred_common_name"),
                    "latitude": coords[1],
                    "longitude": coords[0]
                })

        print(f"   ✅ Página {page} → {len(data)} observaciones")
        page += 1
        time.sleep(1)

    df_year = pd.DataFrame(all_obs)
    df_year.to_csv(f"peces_filipinas_{year}.csv", index=False)
    print(f"💾 Guardado: peces_filipinas_{year}.csv")

In [None]:
years = [2022, 2023, 2024, 2025]

for year in years:
    print(f"\n📅 Año {year} en curso...")
    for month in generate_months1(year):
        year_int = int(month[:4])
        month_int = int(month[-2:])
        last_day = monthrange(year_int, month_int)[1]
        
        start_date = f"{month}-01"
        end_date = f"{month}-{last_day}"

        all_obs = []
        page = 1
        print(f"🔍 {month}...")

        while True:
            url = "https://api.inaturalist.org/v1/observations"
            params = {
                "taxon_id": 47178,  # Peces óseos (Actinopterygii)
                "per_page": 100,
                "page": page,
                "order_by": "observed_on",
                "order": "desc",
                "d1": start_date,
                "d2": end_date,
                **zone_philippines
            }

            response = get_with_retry(url, params, headers)
            if response is None:
                print(f"⛔️ Fallo persistente en {month}, página {page}")
                break

            data = response.json().get("results", [])
            if not data:
                print(f"✅ {month} finalizado")
                break

            for obs in data:
                coords = obs.get("geojson", {}).get("coordinates", [None, None])
                taxon = obs.get("taxon", {})
                if taxon and coords != [None, None]:
                    all_obs.append({
                        "date": obs.get("observed_on"),
                        "scientific_name": taxon.get("name"),
                        "common_name": taxon.get("preferred_common_name"),
                        "latitude": coords[1],
                        "longitude": coords[0]
                    })

            print(f"   ✅ Página {page} → {len(data)} observaciones")
            page += 1
            time.sleep(1)

        # 💾 Guardar CSV por mes
        df_month = pd.DataFrame(all_obs)
        df_month.to_csv(f"peces_filipinas_{month}.csv", index=False)
        print(f"💾 Guardado: peces_filipinas_{month}.csv")

In [None]:
years = range(2015, 2026)

# Descarga por año
for year in years:
    print(f"\n📅 Descargando observaciones para Filipinas - Año {year}...")
    all_obs = []
    page = 1

    while True:
        url = "https://api.inaturalist.org/v1/observations"
        params = {
            "taxon_id": 505362,  # Neoselachii = tiburones + rayas
            "per_page": 100,
            "page": page,
            "order_by": "observed_on",
            "order": "desc",
            "d1": f"{year}-01-01",
            "d2": f"{year}-12-31",
            **zone_philippines
        }

        response = get_with_retry(url, params, headers)
        if response is None:
            print(f"⛔️ Error persistente en {year}, página {page}")
            break

        data = response.json().get("results", [])
        if not data:
            print(f"✅ Año {year} completado (última página: {page - 1})")
            break

        for obs in data:
            coords = obs.get("geojson", {}).get("coordinates", [None, None])
            taxon = obs.get("taxon", {})
            if taxon and coords != [None, None]:
                all_obs.append({
                    "date": obs.get("observed_on"),
                    "scientific_name": taxon.get("name"),
                    "common_name": taxon.get("preferred_common_name"),
                    "latitude": coords[1],
                    "longitude": coords[0]
                })

        print(f"   ✅ Página {page} → {len(data)} observaciones")
        page += 1
        time.sleep(1)

    df_year = pd.DataFrame(all_obs)
    df_year.to_csv(f"tiburones_filipinas_{year}.csv", index=False)
    print(f"💾 Guardado: tiburones_filipinas_{year}.csv")

In [None]:
years = range(2015, 2026)

#  Descarga por año
for year in years:
    print(f"\n📅 Descargando observaciones de cetáceos para Filipinas - Año {year}...")
    all_obs = []
    page = 1

    while True:
        url = "https://api.inaturalist.org/v1/observations"
        params = {
            "taxon_id": 152871,  # Cetacea
            "per_page": 100,
            "page": page,
            "order_by": "observed_on",
            "order": "desc",
            "d1": f"{year}-01-01",
            "d2": f"{year}-12-31",
            **zone_philippines
        }

        response = get_with_retry(url, params, headers)
        if response is None:
            print(f"⛔️ Error persistente en {year}, página {page}")
            break

        data = response.json().get("results", [])
        if not data:
            print(f"✅ Año {year} completado (última página: {page - 1})")
            break

        for obs in data:
            coords = obs.get("geojson", {}).get("coordinates", [None, None])
            taxon = obs.get("taxon", {})
            if taxon and coords != [None, None]:
                all_obs.append({
                    "date": obs.get("observed_on"),
                    "scientific_name": taxon.get("name"),
                    "common_name": taxon.get("preferred_common_name"),
                    "latitude": coords[1],
                    "longitude": coords[0]
                })

        print(f"   ✅ Página {page} → {len(data)} observaciones")
        page += 1
        time.sleep(1)

    df_year = pd.DataFrame(all_obs)
    df_year.to_csv(f"cetaceos_filipinas_{year}.csv", index=False)
    print(f"💾 Guardado: cetaceos_filipinas_{year}.csv")


📅 Descargando observaciones de cetáceos para Filipinas - Año 2015...
   ✅ Página 1 → 2 observaciones
✅ Año 2015 completado (última página: 1)
💾 Guardado: cetaceos_filipinas_2015.csv

📅 Descargando observaciones de cetáceos para Filipinas - Año 2016...
   ✅ Página 1 → 8 observaciones
✅ Año 2016 completado (última página: 1)
💾 Guardado: cetaceos_filipinas_2016.csv

📅 Descargando observaciones de cetáceos para Filipinas - Año 2017...
   ✅ Página 1 → 2 observaciones
✅ Año 2017 completado (última página: 1)
💾 Guardado: cetaceos_filipinas_2017.csv

📅 Descargando observaciones de cetáceos para Filipinas - Año 2018...
   ✅ Página 1 → 7 observaciones
✅ Año 2018 completado (última página: 1)
💾 Guardado: cetaceos_filipinas_2018.csv

📅 Descargando observaciones de cetáceos para Filipinas - Año 2019...
   ✅ Página 1 → 4 observaciones
✅ Año 2019 completado (última página: 1)
💾 Guardado: cetaceos_filipinas_2019.csv

📅 Descargando observaciones de cetáceos para Filipinas - Año 2020...
   ✅ Página 1 →

In [26]:
for year in years:
    print(f"\n📅 Descargando observaciones de tortugas marinas para Filipinas - Año {year}...")
    all_obs = []
    page = 1

    while True:
        url = "https://api.inaturalist.org/v1/observations"
        params = {
            "q": "sea turtle",  # búsqueda textual
            "per_page": 100,
            "page": page,
            "order_by": "observed_on",
            "order": "desc",
            "d1": f"{year}-01-01",
            "d2": f"{year}-12-31",
            **zone_philippines
        }

        response = get_with_retry(url, params, headers)
        if response is None:
            print(f"⛔️ Error persistente en {year}, página {page}")
            break

        data = response.json().get("results", [])
        if not data:
            print(f"✅ Año {year} completado (última página: {page - 1})")
            break

        for obs in data:
            coords = obs.get("geojson", {}).get("coordinates", [None, None])
            taxon = obs.get("taxon", {})
            if taxon and coords != [None, None]:
                all_obs.append({
                    "date": obs.get("observed_on"),
                    "scientific_name": taxon.get("name"),
                    "common_name": taxon.get("preferred_common_name"),
                    "latitude": coords[1],
                    "longitude": coords[0]
                })

        print(f"   ✅ Página {page} → {len(data)} observaciones")
        page += 1
        time.sleep(1)

    df_year = pd.DataFrame(all_obs)
    df_year.to_csv(f"tortugas_filipinas_{year}.csv", index=False)
    print(f"💾 Guardado: tortugas_filipinas_{year}.csv")


📅 Descargando observaciones de tortugas marinas para Filipinas - Año 2015...
   ✅ Página 1 → 27 observaciones
✅ Año 2015 completado (última página: 1)
💾 Guardado: tortugas_filipinas_2015.csv

📅 Descargando observaciones de tortugas marinas para Filipinas - Año 2016...
   ✅ Página 1 → 53 observaciones
✅ Año 2016 completado (última página: 1)
💾 Guardado: tortugas_filipinas_2016.csv

📅 Descargando observaciones de tortugas marinas para Filipinas - Año 2017...
   ✅ Página 1 → 73 observaciones
✅ Año 2017 completado (última página: 1)
💾 Guardado: tortugas_filipinas_2017.csv

📅 Descargando observaciones de tortugas marinas para Filipinas - Año 2018...
   ✅ Página 1 → 70 observaciones
✅ Año 2018 completado (última página: 1)
💾 Guardado: tortugas_filipinas_2018.csv

📅 Descargando observaciones de tortugas marinas para Filipinas - Año 2019...
   ✅ Página 1 → 98 observaciones
✅ Año 2019 completado (última página: 1)
💾 Guardado: tortugas_filipinas_2019.csv

📅 Descargando observaciones de tortugas

**CONCATENAR**

In [2]:
anuales = [f"peces_thailandia_{año}.csv" for año in range(2015, 2023)]

# Generar los nombres de archivos por mes (2023-2025_06)
mensuales = []
for año in range(2023, 2026):
    max_mes = 12
    if año == 2025:
        max_mes = 6
    for mes in range(1, max_mes + 1):
        mensuales.append(f"peces_thailandia_{año}_{mes:02d}.csv")

# Unir las dos listas
archivos = anuales + mensuales

# Leer todos los archivos y concatenarlos
df_thailandia = pd.concat([pd.read_csv(f) for f in archivos], ignore_index=True)

# Guardar el resultado
df_thailandia.to_csv("peces_thailandia_total.csv", index=False)

In [3]:
anuales = [f"peces_filipinas_{año}.csv" for año in range(2015, 2022)]

# Archivos mensuales (2022–2025 hasta junio)
mensuales = []
for año in range(2022, 2026):
    max_mes = 12
    if año == 2025:
        max_mes = 6
    for mes in range(1, max_mes + 1):
        mensuales.append(f"peces_filipinas_{año}-{mes:02d}.csv")

# Unir listas
archivos = anuales + mensuales

# Leer y concatenar
df_filipinas = pd.concat([pd.read_csv(f) for f in archivos], ignore_index=True)

# Guardar el resultado
df_filipinas.to_csv("peces_filipinas_total.csv", index=False)

In [4]:
anuales = [f"peces_indonesia_{año}.csv" for año in [2015, 2017, 2018, 2021]]

# Archivos especiales
especiales = ["peces_indonesia_2016_completo.csv", "peces_indonesia_2020_completo.csv"]

# Archivos mensuales
mensuales = []
for año in [2019, 2022, 2023, 2024, 2025]:
    max_mes = 12
    if año == 2025:
        max_mes = 6
    for mes in range(1, max_mes + 1):
        mensuales.append(f"peces_indonesia_{año}-{mes:02d}.csv")

# Unir todo y concatenar
archivos = anuales + especiales + mensuales
df_indonesia = pd.concat([pd.read_csv(f) for f in archivos], ignore_index=True)

# Guardar el resultado
df_indonesia.to_csv("peces_indonesia_total.csv", index=False)

In [15]:
años = range(2015, 2026)
archivos_tailandia = [f"tiburones_tailandia_{año}.csv" for año in años]

df_tailandia = pd.concat([
    pd.read_csv(f) for f in archivos_tailandia if pd.io.common.file_exists(f)
], ignore_index=True)

df_tailandia.to_csv("tiburones_tailandia_2015_2025.csv", index=False)

In [16]:
años = range(2015, 2026)
archivos_indonesia = [f"tiburones_indonesia_{año}.csv" for año in años]

df_indonesia = pd.concat([
    pd.read_csv(f) for f in archivos_indonesia if pd.io.common.file_exists(f)
], ignore_index=True)

df_indonesia.to_csv("tiburones_indonesia_2015_2025.csv", index=False)

In [17]:
años = range(2015, 2026)
archivos_filipinas = [f"tiburones_filipinas_{año}.csv" for año in años]

df_filipinas = pd.concat([
    pd.read_csv(f) for f in archivos_filipinas if pd.io.common.file_exists(f)
], ignore_index=True)

df_filipinas.to_csv("tiburones_filipinas_2015_2025.csv", index=False)

In [29]:
años = range(2015, 2026)
archivos_cetaceos_tailandia = [f"cetaceos_tailandia_{año}.csv" for año in años]

df_cetaceos_tailandia = pd.concat([
    pd.read_csv(f) for f in archivos_cetaceos_tailandia if pd.io.common.file_exists(f)
], ignore_index=True)

df_cetaceos_tailandia.to_csv("cetaceos_tailandia_2015_2025.csv", index=False)

In [30]:
años = range(2015, 2026)
archivos_cetaceos_indonesia = [f"cetaceos_indonesia_{año}.csv" for año in años]

df_cetaceos_indonesia = pd.concat([
    pd.read_csv(f) for f in archivos_cetaceos_indonesia if pd.io.common.file_exists(f)
], ignore_index=True)

df_cetaceos_indonesia.to_csv("cetaceos_indonesia_2015_2025.csv", index=False)

In [32]:
años = range(2015, 2026)
archivos_cetaceos_filipinas = [f"cetaceos_filipinas_{año}.csv" for año in años]

df_cetaceos_filipinas = pd.concat([
    pd.read_csv(f) for f in archivos_cetaceos_filipinas if pd.io.common.file_exists(f)
], ignore_index=True)

df_cetaceos_filipinas.to_csv("cetaceos_filipinas_2015_2025.csv", index=False)

In [33]:
años = range(2015, 2026)
archivos_tortugas_tailandia = [f"tortugas_tailandia_{año}.csv" for año in años]

df_tortugas_tailandia = pd.concat([
    pd.read_csv(f) for f in archivos_tortugas_tailandia if pd.io.common.file_exists(f)
], ignore_index=True)

df_tortugas_tailandia.to_csv("tortugas_tailandia_2015_2025.csv", index=False)

In [34]:
años = range(2015, 2026)
archivos_tortugas_indonesia = [f"tortugas_indonesia_{año}.csv" for año in años]

df_tortugas_indonesia = pd.concat([
    pd.read_csv(f) for f in archivos_tortugas_indonesia if pd.io.common.file_exists(f)
], ignore_index=True)

df_tortugas_indonesia.to_csv("tortugas_indonesia_2015_2025.csv", index=False)

In [35]:
años = range(2015, 2026)
archivos_tortugas_filipinas = [f"tortugas_filipinas_{año}.csv" for año in años]

df_tortugas_filipinas = pd.concat([
    pd.read_csv(f) for f in archivos_tortugas_filipinas if pd.io.common.file_exists(f)
], ignore_index=True)

df_tortugas_filipinas.to_csv("tortugas_filipinas_2015_2025.csv", index=False)

In [38]:
df_peces = pd.read_csv("peces_thailandia_total.csv")
df_cetaceos = pd.read_csv("cetaceos_tailandia_2015_2025.csv")
df_tiburones = pd.read_csv("tiburones_tailandia_2015_2025.csv")
df_tortugas = pd.read_csv("tortugas_tailandia_2015_2025.csv")

df_animales_tailandia = pd.concat([
    df_peces, df_cetaceos, df_tiburones, df_tortugas
], ignore_index=True)

df_animales_tailandia.to_csv("animales_marinos_tailandia_2015_2025.csv", index=False)

In [39]:
df_peces = pd.read_csv("peces_indonesia_total.csv")
df_cetaceos = pd.read_csv("cetaceos_indonesia_2015_2025.csv")
df_tiburones = pd.read_csv("tiburones_indonesia_2015_2025.csv")
df_tortugas = pd.read_csv("tortugas_indonesia_2015_2025.csv")

df_animales_indonesia = pd.concat([
    df_peces, df_cetaceos, df_tiburones, df_tortugas
], ignore_index=True)

df_animales_indonesia.to_csv("animales_marinos_indonesia_2015_2025.csv", index=False)

In [40]:
df_peces = pd.read_csv("peces_filipinas_total.csv")
df_cetaceos = pd.read_csv("cetaceos_filipinas_2015_2025.csv")
df_tiburones = pd.read_csv("tiburones_filipinas_2015_2025.csv")
df_tortugas = pd.read_csv("tortugas_filipinas_2015_2025.csv")

df_animales_filipinas = pd.concat([
    df_peces, df_cetaceos, df_tiburones, df_tortugas
], ignore_index=True)

df_animales_filipinas.to_csv("animales_marinos_filipinas_2015_2025.csv", index=False)