In [None]:
import requests
import os
import json


stations = [
    {"Identyfikator stacji": 530, "Kod stacji": "MzWarAlNiepo"},
    {"Identyfikator stacji": 532, "Kod stacji": "MzWarAKrzywo"},
    {"Identyfikator stacji": 538, "Kod stacji": "MzWarTolstoj"},
    {"Identyfikator stacji": 550, "Kod stacji": "MzWarWokalna"},
    {"Identyfikator stacji": 552, "Kod stacji": "MzWarKondrat"},
    {"Identyfikator stacji": 10955, "Kod stacji": "MzWarChrosci"},
    {"Identyfikator stacji": 10956, "Kod stacji": "MzWarBajkowa"},
    {"Identyfikator stacji": 16533, "Kod stacji": "MzWarMeteo"}
]


output_folder = "dane_stacji"
os.makedirs(output_folder, exist_ok=True)


headers = {"accept": "application/ld+json"}


for station in stations:
    station_id = station["Identyfikator stacji"]
    station_code = station["Kod stacji"]
    url = f"https://api.gios.gov.pl/pjp-api/v1/rest/station/sensors/{station_id}?size=500"
    
    try:
        response = requests.get(url, headers=headers)
        response.raise_for_status()

        filename = f"{station_code}_{station_id}.json"
        filepath = os.path.join(output_folder, filename)
        
        with open(filepath, "w", encoding="utf-8") as f:
            json.dump(response.json(), f, indent=2, ensure_ascii=False)
        
        log(f"Pobrano dane dla stacji {station_code} ({station_id}) i zapisano jako {filename}")
    
    except requests.RequestException as e:
        print(f"Błąd podczas pobierania danych dla stacji {station_code} ({station_id}): {e}")


Pobrano dane dla stacji MzWarAlNiepo (530) i zapisano jako MzWarAlNiepo_530.json
Pobrano dane dla stacji MzWarAKrzywo (532) i zapisano jako MzWarAKrzywo_532.json
Pobrano dane dla stacji MzWarTolstoj (538) i zapisano jako MzWarTolstoj_538.json
Pobrano dane dla stacji MzWarWokalna (550) i zapisano jako MzWarWokalna_550.json
Pobrano dane dla stacji MzWarKondrat (552) i zapisano jako MzWarKondrat_552.json
Pobrano dane dla stacji MzWarChrosci (10955) i zapisano jako MzWarChrosci_10955.json
Pobrano dane dla stacji MzWarBajkowa (10956) i zapisano jako MzWarBajkowa_10956.json
Pobrano dane dla stacji MzWarMeteo (16533) i zapisano jako MzWarMeteo_16533.json


In [2]:
import os
import json

folder_stacji = "dane_stacji"  
unikatowe_wskazniki = set()

for filename in os.listdir(folder_stacji):
    if not filename.endswith(".json"):
        continue

    with open(os.path.join(folder_stacji, filename), "r", encoding="utf-8") as f:
        data = json.load(f)
        stanowiska = data.get("Lista stanowisk pomiarowych dla podanej stacji", [])
        for s in stanowiska:
            zestaw = (
                s.get("Wskaźnik"),
                s.get("Wskaźnik - wzór"),
                s.get("Wskaźnik - kod")
            )
            unikatowe_wskazniki.add(zestaw)

print("Unikatowe zestawy wskaźników (Wskaźnik, Wzór, Kod):\n")
for wskaznik, wzor, kod in sorted(unikatowe_wskazniki):
    print(f"- {wskaznik} | {wzor} | {kod}")


Unikatowe zestawy wskaźników (Wskaźnik, Wzór, Kod):

- arsen w PM10 | As(PM10) | As(PM10)
- benzen | C6H6 | C6H6
- benzo(a)antracen w PM10 | BaA(PM10) | BaA(PM10)
- benzo(a)piren w PM10 | BaP(PM10) | BaP(PM10)
- benzo(b)fluoranten w PM10 | BbF(PM10) | BbF(PM10)
- benzo(j)fluoranten w PM10 | BjF(PM10) | BjF(PM10)
- benzo(k)fluoranten w PM10 | BkF(PM10) | BkF(PM10)
- dibenzo(a,h)antracen w PM10 | DBahA(PM10) | DBahA(PM10)
- dwutlenek azotu | NO2 | NO2
- dwutlenek siarki | SO2 | SO2
- indeno(1,2,3-cd)piren w PM10 | IP(PM10) | IP(PM10)
- kadm w PM10 | Cd(PM10) | Cd(PM10)
- nikiel w PM10 | Ni(PM10) | Ni(PM10)
- ozon | O3 | O3
- ołów w PM10 | Pb(PM10) | Pb(PM10)
- pył zawieszony PM10 | PM10 | PM10
- pył zawieszony PM2.5 | PM2.5 | PM2.5
- tlenek azotu | NO | NO
- tlenek węgla | CO | CO
- tlenki azotu | NOx | NOx


Unikatowe zestawy wskaźników (Wskaźnik, Wzór, Kod):

- benzen | C6H6 | C6H6
- dwutlenek azotu | NO2 | NO2
- dwutlenek siarki | SO2 | SO2
- ozon | O3 | O3
- pył zawieszony PM10 | PM10 | PM10
- pył zawieszony PM2.5 | PM2.5 | PM2.5
- tlenek węgla | CO | CO


In [6]:
import requests
from pprint import pprint

url = "https://api.gios.gov.pl/pjp-api/v1/rest/metadata/sensors?size=5"
headers = {"accept": "application/ld+json"}
response = requests.get(url, headers=headers)
response.raise_for_status()

data = response.json()
pprint(data)


{'@context': {'Lista metadanych stanowisk pomiarowych': {'@id': 'https://api.gios.gov.pl/pjp-api/v1/rest/metadata/sensors'},
              'links': 'https://schema.org/relatedLink',
              'totalPages': 'https://schema.org/numberOfPages'},
 'Lista metadanych stanowisk pomiarowych': [{'Czas uśredniania': '1-godzinny',
                                             'Data uruchomienia': '2004-01-01',
                                             'Data zamknięcia': '2005-12-31',
                                             'Kod stacji': 'DsBialka',
                                             'Kod stanowiska': 'DsBialka-CO-1g',
                                             'Nazwa stacji': 'Białka',
                                             'Nazwa strefy': 'strefa '
                                                             'dolnośląska',
                                             'Nr': 1,
                                             'Stary Kod stacji': None,
                     

In [None]:
import os
import json
import requests
import time

FOLDER_STACJI = "dane_stacji"

INTERESUJACE_WSKAZNIKI = {
    ("benzen", "C6H6"),
    ("dwutlenek azotu", "NO2"),
    ("dwutlenek siarki", "SO2"),
    ("ozon", "O3"),
    ("pył zawieszony PM10", "PM10"),
    ("pył zawieszony PM2.5", "PM2.5"),
    ("tlenek węgla", "CO"),
}

kody_stacji = set()
for filename in os.listdir(FOLDER_STACJI):
    if filename.endswith(".json"):
        kod_stacji = filename.split("_")[0]
        kody_stacji.add(kod_stacji)

print(f"Znaleziono {len(kody_stacji)} unikalnych stacji.")

headers = {"accept": "application/ld+json"}
wyniki = []

for kod_stacji in sorted(kody_stacji):
    url = f"https://api.gios.gov.pl/pjp-api/v1/rest/metadata/sensors?filter[kod-stacji]={kod_stacji}"
    try:
        response = requests.get(url, headers=headers)
        response.raise_for_status()
        data = response.json()
        lista = data.get("Lista metadanych stanowisk pomiarowych", [])

        print(f"{kod_stacji}: {len(lista)} rekordów")

        for rekord in lista:
            wskaznik = rekord.get("Wskaźnik", "").lower()
            kod = rekord.get("Wskaźnik - kod", "")
            if (wskaznik, kod) in INTERESUJACE_WSKAZNIKI:
                wynik = {
                    "Identyfikator stanowiska": rekord.get("Nr"),
                    "Kod stacji": rekord.get("Kod stacji"),
                    "Nazwa stacji": rekord.get("Nazwa stacji"),
                    "Wskaźnik": wskaznik,
                    "Kod wskaźnika": kod,
                    "Typ pomiaru": rekord.get("Typ pomiaru", ""),
                    "Czas uśredniania": rekord.get("Czas uśredniania", "")
                }
                wyniki.append(wynik)

        time.sleep(20.5)

    except requests.RequestException as e:
        print(f"Błąd dla stacji {kod_stacji}: {e}")

print("\nPodsumowanie znalezionych stanowisk:\n")

if wyniki:
    for w in wyniki:
        print(f"- {w['Wskaźnik']} | {w['Kod wskaźnika']} | {w['Typ pomiaru']} | {w['Czas uśredniania']} "
              f"| ID: {w['Identyfikator stanowiska']} | {w['Kod stacji']} | {w['Nazwa stacji']}")
else:
    print("Brak dopasowanych stanowisk.")

with open("podsumowanie_wskaznikow.json", "w", encoding="utf-8") as f:
    json.dump(wyniki, f, indent=2, ensure_ascii=False)
    print("\nZapisano do pliku: podsumowanie_wskaznikow.json")


In [None]:
import os
import json
import requests

FOLDER_STACJI = "dane_stacji"
FOLDER_WYJSCIE = "dane_stanowiska_4"
os.makedirs(FOLDER_WYJSCIE, exist_ok=True)

INTERESUJACE_WSKAZNIKI = {
    ("benzen", "c6h6"),
    ("tlenek węgla", "co"),
    ("dwutlenek azotu", "no2"),
    ("dwutlenek siarki", "so2"),
    ("ozon", "o3"),
    ("pył zawieszony pm10", "pm10"),
    ("pył zawieszony pm2.5", "pm2.5")
}

size = 500
sort = "Data"
headers = {"accept": "application/ld+json"}
bledne_id = []

for filename in os.listdir(FOLDER_STACJI):
    if not filename.endswith(".json"):
        continue

    kod_stacji = filename.split("_")[0]

    with open(os.path.join(FOLDER_STACJI, filename), "r", encoding="utf-8") as f:
        dane = json.load(f)

    stanowiska = dane.get("Lista stanowisk pomiarowych dla podanej stacji", [])
    if not stanowiska:
        continue

    id_stacji = stanowiska[0].get("Identyfikator stacji")

    for stanowisko in stanowiska:
        wskaznik = stanowisko.get("Wskaźnik", "").lower()
        kod = stanowisko.get("Wskaźnik - kod", "").lower()
        id_stanowiska = stanowisko.get("Identyfikator stanowiska")

        if (wskaznik, kod) not in INTERESUJACE_WSKAZNIKI:
            continue

        url = f"https://api.gios.gov.pl/pjp-api/v1/rest/data/getData/{id_stanowiska}?size={size}&sort={sort}"

        try:
            response = requests.get(url, headers=headers)
            response.raise_for_status()

            folder_docelowy = os.path.join(FOLDER_WYJSCIE, f"{kod_stacji}_{id_stacji}")
            os.makedirs(folder_docelowy, exist_ok=True)

            nazwapliku = f"{id_stanowiska}_{kod}.json"
            output_path = os.path.join(folder_docelowy, nazwapliku)

            with open(output_path, "w", encoding="utf-8") as f_out:
                json.dump(response.json(), f_out, indent=2, ensure_ascii=False)

            print(f"{nazwapliku} zapisany ({kod_stacji})")

        except requests.RequestException as e:
            print(f"Błąd dla stanowiska {id_stanowiska}: {e}")
            bledne_id.append(id_stanowiska)

if bledne_id:
    print("\nBłędy przy stanowiskach:")
    for id_ in bledne_id:
        print(f"- {id_}")


In [None]:
import os
import json
import time
import requests
from datetime import datetime, timedelta
from collections import deque

FOLDER_STACJI = "dane_stacji"
FOLDER_WYJSCIE = "dane_archiwalne"
os.makedirs(FOLDER_WYJSCIE, exist_ok=True)

INTERESUJACE_WSKAZNIKI = {
    ("benzen", "c6h6"),
    ("tlenek węgla", "co"),
    ("dwutlenek azotu", "no2"),
    ("dwutlenek siarki", "so2"),
    ("ozon", "o3"),
    ("pył zawieszony pm10", "pm10"),
    ("pył zawieszony pm2.5", "pm2.5")
}

MAX_REQUESTS_PER_MINUTE = 2
REQUEST_TIMES = deque()


def respect_rate_limit():
    now = time.time()
    while REQUEST_TIMES and now - REQUEST_TIMES[0] > 60:
        REQUEST_TIMES.popleft()
    if len(REQUEST_TIMES) >= MAX_REQUESTS_PER_MINUTE:
        wait_time = 60 - (now - REQUEST_TIMES[0]) + 5
        log(f"Limit API – czekam {int(wait_time)}s...")
        time.sleep(wait_time)
    REQUEST_TIMES.append(time.time())


DATE_START = datetime.strptime("2005-01-01", "%Y-%m-%d")
DATE_END = datetime.today()
SIZE = 500
MAX_PAGE = 999
LOG_FOLDER = "logs"
os.makedirs(LOG_FOLDER, exist_ok=True)
LOG_FILE = os.path.join(LOG_FOLDER, f"log_{datetime.now().strftime('%Y%m%d_%H%M%S')}.txt")
def log(msg: str):
    safe_msg = msg.encode("ascii", errors="ignore").decode("ascii")
    with open(LOG_FILE, "a", encoding="utf-8") as f:
        f.write(safe_msg + "\n")

headers = {"accept": "application/ld+json"}
bledne_id = []

log(f"Zakres: {DATE_START.strftime('%Y-%m-%d')} → {DATE_END.strftime('%Y-%m-%d')}")
log(f"Ładowanie stacji z folderu: {FOLDER_STACJI}")

date_ranges = []
first_range_start = datetime(DATE_END.year, 1, 1)
date_ranges.append((first_range_start, DATE_END))
year = DATE_END.year - 1
while year >= 2005:
    date_from = datetime(year, 1, 1)
    date_to = datetime(year + 1, 1, 1)
    date_ranges.append((date_from, date_to))
    year -= 1

for filename in os.listdir(FOLDER_STACJI):
    if not filename.endswith(".json"):
        continue

    kod_stacji = filename.split("_")[0]
    if kod_stacji != "MzWarChrosci":
        continue

    with open(os.path.join(FOLDER_STACJI, filename), "r", encoding="utf-8") as f:
        dane = json.load(f)

    stanowiska = dane.get("Lista stanowisk pomiarowych dla podanej stacji", [])
    if not stanowiska:
        continue

    id_stacji = stanowiska[0].get("Identyfikator stacji")

    for date_from, date_to in date_ranges:
        log(f"\nZakres danych: {date_from.strftime('%Y-%m-%d')} → {date_to.strftime('%Y-%m-%d')}")

        for stanowisko in stanowiska:
            wskaznik = stanowisko.get("Wskaźnik", "").lower()
            kod = stanowisko.get("Wskaźnik - kod", "").lower()
            id_stanowiska = stanowisko.get("Identyfikator stanowiska")

            if (wskaznik, kod) not in INTERESUJACE_WSKAZNIKI:
                continue

            log(f"\n{kod_stacji} | {id_stanowiska} ({wskaznik} | {kod})")

            page = 0
            while page <= MAX_PAGE:
                url = (
                    f"https://api.gios.gov.pl/pjp-api/v1/rest/archivalData/getDataBySensor/"
                    f"{id_stanowiska}?dateFrom={date_from.strftime('%Y-%m-%d %H:%M')}&"
                    f"dateTo={date_to.strftime('%Y-%m-%d %H:%M')}&size={SIZE}&page={page}&sort=Data"
                )

                log(f"Pobieram strona {page} dla {date_from.strftime('%Y-%m-%d')}")

                try:
                    respect_rate_limit()
                    response = requests.get(url, headers=headers)
                    response.raise_for_status()
                    dane_arch = response.json()
                except requests.HTTPError as e:
                    if response.status_code == 429:
                        log(f"429 Too Many Requests – czekam 70s i ponawiam stronę {page}...")
                        time.sleep(70)
                        continue
                    else:
                        log(f"Błąd {id_stanowiska} ({date_from.strftime('%Y-%m-%d')}): {e}")
                        bledne_id.append((id_stanowiska, date_from.strftime('%Y-%m-%d')))
                        break
                except Exception as e:
                    log(f"Inny błąd: {e}")
                    bledne_id.append((id_stanowiska, date_from.strftime('%Y-%m-%d')))
                    break

                wartosci = dane_arch.get("Lista archiwalnych wyników pomiarów", [])
                log(f"Odebrano {len(wartosci)} wartości pomiarowych")

                if not wartosci:
                    break

                folder_stanowiska = os.path.join(
                    FOLDER_WYJSCIE,
                    date_from.strftime("%Y"),
                    f"{kod_stacji}_{id_stacji}",
                    f"{id_stanowiska}_{kod}"
                )
                os.makedirs(folder_stanowiska, exist_ok=True)

                path = os.path.join(folder_stanowiska, f"{id_stanowiska}_{kod}_p{page}.json")
                with open(path, "w", encoding="utf-8") as f_out:
                    json.dump(wartosci, f_out, indent=2, ensure_ascii=False)

                log(f"Zapisano {len(wartosci)} → {path}")
                page += 1

if bledne_id:
    log("Błędy podczas pobierania:")
    for id_, data in bledne_id:
        log(f"- {id_} ({data})")
else:
    log("\nBrak błędów – wszystkie dane pobrane.")
