## Data preprocessing

In [7]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

In [8]:
# global data
years = [2022, 2023]
g_encoding = "utf-8" #"ISO-8859-1"

In [9]:
def find_columns_names(file_path, max_num_if_empty_lines=1, end_character='  '):
    column_names = []
    with open(file_path) as fp:
        lines = fp.readlines()
        empty_lines_counter = 0
        for line in lines:
            # print(line)
            if line in ['\n', '\r\n']:
                empty_lines_counter += 1
                if empty_lines_counter > max_num_if_empty_lines:
                    break
                else:
                    continue
            title_end = line.index(end_character)
            column_names.append(line[:title_end])
    return column_names

#### Dane meteorologiczne - wykaz stacji

In [10]:
weather_station_columns = ["kod stacji", "nazwa stacji", "kod pięcioznakowy stacji"]
weather_station_list = pd.read_csv("dane\meteorologiczne\wykaz_stacji.csv", header=None, encoding=g_encoding, names=weather_station_columns)

weather_station_list.head()

Unnamed: 0,kod stacji,nazwa stacji,kod pięcioznakowy stacji
0,250180460,ADAMOWICE,95414
1,254230010,ALEKSANDRÓWKA,91908
2,250190430,ALWERNIA,95506
3,250210030,ANNOPOL,95751
4,249199978,ANTAŁÓWKA,6522


#### Dane meteorologiczne - klimat

FORMAT: k_m_d_rok:
* Kod stacji                                         9
* Nazwa stacji                                      30
* Rok                                                4
* Miesiąc                                            2
* Absolutna temperatura maksymalna [°C]              5/1
* Status pomiaru TMAX                                1
* Średnia temperatura maksymalna [°C]                6/1
* Status pomiaru TMXS                                1
* Absolutna temperatura minimalna [°C]               5/1
* Status pomiaru TMIN                                1
* Średnia temperatura minimalna  [°C]                6/1
* Status pomiaru TMNS                                1
* Średnia temperatura miesięczna  [°C]               6/1
* Status pomiaru STM                                 1
* Minimalna temperatura przy gruncie [°C]            5/1
* Status pomiaru TMNG                                1
* Miesieczna suma opadów  [mm]                       7/1
* Status pomiaru SUMM                                1
* Maksymalna dobowa suma opadów [mm]                 6/1
* Status pomiaru OPMX                                1
* Pierwszy dzień wystapienia opadu maksymalnego      2
* Ostatni dzień wystąpienia opadu maksymalnego       2
* Maksymalna wysokość pokrywy śnieżnej [cm]          4
* Status pomiaru PKSN                                1
* Liczba dni z pokrywą śnieżną                       3
* Liczba dni z opadem deszczu                        3
* Liczba dni z opadem śniegu                         3


Status "8" brak pomiaru </br>
Status "9" brak zjawiska </br>
Wartość "0" w kolumnie "Maksymalna wysokość pokrywy śnieżnej", jeżeli nie jest doprecyzowana wartością kolumny status, oznacza, że pokrywa nie występowała w danym miesiącu lub nie można ustalić wartości maksymalnej </br>

In [11]:
climate_kmd_columns = find_columns_names('dane\meteorologiczne\klimat\k_m_d_format.txt')
print(climate_kmd_columns)

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb9 in position 169: invalid start byte

In [None]:
climate_kmd = pd.DataFrame()
for year in years:
    relative_path = f"dane\meteorologiczne\klimat\k_m_d_{year}.csv"
    climate_kmd_year = pd.read_csv(relative_path, header=None, encoding=g_encoding)
    climate_kmd = pd.concat([climate_kmd, climate_kmd_year])
climate_kmd.columns = climate_kmd_columns
climate_kmd.head()

Unnamed: 0,Kod stacji,Nazwa stacji,Rok,Miesiąc,Absolutna temperatura maksymalna [°C],Status pomiaru TMAX,Średnia temperatura maksymalna [°C],Status pomiaru TMXS,Absolutna temperatura minimalna [°C],Status pomiaru TMIN,...,Status pomiaru SUMM,Maksymalna dobowa suma opadów [mm],Status pomiaru OPMX,Pierwszy dzień wystapienia opadu maksymalnego,Ostatni dzień wystąpienia opadu maksymalnego,Maksymalna wysokość pokrywy śnieżnej [cm],Status pomiaru PKSN,Liczba dni z pokrywą śnieżną,Liczba dni z opadem deszczu,Liczba dni z opadem śniegu
0,249180010,PSZCZYNA,2022,1,12.3,,3.7,,-12.2,,...,,8.8,,3,,10,,9,7,13
1,249180010,PSZCZYNA,2022,2,12.9,,7.5,,-5.2,,...,,9.6,,17,,2,,1,13,6
2,249180010,PSZCZYNA,2022,3,20.3,,9.7,,-7.2,,...,,12.6,,31,,0,,0,8,0
3,249180010,PSZCZYNA,2022,4,21.8,,11.4,,-3.8,,...,,12.6,,8,,6,,3,11,4
4,249180010,PSZCZYNA,2022,5,26.8,,20.7,,1.9,,...,,8.1,,27,,0,,0,12,0


In [None]:
climate_kmd['Kod stacji'].unique().size

58

FORMAT: k_m_t_rok:
* Kod stacji                                       9
* Nazwa stacji                                    30
* Rok                                              4
* Miesiąc                                          2
* Średnia miesięczna temperatura [°C]              5/1
* Status pomiaru TEMP                              1
* Średnia miesięczna wilgotność względna [%]       8/1
* Status pomiaru WLGS                              1
* Średnia miesięczna prędkość wiatru [m/s]         6/1
* Status pomiaru FWS                               1
* Średnie miesięczne zachmurzenie ogólne [oktanty] 6/1
* Status pomiaru NOS                               1
   
Status "8" brak pomiaru

In [None]:
climate_kmt_columns = find_columns_names('dane\meteorologiczne\klimat\k_m_t_format.txt')
print(climate_kmt_columns)

['Kod stacji', 'Nazwa stacji', 'Rok', 'Miesiąc', 'Średnia miesięczna temperatura [°C]', 'Status pomiaru TEMP', 'Średnia miesięczna wilgotność względna [%]', 'Status pomiaru WLGS', 'Średnia miesięczna prędkość wiatru [m/s]', 'Status pomiaru FWS', 'Średnie miesięczne zachmurzenie ogólne [oktanty]', 'Status pomiaru NOS']


In [None]:
climate_kmt = pd.DataFrame()
for year in years:
    relative_path = f"dane\meteorologiczne\klimat\k_m_t_{year}.csv"
    climate_kmt_year = pd.read_csv(relative_path, header=None, encoding=g_encoding)
    climate_kmt = pd.concat([climate_kmt, climate_kmt_year])
climate_kmt.columns = climate_kmt_columns
climate_kmt.head()

Unnamed: 0,Kod stacji,Nazwa stacji,Rok,Miesiąc,Średnia miesięczna temperatura [°C],Status pomiaru TEMP,Średnia miesięczna wilgotność względna [%],Status pomiaru WLGS,Średnia miesięczna prędkość wiatru [m/s],Status pomiaru FWS,Średnie miesięczne zachmurzenie ogólne [oktanty],Status pomiaru NOS
0,249180010,PSZCZYNA,2022,1,0.3,,0.0,8.0,0.0,8.0,6.2,
1,249180010,PSZCZYNA,2022,2,3.3,,0.0,8.0,0.0,8.0,5.3,
2,249180010,PSZCZYNA,2022,3,3.1,,0.0,8.0,0.0,8.0,0.0,8.0
3,249180010,PSZCZYNA,2022,4,6.4,,0.0,8.0,0.0,8.0,5.7,
4,249180010,PSZCZYNA,2022,5,14.5,,0.0,8.0,0.0,8.0,4.4,


#### Dane meteorologiczne - opady

FORMAT: o_m_rok:
* Kod stacji                                        9
* Nazwa stacji                                     30
* Rok                                               4
* Miesiąc                                           2
* Miesięczna suma opadów [mm]                       8/1
* Status pomiaru SUMM                               1
* Liczba dni z opadem śniegu                        5
* Status pomiaru LDS                                1
* Opad maksymalny [mm]                              8/1
* Status pomiaru MAXO                               1
* Dzień pierwszy wystąpienia opadu maksymalnego     2
* Dzień ostatni wystąpienia opadu maksymalnego      2
* Liczba dni z pokrywą śnieżną                      5
* Status pomiaru LDPS                               1

Status "8" brak pomiaru
Status "9" brak zjawiska

In [None]:
fall_om_columns = find_columns_names('dane\meteorologiczne\opad\o_m_format.txt')
print(fall_om_columns)

['Kod stacji', 'Nazwa stacji', 'Rok', 'Miesiąc', 'Miesięczna suma opadów [mm]', 'Status pomiaru SUMM', 'Liczba dni z opadem śniegu', 'Status pomiaru LDS', 'Opad maksymalny [mm]', 'Status pomiaru MAXO', 'Dzień pierwszy wystąpienia opadu maksymalnego', 'Dzień ostatni wystąpienia opadu maksymalnego', 'Liczba dni z pokrywą śnieżną', 'Status pomiaru LDPS']


In [None]:
fall_om = pd.DataFrame()
for year in years:
    relative_path = f"dane\meteorologiczne\opad\o_m_{year}.csv"
    fall_om_year = pd.read_csv(relative_path, header=None, encoding=g_encoding)
    fall_om = pd.concat([fall_om, fall_om_year])
fall_om.columns = fall_om_columns
fall_om.head()

Unnamed: 0,Kod stacji,Nazwa stacji,Rok,Miesiąc,Miesięczna suma opadów [mm],Status pomiaru SUMM,Liczba dni z opadem śniegu,Status pomiaru LDS,Opad maksymalny [mm],Status pomiaru MAXO,Dzień pierwszy wystąpienia opadu maksymalnego,Dzień ostatni wystąpienia opadu maksymalnego,Liczba dni z pokrywą śnieżną,Status pomiaru LDPS
0,249180020,WARSZOWICE,2022,1,47.7,,10,,8.2,,3.0,,0,
1,249180020,WARSZOWICE,2022,2,42.0,,8,,7.0,,17.0,,0,
2,249180020,WARSZOWICE,2022,3,29.4,,2,,12.0,,31.0,,0,
3,249180020,WARSZOWICE,2022,4,43.8,,2,,11.4,,8.0,,0,
4,249180020,WARSZOWICE,2022,5,47.2,,0,,12.8,,25.0,,0,


#### Dane meteorologiczne - synoptyczne

FORMAT: s_m_d_rok:
* Kod stacji                                        9
* Nazwa stacji                                     30
* Rok                                               4
* Miesiąc                                           2
* Absolutna temperatura maksymalna [°C]             5/1
* Status pomiaru TMAX                               1
* Średnia temperatura maksymalna [°C]               6/1
* Status pomiaru TMXS                               1
* Absolutna temperatura minimalna [°C]              5/1
* Status pomiaru TMIN                               1
* Średnia temperatura minimalna [°C]                6/1
* Status pomiaru TMNS                               1
* Średnia temperatura miesięczna [°C]               6/1
* Status pomiaru STM                                1
* Minimalna temperatura przy gruncie [°C]           5/1
* Status pomiaru TMNG                               1
* Miesięczna suma opadów [mm]                       7/1
* Status pomiaru SUMM                               1
* Maksymalna dobowa suma opadów  [mm]               6/1
* Status pomiaru OPMX                               1
* Pierwszy dzień wystąpienia opadu maksymalnego     2
* Ostatni dzień wystąpienia opadu maksymalnego      2
* Miesięczna suma usłonecznienia  [godziny]         7/1
* Status pomiaru SUUS                               1
* Maksymalna wysokość pokrywy śnieżnej [cm]         4
* Status pomiaru PKSN                               1
* Liczba dni z pokrywą śnieżną                      3
* Status pomiaru PSDN                               1
* Liczba dni z opadem deszczu                       3
* Status pomiaru DESD                               1
* Liczba dni z opadem śniegu                        3
* Status pomiaru SNID                               1
* Liczba dni z opadem deszczu ze śniegiem           3
* Status pomiaru DSND                               1
* Liczba dni z gradem                               3
* Status pomiaru GRDD                               1
* Liczba dni z mgłą                                 3
* Status pomiaru MGLD                               1
* Liczba dni z zamgleniem                           3
* Status pomiaru ZAMD                               1
* Liczba dni z sadzią                               3
* Status pomiaru SADD                               1
* Liczba dni z gołoledzią                           3
* Status pomiaru GOLD                               1
* Liczba dni z zamiecią śnieżną niską               3
* Status pomiaru ZAND                               1
* Liczba dni z zamiecią śnieżną wysoką              3
* Status pomiaru ZAWD                               1
* Liczba dni ze zmętnieniem                         3
* Status pomiaru ZMED                               1
* Liczba dni z wiatrem >= 10m/s                     3
* Status pomiaru W10D                               1
* Liczba dni z wiatrem >15m/s                       3
* Status pomiaru W15D                               1
* Liczba dni z burzą                                3
* Status pomiaru BURD                               1
* Liczba dni z rosą                                 3
* Status pomiaru ROSD                               1
* Liczba dni ze szronem                             3
* Status pomiaru SZRD                               1


Status "8" brak pomiaru </br>
Status "9" brak zjawiska </br>
Dla agregacji typu "Liczba dni z" status "9" oznacza brak pomiaru zjawisk na stacji. </br>

In [None]:
synoptic_smd_columns = find_columns_names('dane\meteorologiczne\synop\s_m_d_format.txt')
print(synoptic_smd_columns)

['Kod stacji', 'Nazwa stacji', 'Rok', 'Miesiąc', 'Absolutna temperatura maksymalna [°C]', 'Status pomiaru TMAX', 'Średnia temperatura maksymalna [°C]', 'Status pomiaru TMXS', 'Absolutna temperatura minimalna [°C]', 'Status pomiaru TMIN', 'Średnia temperatura minimalna [°C]', 'Status pomiaru TMNS', 'Średnia temperatura miesięczna [°C]', 'Status pomiaru STM', 'Minimalna temperatura przy gruncie [°C]', 'Status pomiaru TMNG', 'Miesięczna suma opadów [mm]', 'Status pomiaru SUMM', 'Maksymalna dobowa suma opadów', 'Status pomiaru OPMX', 'Pierwszy dzień wystąpienia opadu maksymalnego', 'Ostatni dzień wystąpienia opadu maksymalnego', 'Miesięczna suma usłonecznienia', 'Status pomiaru SUUS', 'Maksymalna wysokość pokrywy śnieżnej [cm]', 'Status pomiaru PKSN', 'Liczba dni z pokrywą śnieżną', 'Status pomiaru PSDN', 'Liczba dni z opadem deszczu', 'Status pomiaru DESD', 'Liczba dni z opadem śniegu', 'Status pomiaru SNID', 'Liczba dni z opadem deszczu ze śniegiem', 'Status pomiaru DSND', 'Liczba dni z 

In [None]:
synoptic_smd = pd.DataFrame()
for year in years:
    relative_path = f"dane\meteorologiczne\synop\s_m_d_{year}.csv"
    synoptic_smd_year = pd.read_csv(relative_path, header=None, encoding=g_encoding)
    synoptic_smd = pd.concat([synoptic_smd, synoptic_smd_year])
synoptic_smd.columns = synoptic_smd_columns
synoptic_smd.head()

Unnamed: 0,Kod stacji,Nazwa stacji,Rok,Miesiąc,Absolutna temperatura maksymalna [°C],Status pomiaru TMAX,Średnia temperatura maksymalna [°C],Status pomiaru TMXS,Absolutna temperatura minimalna [°C],Status pomiaru TMIN,...,Liczba dni z wiatrem >= 10m/s,Status pomiaru W10D,Liczba dni z wiatrem >15m/s,Status pomiaru W15D,Liczba dni z burzą,Status pomiaru BURD,Liczba dni z rosą,Status pomiaru ROSD,Liczba dni ze szronem,Status pomiaru SZRD
0,349190600,BIELSKO-BIAŁA,2022,1,12.4,,3.2,,-12.5,,...,0,9.0,0,9.0,0,9.0,0,9.0,0,9.0
1,349190600,BIELSKO-BIAŁA,2022,2,11.3,,6.6,,-5.1,,...,0,9.0,0,9.0,0,9.0,0,9.0,0,9.0
2,349190600,BIELSKO-BIAŁA,2022,3,19.5,,8.8,,-7.4,,...,0,9.0,0,9.0,0,9.0,0,9.0,0,9.0
3,349190600,BIELSKO-BIAŁA,2022,4,21.4,,10.9,,-3.1,,...,0,9.0,0,9.0,0,9.0,0,9.0,0,9.0
4,349190600,BIELSKO-BIAŁA,2022,5,26.5,,19.8,,3.3,,...,0,9.0,0,9.0,0,9.0,0,9.0,0,9.0


FORMAT: s_m_t_rok:
* Kod stacji                                            9
* Nazwa stacji                                         30
* Rok                                                   4
* Miesiąc                                               2
* Średnie miesięczne zachmurzenie ogólne [oktanty]      6/1
* Status pomiaru NOS                                    1
* Średnia miesięczna prędkość wiatru [m/s]              6/1
* Status pomiaru FWS                                    1
* Średnia miesięczna temperatura [°C]                   5/1
* Status pomiaru TEMP                                   1
* Średnie miesięczne ciśnienie pary wodnej [hPa]        5/1
* Status pomiaru CPW                                    1
* Średnia miesięczna wilgotność względna [%]            8/1
* Status pomiaru WLGS                                   1
* Średnie miesięczne ciśnienie na poziomie stacji [hPa] 7/1
* Status pomiaru PPPS                                   1
* Średnie miesięczne ciśnienie na pozimie morza [hPa]   7/1
* Status pomiaru PPPM                                   1
* Suma opadu dzień [mm]                                 8/1
* Status pomiaru WODZ                                   1
* Suma opadu noc   [mm]                                 8/1
* Status pomiaru WONO                                   1


Status "8" brak pomiaru </br>
Status "9" brak zjawiska </br>

In [None]:
synoptic_smt_columns = find_columns_names('dane\meteorologiczne\synop\s_m_t_format.txt')
print(synoptic_smt_columns)

['Kod stacji', 'Nazwa stacji', 'Rok', 'Miesiąc', 'Średnie miesięczne zachmurzenie ogólne [oktanty]', 'Status pomiaru NOS', 'Średnia miesięczna prędkość wiatru [m/s]', 'Status pomiaru FWS', 'Średnia miesięczna temperatura [°C]', 'Status pomiaru TEMP', 'Średnie miesięczne ciśnienie pary wodnej [hPa]', 'Status pomiaru CPW', 'Średnia miesięczna wilgotność względna [%]', 'Status pomiaru WLGS', 'Średnie miesięczne ciśnienie na poziomie stacji [hPa]', 'Status pomiaru PPPS', 'Średnie miesięczne ciśnienie na pozimie morza [hPa]', 'Status pomiaru PPPM', 'Suma opadu dzień [mm]', 'Status pomiaru WODZ', 'Suma opadu noc', 'Status pomiaru WONO']


In [None]:
synoptic_smt = pd.DataFrame()
for year in years:
    relative_path = f"dane\meteorologiczne\synop\s_m_t_{year}.csv"
    synoptic_smt_year = pd.read_csv(relative_path, header=None, encoding=g_encoding)
    synoptic_smt = pd.concat([synoptic_smt, synoptic_smt_year])
synoptic_smt.columns = synoptic_smt_columns
synoptic_smt.head()

Unnamed: 0,Kod stacji,Nazwa stacji,Rok,Miesiąc,Średnie miesięczne zachmurzenie ogólne [oktanty],Status pomiaru NOS,Średnia miesięczna prędkość wiatru [m/s],Status pomiaru FWS,Średnia miesięczna temperatura [°C],Status pomiaru TEMP,...,Średnia miesięczna wilgotność względna [%],Status pomiaru WLGS,Średnie miesięczne ciśnienie na poziomie stacji [hPa],Status pomiaru PPPS,Średnie miesięczne ciśnienie na pozimie morza [hPa],Status pomiaru PPPM,Suma opadu dzień [mm],Status pomiaru WODZ,Suma opadu noc,Status pomiaru WONO
0,349190600,BIELSKO-BIAŁA,2022,1,0.0,8.0,4.7,,0.6,,...,80.8,,971.9,,1021.7,,24.5,,21.9,
1,349190600,BIELSKO-BIAŁA,2022,2,0.0,8.0,5.6,,3.4,,...,71.5,,968.3,,1017.4,,22.2,,15.3,
2,349190600,BIELSKO-BIAŁA,2022,3,0.0,8.0,2.9,,3.4,,...,59.4,,978.0,,1027.5,,5.2,,15.6,
3,349190600,BIELSKO-BIAŁA,2022,4,0.0,8.0,3.5,,6.6,,...,68.5,,966.0,,1014.4,,33.1,,26.2,
4,349190600,BIELSKO-BIAŁA,2022,5,0.0,8.0,2.8,,14.4,,...,62.8,,971.1,,1018.4,,30.3,,14.5,


#### Dane hydrologiczne

Pliki ze średnimi i ekstremami miesięcznymi zawierają w kolejnych polach następujące informacje:

* Kod stacji
* Nazwa stacji
* Nazwa rzeki/jeziora
* Rok hydrologiczny
* Wskaźnik miesiąca w roku hydrologicznym
* Wskaźnik ekstremum
* Stan wody [cm]
* Przepływ [m^3/s]
* Temperatura wody [st. C]
* Miesiąc kalendarzowy


Wskaźnik ekstremum może przyjmować następujące wartości:
1 - minimum,
2 - wartość średnia,
3 - maksimum.



Stan wody 9999 oznacza brak danych w bazie lub przerwy w obserwacjach w danym miesiącu i stąd brak możliwości obliczenia charakterystyk.
Przepływ 99999.999 oznacza brak danych lub przerwy w obserwacjach w danym miesiącu i stąd brak możliwości obliczenia charakterystyk.
Temperatura wody 99.9 oznacza brak danych lub przerwy w obserwacjach w danym miesiącu i stąd brak możliwości obliczenia charakterystyk.



In [None]:
hydrological_columns = find_columns_names('dane\hydrologiczne\mies_info.txt', end_character='\n')
print(hydrological_columns)

['Kod stacji', 'Nazwa stacji', 'Nazwa rzeki/jeziora', 'Rok hydrologiczny', 'Wskaźnik miesiąca w roku hydrologicznym', 'Wskaźnik ekstremum', 'Stan wody [cm]', 'Przepływ [m^3/s]', 'Temperatura wody [st. C]', 'Miesiąc kalendarzowy']


In [None]:
hydrological_data_all = pd.DataFrame()
years = [2022]
for year in years:
    relative_path = f"dane\hydrologiczne\mies_{year}.csv"
    hydrological_year = pd.read_csv(relative_path, header=None, encoding=g_encoding)
    hydrological_data_all = pd.concat([hydrological_data_all, hydrological_year])
hydrological_data_all.columns = hydrological_columns
hydrological_data_all.head()

Unnamed: 0,Kod stacji,Nazwa stacji,Nazwa rzeki/jeziora,Rok hydrologiczny,Wskaźnik miesiąca w roku hydrologicznym,Wskaźnik ekstremum,Stan wody [cm],Przepływ [m^3/s],Temperatura wody [st. C],Miesiąc kalendarzowy
0,149180020,CHAŁUPKI,Odra (1),2022,1,1,71,8.38,99.9,11
1,149180020,CHAŁUPKI,Odra (1),2022,1,2,83,11.9,99.9,11
2,149180020,CHAŁUPKI,Odra (1),2022,1,3,110,22.4,99.9,11
3,149180020,CHAŁUPKI,Odra (1),2022,2,1,85,12.4,99.9,12
4,149180020,CHAŁUPKI,Odra (1),2022,2,2,102,18.9,99.9,12


# Selekcja danych

### Wyselekcjonowane dane:

* Średnia temperatura maksymalna [°C]
* Średnia temperatura minimalna  [°C]
* Minimalna temperatura przy gruncie
* Miesieczna suma opadów
* Liczba dni z opadem deszczu
---------------------------------
* Średnia miesięczna wilgotność względna [%]
---------------------------------
* Opad maksymalny [mm] / Maksymalna dobowa suma opadów [mm]
---------------------------------
* Miesięczna suma usłonecznienia  [godziny]
---------------------------------
* Stan wody [cm]
* Przepływ [m^3/s]
* Temperatura wody [st. C]

In [None]:
selected_climate_data_1 = ['Kod stacji', 'Nazwa stacji', 'Rok', 'Miesiąc', 'Średnia temperatura maksymalna [°C]', 'Średnia temperatura minimalna','Minimalna temperatura przy gruncie [°C]', 'Miesieczna suma opadów', 'Liczba dni z opadem deszczu']
climate_data_1 = climate_kmd[selected_climate_data_1]
climate_data_1.head()

Unnamed: 0,Kod stacji,Nazwa stacji,Rok,Miesiąc,Średnia temperatura maksymalna [°C],Średnia temperatura minimalna,Minimalna temperatura przy gruncie [°C],Miesieczna suma opadów,Liczba dni z opadem deszczu
0,249180010,PSZCZYNA,2022,1,3.7,-2.4,-19.0,48.6,7
1,249180010,PSZCZYNA,2022,2,7.5,-0.1,-8.0,43.8,13
2,249180010,PSZCZYNA,2022,3,9.7,-1.7,-8.3,30.1,8
3,249180010,PSZCZYNA,2022,4,11.4,1.9,-5.9,45.8,11
4,249180010,PSZCZYNA,2022,5,20.7,8.0,-0.5,38.6,12


In [None]:
selected_climate_data_2 = ['Kod stacji', 'Nazwa stacji', 'Rok', 'Miesiąc', 'Średnia miesięczna wilgotność względna [%]']
climate_data_2 = climate_kmt[selected_climate_data_2]
climate_data_2.head()

Unnamed: 0,Kod stacji,Nazwa stacji,Rok,Miesiąc,Średnia miesięczna wilgotność względna [%]
0,249180010,PSZCZYNA,2022,1,0.0
1,249180010,PSZCZYNA,2022,2,0.0
2,249180010,PSZCZYNA,2022,3,0.0
3,249180010,PSZCZYNA,2022,4,0.0
4,249180010,PSZCZYNA,2022,5,0.0


In [None]:
selected_fall_data = ['Kod stacji', 'Nazwa stacji', 'Rok', 'Miesiąc', 'Opad maksymalny [mm]']
fall_data = fall_om[selected_fall_data]
fall_data.head()

Unnamed: 0,Kod stacji,Nazwa stacji,Rok,Miesiąc,Opad maksymalny [mm]
0,249180020,WARSZOWICE,2022,1,8.2
1,249180020,WARSZOWICE,2022,2,7.0
2,249180020,WARSZOWICE,2022,3,12.0
3,249180020,WARSZOWICE,2022,4,11.4
4,249180020,WARSZOWICE,2022,5,12.8


In [None]:
selected_synoptic_data_1 = ['Kod stacji', 'Nazwa stacji', 'Rok', 'Miesiąc', 'Miesięczna suma usłonecznienia']
synoptic_data_1 = synoptic_smd[selected_synoptic_data_1]
synoptic_data_1.head()

Unnamed: 0,Kod stacji,Nazwa stacji,Rok,Miesiąc,Miesięczna suma usłonecznienia
0,349190600,BIELSKO-BIAŁA,2022,1,62.3
1,349190600,BIELSKO-BIAŁA,2022,2,95.2
2,349190600,BIELSKO-BIAŁA,2022,3,236.9
3,349190600,BIELSKO-BIAŁA,2022,4,154.0
4,349190600,BIELSKO-BIAŁA,2022,5,239.0


In [None]:
selected_synoptic_data_2 = ['Kod stacji', 'Nazwa stacji', 'Rok', 'Miesiąc', 'Średnia temperatura maksymalna [°C]',
                            'Średnia temperatura minimalna [°C]', 'Minimalna temperatura przy gruncie [°C]',
                            'Miesięczna suma opadów [mm]', 'Miesięczna suma usłonecznienia', 'Liczba dni z opadem deszczu']
synoptic_data_2 = synoptic_smd[selected_synoptic_data_2]
synoptic_data_2.head()

Unnamed: 0,Kod stacji,Nazwa stacji,Rok,Miesiąc,Średnia temperatura maksymalna [°C],Średnia temperatura minimalna [°C],Minimalna temperatura przy gruncie [°C],Miesięczna suma opadów [mm],Miesięczna suma usłonecznienia,Liczba dni z opadem deszczu
0,349190600,BIELSKO-BIAŁA,2022,1,3.2,-2.3,-17.5,46.4,62.3,6
1,349190600,BIELSKO-BIAŁA,2022,2,6.6,0.3,-7.7,37.5,95.2,4
2,349190600,BIELSKO-BIAŁA,2022,3,8.8,-1.9,-10.5,20.8,236.9,5
3,349190600,BIELSKO-BIAŁA,2022,4,10.9,2.2,-4.9,59.3,154.0,10
4,349190600,BIELSKO-BIAŁA,2022,5,19.8,8.8,1.6,44.8,239.0,14


In [None]:
selected_hydrological_data = ['Kod stacji', 'Nazwa stacji', 'Rok hydrologiczny', 'Miesiąc kalendarzowy', 'Stan wody [cm]', 'Przepływ [m^3/s]', 'Temperatura wody [st. C]', 'Nazwa rzeki/jeziora']
hydrological_data = hydrological_data_all[selected_hydrological_data]
hydrological_data.head()

Unnamed: 0,Kod stacji,Nazwa stacji,Rok hydrologiczny,Miesiąc kalendarzowy,Stan wody [cm],Przepływ [m^3/s],Temperatura wody [st. C],Nazwa rzeki/jeziora
0,149180020,CHAŁUPKI,2022,11,71,8.38,99.9,Odra (1)
1,149180020,CHAŁUPKI,2022,11,83,11.9,99.9,Odra (1)
2,149180020,CHAŁUPKI,2022,11,110,22.4,99.9,Odra (1)
3,149180020,CHAŁUPKI,2022,12,85,12.4,99.9,Odra (1)
4,149180020,CHAŁUPKI,2022,12,102,18.9,99.9,Odra (1)


#### Część wspólna dla wyselekcjonowanych danych

In [None]:
param_to_compare = 'Nazwa stacji'
print(len(set(climate_data_1[param_to_compare]) & set(climate_data_2[param_to_compare])))
print(len(set(climate_data_1[param_to_compare]) & set(fall_data[param_to_compare])))
print(len(set(climate_data_1[param_to_compare]) & set(synoptic_data_1[param_to_compare])))
print(len(set(climate_data_1[param_to_compare]) & set(synoptic_data_2[param_to_compare])))
print(len(set(climate_data_1[param_to_compare]) & set(hydrological_data[param_to_compare])))
print(len(set(synoptic_data_2[param_to_compare]) & set(hydrological_data[param_to_compare])))

58
6
1
1
14
14


## Tworzenie zbiorów danych 

In [None]:
month_range = (5, 8) # maj - sierpień

### Zbiór nr 1

In [None]:
dataset_1 = synoptic_data_2
dataset_1.head()

Unnamed: 0,Kod stacji,Nazwa stacji,Rok,Miesiąc,Średnia temperatura maksymalna [°C],Średnia temperatura minimalna [°C],Minimalna temperatura przy gruncie [°C],Miesięczna suma opadów [mm],Miesięczna suma usłonecznienia,Liczba dni z opadem deszczu
0,349190600,BIELSKO-BIAŁA,2022,1,3.2,-2.3,-17.5,46.4,62.3,6
1,349190600,BIELSKO-BIAŁA,2022,2,6.6,0.3,-7.7,37.5,95.2,4
2,349190600,BIELSKO-BIAŁA,2022,3,8.8,-1.9,-10.5,20.8,236.9,5
3,349190600,BIELSKO-BIAŁA,2022,4,10.9,2.2,-4.9,59.3,154.0,10
4,349190600,BIELSKO-BIAŁA,2022,5,19.8,8.8,1.6,44.8,239.0,14


In [None]:
dataset_1 = dataset_1[dataset_1['Miesiąc'].between(month_range[0], month_range[1])]
dataset_1.describe()

Unnamed: 0,Kod stacji,Rok,Miesiąc,Średnia temperatura maksymalna [°C],Średnia temperatura minimalna [°C],Minimalna temperatura przy gruncie [°C],Miesięczna suma opadów [mm],Miesięczna suma usłonecznienia,Liczba dni z opadem deszczu
count,464.0,464.0,464.0,464.0,464.0,464.0,464.0,464.0,464.0
mean,351702600.0,2022.5,6.5,22.728017,11.703879,3.420474,67.857328,233.609914,12.241379
std,1669694.0,0.50054,1.119241,4.070824,3.431726,4.268883,43.466132,93.851534,4.091018
min,349190600.0,2022.0,5.0,0.0,0.0,-6.4,4.3,0.0,2.0
25%,350190600.0,2022.0,5.75,20.075,8.5,-0.025,38.875,220.8,9.75
50%,351215500.0,2022.5,6.5,24.0,12.7,4.25,58.75,260.5,12.0
75%,353180200.0,2023.0,7.25,25.8,14.4,6.9,87.375,288.9,15.0
max,354220200.0,2023.0,8.0,28.1,17.2,12.2,273.0,379.0,23.0


In [None]:
column_names_to_mean = dataset_1.columns[4:]
dataset1 = dataset_1.groupby(['Kod stacji', 'Nazwa stacji', 'Rok'])[column_names_to_mean].mean()
dataset1.head()

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,Średnia temperatura maksymalna [°C],Średnia temperatura minimalna [°C],Minimalna temperatura przy gruncie [°C],Miesięczna suma opadów [mm],Miesięczna suma usłonecznienia,Liczba dni z opadem deszczu
Kod stacji,Nazwa stacji,Rok,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
349190600,BIELSKO-BIAŁA,2022,23.325,12.675,5.85,98.85,249.075,13.5
349190600,BIELSKO-BIAŁA,2023,22.325,12.3,3.75,101.625,237.425,13.5
349190625,ZAKOPANE,2022,21.15,9.975,3.5,113.5,214.575,14.75
349190625,ZAKOPANE,2023,20.3,9.55,1.35,155.6,208.45,15.25
349190650,KASPROWY WIERCH,2022,12.15,5.625,0.0,131.925,182.825,15.0


In [None]:
dataset1.reset_index().to_csv('dataset1.csv', encoding='utf-8-sig')

In [None]:
dataset1.isnull().values.any()

False

### Zbiór nr 2

In [None]:
dataset_2_p1 = climate_data_1
dataset_2_p2 = climate_data_2

dataset_2_p1 = dataset_2_p1[dataset_2_p1['Miesiąc'].between(month_range[0], month_range[1])]
dataset_2_p2 = dataset_2_p2[dataset_2_p2['Miesiąc'].between(month_range[0], month_range[1])]

In [None]:
dataset_2_p1.describe()

Unnamed: 0,Kod stacji,Rok,Miesiąc,Średnia temperatura maksymalna [°C],Średnia temperatura minimalna,Minimalna temperatura przy gruncie [°C],Miesieczna suma opadów,Liczba dni z opadem deszczu
count,442.0,442.0,442.0,442.0,442.0,442.0,442.0,442.0
mean,250822100.0,2022.477376,6.497738,23.30724,11.032805,1.583484,73.491403,11.812217
std,1593742.0,0.500054,1.119299,3.724399,3.422718,3.641599,47.005878,4.067853
min,249180000.0,2022.0,5.0,0.0,0.0,-9.0,0.0,0.0
25%,249200600.0,2022.0,5.25,20.8,8.525,0.0,39.4,9.0
50%,250220100.0,2022.0,6.5,24.55,11.9,0.0,61.75,12.0
75%,252200100.0,2023.0,7.0,26.0,13.6,4.8,98.825,15.0
max,254220100.0,2023.0,8.0,28.5,17.7,11.1,296.6,22.0


In [None]:
dataset_2_p2

Unnamed: 0,Kod stacji,Nazwa stacji,Rok,Miesiąc,Średnia miesięczna wilgotność względna [%]
4,249180010,PSZCZYNA,2022,5,0.0
5,249180010,PSZCZYNA,2022,6,0.0
6,249180010,PSZCZYNA,2022,7,0.0
7,249180010,PSZCZYNA,2022,8,0.0
16,249180160,BRENNA,2022,5,0.0
...,...,...,...,...,...
514,254200080,LIDZBARK WARMIŃSKI,2023,8,75.3
521,254220090,OLECKO,2023,5,0.0
522,254220090,OLECKO,2023,6,0.0
523,254220090,OLECKO,2023,7,0.0


In [None]:
common_keys = ['Kod stacji', 'Nazwa stacji', 'Rok', 'Miesiąc']
dataset_2 = pd.merge(dataset_2_p1, dataset_2_p2, on=common_keys)
dataset_2.head()

Unnamed: 0,Kod stacji,Nazwa stacji,Rok,Miesiąc,Średnia temperatura maksymalna [°C],Średnia temperatura minimalna,Minimalna temperatura przy gruncie [°C],Miesieczna suma opadów,Liczba dni z opadem deszczu,Średnia miesięczna wilgotność względna [%]
0,249180010,PSZCZYNA,2022,5,20.7,8.0,-0.5,38.6,12,0.0
1,249180010,PSZCZYNA,2022,6,25.0,12.2,4.8,90.7,10,0.0
2,249180010,PSZCZYNA,2022,7,25.5,12.9,1.3,113.1,15,0.0
3,249180010,PSZCZYNA,2022,8,25.8,13.6,7.4,111.5,11,0.0
4,249180160,BRENNA,2022,5,20.2,8.5,0.4,46.5,14,0.0


In [None]:
dataset_2.describe()

Unnamed: 0,Kod stacji,Rok,Miesiąc,Średnia temperatura maksymalna [°C],Średnia temperatura minimalna,Minimalna temperatura przy gruncie [°C],Miesieczna suma opadów,Liczba dni z opadem deszczu,Średnia miesięczna wilgotność względna [%]
count,442.0,442.0,442.0,442.0,442.0,442.0,442.0,442.0,442.0
mean,250822100.0,2022.477376,6.497738,23.30724,11.032805,1.583484,73.491403,11.812217,25.811765
std,1593742.0,0.500054,1.119299,3.724399,3.422718,3.641599,47.005878,4.067853,34.362943
min,249180000.0,2022.0,5.0,0.0,0.0,-9.0,0.0,0.0,0.0
25%,249200600.0,2022.0,5.25,20.8,8.525,0.0,39.4,9.0,0.0
50%,250220100.0,2022.0,6.5,24.55,11.9,0.0,61.75,12.0,0.0
75%,252200100.0,2023.0,7.0,26.0,13.6,4.8,98.825,15.0,67.825
max,254220100.0,2023.0,8.0,28.5,17.7,11.1,296.6,22.0,86.7


In [None]:
column_names_to_mean = dataset_2.columns[4:]
dataset2 = dataset_2.groupby(['Kod stacji', 'Nazwa stacji', 'Rok'])[column_names_to_mean].mean()
dataset2.head()

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,Średnia temperatura maksymalna [°C],Średnia temperatura minimalna,Minimalna temperatura przy gruncie [°C],Miesieczna suma opadów,Liczba dni z opadem deszczu,Średnia miesięczna wilgotność względna [%]
Kod stacji,Nazwa stacji,Rok,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
249180010,PSZCZYNA,2022,24.25,11.675,3.25,88.475,12.0,0.0
249180010,PSZCZYNA,2023,23.45,11.325,2.525,89.025,12.5,0.0
249180160,BRENNA,2022,23.725,12.3,4.675,104.125,13.0,0.0
249180160,BRENNA,2023,22.85,11.95,2.3,117.1,14.75,0.0
249190560,JABŁONKA,2022,23.025,8.5,0.0,66.75,13.5,0.0


In [None]:
dataset2.reset_index().to_csv('dataset2.csv', encoding='utf-8-sig')

In [None]:
dataset2.isnull().values.any()

False

### Zbiór nr 3

In [None]:
dataset_3_p1 = synoptic_data_2
dataset_3_p2 = hydrological_data

In [None]:
dataset_3_p1.head()

Unnamed: 0,Kod stacji,Nazwa stacji,Rok,Miesiąc,Średnia temperatura maksymalna [°C],Średnia temperatura minimalna [°C],Minimalna temperatura przy gruncie [°C],Miesięczna suma opadów [mm],Miesięczna suma usłonecznienia,Liczba dni z opadem deszczu
0,349190600,BIELSKO-BIAŁA,2022,1,3.2,-2.3,-17.5,46.4,62.3,6
1,349190600,BIELSKO-BIAŁA,2022,2,6.6,0.3,-7.7,37.5,95.2,4
2,349190600,BIELSKO-BIAŁA,2022,3,8.8,-1.9,-10.5,20.8,236.9,5
3,349190600,BIELSKO-BIAŁA,2022,4,10.9,2.2,-4.9,59.3,154.0,10
4,349190600,BIELSKO-BIAŁA,2022,5,19.8,8.8,1.6,44.8,239.0,14


In [None]:
dataset_3_p2 = dataset_3_p2.rename(columns = {'Rok hydrologiczny':'Rok', 'Miesiąc kalendarzowy': 'Miesiąc'})

dataset_3_p2.head()

Unnamed: 0,Kod stacji,Nazwa stacji,Rok,Miesiąc,Stan wody [cm],Przepływ [m^3/s],Temperatura wody [st. C],Nazwa rzeki/jeziora
0,149180020,CHAŁUPKI,2022,11,71,8.38,99.9,Odra (1)
1,149180020,CHAŁUPKI,2022,11,83,11.9,99.9,Odra (1)
2,149180020,CHAŁUPKI,2022,11,110,22.4,99.9,Odra (1)
3,149180020,CHAŁUPKI,2022,12,85,12.4,99.9,Odra (1)
4,149180020,CHAŁUPKI,2022,12,102,18.9,99.9,Odra (1)


In [None]:
dataset_3_p1 = dataset_3_p1[dataset_3_p1['Miesiąc'].between(month_range[0], month_range[1])]
dataset_3_p2 = dataset_3_p2[dataset_3_p2['Miesiąc'].between(month_range[0], month_range[1])]

In [None]:
dataset_3_p1.describe()

Unnamed: 0,Kod stacji,Rok,Miesiąc,Średnia temperatura maksymalna [°C],Średnia temperatura minimalna [°C],Minimalna temperatura przy gruncie [°C],Miesięczna suma opadów [mm],Miesięczna suma usłonecznienia,Liczba dni z opadem deszczu
count,464.0,464.0,464.0,464.0,464.0,464.0,464.0,464.0,464.0
mean,351702600.0,2022.5,6.5,22.728017,11.703879,3.420474,67.857328,233.609914,12.241379
std,1669694.0,0.50054,1.119241,4.070824,3.431726,4.268883,43.466132,93.851534,4.091018
min,349190600.0,2022.0,5.0,0.0,0.0,-6.4,4.3,0.0,2.0
25%,350190600.0,2022.0,5.75,20.075,8.5,-0.025,38.875,220.8,9.75
50%,351215500.0,2022.5,6.5,24.0,12.7,4.25,58.75,260.5,12.0
75%,353180200.0,2023.0,7.25,25.8,14.4,6.9,87.375,288.9,15.0
max,354220200.0,2023.0,8.0,28.1,17.2,12.2,273.0,379.0,23.0


In [None]:
dataset_3_p2.describe()

Unnamed: 0,Kod stacji,Rok,Miesiąc,Stan wody [cm],Przepływ [m^3/s],Temperatura wody [st. C]
count,9960.0,9960.0,9960.0,9960.0,9960.0,9960.0
mean,151553900.0,2022.0,6.497289,213.061847,16160.835813,89.599809
std,1630479.0,0.0,1.118356,731.628337,36788.941424,27.151517
min,149180000.0,2022.0,5.0,-14.0,0.0,1.7
25%,150180200.0,2022.0,5.0,86.0,0.68,99.9
50%,151210100.0,2022.0,6.0,132.0,2.8,99.9
75%,153170000.0,2022.0,7.0,200.0,29.1,99.9
max,154230000.0,2022.0,8.0,9999.0,99999.999,99.9


In [None]:
common_keys = ['Nazwa stacji', 'Rok', 'Miesiąc']
dataset_3 = pd.merge(dataset_3_p1, dataset_3_p2.drop('Kod stacji', axis=1), on=common_keys)
dataset_3.head()

Unnamed: 0,Kod stacji,Nazwa stacji,Rok,Miesiąc,Średnia temperatura maksymalna [°C],Średnia temperatura minimalna [°C],Minimalna temperatura przy gruncie [°C],Miesięczna suma opadów [mm],Miesięczna suma usłonecznienia,Liczba dni z opadem deszczu,Stan wody [cm],Przepływ [m^3/s],Temperatura wody [st. C],Nazwa rzeki/jeziora
0,349200660,NOWY SĄCZ,2022,5,21.3,8.0,0.4,17.8,256.1,11,77,40.0,99.9,Dunajec (214)
1,349200660,NOWY SĄCZ,2022,5,21.3,8.0,0.4,17.8,256.1,11,88,59.2,99.9,Dunajec (214)
2,349200660,NOWY SĄCZ,2022,5,21.3,8.0,0.4,17.8,256.1,11,96,73.8,99.9,Dunajec (214)
3,349200660,NOWY SĄCZ,2022,5,21.3,8.0,0.4,17.8,256.1,11,76,0.73,99.9,Kamienica (21432)
4,349200660,NOWY SĄCZ,2022,5,21.3,8.0,0.4,17.8,256.1,11,81,1.13,99.9,Kamienica (21432)


In [None]:
dataset_3.columns[4:]

Index(['Średnia temperatura maksymalna [°C]',
       'Średnia temperatura minimalna [°C]',
       'Minimalna temperatura przy gruncie [°C]',
       'Miesięczna suma opadów [mm]', 'Miesięczna suma usłonecznienia',
       'Liczba dni z opadem deszczu', 'Stan wody [cm]', 'Przepływ [m^3/s]',
       'Temperatura wody [st. C]', 'Nazwa rzeki/jeziora'],
      dtype='object')

In [None]:
column_names_to_mean = dataset_3.columns[4:-1]
dataset3 = dataset_3.groupby(['Kod stacji', 'Nazwa stacji', 'Rok', 'Nazwa rzeki/jeziora'])[column_names_to_mean].mean()
dataset3.head()

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,Unnamed: 3_level_0,Średnia temperatura maksymalna [°C],Średnia temperatura minimalna [°C],Minimalna temperatura przy gruncie [°C],Miesięczna suma opadów [mm],Miesięczna suma usłonecznienia,Liczba dni z opadem deszczu,Stan wody [cm],Przepływ [m^3/s],Temperatura wody [st. C]
Kod stacji,Nazwa stacji,Rok,Nazwa rzeki/jeziora,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1
349200660,NOWY SĄCZ,2022,Dunajec (214),25.1,12.4,5.075,70.2,263.925,10.25,78.833333,44.8,99.9
349200660,NOWY SĄCZ,2022,Kamienica (21432),25.1,12.4,5.075,70.2,263.925,10.25,85.083333,2.3075,99.9
349200660,NOWY SĄCZ,2022,Łubinka (21434),25.1,12.4,5.075,70.2,263.925,10.25,207.333333,0.675,99.9
349210670,KROSNO,2022,Drwęca Warmińska (566),24.125,12.725,5.775,54.6,274.2,10.75,180.5,2.676667,99.9
349210670,KROSNO,2022,Wisłok (226),24.125,12.725,5.775,54.6,274.2,10.75,177.166667,2.4625,99.9


In [None]:
dataset3 = dataset3.reset_index()

In [None]:
dataset3.head()

Unnamed: 0,Kod stacji,Nazwa stacji,Rok,Nazwa rzeki/jeziora,Średnia temperatura maksymalna [°C],Średnia temperatura minimalna [°C],Minimalna temperatura przy gruncie [°C],Miesięczna suma opadów [mm],Miesięczna suma usłonecznienia,Liczba dni z opadem deszczu,Stan wody [cm],Przepływ [m^3/s],Temperatura wody [st. C]
0,349200660,NOWY SĄCZ,2022,Dunajec (214),25.1,12.4,5.075,70.2,263.925,10.25,78.833333,44.8,99.9
1,349200660,NOWY SĄCZ,2022,Kamienica (21432),25.1,12.4,5.075,70.2,263.925,10.25,85.083333,2.3075,99.9
2,349200660,NOWY SĄCZ,2022,Łubinka (21434),25.1,12.4,5.075,70.2,263.925,10.25,207.333333,0.675,99.9
3,349210670,KROSNO,2022,Drwęca Warmińska (566),24.125,12.725,5.775,54.6,274.2,10.75,180.5,2.676667,99.9
4,349210670,KROSNO,2022,Wisłok (226),24.125,12.725,5.775,54.6,274.2,10.75,177.166667,2.4625,99.9


In [None]:
dataset3 = dataset3[[col for col in dataset3.columns if col != 'Nazwa rzeki/jeziora'] + ['Nazwa rzeki/jeziora']]

In [None]:
dataset3.head()

Unnamed: 0,Kod stacji,Nazwa stacji,Rok,Średnia temperatura maksymalna [°C],Średnia temperatura minimalna [°C],Minimalna temperatura przy gruncie [°C],Miesięczna suma opadów [mm],Miesięczna suma usłonecznienia,Liczba dni z opadem deszczu,Stan wody [cm],Przepływ [m^3/s],Temperatura wody [st. C],Nazwa rzeki/jeziora
0,349200660,NOWY SĄCZ,2022,25.1,12.4,5.075,70.2,263.925,10.25,78.833333,44.8,99.9,Dunajec (214)
1,349200660,NOWY SĄCZ,2022,25.1,12.4,5.075,70.2,263.925,10.25,85.083333,2.3075,99.9,Kamienica (21432)
2,349200660,NOWY SĄCZ,2022,25.1,12.4,5.075,70.2,263.925,10.25,207.333333,0.675,99.9,Łubinka (21434)
3,349210670,KROSNO,2022,24.125,12.725,5.775,54.6,274.2,10.75,180.5,2.676667,99.9,Drwęca Warmińska (566)
4,349210670,KROSNO,2022,24.125,12.725,5.775,54.6,274.2,10.75,177.166667,2.4625,99.9,Wisłok (226)


In [None]:
dataset3.reset_index().to_csv('dataset3.csv', encoding='utf-8-sig', index = False)