# Skrypt do predykcji danych demograficznych oparty o dane historyczne GUS

## Zaimportowanie bibliotek

In [22]:
import requests as rq

import numpy as np
import pandas as pd

import matplotlib as mpl
import matplotlib.pyplot as plt

import seaborn as sns
import seaborn.objects as so

## Zaimportowanie danych z API GUS

Zaimportowanie danych z API GUS Portal z API BDL.

In [25]:
data = {
    "Area": [
        "Polska", "Malopolskie", "Slaskie", "Lubuskie", "Wielkopolskie",
        "Zachodniopomorskie", "Dolnoslaskie", "Opolskie", "Kujawsko-Pomorskie",
        "Pomorskie", "Warminsko-Mazurskie", "Lodzkie", "Swietokrzyskie",
        "Lubelskie", "Podkarpackie", "Podlaskie", "Mazowieckie"
    ],
    "Code": [
        "000000000000", "011200000000", "012400000000", "020800000000",
        "023000000000", "023200000000", "030200000000", "031600000000",
        "040400000000", "042200000000", "042800000000", "051000000000",
        "052600000000", "060600000000", "061800000000", "062000000000",
        "071400000000"
    ]
}

data2 = {
    "category_code": [
        "ludnosc_na_1_km2",
        "zmiana_liczby_ludnosci_na_1000_mieszkancow",
        "ludnosc_w_tysiacach",
        "wskaznik_urbanizacji",
        "liczba_ludnosci_ogolem",
        "liczba_ludnosci_ogolem_mezczyzni",
        "liczba_ludnosci_ogolem_kobiety",
        "mediana_wieku_ludnosci_ogolem",
        "mediana_wieku_ludnosci_mezczyzni",
        "mediana_wieku_ludnosci_kobiety",
        "ludnosc_w_wieku_nieprodukcyjnym_na_100_osob_w_wieku_produkcyjnym",
        "ludnosc_w_wieku_poprodukcyjnym_na_100_osob_w_wieku_przedprodukcyjnym",
        "ludnosc_w_wieku_poprodukcyjnym_na_100_osob_w_wieku_produkcyjnym",
        "wspolczynnik_obciazenia_demograficznego_osobami_starszymi",
        "wspolczynnik_feminizacji_ogolem",
        "migracje_miedzywojewodzkie_na_pobyt_staly_wymeldowania_osob_w_wieku_20-40_lat",
        "migracje_miedzywojewodzkie_na_pobyt_staly_zameldowania_osob_w_wieku_20-40_lat",
        "zgony_wg_plci_i_grup_wieku_ogolem",
        "zgony_mezczyzni_ogolem",
        "zgony_kobiety_ogolem",
        "urodzenia_zywe_na_1000_ludnosci",
        "zgony_na_1000_ludnosci",
        "przyrost_naturalny_na_1000_ludnosci",
        "dzietnosc",
        "reprodukcja_brutto",
        "bezrobotni_zarejestrowani_pozostajacy_bez_pracy_dluzej_niz_1_rok_ogolem",
        "bezrobotni_zarejestrowani_pozostajacy_bez_pracy_dluzej_niz_1_rok_ogolem_w_%_bezrobotnych_ogolem",
        "bezrobotni_zarejestrowani_pozostajacy_bez_pracy_dluzej_niz_1_rok_mezczyzni_w_%_bezrobotnych_mezczyzn",
        "bezrobotni_zarejestrowani_pozostajacy_bez_pracy_dluzej_niz_1_rok_kobiety_w_%_bezrobotnych_kobiet"
    ],
    "values": [
        60559,
        458603,
        1645341,
        1725015,
        72305,
        72300,
        72295,
        746289,
        746290,
        746291,
        60563,
        60564,
        60562,
        634067,
        450542,
        1723482,
        1723483,
        3231,
        30149,
        30165,
        450540,
        450541,
        450551,
        59049,
        59048,
        79226,
        79228,
        453821,
        453822
    ]
}

my_params = {'lang': 'pl', 'format': 'json', 'var-id': None}
for area, code in zip(data['Area'], data['Code']):
    for category_code, value in zip(data2['category_code'], data2['values']):
        my_params['var-id'] = value
        response = rq.get(f'https://bdl.stat.gov.pl/api/v1/data/by-unit/{code}', params=my_params)
        output = response.json()
        df_name = f"{category_code}_{area}".replace(" ", "_")
        locals()[df_name] = pd.DataFrame(output['results'][0]['values'], columns=['year', 'val'])
        print(f"{df_name}:")
        print(locals()[df_name])
        print("\n")


ludnosc_na_1_km2_Polska:
    year    val
0   2002  122.2
1   2003  122.1
2   2004  122.1
3   2005  122.0
4   2006  121.9
5   2007  121.9
6   2008  122.0
7   2009  122.1
8   2010  123.2
9   2011  123.3
10  2012  123.2
11  2013  123.1
12  2014  123.1
13  2015  122.9
14  2016  122.9
15  2017  122.9
16  2018  122.8
17  2019  122.7
18  2020  121.8
19  2021  121.2
20  2022  120.8


zmiana_liczby_ludnosci_na_1000_mieszkancow_Polska:
    year  val
0   2003 -0.7
1   2004 -0.4
2   2005 -0.4
3   2006 -0.8
4   2007 -0.3
5   2008  0.5
6   2009  0.8
7   2010  9.5
8   2011  0.2
9   2012 -0.1
10  2013 -1.0
11  2014 -0.4
12  2015 -1.1
13  2016 -0.1
14  2017  0.0
15  2018 -0.6
16  2019 -0.7
17  2020 -3.1
18  2021 -4.8
19  2022 -3.7


ludnosc_w_tysiacach_Polska:
    year       val
0   1995  38609.40
1   1996  38639.34
2   1997  38659.98
3   1998  38666.98
4   1999  38263.30
5   2000  38253.96
6   2001  38242.20
7   2002  38218.53
8   2003  38190.61
9   2004  38173.84
10  2005  38157.06
11  2006  38125.48