In [2]:
#Collecting the data


#importing libraries
import pandas as pd
from statsmodels.tsa.arima.model import ARIMA

#downloading data from "GUS" - Central Statistical Office
csv= 'https://stat.gov.pl/download/gfx/portalinformacyjny/pl/defaultstronaopisowa/4741/1/1/miesieczne_wskazniki_cen_towarow_i_uslug_konsumpcyjnych_od_1982_roku.csv'

#Loading data to dataframe
df = pd.read_csv(csv, delimiter=';', encoding='cp1250')


In [3]:
#Data preparation


#data cleaning
df = df.drop(['Nazwa zmiennej', 'Jednostka terytorialna', 'Flaga', 'Unnamed: 7', 'Unnamed: 8'  ], axis=1)
df = df[df['Sposób prezentacji'] == 'Analogiczny miesiąc poprzedniego roku = 100']
df = df.drop('Sposób prezentacji', axis=1)
df['Wartość'] = df['Wartość'].str.replace(',', '.').astype(float)
df= df.dropna()


#creating "Date" as index
df['Dzień'] = pd.to_datetime(df['Miesiąc'].astype(str) + '-' + df['Rok'].astype(str), format='%m-%Y').dt.days_in_month
df['Data'] = pd.to_datetime(df['Rok'].astype(str) + '-' + df['Miesiąc'].astype(str) + '-' + df['Dzień'].astype(str))
df.set_index('Data', inplace=True)


#data sorting
df.sort_index(inplace=True)

#further data cleaning
df.drop(['Rok', 'Miesiąc', 'Dzień'], axis=1, inplace=True)


In [None]:
#creating ARIMA model

model = ARIMA(df['Wartość'], order=(1, 2, 1), freq='M')
model_fit = model.fit()

In [7]:
#predicting CPI for next month
predicted_cpi = model_fit.forecast(steps=1)[0]
print('Predicted CPI value for next month:', round(predicted_cpi-100, 1))

Predicted CPI value for next month: 11.9
