In [610]:
import pandas as pd
import numpy as np
pd.options.display.float_format = '{:.2f}'.format

## Common Russian Data

In [611]:
brent = pd.read_csv('Данные/Brent.csv')
brent = brent[brent['Date'] >= '2014-01-15']
brent.rename(columns={'Price': 'Brent'}, inplace=True)
brent['Date'] = pd.date_range(start='2014-01-01', end='2025-01-01', freq='M')
brent.reset_index(drop=True, inplace=True)
brent.head()

Unnamed: 0,Date,Brent
0,2014-01-31,108.12
1,2014-02-28,108.9
2,2014-03-31,107.48
3,2014-04-30,107.76
4,2014-05-31,109.54


In [612]:
gosdolg = pd.read_excel('Данные/gosdolg.xls')
gosdolg['Date'] = pd.date_range(start='2014-01-01', end='2025-01-01', freq='M')
gosdolg.head()

Unnamed: 0,Date,gov_debt
0,2014-01-31,5722.24
1,2014-02-28,5733.57
2,2014-03-31,5754.95
3,2014-04-30,5707.24
4,2014-05-31,5714.97


In [613]:
infl_exp = pd.read_excel('Данные/Infl_expectation.xlsx')
infl_exp.columns = ['Date', 'Infl_exp']
infl_exp['Date'] = pd.date_range(start='2014-01-01', end='2025-02-01', freq='M')
infl_exp.head()

Unnamed: 0,Date,Infl_exp
0,2014-01-31,13.04
1,2014-02-28,11.8
2,2014-03-31,11.52
3,2014-04-30,12.67
4,2014-05-31,11.72


In [614]:
m2 = pd.read_excel('Данные/M2.xlsx')
m2.columns = ['Date', 'M2']
m2 = m2[m2['Date'] >= '2014-01-01']
m2['Date'] = pd.date_range(start='2014-01-01', end='2025-03-01', freq='M')
m2.reset_index(drop=True, inplace=True)
m2.head()

Unnamed: 0,Date,M2
0,2014-01-31,31155.6
1,2014-02-28,29861.2
2,2014-03-31,30169.0
3,2014-04-30,29519.3
4,2014-05-31,29879.0


In [615]:
miacr = pd.read_excel('Данные/miacr.xlsx')
miacr.columns = ['Date', 'MIACR']
miacr.set_index('Date', inplace=True)
miacr = miacr.resample('M').mean()
miacr.index = miacr.index.to_period('M').to_timestamp('M') - pd.offsets.MonthBegin(1)
miacr.reset_index(inplace=True)
miacr['Date'] = pd.date_range(start='2014-01-01', end='2025-04-01', freq='M')
miacr.head()

Unnamed: 0,Date,MIACR
0,2014-01-31,6.06
1,2014-02-28,5.99
2,2014-03-31,7.85
3,2014-04-30,7.87
4,2014-05-31,8.21


In [616]:
obligates = pd.read_excel('Данные/доходность ОФЗ.xlsx')
obligates['Date'] = pd.bdate_range('2014-01-06', '2024-10-08')
obligates['obligates'].astype('float')
obligates['year'] = obligates['Date'].dt.year
obligates['month'] = obligates['Date'].dt.month
ofz = obligates.groupby(['year', 'month'], as_index=False)[['obligates']].mean()
ofz['Date'] = pd.date_range('2014-01-01', '2024-11-01', freq='M')
ofz = ofz[['Date', 'obligates']]
ofz

Unnamed: 0,Date,obligates
0,2014-01-31,6.20
1,2014-02-28,6.39
2,2014-03-31,7.40
3,2014-04-30,7.50
4,2014-05-31,7.95
...,...,...
125,2024-06-30,21.45
126,2024-07-31,21.72
127,2024-08-31,18.67
128,2024-09-30,18.85


In [617]:
unemp = pd.read_excel('Данные/unemployment.xlsx', sheet_name='2')
unemp = pd.DataFrame(np.repeat(unemp.values, repeats=12,axis=0), columns=['Date', 'unemployment'])
unemp['Date'] = pd.date_range(start='2014-01-01', end='2024-01-01', freq='M')
unemp

Unnamed: 0,Date,unemployment
0,2014-01-31,6.80
1,2014-02-28,6.80
2,2014-03-31,6.80
3,2014-04-30,6.80
4,2014-05-31,6.80
...,...,...
115,2023-08-31,4.21
116,2023-09-30,4.21
117,2023-10-31,4.21
118,2023-11-30,4.21


## Regional Data

In [795]:
fm_names = ['Ожидания изменение цен на готов', 'Ожидания изменение спроса на пр', 'Ожидания изменение объемов прои',
            ' Изменение спроса на продукцию', 'Изменение издержек производства', 'Изменение объемов производства']

fm_heading = ['price_exp', 'demand_exp', 'volume_exp',
              'changes_demand', 'changes_costs', 'changes_volume']

for i in range(len(fm_names)):
    df_head = f'fm_{fm_heading[i]}'
    globals()[df_head] = pd.read_excel('Данные/МП.xlsx', sheet_name=fm_names[i])
    cols = list(map(str.strip, globals()[df_head].columns))
    globals()[df_head].columns = cols
    globals()[df_head]['Date'] = pd.date_range('2014-01-01', '2023-11-01', freq='M')
    date = globals()[df_head].pop('Date')
    globals()[df_head].insert(0, 'Date', date)
    globals()[df_head].drop(['date'], axis=1, inplace=True)
    globals()[df_head].reset_index(drop=True, inplace=True)
    globals()[df_head] = globals()[df_head].reindex(sorted(globals()[df_head].columns), axis=1)
    globals()[df_head].columns = globals()[df_head].columns.str.replace(' ', '_')


fm_demand_exp.head()

Unnamed: 0,Date,Алтайский_край,Амурская_область,Архангельская_область,Астраханская_область,Белгородская_область,Брянская_область,Владимирская_область,Волгоградская_область,Вологодская_область,...,Тюменская_область,Удмуртская_Республика,Ульяновская_область,Хабаровский_край,Челябинская_область,Чувашская_Республика,Чукотский_автономный_округ,Ярославская_область,г._Москва,г._Санкт-Петербург
0,2014-01-31,7.17,11.48,22.22,22.22,22.44,35.71,19.55,14.0,14.5,...,17.36,24.7,23.5,12.92,23.36,23.8,34.92,16.79,14.5,17.5
1,2014-02-28,12.92,8.2,30.86,30.86,32.0,33.04,17.51,18.75,7.3,...,15.57,25.7,17.1,18.31,26.05,24.2,28.57,22.73,8.8,14.4
2,2014-03-31,13.82,8.8,28.4,28.4,24.34,25.45,22.33,21.62,13.8,...,12.3,9.0,20.7,17.42,34.42,19.1,23.44,17.29,10.3,18.5
3,2014-04-30,15.47,9.09,28.4,28.4,23.33,17.27,14.81,20.75,12.1,...,22.76,13.6,11.4,16.57,32.09,23.6,15.87,20.74,7.0,16.4
4,2014-05-31,17.13,8.06,24.69,24.69,25.68,22.94,11.27,26.11,10.1,...,4.1,11.5,15.5,14.8,28.97,24.5,41.54,17.04,10.5,15.8


In [772]:
inflation = pd.read_excel('Данные/бипц1.xls', sheet_name='1')
cols = list(map(str.strip, inflation.columns))
inflation.columns = cols
inflation.fillna(method='ffill')
inflation['Date'] = pd.date_range(start='2014-01-01', end='2025-02-01', freq='M')
date = inflation.pop('Date')
inflation.insert(0, 'Date', date)
inflation.reset_index(drop=True, inplace=True)
inflation = inflation.reindex(sorted(inflation.columns), axis=1)
inflation.columns = inflation.columns.str.replace(' ', '_')
inflation.head()

  inflation.fillna(method='ffill')


Unnamed: 0,Date,Алтайский_край,Амурская_область,Архангельская_область,Астраханская_область,Белгородская_область,Брянская_область,Владимирская_область,Волгоградская_область,Вологодская_область,...,Хабаровский_край,Ханты-Мансийский_автономный_округ,Челябинская_область,Чеченская_Республика,Чувашская_Республика,Чукотский_автономный_округ,Ямало-Ненецкий_автономный_округ,Ярославская_область,г._Москва,г._Санкт-Петербург
0,2014-01-31,100.38,100.5,100.44,100.47,100.56,100.44,100.42,100.2,100.29,...,100.18,100.21,100.5,99.84,100.65,100.26,100.37,100.59,100.55,100.52
1,2014-02-28,100.5,100.34,100.61,100.18,100.13,100.35,100.51,100.73,100.46,...,100.6,100.55,100.35,100.15,100.62,100.81,100.61,100.48,100.55,100.56
2,2014-03-31,101.38,100.64,100.78,100.8,100.21,100.97,101.15,100.93,100.68,...,100.66,100.5,100.66,100.44,100.38,100.97,100.49,101.16,101.06,100.82
3,2014-04-30,100.62,101.02,100.74,100.93,101.1,100.97,101.24,100.89,100.7,...,100.68,100.58,100.63,100.49,100.93,100.2,100.45,100.99,101.07,100.94
4,2014-05-31,101.2,100.49,100.44,100.58,100.66,101.66,101.41,100.91,100.94,...,100.87,100.27,100.73,99.81,100.91,100.16,101.32,100.74,100.76,101.43


In [773]:
money_income = pd.read_excel('Данные/денежные доходы.xls')
cols = list(map(str.strip, money_income.columns))
money_income.columns = cols
money_income = pd.DataFrame(np.repeat(money_income.values, repeats=12, axis=0), columns=cols)
money_income['Date'] = pd.date_range(start='2014-01-01', end='2025-01-01', freq='M')
date = money_income.pop('Date')
money_income.insert(0, 'Date', date)
money_income.drop(['Unnamed: 0'], axis=1, inplace=True)
money_income.reset_index(drop=True, inplace=True)
money_income = money_income.reindex(sorted(money_income.columns), axis=1)
money_income.columns = money_income.columns.str.replace(' ', '_')
money_income.head()

Unnamed: 0,Date,Алтайский_край,Амурская_область,Архангельская_область,Астраханская_область,Белгородская_область,Брянская_область,Владимирская_область,Волгоградская_область,Вологодская_область,...,Хабаровский_край,Ханты-Мансийский_автономный_округ,Челябинская_область,Чеченская_Республика,Чувашская_Республика,Чукотский_автономный_округ,Ямало-Ненецкий_автономный_округ,Ярославская_область,г._Москва,г._Санкт-Петербург
0,2014-01-31,16069.62,23096.71,25848.54,20103.62,23229.01,18733.27,18006.5,17999.84,18997.72,...,29257.09,39820.66,21967.48,18170.65,14833.59,56200.48,59885.08,20743.98,56409.3,30179.03
1,2014-02-28,16069.62,23096.71,25848.54,20103.62,23229.01,18733.27,18006.5,17999.84,18997.72,...,29257.09,39820.66,21967.48,18170.65,14833.59,56200.48,59885.08,20743.98,56409.3,30179.03
2,2014-03-31,16069.62,23096.71,25848.54,20103.62,23229.01,18733.27,18006.5,17999.84,18997.72,...,29257.09,39820.66,21967.48,18170.65,14833.59,56200.48,59885.08,20743.98,56409.3,30179.03
3,2014-04-30,16069.62,23096.71,25848.54,20103.62,23229.01,18733.27,18006.5,17999.84,18997.72,...,29257.09,39820.66,21967.48,18170.65,14833.59,56200.48,59885.08,20743.98,56409.3,30179.03
4,2014-05-31,16069.62,23096.71,25848.54,20103.62,23229.01,18733.27,18006.5,17999.84,18997.72,...,29257.09,39820.66,21967.48,18170.65,14833.59,56200.48,59885.08,20743.98,56409.3,30179.03


In [774]:
trade_turnover = pd.read_excel('Данные/динамика_розничного_товарооборота.xls')
cols = list(map(str.strip, trade_turnover.columns))
trade_turnover.columns = cols
trade_turnover = pd.DataFrame(np.repeat(trade_turnover.values, repeats=12, axis=0), columns=cols)
trade_turnover['Date'] = pd.date_range(start='2014-01-01', end='2024-01-01', freq='M')
date = trade_turnover.pop('Date')
trade_turnover.insert(0, 'Date', date)
trade_turnover.drop(['date'], axis=1, inplace=True)
trade_turnover.reset_index(drop=True, inplace=True)
trade_turnover = trade_turnover.reindex(sorted(trade_turnover.columns), axis=1)
trade_turnover.columns = trade_turnover.columns.str.replace(' ', '_')
trade_turnover.head()

Unnamed: 0,Date,Алтайский_край,Амурская_область,Архангельская_область,Астраханская_область,Белгородская_область,Брянская_область,Владимирская_область,Волгоградская_область,Вологодская_область,...,Хабаровский_край,Ханты-Мансийский_автономный_округ,Челябинская_область,Чеченская_Республика,Чувашская_Республика,Чукотский_автономный_округ,Ямало-Ненецкий_автономный_округ,Ярославская_область,г._Москва,г._Санкт-Петербург
0,2014-01-31,130356,164379,181480,164103,163905,158805,129044,126189,125059,...,179045,223540,154189,88284,106919,104258,241638,150435,366390,194353
1,2014-02-28,130356,164379,181480,164103,163905,158805,129044,126189,125059,...,179045,223540,154189,88284,106919,104258,241638,150435,366390,194353
2,2014-03-31,130356,164379,181480,164103,163905,158805,129044,126189,125059,...,179045,223540,154189,88284,106919,104258,241638,150435,366390,194353
3,2014-04-30,130356,164379,181480,164103,163905,158805,129044,126189,125059,...,179045,223540,154189,88284,106919,104258,241638,150435,366390,194353
4,2014-05-31,130356,164379,181480,164103,163905,158805,129044,126189,125059,...,179045,223540,154189,88284,106919,104258,241638,150435,366390,194353


In [776]:
debt_fiz = pd.read_excel('Данные/задолженность_физ.xls')
cols = list(map(str.strip, debt_fiz.columns))
debt_fiz.columns = cols
debt_fiz = debt_fiz[debt_fiz['month'].str.contains('-') == 0]
debt_fiz['Date'] = pd.date_range(start='2014-01-01', end='2025-03-01', freq='M')
date = debt_fiz.pop('Date')
debt_fiz.insert(0, 'Date', date)
debt_fiz.drop(['year', 'month'], axis=1, inplace=True)
debt_fiz.reset_index(drop=True, inplace=True)
debt_fiz = debt_fiz.reindex(sorted(debt_fiz.columns), axis=1)
debt_fiz.columns = debt_fiz.columns.str.replace(' ', '_')
debt_fiz.head()

Unnamed: 0,Date,Алтайский_край,Амурская_область,Архангельская_область,Астраханская_область,Белгородская_область,Брянская_область,Владимирская_область,Волгоградская_область,Вологодская_область,...,Удмуртская_Республика,Ульяновская_область,Хабаровский_край,Челябинская_область,Чеченская_Республика,Чувашская_Республика,Чукотский_автономный_округ,Ярославская_область,г._Москва,г._Санкт-Петербург
0,2014-01-31,140761,66808,88498,61500,88965,57397,79515,125715,82317,...,96388,83582,113478,255349,14994,65162,3280,69682,1025018,411440
1,2014-02-28,142506,67162,89397,62431,90010,57938,80738,127228,83380,...,97596,84877,114440,257743,15283,66334,3256,70645,1036029,417429
2,2014-03-31,144720,68119,90517,63412,91400,58883,81795,128553,84444,...,99075,86310,115755,259317,15551,67702,3307,71918,1056847,425001
3,2014-04-30,147432,69436,92392,64579,92674,59929,83173,130767,86166,...,100930,88203,117465,263240,15915,69378,3410,73326,1071420,439920
4,2014-05-31,149353,70416,92391,64976,94031,60780,83510,132855,85634,...,102016,89290,119340,265833,16278,69754,3511,74355,1077191,443641


In [782]:
debt_firms = pd.read_excel('Данные/задолженность_юр.xls')
cols = list(map(str.strip, debt_firms.columns))
debt_firms.columns = cols
debt_firms = debt_firms[debt_firms['month'].str.contains('-') == 0]
debt_firms['Date'] = pd.date_range(start='2014-01-01', end='2025-02-01', freq='M')
date = debt_firms.pop('Date')
debt_firms.insert(0, 'Date', date)
debt_firms.drop(['year', 'month'], axis=1, inplace=True)
debt_firms.reset_index(drop=True, inplace=True)
debt_firms = debt_firms.reindex(sorted(debt_firms.columns), axis=1)
debt_firms.columns = debt_firms.columns.str.replace(' ', '_')
debt_firms.head()

Unnamed: 0,Date,Алтайский_край,Амурская_область,Архангельская_область,Астраханская_область,Белгородская_область,Брянская_область,Владимирская_область,Волгоградская_область,Вологодская_область,...,Хабаровский_край,Ханты-Мансийский_автономный_округ,Челябинская_область,Чеченская_Республика,Чувашская_Республика,Чукотский_автономный_округ,Ямало-Ненецкий_автономный_округ,Ярославская_область,г._Москва,г._Санкт-Петербург
0,2014-01-31,128271,33840,96682,36541,218657,63730,77908,132209,93995,...,124971,137722.0,314366,17917,94804.0,5058,125544,130068,6724491,1336574
1,2014-02-28,127666,34412,98356,36752,212615,64339,78326,133385,94111,...,125020,138425.0,335519,18671,93764.0,4949,127843,118477,6662149,1355738
2,2014-03-31,132560,32272,98934,37095,213605,64590,79716,134974,86324,...,125946,149995.0,347002,17783,94311.0,4506,117396,119044,6680316,1390857
3,2014-04-30,132871,32777,100700,37154,214755,64844,80706,135451,98299,...,127787,155446.0,347903,18036,94534.0,4874,117385,119073,6800508,1406487
4,2014-05-31,133605,33062,100637,37225,213583,65647,81658,135229,101564,...,128529,156774.0,352768,18513,93205.0,5222,116949,120194,6952824,1406521


In [783]:
salary = pd.read_excel('Данные/номинальная ЗП.xlsx')
cols = list(map(str.strip, salary.columns))
salary.columns = cols
salary['Date'] = pd.date_range(start='2014-01-01', end='2025-01-01', freq='M')
date = salary.pop('Date')
salary.insert(0, 'Date', date)
salary.reset_index(drop=True, inplace=True)
salary = salary.reindex(sorted(salary.columns), axis=1)
salary.columns = salary.columns.str.replace(' ', '_')
salary.head()

Unnamed: 0,Date,Алтайский_край,Амурская_область,Архангельская_область,Астраханская_область,Белгородская_область,Брянская_область,Владимирская_область,Волгоградская_область,Вологодская_область,...,Хабаровский_край,Ханты-Мансийский_автономный_округ,Челябинская_область,Чеченская_Республика,Чувашская_Республика,Чукотский_автономный_округ,Ямало-Ненецкий_автономный_округ,Ярославская_область,г._Москва,г._Санкт-Петербург
0,2014-01-31,17809.4,29881.6,33650.3,21643.3,22458.8,18884.6,20672.5,21723.0,24893.0,...,33216.6,50575.2,26101.3,21184.5,18868.3,71928.6,67194.5,22824.0,53584.3,35999.6
1,2014-02-28,17319.1,29197.0,31975.2,22141.9,21473.6,18540.4,20428.6,21535.7,25203.6,...,32582.9,50390.4,25527.1,21147.1,18635.8,68198.9,68252.0,22618.0,54672.5,36196.2
2,2014-03-31,18596.9,30968.9,33880.8,22778.4,22816.3,19821.8,21486.7,22509.0,25314.1,...,34300.5,61452.0,26472.9,22140.7,19711.0,72779.5,73467.6,23789.1,59753.7,40474.5
3,2014-04-30,18732.4,32061.9,35695.8,25999.0,23169.7,21231.8,22077.5,23901.3,27138.3,...,35737.0,57310.0,28258.4,21231.2,20224.8,80235.6,90185.1,25150.0,64337.9,40195.9
4,2014-05-31,19356.4,32351.0,36816.4,23677.3,23545.5,20837.2,22466.8,22763.5,26322.5,...,35825.9,59415.0,27417.7,22066.8,20980.4,79562.6,81474.2,25121.5,58421.6,39000.1


In [784]:
paid_services = pd.read_excel('Данные/объем платных услуг.xls')
cols = list(map(str.strip, paid_services.columns))
paid_services.columns = cols
paid_services = paid_services[paid_services['month'].str.contains('-') == 0]
paid_services['Date'] = pd.date_range(start='2014-01-01', end='2024-04-01', freq='M')
date = paid_services.pop('Date')
paid_services.insert(0, 'Date', date)
paid_services.drop(['year', 'month'], axis=1, inplace=True)
paid_services.reset_index(drop=True, inplace=True)
paid_services = paid_services.reindex(sorted(paid_services.columns), axis=1)
paid_services.columns = paid_services.columns.str.replace(' ', '_')
paid_services.head()

Unnamed: 0,Date,Алтайский_край,Амурская_область,Архангельская_область,Астраханская_область,Белгородская_область,Брянская_область,Владимирская_область,Волгоградская_область,Вологодская_область,...,Хабаровский_край,Ханты-Мансийский_автономный_округ,Челябинская_область,Чеченская_Республика,Чувашская_Республика,Чукотский_автономный_округ,Ямало-Ненецкий_автономный_округ,Ярославская_область,г._Москва,г._Санкт-Петербург
0,2014-01-31,1222227.8,2900057.9,4405802.6,2859222.4,5607051.4,3313633.9,4918551.6,9818283.1,3628160.9,...,9070106.3,7100536.9,10224654.3,2659865.4,3238109.9,277402.6,3026971.3,3659005.3,98389278.9,28950444.5
1,2014-02-28,1287226.3,3214893.4,4705042.3,3000332.3,5846879.3,3453973.6,4992916.1,10312071.5,3886565.1,...,9918022.0,7328075.7,10418260.8,3096250.0,3287213.6,297073.7,3204332.3,3533473.3,96705313.8,29337314.3
2,2014-03-31,1254021.4,3367412.5,4988669.5,2939450.9,5932783.1,3430976.5,5364232.1,10801270.9,4072760.8,...,10881703.0,7967728.3,10913285.3,3067913.6,3371816.8,280057.0,3545949.0,3886556.7,97423350.1,31783111.1
3,2014-04-30,1237841.8,3385204.3,5195905.7,2964512.8,5881579.9,3456498.3,5491976.3,10824181.1,4088728.2,...,11592908.4,7643942.1,11041072.4,3407861.0,3381803.0,285534.0,3403576.0,3726333.0,105016594.0,31447023.2
4,2014-05-31,1288983.3,3256951.1,5007149.7,2760722.8,5448840.4,3226869.5,5117365.8,10532465.7,3951865.4,...,10289523.4,8075343.4,10446104.9,2724495.2,3160771.1,283519.9,3206858.2,3548348.5,101844625.7,32058336.5


In [796]:
regions1 = list(map(str.strip, fm_demand_exp.columns))
regions1.remove('Date')
regions2 = list(map(str.strip, inflation.columns))
regions2.remove('Date')
regions3 = list(map(str.strip, paid_services.columns))
regions3.remove('Date')
regions4 = list(map(str.strip, money_income.columns))
regions4.remove('Date')
regions5 = list(map(str.strip, debt_fiz.columns))
regions5.remove('Date')
regions6 = list(map(str.strip, debt_firms.columns))
regions6.remove('Date')
regions7 = list(map(str.strip, trade_turnover.columns))
regions7.remove('Date')
regions8 = list(map(str.strip, salary.columns))
regions8.remove('Date')

In [798]:
region_columns = set(regions1) & set(regions2) & set(regions3) & set(regions4) & set(regions5) & set(regions6) & set(regions7) & set(regions8) 
len(region_columns)

80

In [799]:
datasets = [fm_price_exp, fm_demand_exp, fm_volume_exp, fm_changes_demand, fm_changes_costs, fm_changes_volume, inflation, money_income, trade_turnover, debt_fiz, debt_firms, salary, paid_services]

for i in range(len(datasets)):
    datasets[i] = datasets[i].loc[:, datasets[i].columns.isin(region_columns)]

In [800]:
general_df = (
    brent
    .merge(miacr,    how='inner', on='Date')
    .merge(infl_exp, how='inner', on='Date')
    .merge(m2,       how='inner', on='Date')
    .merge(gosdolg,  how='inner', on='Date')
    .merge(ofz,      how='inner', on='Date')
    .merge(unemp,    how='inner', on='Date')
    .dropna()
)
general_df

Unnamed: 0,Date,Brent,MIACR,Infl_exp,M2,gov_debt,obligates,unemployment
0,2014-01-31,108.12,6.06,13.04,31155.60,5722.24,6.20,6.80
1,2014-02-28,108.90,5.99,11.80,29861.20,5733.57,6.39,6.80
2,2014-03-31,107.48,7.85,11.52,30169.00,5754.95,7.40,6.80
3,2014-04-30,107.76,7.87,12.67,29519.30,5707.24,7.50,6.80
4,2014-05-31,109.54,8.21,11.72,29879.00,5714.97,7.95,6.80
...,...,...,...,...,...,...,...,...
115,2023-08-31,86.15,10.33,11.72,88294.00,20376.88,12.79,4.21
116,2023-09-30,93.72,12.28,11.16,90110.90,20384.09,13.40,4.21
117,2023-10-31,90.60,13.08,12.18,90597.30,20714.58,14.14,4.21
118,2023-11-30,82.94,14.79,14.24,91134.70,20812.75,14.42,4.21


In [801]:
import os
os.makedirs('regional_data', exist_ok=True)
os.path.join(os.getcwd(), 'regional_data')

'/Users/askar/Desktop/ВКР/Diploma.-Inflation-model-using-PCA/regional_data'

In [805]:
datasets = [fm_price_exp, fm_demand_exp, fm_volume_exp, fm_changes_demand, fm_changes_costs, fm_changes_volume, inflation, money_income, trade_turnover, debt_fiz, debt_firms, salary, paid_services]
names = ['fm_price_exp', 'fm_demand_exp', 'fm_volume_exp', 'fm_changes_demand', 'fm_changes_costs', 'fm_changes_volume', 'inflation', 'money_income', 'trade_turnover', 'debt_fiz', 'debt_firms', 'salary', 'paid_services']

region_columns = list(region_columns)
for i in range(len(region_columns)):
    region = region_columns[i]    
    df_head = f'infl_{region}'
    globals()[df_head] = general_df.copy()
    for j in range(len(datasets)):    
        globals()[df_head] = datasets[j].loc[:, region].to_frame(name=names[j]).join(globals()[df_head])
    globals()[df_head].to_csv(f'regional_data/{df_head}.csv', index=False)

In [806]:
pd.read_csv('regional_data/infl_Республика_Ингушетия.csv')

Unnamed: 0,paid_services,salary,debt_firms,debt_fiz,trade_turnover,money_income,inflation,fm_changes_volume,fm_changes_costs,fm_changes_demand,...,fm_demand_exp,fm_price_exp,Date,Brent,MIACR,Infl_exp,M2,gov_debt,obligates,unemployment
0,846646.00,23257.50,7200,4432,42170.00,13355.02,100.01,4.80,14.30,-9.50,...,4.80,9.50,2014-01-31,108.12,6.06,13.04,31155.60,5722.24,6.20,6.80
1,767938.10,20242.10,7001,4288,42170.00,13355.02,99.97,0.00,18.80,0.00,...,0.00,18.80,2014-02-28,108.90,5.99,11.80,29861.20,5733.57,6.39,6.80
2,795890.80,20627.00,6952,4281,42170.00,13355.02,100.34,-4.80,19.00,0.00,...,4.80,23.80,2014-03-31,107.48,7.85,11.52,30169.00,5754.95,7.40,6.80
3,713122.00,20410.60,6964,4295,42170.00,13355.02,100.20,0.00,20.00,-5.00,...,10.50,21.10,2014-04-30,107.76,7.87,12.67,29519.30,5707.24,7.50,6.80
4,742253.50,20637.30,6927,4313,42170.00,13355.02,100.02,11.10,12.50,0.00,...,16.70,8.30,2014-05-31,109.54,8.21,11.72,29879.00,5714.97,7.95,6.80
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
118,5481575.60,35073.30,5381,15178,92894.00,23047.00,100.72,,,,...,,,,,,,,,,
119,5550862.10,47893.60,5414,15374,92894.00,23047.00,100.47,,,,...,,,,,,,,,,
120,6343781.70,37376.20,5519,15662,,,,,,,...,,,,,,,,,,
121,7068020.10,37755.10,5566,16004,,,,,,,...,,,,,,,,,,
