# Задача
Построение модели распространения Ковид [youtube.com](https://www.youtube.com/watch?v=gxAaO2rsdIs&t=634s). Сделать подобие сайта [Covid Wizard](http://covidwizard.com) сайта, только с возможностью подкачивать данные по Российским городам. И с понятной частью в плане того, как строится прогноз на несколько недель вперед (для этого из последней истории можно калибровать коэффициенты модели и строить прогноз).

# Covid Wizard
[Covid Wizard](http://covidwizard.com)

Код: https://github.com/naens/cvdwiz (дата обращения: 01.10.2020)

Нас интересует только файл `CovidStat.java`. Начинать стоит с функции `fillArrays`. Все считается в ней.

Используется $\Delta = 10$

Далее в коде элемент списка `T[i]` содержит количество подтвержденных случаев за `i`-ый день.

Подсчет Total Infection Rate:
```
for k in range(firstDay,lastDay-10):
  H[k] = T[k+9]-T[k-1]
  
for k in range(firstDay,lastDay-9):
  k1 = k+10
  h = H[k]
  if h > 0:
    infection_rate[k] = (T[k1]-T[k1-1])/h
  else:
    infection_rate[k] = None

for k in range(firstDay,lastDay-9):
  G = 0.0
  for i in range(0,10):
    if infection_rate[k-i] != None:
      G += infection_rate[k-i]
  total_infection_rate[k] = G
```

Предсказание Total Infection Rate:
```
for k in range(lastDay-9,lastDay+predictionDays):
  s = 0.0
  for i in range(1,11):
    ir = infection_rate[k-i]
    if ir != None:
      s += ir
  infection_rate[k] = s/10.0

for k in range(lastDay-9,lastDay+predictionDays):
  G = 0.0
  for i in range(10):
    ir = infection_rate[k-i]
    if ir != None:
      G += ir
  total_infection_rate[k] = G
```
# Как пользоваться этим блокнотом
Необходимо запустить все cells по порядку. Код сгенерирует веб-интерфейс для настройки моделей.


# Библиотеки
```
$ cat requirements.txt
jupyter==1.0.0
matplotlib==3.3.2
pandas==1.1.2
scipy==1.5.2
```

# Данные
## Источники
- COVID-19: [Архив статистики от Яндекса](https://yandex.ru/covid19/stat) (собирает статистику со [стопкоронавирус.рф](https://стопкоронавирус.рф/information/))
- Погода: [Архив фактической погоды от Росгидромедцентра](https://meteoinfo.ru/archive-pogoda) (доступны только последние 6 месяцев)

## Структура директорий
```
./
└── csv/
    ├── weather/
    │   ├─── info.csv
    │   ├─── 1138.csv
    │   ├─── 1486.csv
    │   ├─── 1624.csv
    │   ├─── 1700.csv
    │   ├─── 1819.csv
    │   ├─── 2223.csv
    │   ├─── 2532.csv
    │   ├─── 2718.csv
    │   ├─── 1179.csv
    │   ├─── 1498.csv
    │   ├─── 1631.csv
    │   ├─── 1705.csv
    │   ├─── 1834.csv
    │   ├─── 2262.csv
    │   ├─── 2535.csv
    │   ├─── 2740.csv
    │   ├─── 1206.csv
    │   ├─── 1557.csv
    │   ├─── 1634.csv
    │   ├─── 1707.csv
    │   ├─── 1887.csv
    │   ├─── 2292.csv
    │   ├─── 2539.csv
    │   ├─── 4994.csv
    │   ├─── 1238.csv
    │   ├─── 1567.csv
    │   ├─── 1647.csv
    │   ├─── 1709.csv
    │   ├─── 1913.csv
    │   ├─── 2322.csv
    │   ├─── 2556.csv
    │   ├─── 5019.csv
    │   ├─── 1248.csv
    │   ├─── 1581.csv
    │   ├─── 1654.csv
    │   ├─── 1732.csv
    │   ├─── 1930.csv
    │   ├─── 2430.csv
    │   ├─── 2616.csv
    │   ├─── 5031.csv
    │   ├─── 1302.csv
    │   ├─── 1590.csv
    │   ├─── 1656.csv
    │   ├─── 1754.csv
    │   ├─── 1935.csv
    │   ├─── 2446.csv
    │   ├─── 2628.csv
    │   ├─── info.csv
    │   ├─── 1318.csv
    │   ├─── 1599.csv
    │   ├─── 1659.csv
    │   ├─── 1759.csv
    │   ├─── 1980.csv
    │   ├─── 2450.csv
    │   ├─── 2697.csv
    │   ├─── 1401.csv
    │   ├─── 1613.csv
    │   ├─── 1679.csv
    │   ├─── 1768.csv
    │   ├─── 1987.csv
    │   ├─── 2455.csv
    │   ├─── 2700.csv
    │   ├─── 1433.csv
    │   ├─── 1614.csv
    │   ├─── 1680.csv
    │   ├─── 1803.csv
    │   ├─── 2094.csv
    │   ├─── 2496.csv
    │   ├─── 2715.csv
    │   ├─── 1452.csv
    │   ├─── 1617.csv
    │   ├─── 1685.csv
    │   ├─── 1807.csv
    │   ├─── 2107.csv
    │   ├─── 2513.csv
    │   ├─── 2716.csv
    │   ├─── 1468.csv
    │   ├─── 16186.csv
    │   ├─── 1686.csv
    │   ├─── 1815.csv
    │   ├─── 2200.csv
    │   ├─── 2530.csv
    │   └─── 2717.csv
    ├─── info.csv
    ├─── RU_ALT.csv
    ├─── RU_AMU.csv
    ├─── RU_ARK.csv
    ├─── RU_AST.csv
    ├─── RU_BEL.csv
    ├─── RU_BRY.csv
    ├─── RU_VLA.csv
    ├─── RU_VGG.csv
    ├─── RU_VLG.csv
    ├─── RU_VOR.csv
    ├─── RU_YEV.csv
    ├─── RU_ZAB.csv
    ├─── RU_IVA.csv
    ├─── RU_IRK.csv
    ├─── RU_KB.csv
    ├─── RU_KGD.csv
    ├─── RU_KLU.csv
    ├─── RU_KAM.csv
    ├─── RU_KC.csv
    ├─── RU_KEM.csv
    ├─── RU_KIR.csv
    ├─── RU_KOS.csv
    ├─── RU_KDA.csv
    ├─── RU_KYA.csv
    ├─── RU_KGN.csv
    ├─── RU_KRS.csv
    ├─── RU_LEN.csv
    ├─── RU_LIP.csv
    ├─── RU_MAG.csv
    ├─── RU_MOW.csv
    ├─── RU_MOS.csv
    ├─── RU_MUR.csv
    ├─── RU_NEN.csv
    ├─── RU_NIZ.csv
    ├─── RU_NGR.csv
    ├─── RU_NVS.csv
    ├─── RU_OMS.csv
    ├─── RU_ORE.csv
    ├─── RU_ORL.csv
    ├─── RU_PNZ.csv
    ├─── RU_PER.csv
    ├─── RU_PRI.csv
    ├─── RU_PSK.csv
    ├─── RU_AD.csv
    ├─── RU_AL.csv
    ├─── RU_BA.csv
    ├─── RU_BU.csv
    ├─── RU_DA.csv
    ├─── RU_IN.csv
    ├─── RU_KL.csv
    ├─── RU_KR.csv
    ├─── RU_KO.csv
    ├─── RU_CR.csv
    ├─── RU_ME.csv
    ├─── RU_MO.csv
    ├─── RU_SA.csv
    ├─── RU_SE.csv
    ├─── RU_TA.csv
    ├─── RU_TY.csv
    ├─── RU_KK.csv
    ├─── RU_ROS.csv
    ├─── RU_RYA.csv
    ├─── RU_SAM.csv
    ├─── RU_SPE.csv
    ├─── RU_SAR.csv
    ├─── RU_SAK.csv
    ├─── RU_SVE.csv
    ├─── RU_SMO.csv
    ├─── RU_STA.csv
    ├─── RU_TAM.csv
    ├─── RU_TVE.csv
    ├─── RU_TOM.csv
    ├─── RU_TUL.csv
    ├─── RU_TYU.csv
    ├─── RU_UD.csv
    ├─── RU_ULY.csv
    ├─── RU_KHA.csv
    ├─── RU_KHM.csv
    ├─── RU_CHE.csv
    ├─── RU_CE.csv
    ├─── RU_CU.csv
    ├─── RU_CHU.csv
    ├─── RU_YAN.csv
    └─── RU_YAR.csv
```

## Формат
### COVID
Файл `./csv/info.csv` содержит инофрмацию следующие поля:
- `keys` -- ключи, по которым код обращается к файлам с статистикой по covid. Эти же ключи используются Яндексом и сайтом стопкоронавирус.рф.
- `name` -- название населенного пункта. Кодом не используется.
- `url` -- ссылка на json с данными яндекса.
- `population` -- население города.

Данный файл не используется настоящим кодом.

```
$ cat ./csv/info.csv
keys,name,url,population
RU_MOS,Московская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/1.json,7503385
RU_LEN,Ленинградская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10174.json,1813816
RU_NEN,Ненецкий автономный округ,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10176.json,43997
RU_AL,Республика Алтай,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10231.json,218063
RU_TY,Республика Тыва,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10233.json,321722
RU_YEV,Еврейская автономная область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10243.json,162014
RU_CHU,Чукотский автономный округ,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10251.json,49348
RU_BEL,Белгородская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10645.json,1549876
RU_BRY,Брянская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10650.json,1210982
RU_VLA,Владимирская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10658.json,1378337
RU_VOR,Воронежская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10672.json,2333768
RU_IVA,Ивановская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10687.json,1014646
RU_KLU,Калужская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10693.json,1012156
RU_KOS,Костромская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10699.json,643324
RU_KRS,Курская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10705.json,1115237
RU_LIP,Липецкая область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10712.json,1150201
RU_ORL,Орловская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10772.json,747247
RU_RYA,Рязанская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10776.json,1121474
RU_SMO,Смоленская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10795.json,949348
RU_TAM,Тамбовская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10802.json,1033552
RU_TVE,Тверская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10819.json,1283873
RU_TUL,Тульская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10832.json,1491855
RU_YAR,Ярославская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10841.json,1265684
RU_ARK,Архангельская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10842.json,1111031
RU_VLG,Вологодская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10853.json,1176689
RU_KGD,Калининградская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10857.json,994599
RU_MUR,Мурманская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10897.json,753557
RU_NGR,Новгородская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10904.json,606476
RU_PSK,Псковская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10926.json,636546
RU_KR,Республика Карелия,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10933.json,622484
RU_KO,Республика Коми,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10939.json,840873
RU_AST,Астраханская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10946.json,1017514
RU_VGG,Волгоградская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10950.json,2521276
RU_KDA,Краснодарский край,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/10995.json,5603420
RU_AD,Республика Адыгея,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11004.json,453376
RU_DA,Республика Дагестан,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11010.json,3063885
RU_IN,Республика Ингушетия,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11012.json,488043
RU_KB,Кабардино-Балкарская Республика,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11013.json,865828
RU_KL,Республика Калмыкия,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11015.json,275413
RU_KC,Карачаево-Черкесская Республика,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11020.json,466305
RU_SE,Республика Северная Осетия — Алания,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11021.json,701765
RU_CE,Чеченская Республика,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11024.json,1436981
RU_ROS,Ростовская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11029.json,4220452
RU_STA,Ставропольский край,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11069.json,2800674
RU_KIR,Кировская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11070.json,1283238
RU_ME,Республика Марий Эл,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11077.json,682333
RU_NIZ,Нижегородская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11079.json,3234752
RU_ORE,Оренбургская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11084.json,1977720
RU_PNZ,Пензенская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11095.json,1331655
RU_PER,Пермский край,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11108.json,2623122
RU_BA,Республика Башкортостан,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11111.json,4063293
RU_MO,Республика Мордовия,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11117.json,805056
RU_TA,Республика Татарстан,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11119.json,3894284
RU_SAM,Самарская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11131.json,3193514
RU_SAR,Саратовская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11146.json,2462950
RU_UD,Удмуртская Республика,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11148.json,1513044
RU_ULY,Ульяновская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11153.json,1246618
RU_CU,Чувашская Республика,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11156.json,1231117
RU_KGN,Курганская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11158.json,845537
RU_SVE,Свердловская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11162.json,4325256
RU_TYU,Тюменская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11176.json,1498779
RU_KHM,Ханты-Мансийский автономный округ — Югра,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11193.json,1655074
RU_CHE,Челябинская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11225.json,3493036
RU_YAN,Ямало-Ненецкий автономный округ,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11232.json,538547
RU_ALT,Алтайский край,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11235.json,2350080
RU_IRK,Иркутская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11266.json,2404195
RU_KEM,Кемеровская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11282.json,2694877
RU_KYA,Красноярский край,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11309.json,2876497
RU_NVS,Новосибирская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11316.json,2788849
RU_OMS,Омская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11318.json,1960081
RU_BU,Республика Бурятия,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11330.json,984511
RU_KK,Республика Хакасия,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11340.json,537513
RU_TOM,Томская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11353.json,1078280
RU_AMU,Амурская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11375.json,798424
RU_KAM,Камчатский край,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11398.json,315557
RU_MAG,Магаданская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11403.json,144091
RU_PRI,Приморский край,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11409.json,1913037
RU_SA,Республика Саха (Якутия),https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11443.json,964330
RU_SAK,Сахалинская область,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11450.json,490181
RU_KHA,Хабаровский край,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/11457.json,1328302
RU_SPE,Санкт-Петербург,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/2.json,5351935
RU_MOW,Москва,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/213.json,12506468
RU_ZAB,Забайкальский край,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/21949.json,1072806
RU_CR,Республика Крым,https://yastat.net/s3/milab/2020/covid19-stat/data/data-by-region/977.json,1913731
```

Файлы `./csv/RU_*.csv` содержат статистику по covid для одного региона. Именная часть файла соответствует ключу из поля `key` файла `./csv/info.csv`. Файлы `./csv/RU_*.csv` содержат следующие поля:
- `date` -- дата
- `cases_total` -- общее количество случаев заражения
- `cases_new` -- количество новых случаев заражения за день `date`
- `deaths_total` -- общее количество летальных исходов
- `deaths_new` -- количество новых летальных исходов за день `date`
- `cured_total` -- общее количество выздоровевших
- `cured_new` -- количество новых количество выздоровевших за день `date`

Настоящий файл использует только поле `date` и `cases_total`.

```
$ head ./csv/RU_ALT.csv
date,cases_total,cases_new,deaths_total,deaths_new,cured_total,cured_new
2020-03-12,0,0,0,0,0,0
2020-03-13,0,0,0,0,0,0
2020-03-14,0,0,0,0,0,0
2020-03-15,0,0,0,0,0,0
2020-03-16,0,0,0,0,0,0
2020-03-17,0,0,0,0,0,0
2020-03-18,0,0,0,0,0,0
2020-03-19,0,0,0,0,0,0
2020-03-20,0,0,0,0,0,0
```

### Погода
Файл `./csv/weather/info.csv` содержит следующие поля:
- `id` -- идентификатор города, по которому код обращается к файлам. Этот же идентификатор используется сайтом Росгидромедцентра.
- `friendly_name` -- название региона. Данным кодом не используется.
- `region_key` -- ключ региона, совпадающий с ключем из `./csv/info.csv`. Используется для сопоставления региона с файлами `./csv/weather/!(info.csv)` по идентификатору.

```
$ cat ./csv/weather/info.csv
id,friendly_name,region_key
1987,"Абакан, Хакасия республика",RU_KK
1433,"Анадырь, Чукотский автономный округ",RU_CHU
1179,"Архангельск I, Архангельская область",RU_ARK
2532,"Астрахань I, Астраханская область",RU_AST
1980,"Барнаул, Алтайский край",RU_ALT
2455,"Белгород, Белгородская область",RU_BEL
5019,"Биробиджан, Еврейская автономная область",RU_YEV
2200,"Благовещенск, Амурская область",RU_AMU
1581,"Брянск, Брянская область",RU_BRY
1486,"Великий Новгород, Новгородская область",RU_NGR
2262,"Владивосток, Приморский край",RU_PRI
2716,"Владикавказ, Северная Осетия-Алания республика",RU_SE
1647,"Владимир, Владимирская область",RU_VLA
2496,"Волгоград II, Волгоградская область",RU_VGG
1590,"Вологда I, Вологодская область",RU_VLG
2446,"Воронеж I, Воронежская область",RU_VOR
2616,"Горно-Алтайск, Алтай республика",RU_AL
2718,"Грозный, Чеченская республика",RU_CE
1768,"Екатеринбург, Свердловская область",RU_SVE
1617,"Иваново, Ивановская область",RU_IVA
1759,"Ижевск, Удмуртия республика",RU_UD
4994,"Иркутск, Иркутская область",RU_IRK
1634,"Йошкар-Ола, Марий Эл республика",RU_ME
1656,"Казань, Татарстан республика",RU_TA
1557,"Калининград, Калининградская область",RU_KGD
16186,"Калуга, Калужская область",RU_KLU
1935,"Кемерово, Кемеровская область",RU_KEM
1599,"Киров I, Кировская область",RU_KIR
1614,"Кострома I, Костромская область",RU_KOS
2535,"Краснодар I, Краснодарский край",RU_KDA
1913,"Красноярск, Красноярский край",RU_KYA
1807,"Курган, Курганская область",RU_KGN
2430,"Курск I, Курская область",RU_KRS
2628,"Кызыл, Тыва республика",RU_TY
1705,"Липецк, Липецкая область",RU_LIP
1452,"Магадан, Магаданская область",RU_MAG
2697,"Майкоп, Адыгея республика",RU_AD
2740,"Махачкала II, Дагестан республика",RU_DA
1659,"Москва (ВДНХ), Москва и область",RU_MOW
1659,"Москва (ВДНХ), Москва и область",RU_MOS
1138,"Мурманск, Мурманская область",RU_MUR
2717,"Назрань, Ингушетия республика",RU_IN
2715,"Нальчик, Кабардино-Балкария республика",RU_KB
1238,"Нарьян-Мар, Ненецкий автономный округ",RU_NEN
1631,"Нижний Новгород I, Нижегородская область",RU_NIZ
1930,"Новосибирск, Новосибирская область",RU_NVS
1815,"Омск, Омская область",RU_OMS
1700,"Орел, Орловская область",RU_ORL
2556,"Оренбург, Оренбургская область",RU_ORE
1709,"Пенза, Пензенская область",RU_PNZ
1732,"Пермь I, Пермский край",RU_PER
1206,"Петрозаводск, Карелия республика",RU_KR
2322,"Петропавловск-Камчатский, Камчатский край",RU_KAM
1498,"Псков, Псковская область",RU_PSK
2513,"Ростов-на-Дону, Ростовская область",RU_ROS
1680,"Рязань I, Рязанская область",RU_RYA
1248,"Салехард, Ямало-Ненецкий АО",RU_YAN
1834,"Самара (обсерватория), Самарская область",RU_SAM
1468,"Санкт-Петербург, Ленобласть и Санкт-Петербург",RU_SPE
1468,"Санкт-Петербург, Ленобласть и Санкт-Петербург",RU_LEN
1685,"Саранск, Мордовия республика",RU_MO
2450,"Саратов, Саратовская область",RU_SAR
5031,"Симферополь I, Крым республика",RU_CR
1567,"Смоленск, Смоленская область",RU_SMO
2539,"Ставрополь, Ставропольский край",RU_STA
1302,"Сыктывкар I, Коми республика",RU_KO
1707,"Тамбов АМСГ, Тамбовская область",RU_TAM
1624,"Тверь, Тверская область",RU_TVE
1887,"Томск, Томская область",RU_TOM
1679,"Тула, Тульская область",RU_TUL
1754,"Тюмень, Тюменская область",RU_TYU
2107,"Улан-Удэ, Бурятия республика",RU_BU
1686,"Ульяновск I, Ульяновская область",RU_ULY
1819,"Уфа город, Башкортостан республика",RU_BA
2223,"Хабаровск, Хабаровский край",RU_KHA
1318,"Ханты-Мансийск, Ханты-Мансийский автономный округ",RU_KHM
1654,"Чебоксары, Чувашская республика",RU_CU
1803,"Челябинск Город, Челябинская область",RU_CHE
2700,"Черкесск, Карачаево-Черкесия",RU_KC
2094,"Чита, Забайкальский край",RU_ZAB
2530,"Элиста, Калмыкия республика",RU_KL
2292,"Южно-Сахалинск, Сахалинская область",RU_SAK
1401,"Якутск, Саха(Якутия) республика",RU_SA
1613,"Ярославль I, Ярославская область",RU_YAR
```
Файлы `./csv/weather/!(info.csv)` содержат информацию о погоде для конкретного региона. Поля получены с сайта Росгидромедцентра автоматически. Поля, которые использует данный код:
- `timestamp` -- время измерения в формате UNIX timestamp.
- `Температура воздуха, °C`
- `Относительная влажность, %`

```
$ head ./csv/weather/1138.csv
timestamp,date,Дождь (незамерзающий) сильный непрерывный,"Порывы, м/с",Дождь (незамерзающий) слабый непрерывный,Туман (видимость менее 1 км),Ливневой дождь со снегом слабый,Дождь (незамерзающий) сильный с перерывами,Ливневый дождь со снегом,Ливневый дождь,Количество облаков уменьшилось,Дождь (незамерзающий) слабый с перерывами,Дождь (незамерзающий) умеренный непрерывный,Осадки (не достигают поверхности земли),"Гроза, но без осадков","Относительная влажность, %",Морось (незамерзающая) слабая непрерывная,Град,"Минимальная температура, °C",Поземок (слабый или умеренный),Направление ветра,Гроза,Метель низовая сильная,Снег слабый с перерывами,"Максимальная температура, °C","Средняя скорость ветра, м/с",Дождь (незамерзающий),Ливневой снег умеренный или сильный,"Осадки за 12 часов, мм",Туман начался (усилился). Небо видно,"Высота снежного покрова, см",Количество облаков увеличилось,"Осадки за 24 часа, мм",Дымка (видимость больше 1 км),Ливневой дождь слабый,Туман без изменений (небо не видно),Снежная крупа (возможно с дождем) слабая,Осадки (достигают поверхности земли вдали от станции (&gt; 5 км)),"Горизонтальная видимость, км","Атмосферное давление на уровне станции, мм рт.ст.",Ливневой дождь умеренный или сильный,Туман начался (усилился). Небо не видно,Снег умеренный непрерывный,"Температура воздуха, °C",Снег сильный непрерывный,Снег слабый непрерывный,Количество облаков не изменилось,Балл общей облачности,Ливневой снег слабый,Осадки (достигают поверхности земли)
1585882800,"Пятница, 3 апреля
03:00 (UTC)",,,,,,,,,,,,,,93.1,,,-9.4,,,,,,,0,,,0.2,,,,0.2,,,,,,20,732,,,,-9.4,,,True,10.0,,
1585893600,"Пятница, 3 апреля
06:00 (UTC)",,,,,,,,,,,,,,92.5,,,-9.8,,,,,,,0,,,0.2,,39.0,,,,,,,,10,732,,,,-8.1,,,True,7.0,,
1585904400,"Пятница, 3 апреля
09:00 (UTC)",,6.0,,,,,,,,,,,,75.7,,,,,северный,,,,,4,,,,,,,,,,,,,20,731,,,,-5.5,,,,10.0,,
1585915200,"Пятница, 3 апреля
12:00 (UTC)",,6.0,,,,,,,,,,,,69.3,,,,,северный,,,,,4,,,,,,,,,,,,,20,731,,,,-3.5,,,,7.0,,
1585926000,"Пятница, 3 апреля
```

# Литература
[1] Nesterov, Yurii. Online prediction of COVID19 dynamics. Belgian case study. CORE Discussion Papers ; 2020/22 (2020) 28 pages. URL: http://hdl.handle.net/2078.1/230164 (Visited on: 08.11.2020)

In [None]:
from datetime import datetime
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import ipywidgets as widgets
import matplotlib.dates as mdates
import scipy.stats

np.seterr(all='raise')

class Global:
    data_root = 'csv'
    data_weather_path = 'weather'
    region_keys = [ "RU_AD", "RU_AL", "RU_ALT", "RU_AMU", "RU_ARK", "RU_AST", "RU_BA", "RU_BEL", "RU_BRY", "RU_BU", "RU_CE", "RU_CHE", "RU_CHU", "RU_CU", "RU_DA", "RU_IN", "RU_IRK", "RU_IVA", "RU_KAM", "RU_KB", "RU_KC", "RU_KDA", "RU_KEM", "RU_KGD", "RU_KGN", "RU_KHA", "RU_KHM", "RU_KIR", "RU_KK", "RU_CR", "RU_KL", "RU_KLU", "RU_KO", "RU_KOS", "RU_KR", "RU_KRS", "RU_KYA", "RU_LEN", "RU_LIP", "RU_MAG", "RU_ME", "RU_MO", "RU_MOS", "RU_MOW", "RU_MUR", "RU_NEN", "RU_NGR", "RU_NIZ", "RU_NVS", "RU_OMS", "RU_ORE", "RU_ORL", "RU_PER", "RU_PNZ", "RU_PRI", "RU_PSK", "RU_ROS", "RU_RYA", "RU_SA", "RU_SAK", "RU_SAM", "RU_SAR", "RU_SE", "RU_SMO", "RU_SPE", "RU_STA", "RU_SVE", "RU_TA", "RU_TAM", "RU_TOM", "RU_TUL", "RU_TVE", "RU_TY", "RU_TYU", "RU_UD", "RU_ULY", "RU_VGG", "RU_VLA", "RU_VLG", "RU_VOR", "RU_YAN", "RU_YAR", "RU_YEV", "RU_ZAB", ]
    region_friendly_name = {
        "RU_ALT": "Алтайский край",
        "RU_AMU": "Амурская область",
        "RU_ARK": "Архангельская область",
        "RU_AST": "Астраханская область",
        "RU_BEL": "Белгородская область",
        "RU_BRY": "Брянская область",
        "RU_VLA": "Владимирская область",
        "RU_VGG": "Волгоградская область",
        "RU_VLG": "Вологодская область",
        "RU_VOR": "Воронежская область",
        "RU_YEV": "Еврейская автономная область",
        "RU_ZAB": "Забайкальский край",
        "RU_IVA": "Ивановская область",
        "RU_IRK": "Иркутская область",
        "RU_KB": "Кабардино-Балкарская Республика",
        "RU_KGD": "Калининградская область",
        "RU_KLU": "Калужская область",
        "RU_KAM": "Камчатский край",
        "RU_KC": "Карачаево-Черкесская Республика",
        "RU_KEM": "Кемеровская область",
        "RU_KIR": "Кировская область",
        "RU_KOS": "Костромская область",
        "RU_KDA": "Краснодарский край",
        "RU_KYA": "Красноярский край",
        "RU_KGN": "Курганская область",
        "RU_KRS": "Курская область",
        "RU_LEN": "Ленинградская область",
        "RU_LIP": "Липецкая область",
        "RU_MAG": "Магаданская область",
        "RU_MOW": "Москва",
        "RU_MOS": "Московская область",
        "RU_MUR": "Мурманская область",
        "RU_NEN": "Ненецкий автономный округ",
        "RU_NIZ": "Нижегородская область",
        "RU_NGR": "Новгородская область",
        "RU_NVS": "Новосибирская область",
        "RU_OMS": "Омская область",
        "RU_ORE": "Оренбургская область",
        "RU_ORL": "Орловская область",
        "RU_PNZ": "Пензенская область",
        "RU_PER": "Пермский край",
        "RU_PRI": "Приморский край",
        "RU_PSK": "Псковская область",
        "RU_AD": "Республика Адыгея",
        "RU_AL": "Республика Алтай",
        "RU_BA": "Республика Башкортостан",
        "RU_BU": "Республика Бурятия",
        "RU_DA": "Республика Дагестан",
        "RU_IN": "Республика Ингушетия",
        "RU_KL": "Республика Калмыкия",
        "RU_KR": "Республика Карелия",
        "RU_KO": "Республика Коми",
        "RU_CR": "Республика Крым",
        "RU_ME": "Республика Марий Эл",
        "RU_MO": "Республика Мордовия",
        "RU_SA": "Республика Саха (Якутия)",
        "RU_SE": "Республика Северная Осетия — Алания",
        "RU_TA": "Республика Татарстан",
        "RU_TY": "Республика Тыва",
        "RU_KK": "Республика Хакасия",
        "RU_ROS": "Ростовская область",
        "RU_RYA": "Рязанская область",
        "RU_SAM": "Самарская область",
        "RU_SPE": "Санкт-Петербург",
        "RU_SAR": "Саратовская область",
        "RU_SAK": "Сахалинская область",
        "RU_SVE": "Свердловская область",
        "RU_SMO": "Смоленская область",
        "RU_STA": "Ставропольский край",
        "RU_TAM": "Тамбовская область",
        "RU_TVE": "Тверская область",
        "RU_TOM": "Томская область",
        "RU_TUL": "Тульская область",
        "RU_TYU": "Тюменская область",
        "RU_UD": "Удмуртская Республика",
        "RU_ULY": "Ульяновская область",
        "RU_KHA": "Хабаровский край",
        "RU_KHM": "Ханты-Мансийский автономный округ — Югра",
        "RU_CHE": "Челябинская область",
        "RU_CE": "Чеченская Республика",
        "RU_CU": "Чувашская Республика",
        "RU_CHU": "Чукотский автономный округ",
        "RU_YAN": "Ямало-Ненецкий автономный округ",
        "RU_YAR": "Ярославская область",
    }

# Модель HIT [1]
- If TIR>1, we say that the process (3.3) is in *apropagation* mode.
- If TIR<1, we say that the process (3.3) is in *arecession* mode.
- If TIR=1, we say that the process (3.3) is in *astagnation* mode.

where TIR on day $d$ is $\sum_{i=d-\Delta+1}^{d+1}(\gamma_i)$

In [None]:
class HIT:
    def __init__(self, date, T, Delta=10):
        '''
        Args
            T [int]: array of official total number of infected
            date [str]: array of strings with X_labels for T array (ascending order)
            Delta int: Constant Latent Period [1]
        '''
        self.Delta = Delta
        self.T = T
        self.date = date

    def plot(self):
        '''
        Calculates Total Infection Rate (TIR), Daily Infection Rate [1] and number 
        of asymptomatic virus holders [1].
        
        TIR[i] = sum(gamma[i-Delta+1:i+1])
        
        Returns
            {
                'x_TIR': [str], # slice of X_labels (see `__init__`) for Total Infection Rate
                'TIR': [float], # Total Infection Rate
                'x_gamma': [str], # slice of X_labels (see `__init__`) for Daily Infection Rate
                'gamma': [float], # Daily Infection Rate [1]
                'x_H': [str], slice of X_labels (see `__init__`) for asymptomatic virus holders
                'H': [int], number of asymptomatic virus holders [1]
                'x_T': [str], # X_labels for T array (see `__init__`)
                'T': [int] array of official total number of infected (see `__init__`)
            }
        '''
        D = self.Delta
        T = self.T
        d_last = len(T)-D

        x = self.date[1:d_last]
        gamma = [self.gamma(i, D, T) for i in range(1,d_last)]
        gamma_ext = [0,]*D + gamma
        
        return {
            'x_TIR': x,
            'TIR': [self.total_infection_rate(i, D, gamma_ext) for i in range(D+1,d_last+D)],
            'x_gamma': x,
            'gamma': gamma,
            'x_H': x,
            'H': [self.H(i, D, T) for i in range(1,d_last)],
            'x_T': self.date,
            'T': self.T
        }
    
    # Next methods are PRIVATE:
        
    @staticmethod
    def H(d, Delta, T):
        return T[d+Delta-1]-T[d-1]
        
    @staticmethod
    def gamma(d, Delta, T):
        d1 = d+Delta
        h = T[d1-1]-T[d-1]
        return (T[d1]-T[d1-1])/h if h != 0 else 0
    
    @staticmethod
    def total_infection_rate(d, Delta, gamma):
        d1 = d+1
        return sum(gamma[d1-Delta:d1])

# Визуализация модели HIT.

In [None]:
class HIT_Plotting:
    @staticmethod
    def make_hit(region_key, Delta, start_date, end_date):
        '''
        Generate HIT model for region by it's `region key` for 
        Daily Infection Rate `Delta` starting from `start_date`
        to `end_date`
        
        Args:
            region_key str: region key from `./csv/info.csv`
            Delta int: Daily Infection Rate (see class HIT)
            start_date, end_date str: date in the format, that
                can be passed to `pd.to_datetime`
                
        Returns:
            class HIT
        '''
        data = pd.read_csv(Global.data_root + '/' + region_key + '.csv')
        data['date'] = pd.to_datetime(data['date'])
        data.sort_values('date',inplace=True)
        data = data[(data['date']>=pd.to_datetime(start_date)) & (data['date']<=pd.to_datetime(end_date))]
        date = pd.to_datetime(data['date']).tolist()
        T = data['cases_total'].tolist()

        hit = HIT(date, T, Delta=Delta)
        return hit

    @classmethod
    def model_and_plot(cls, region_key, region_to_compare_key, Delta, start_date, end_date, 
                       derivate_main, derivate_second, main_axe_vars, second_axe_vars):
        '''
        Plots HIT visualization. 
        See web-interface and it's building in `draw_interface` for more details on the arguments.
        '''
        fig, ax = plt.subplots()
        fig.set_size_inches(16, 9)
        ax.xaxis.set_major_locator(mdates.MonthLocator())
        ax.xaxis.set_major_formatter(mdates.DateFormatter('%b'))
        ax.xaxis.set_minor_locator(mdates.DayLocator())
        ax.grid(True)
        ax.grid(True,'minor')
        
        ax2 = ax.twinx()
        ax2.xaxis.set_major_locator(mdates.MonthLocator())
        ax2.xaxis.set_major_formatter(mdates.DateFormatter('%b'))
        ax2.xaxis.set_minor_locator(mdates.DayLocator())
        ax.grid(True)
        ax.grid(True,'minor')

        def plot(region_key):
            hit = cls.make_hit(region_key, Delta, start_date, end_date)
            plotting = hit.plot()
            
            def deriv(x,y):
                x = x[1:]
                y = (np.asarray(y[1:]) - np.asarray(y[:-1])).tolist()
                return x,y
            
            for v in main_axe_vars:
                if derivate_main:
                    x,y=deriv(plotting['x_'+v], plotting[v])
                    v += '\''
                else:
                    x,y=plotting['x_'+v], plotting[v]
                ax.plot(x, y, label='_'.join([Global.region_friendly_name[region_key],v]))
            
            if len(second_axe_vars) > 0:
                for v in second_axe_vars:
                    if derivate_second:
                        x,y=deriv(plotting['x_'+v], plotting[v])
                        v += '\''
                    else:
                        x,y=plotting['x_'+v], plotting[v]
                    ax2.plot(x, y, label='_'.join([Global.region_friendly_name[region_key],v]), linestyle='--')

        plot(region_key)
        if (region_to_compare_key != 'NONE'):
            plot(region_to_compare_key)

        fig.autofmt_xdate()
        ax.legend()
        if len(second_axe_vars) > 0:
            ax2.legend()
        plt.show()

    def draw_interface(self):
        '''
        Build and show web-interface.
        '''
        options = [(k,v) for v,k in Global.region_friendly_name.items()]
        region = widgets.Dropdown(options=options,value='RU_MOW',description='Region',disabled=False)
        region_to_compare = widgets.Dropdown(
            options=[('NONE','NONE')]+options,value='NONE',description='Compare with',disabled=False)
        
        start_date = widgets.DatePicker(description='Start', value=datetime(2020,3,1), disabled=False)
        end_date = widgets.DatePicker(description='End', value=datetime.today(), disabled=False)
        
        Delta = widgets.IntSlider(value=10,min=1,max=100,step=1,description='Delta',
                                    disabled=False,continuous_update=False,orientation='horizontal',
                                    readout=True,readout_format='d')
        
        options = ['TIR', 'H', 'T', 'gamma']
        main_axe_vars = widgets.SelectMultiple(options=options, value=['TIR'], rows=len(options),
            description='Main axe (solid)', disabled=False)
        
        second_axe_vars = widgets.SelectMultiple(options=options, value=['H'], rows=len(options),
            description='Second axe (dotted)', disabled=False)
        
        derivate_main = widgets.Checkbox(value=False, description='Derivate main', disabled=False, indent=False)
        derivate_second = widgets.Checkbox(value=False, description='Derivate second', disabled=False, indent=False)
        
        out = widgets.interactive_output(self.model_and_plot, {
            'region_key': region, 
            'region_to_compare_key': region_to_compare,
            'Delta': Delta, 
            'start_date': start_date, 
            'end_date': end_date, 
            'derivate_main': derivate_main,
            'derivate_second': derivate_second,
            'main_axe_vars': main_axe_vars,
            'second_axe_vars': second_axe_vars
        })
        main_box = widgets.VBox([region, region_to_compare, Delta, start_date, end_date])
        axe_vars_box = widgets.VBox([derivate_main, main_axe_vars, derivate_second, second_axe_vars])
        ui = widgets.HBox([main_box, axe_vars_box])
        display(ui, out)

hit_plotting = HIT_Plotting()
hit_plotting.draw_interface()

# Корреляция с погодой
Гипотеза: $\rho = \text{corr}(\Gamma_t,\text{weather}_{t-lag}) = 0$  
Отвергается при $\left|\hat\rho_n\right| > z_\alpha = \cfrac{t_\alpha}{\sqrt{n-2+t_\alpha^2}}$  
$\hat\rho_n = \frac{S_{12}}{S_1S_2}$  
$S_{12} = \cfrac{1}{n}\sum\limits_{i=1}^n (X_{i1}-\overline{X}_1)(X_{i2}-\overline{X}_2)$  
$\overline{X}_i = \cfrac{1}{n}\sum\limits_{i=1}^nX_{ij}$  
$S_j^2 = \cfrac{1}{n}\sum\limits_{i=1}^n \left(X_{ij}-\overline{X}_j\right)^2$  
$t_a = S_{n-2}^{-1}\left(1-\alpha/2\right)$

In [None]:
class CorrelationWithWeather:
    weather_cols = {
        'temperature': "Температура воздуха, °C",
        'humidity': "Относительная влажность, %",
    }
    
    @staticmethod
    def make_hit(region_key, Delta):
        '''
        Generate HIT model for region by it's `region key` for 
        Daily Infection Rate `Delta`
        
        Args:
            region_key str: region key from `./csv/info.csv`
            Delta int: Daily Infection Rate (see class HIT)
                
        Returns:
            class HIT
        '''
        data = pd.read_csv(Global.data_root + '/' + region_key + '.csv')
        date = pd.to_datetime(data['date']).tolist()
        T = data['cases_total'].tolist()

        hit = HIT(date, T, Delta)
        return hit
    
    @staticmethod
    def load_weather_data(region_key):
        '''
        Loads weather for region by it's `region key`
        
        Args:
            region_key str: region key from `./csv/info.csv`
            
        Returns:
            pandas.read_csv(./csv/weather/{region_id}) with additional `date` and `time` columns
            in format '%Y-%m-%d' and '%H:%M' correspondingly
        '''
        weather_data_path = ''.join([Global.data_root, '/', Global.data_weather_path, '/'])
        info = pd.read_csv(weather_data_path + 'info.csv')
        id_ = info[info['region_key']==region_key]['id'].to_list()
        assert len(id_) == 1
        id_ = str(id_[0])
        data = pd.read_csv(''.join([weather_data_path, id_, '.csv']))
        
        data['date'] = pd.to_datetime(data['timestamp'].map(lambda x: datetime.utcfromtimestamp(x).date())) # strftime('%Y-%m-%d'))
        data['time'] = data['timestamp'].map(lambda x: datetime.utcfromtimestamp(x).strftime('%H:%M'))
        
        return data
    
    @staticmethod
    def correlation_plot(series1, series2, ax=None, max_lag=10, **kwds):
        '''
        Plots on `ax` Pearson correlation between `series1` and `series2` for lag from 1 to `max_lag`
        
        Arguments:
            series1, series2 [float]: time series
            ax class matplotlib.axes.Axes or None: axes to plot on. If None, plt.gca() will be used
            kwds dict(): keyword args to be passed to ax.plot
        
        Returns:
            ax class matplotlib.axes.Axes
        '''
        import matplotlib.pyplot as plt

        if ax is None:
            ax = plt.gca(xlim=(1, max_lag))#, ylim=(-1.0, 1.0))
            plt.gcf().set_size_inches(16, 9)
        
        n1 = len(series1)
        n2 = len(series2)
        assert n1 == n2, "The series have different lengths."
        n = n1
        data1 = np.asarray(series1)
        data2 = np.asarray(series2)

        def rho(lag):
            d1 = data1[:n-lag]
            d2 = data2[lag:]
            m1 = d1.mean()
            m2 = d2.mean()
            S1 = ((d1-m1)**2).sum()
            S2 = ((d2-m2)**2).sum()
            S12 = ((d1-m1)*(d2-m2)).sum()
            return S12/np.sqrt(S1*S2)

        x = np.arange(max_lag) + 1
        y = [rho(lag) for lag in x]
        
        def conf_int(a):
            ta = np.asarray([scipy.stats.t.ppf(a,n-lag-2) for lag in x])
            ta2 = ta**2
            denom = np.sqrt(np.array([n-lag-2+ta2[lag] for lag in range(max_lag)]))
            return ta/denom
        
        z95 = conf_int(0.95)
        z99 = conf_int(0.99)

        ax.plot(x, z99, linestyle="--", color="grey")
        ax.plot(x, z95, color="grey")
        ax.plot(x, -z95, color="grey")
        ax.plot(x, -z99, linestyle="--", color="grey")
        
        ax.set_xlabel("Lag")
        ax.set_ylabel("Correlation")
        ax.plot(x, y, **kwds)
        if "label" in kwds:
            ax.legend()
        ax.grid()
        return ax
    
    def plot(self, region_key, weather_col, aggregate_func, aggregation_times, start_from_date, 
             end_date, max_lag, weather_from, weather_to, corr_with, Delta, derivation):
        '''
        Plots corrlation of Total Infection Rate with weather.
        See web-interface and it's building in `draw_interface` for more details on the arguments.
        '''
        data_weather = self.load_weather_data(region_key)
        
        time_select = [False,]*len(data_weather)
        for t in aggregation_times:
            time_select |= (data_weather['time'] == t)
        data_weather = data_weather[time_select]
        
        data_weather = data_weather[['date',self.weather_cols[weather_col]]].groupby('date',as_index=False)
        
        if aggregate_func == 'mean':
            data_weather = data_weather.mean()
        elif aggregate_func == 'max':
            data_weather = data_weather.max()
        elif aggregate_func == 'min':
            data_weather = data_weather.min()
        else:
            assert False
        
        hit = self.make_hit(region_key, Delta)
        hit_plotting = hit.plot()
        
        
        data_hit = pd.DataFrame({'date': hit_plotting['x_'+corr_with], 'var': hit_plotting[corr_with]})
        data_hit.sort_values('date',ascending=False,inplace=True)
        if derivation:
            deriv = pd.Series(data_hit['var'].iloc[:-1].to_numpy() - data_hit['var'].iloc[1:].to_numpy())
            data_hit.drop(data_hit.tail(1).index,inplace=True)
            data_hit['var'] = deriv
        
        df = data_hit.join(data_weather.set_index('date'), on='date')
        df = df[df[self.weather_cols[weather_col]].notnull() & df['var'].notnull()]
        
        df = df[df['date'] >= datetime.combine(start_from_date, datetime.min.time())]
        df = df[df['date'] <= datetime.combine(end_date, datetime.min.time())]

        df = df[(df[self.weather_cols[weather_col]] >= weather_from) & (df[self.weather_cols[weather_col]] <= weather_to)]
        
        ax = self.correlation_plot(df['var'], df[self.weather_cols[weather_col]], max_lag=max_lag)
        from matplotlib.ticker import MaxNLocator
        ax.xaxis.set_major_locator(MaxNLocator(integer=True))
        plt.show()
    
    def draw_interface(self):
        '''
        Build and show web-interface.
        '''
        options = [(k,v) for v,k in Global.region_friendly_name.items()]
        region = widgets.Dropdown(options=options,value='RU_MOW',description='Region',disabled=False)
        
        options = [(k,v) for v,k in self.weather_cols.items()]
        weather_col = widgets.Dropdown(options=options,value='temperature',description='Weather',disabled=False)
        
        options = ['min','max','mean']
        aggregate_func = widgets.Dropdown(options=options,value='mean',description='Date Aggregate',disabled=False)
        
        options = ['00:00', '03:00', '06:00', '09:00', '12:00', '15:00', '18:00', '21:00']
        value = ['00:00', '03:00', '06:00', '09:00', '12:00', '15:00', '18:00', '21:00']
        aggregation_times = widgets.SelectMultiple(options=options, value=value, rows=len(options),
                                           description='Time Aggregation', disabled=False)
        
        
        
        start_from_date = widgets.DatePicker(description='Start from', value=datetime(2020,6,1), disabled=False)
        end_date = widgets.DatePicker(description='End', value=datetime.today(), disabled=False)
        
        max_lag = widgets.IntSlider(value=10,min=1,max=100,step=1,description='Max Lag',
                                    disabled=False,continuous_update=False,orientation='horizontal',
                                    readout=True,readout_format='d')
        
        corr_with = widgets.Dropdown(options=['TIR','gamma'],value='TIR',description='Correlation with',disabled=False)
        Delta = widgets.IntSlider(value=10,min=1,max=100,step=1,description='Delta',
                                    disabled=False,continuous_update=False,orientation='horizontal',
                                    readout=True,readout_format='d')
        derivation = widgets.Checkbox(value=False, description='Derivation', disabled=False, indent=False)
        
        weather_from = widgets.FloatText(value=-100.1, description='Weather from',disabled=False)
        weather_to = widgets.FloatText(value=100.1, description='Weather to',disabled=False)
        
        out = widgets.interactive_output(self.plot, {
            'region_key': region,
            'weather_col': weather_col, 
            'aggregate_func': aggregate_func, 
            'aggregation_times': aggregation_times, 
            'derivation': derivation, 
            'start_from_date': start_from_date, 
            'end_date': end_date,
            'max_lag': max_lag,
            'weather_from': weather_from,
            'weather_to': weather_to,
            'Delta': Delta,
            'corr_with': corr_with,
        })
        weather_box = widgets.HBox([weather_from, weather_to])
        date_box = widgets.HBox([start_from_date, end_date])
        data_box = widgets.HBox([region, weather_col])
        model_box = widgets.HBox([Delta, corr_with, derivation])
        aggregation_box = widgets.HBox([aggregate_func, aggregation_times])
        ui = widgets.VBox([data_box, model_box, aggregation_box, date_box, weather_box, max_lag])
        display(ui, out)
        
correlation_with_weather = CorrelationWithWeather()
correlation_with_weather.draw_interface()

# Корреляция с выходными
График от $\Delta$ отношения индекса корреляции к количеству понедельников и суббот в заданном промежутке. Индекс корреляции -- количество суббот и понедельников в заданном периоде, таких что производная гамма $\gamma'(d) = \gamma(d)-\gamma(d-1)$ отрицательна в субботу, и положительна в понедельник.

In [None]:
class CorrelationWithWeekends:
    @staticmethod
    def make_hit(region_key, Delta):
        '''
        Generate HIT model for region by it's `region key` for 
        Daily Infection Rate `Delta`
        
        Args:
            region_key str: region key from `./csv/info.csv`
            Delta int: Daily Infection Rate (see class HIT)
                
        Returns:
            class HIT
        '''
        data = pd.read_csv(Global.data_root + '/' + region_key + '.csv')
        date = pd.to_datetime(data['date']).tolist()
        T = data['cases_total'].tolist()

        hit = HIT(date, T, Delta)
        return hit
    
    def plot(self, region_key, Delta, start_date, end_date):
        '''
        Plots corrlation of Total Infection Rate with weekends.
        See web-interface and it's building in `draw_interface` for more details on the arguments.
        '''
        x = range(Delta)
        y = []
        for D in x:
            hit = self.make_hit(region_key, D)
            plotting = hit.plot()
            gamma = np.asarray(plotting['gamma'])
            gamma_deriv = gamma[1:] - gamma[:-1]
            df = pd.DataFrame({'date': plotting['x_gamma'][1:], 'gamma_deriv': gamma_deriv})
            df['date'] = pd.to_datetime(df['date'])
            df = df[(pd.to_datetime(start_date) <= df['date']) & (df['date'] <= pd.to_datetime(end_date))]
            corr_index = 0
            corr_index += df[(df['date'].dt.dayofweek == 5) & (df['gamma_deriv'] < 0)].shape[0]
            corr_index += df[(df['date'].dt.dayofweek == 0) & (df['gamma_deriv'] > 0)].shape[0]
            denom = (df[(df['date'].dt.dayofweek == 5) | (df['date'].dt.dayofweek == 0)]).shape[0]
            y.append(corr_index/denom)
        fig, ax = plt.subplots()
        fig.set_size_inches(16, 9)
        ax.set_xticks(x)
        ax.plot(x,y)
        plt.grid()
        plt.show()
    
    def draw_interface(self):
        '''
        Build and show web-interface.
        '''
        options = [(k,v) for v,k in Global.region_friendly_name.items()]
        region = widgets.Dropdown(options=options,value='RU_MOW',description='Region',disabled=False)
        
        Delta = widgets.IntSlider(value=30,min=1,max=100,step=1,description='Max Delta',
                                  disabled=False,continuous_update=False,orientation='horizontal',
                                  readout=True,readout_format='d')
        
        start_date = widgets.DatePicker(description='From', value=datetime(2020,6,1), disabled=False)
        end_date = widgets.DatePicker(description='End', value=datetime(2020,8,1), disabled=False)
        
        out = widgets.interactive_output(self.plot, {
            'start_date': start_date,
            'end_date': end_date, 
            'Delta': Delta,
            'region_key': region
        })
        region_box = widgets.HBox([region])
        date_box = widgets.HBox([start_date, end_date])
        model_box = widgets.HBox([Delta])
        ui = widgets.VBox([region_box, date_box, model_box])
        display(ui, out)
        
correlation_with_weekends = CorrelationWithWeekends()
correlation_with_weekends.draw_interface()