### Где найти базы данных о коронавирусе COVID-19?

Учёными и исследователями собираются многочисленные базы данных о коронавирусе, его генетической структуре, ходе распространения и научных исследованиях о нём. Значительные объёмы этих данных общедоступны.

Подробности по [ссылке](https://covid19faq.ru/l/ru/article/f3sw02fiup-data)

### Почему так сложно сделать хорошую математическую модель COVID-19?

В это сложное время пандемии нам всем нужны ответы. Тысячи ученых, исследовательских центров и активистов по всему миру собирают данные и проводят исследования по теме «коронавирус» (COVID-19). Кажется, что уже должны существовать точные ответы. Эти ответы основаны на данных, но проблема в том, что данные повсюду и часто один источник противоречит другому.

Подробности по [ссылке](https://covid19faq.ru/l/ru/article/dwmsq2i0ef-good-mathematical-model-covid-19)

**Почему так сложно построить хороший прогноз по COVID-19? Как понять, сколько продлится карантин?** [Подробнее](https://vc.ru/flood/117032-pochemu-tak-slozhno-postroit-horoshiy-prognoz-po-covid-19-kak-ponyat-skolko-prodlitsya-karantin)

### Где ведутся и публикуются исследования COVID-19?

Исследования о COVID-19 ведутся в сотнях научных и исследовательских учреждений по всему миру. Здесь собраны ссылки на общедоступные исследования, базы научных публикаций и сообществ учёных.

Подробности по [ссылке](https://covid19faq.ru/l/ru/article/5pqxj6az02-research)

### Граф знаний COVID-19 

Мы создаем граф знаний по COVID-19, который объединяет различные общедоступные наборы данных. Он включает в себя соответствующие публикации, статистику случаев, гены и функции, молекулярные данные и многое другое.

Подробности по [ссылке](https://covidgraph.org)


<a href="https://colab.research.google.com/github/dm-fedorov/pandas_basic/blob/master/быстрое%20введение%20в%20pandas/COVID-19.ipynb"><img align="left" src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open in Colab" title="Open and Execute in Google Colaboratory" target="_blank"></a>

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns
sns.set()

In [None]:
import pandas as pd

#Источник данных: https://github.com/datasets/covid-19

url = "https://raw.githubusercontent.com/datasets/covid-19/master/data/time-series-19-covid-combined.csv"
df = pd.read_csv(url, 
                 parse_dates=['Date'], 
                 index_col='Date', 
                 usecols=['Date','Country/Region', 'Confirmed', 'Recovered', 'Deaths'])
df.sample(10)

In [None]:
df.info()

In [None]:
df['Country/Region'].unique()

In [None]:
df.plot(alpha=0.5);

### Россия

In [None]:
rus = df[df['Country/Region']=='Russia']
rus.head()

In [None]:
rus.describe()

Округление:

In [None]:
format = lambda x: f'{x:.2f}'
rus.describe().applymap(format)

In [None]:
rus.plot();

In [None]:
rus.loc["2020-09-25":"2020-11-16"].plot();

In [None]:
rus.Confirmed.corr(rus.Recovered)

Коэффициент корреляции стремится к 1.

Вычисляем %-ное изменение с помощью метода [pct_change](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.pct_change.html) для параметра Confirmed:

In [None]:
data = rus.Confirmed.pct_change()
data

In [None]:
data[data.notna()]

Прирост:

In [None]:
data[data.notna()].plot();

In [None]:
data[data.notna()].plot(label="all");
data[data.notna()].rolling(10).mean().plot(label="rolling 10");
plt.legend();

In [None]:
data[data.notna()].plot(label="all");
data[data.notna()].rolling(10).mean().plot(label="rolling 10");
data[data.notna()].expanding().mean().plot(label="expanding");
plt.legend();

In [None]:
rus.index

In [None]:
rus['2020-10':'2020-11'][:10]

### Передискретизация и преобразование частот

In [None]:
rus['2020-10':'2020-11'].plot();

In [None]:
rus.Confirmed.plot();

In [None]:
# среднее в месяц:
rus.Confirmed.resample("M").mean().plot(label='mean');
rus.Confirmed.plot(label='all');
plt.legend();

In [None]:
# среднее в месяц:
rus.Confirmed.resample("M", kind='period').mean()

In [None]:
# среднее в месяц:
rus.Confirmed.resample("M", kind='period').mean().plot();

In [None]:
rus.Confirmed.resample("M", kind='period').mean().pct_change().plot();

### Италия

In [None]:
it = df[df['Country/Region']=='Italy']
it.head()

In [None]:
it.plot();

In [None]:
it[it.Deaths<=1].tail()