## Корреляция

Посмотрим, как считать изученные коэффициенты корреляции в Python

In [None]:
# как обычно, начнем с импорта нужных библиотек
import numpy as np
import pandas as pd
from scipy import stats
import matplotlib.pyplot as plt
%matplotlib inline

In [None]:
# и зафиксируем seed
np.random.seed(123)

В файле **pressure.xls** приводятся для 15 пациентов данные о систолическом и диастолическом давлении крови непосредственно до принятия и спустя 2 часа после принятия 25 мг каптоприла. 
  
Имеется ли связь между снижением систолического и диастолического давления? Вычислите все изученные коэфиициенты корреляции и проверьте их значимость. Есть ли среди данных выбросы? 

In [None]:
# сначала импортируем данные

data = pd.read_excel('data/pressure.xls')

In [None]:
data

In [None]:
DP1 = data["СистДо"] - data["СистПосл"]
DP2 = data["ДиасДо"] - data["ДиасПосл"]

In [None]:
# посмотрим на данные

plt.scatter(DP1, DP2)
plt.show()

In [None]:
# коэффициент корреляции Пирсона

stats.pearsonr(DP1,DP2)

In [None]:
# коэффициент корреляции Спирмена

stats.spearmanr(DP1,DP2)

In [None]:
# коэффициент корреляции Кендалла

stats.kendalltau(DP1,DP2)

Давайте уберем одну точку, которая нам кажется выбросом и посмотрим, что случится с коэффициентами корреляции. У этой точки отрицательные изменения в DP1.

In [None]:
data_new = data[DP1>0]

DP1_new = data_new["СистДо"] - data_new["СистПосл"]
DP2_new = data_new["ДиасДо"] - data_new["ДиасПосл"]

In [None]:
# еще раз посмотрим на данные

plt.scatter(DP1_new, DP2_new)
plt.show()

In [None]:
# коэффициент корреляции Пирсона

stats.pearsonr(DP1_new,DP2_new)

In [None]:
# коэффициент корреляции Спирмена

stats.spearmanr(DP1_new,DP2_new)

In [None]:
# коэффициент корреляции Кендалла

stats.kendalltau(DP1_new,DP2_new)

**Вывод** в этой задаче мы делаем следующий: снижение систолического и диастолического давления положительно коррелированы. И эта корреляция значима. Кроме того, мы лишний раз убедились в том, что коэффициент корреляции Пирсона подвержен сильному влиянию выбросов. 