In [None]:
'''Идея для исследования родилась после спора с одним из предпринимателей о судьбе курса американского доллара.
Бытует ошибочное мнение, что сейчас спроса на доллар в России нет, поэтому он будет дешеветь, важнее смотреть на 
курс китайского юаня, поскольку закупки в нем будут нарастать. При этом здравый смысл подсказывает, что у доллара и юаня 
есть свой обменный курс, независимый от рубля и перекоса за счет повышенного спроса в России на юани и пониженного на доллары
не произойдет
Цель исследования - установить наличие корреляционной связи линейного характера между курсом юаня и доллара, рассчитать 
уровнение линейной регрессии для данных валют исходя из их курса относительного российского рубля.

Данные для анализа взяты на сайте ЦБ РФ, курс доллара и курс юаня по отношению к рублю за период с 1.01.2014 по 16.07.2022 г.
Поскольку ЦБ периодически указывает курс к юаню за 10 единиц, введена дополнительная колонка 
CNY.1, где курс пересчитан на 1 юань'''

In [15]:
import pandas as pd
import numpy as np
import scipy.stats as st

In [9]:
currency = pd.read_excel('\currency.xlsx')
currency

Unnamed: 0,nominal,data,CNY,USD,CNY.1
0,1,2022-07-16,8.57233,57.8323,8.57233
1,1,2022-07-15,8.63954,58.2568,8.63954
2,1,2022-07-14,8.72451,58.5322,8.72451
3,1,2022-07-13,8.79476,58.8541,8.79476
4,1,2022-07-12,9.21024,61.3045,9.21024
5,1,2022-07-09,9.28268,61.2664,9.28268
6,1,2022-07-08,9.59366,63.1427,9.59366
7,10,2022-07-07,95.5793,62.911,9.55793
8,10,2022-07-06,89.4609,58.5118,8.94609
9,10,2022-07-05,87.1399,55.0858,8.71399


In [5]:
r = currency['USD'].corr(currency['CNY.1'])
r

0.9756394340624731

In [7]:
usd = currency['USD']
cny = currency['CNY.1']

In [10]:
b1 = (np.mean(usd * cny) - np.mean(usd) * np.mean(cny)) / (np.mean(usd**2) - np.mean(usd)**2) #находим коэффициент b1
b1

0.14402215896011245

In [11]:
b0 = np.mean(cny) - b1 * np.mean(usd) #находим коэффициент b0
b0

0.4833981477401448

In [12]:
z = b0 + b1 * usd  #напишем уравнение линейной регрессии для значения usd и вычислим предсказания полученной модели
z

0        8.812531
1        8.873668
2        8.913332
3        8.959693
4        9.312605
5        9.307117
6        9.577346
7        9.543976
8        8.910394
9        8.416974
10       8.227124
11       8.046333
12       7.851284
13       8.112238
14       8.169011
15       8.163149
16       8.168104
17       8.156726
18       8.362577
19       8.573512
20       8.650909
21       8.673809
22       8.644039
23       8.705998
24       8.804710
25       8.892780
26       9.157594
27       9.262485
28       9.284506
29       9.407861
30       9.351563
31       9.336916
32       9.356157
33       9.570836
34      10.046887
35       9.419901
36       8.591788
37       8.688197
38       8.866741
39       8.964316
40       9.470827
41       9.638066
42       9.634969
43       9.620812
44       9.669117
45       9.958846
46      10.397725
47      10.188231
48      10.023109
49      10.480840
50      10.712385
51      10.895523
52      10.979215
53      10.955091
54      11.049022
55      11

In [13]:
R1 = z.var() / cny.var() #найдем коэффициент детерминации
R1

0.9518723052976878

In [14]:
k1 = 1 
k2 = (len(usd) - k1 - 1)
T1 = (R1 / (1 - R1)) * (k2 / k1) #рассчитаем критическую статистику
T1

41514.1423493916

In [16]:
F_crit = st.f.ppf(0.99, k1, k2)  #рассчитаем критерий Фишера для уровня значимости 0.01
F_crit

6.646979311062234

In [17]:
T1 > F_crit #проверим истинность

True

In [18]:
def standard_error_slope(x, y, z):
    n = x.shape[0]
    
    upper = ((y - z) ** 2).sum() / (n - 2)
    lower = ((x - x.mean()) ** 2).sum()
    
    return np.sqrt(upper / lower)

In [19]:
s_slope = standard_error_slope(usd, cny, z) #рассчитаем значимость коэффициента наклона
s_slope

0.0007068565420955221

In [20]:
t = st.f.ppf((1-0.01)/2, k1, k2) #вычислим квантиль для уровня значимости 0.01
t

0.44456624449861293

In [21]:
T = b1 / s_slope  # полученное значение статистики принадлежит доверительному интревалу
T

203.75019594944882

In [22]:
(b1 - t * s_slope, b1 + t * s_slope)  #доверительный интервал для b1

(0.14370791440179376, 0.14433640351843113)

In [23]:
def standard_error_intercept(x, y, z):
    return standard_error_slope(x, y, z) * np.sqrt((x ** 2).mean())

In [25]:
s_intercept = standard_error_intercept(usd, cny, z)
s_intercept

0.045365950931956694

In [26]:
T = b0 / s_intercept
T

10.65552772089319

In [27]:
(b0 - t * s_intercept, b0 + t * s_intercept)  # доверительный интервал для b0

(0.46322997730621646, 0.5035663181740732)