In [None]:
n <- 200
a <- 2
b <- 3
epsilon <- rnorm(n, 0, 1)

# Часть 1

$$y_{i} = a + b\,x_{i} ​+ ε_{i}​, \quad ε_{i}​ ∼ N(0,σ^2),\quad i=\overline{1,n}$$

In [None]:
x <- rnorm(n, 0, .8)
y <- a + b * x + epsilon
plot(y~x)
summary(lm(y ~ x))
abline(lm(y ~ x))


Для случая `парной линейной регрессии`
$${\displaystyle {\hat {b}}={\frac {\sum _{t=1}^{n}x_{t}y_{t}}{\sum _{t=1}^{n}x_{t}^{2}}}}$$
$$ \hat{a} = \overline{y} + \hat{b}\,\overline{x} $$

In [None]:
b_est <- sum(x,y)/sum(x^2)
a_est <- mean(y) - b_est*mean(x)
a_est
b_est
y_est <- a_est+b_est*x

Коэффент детерминации <br>
$ R^{2} = 1 - \,\frac{RSS}{TSS} $ <br>
$ RSS = \sum{(y_{i}-\hat{y}_{i})^{2}}$ <br>
$ TSS = \sum{(y_{i}-\overline{y}_{i})^{2}}$

In [None]:
RSS <- sum((y-y_est)^2)
TSS <- sum((y-mean(y))^2)
R_2 <- 1- RSS/TSS
RSS
TSS
R_2

Гипотеза о о адкветности модели
$$ F = \frac{R^2}{1-R^2}\,(n-2)$$

In [None]:
F <- (R_2/(1-R_2))*(n-2)
F
qf(1 - .05, 1, n-2) #Крит значение статистики

Среднеквадратическая ошибка 
$$ S^2 = \frac{1}{n-2} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2$$
Стандартная ошибка оценки 
$$ S = \sqrt{S^2}$$
Оценка дисперсии коэффициента наклона:
$$S^2_{b} = \frac{S^2}{\sum_{i=1}^{n} (x_i - \bar{x})^2}$$
Стандартная ошибка оценки коэффициента наклона SbSb​:
$$S_{b} = \sqrt{S^2_{b}}$$
Оценка дисперсии коэффициента сдвига
$$S^2_{a} = S^2 \cdot \frac{\bar{x}^2}{\sum_{i=1}^{n} (x_i - \bar{x})^2}$$
Стандартная ошибка оценки коэффициента сдвига
$$S_{a} = \sqrt{S^2_{a}}$$
t-статистика для коэффициента сдвига и наклона:
$$t = \frac{\text{оцененное значение коэффициента}}{\text{стандартная ошибка оценки коэффициента}}$$

In [None]:
S2 <- sum((y - y_est)^2) / (n - 2)
SE <- sqrt(S2)
S2_b <- S2 / sum((x - mean(x))^2)
SE_b <- sqrt(S2_b)
S2_a <- S2 * (mean(x^2)) / sum((x - mean(x))^2)
SE_a <- sqrt(S2_a)
t_value_a <- a_est / SE_a
t_value_b <- b_est / SE_b
t_value_a
t_value_b
qt(1 - .05/2, df = n - 2) #квантиль t распределения

# Часть 2

$$y_{i} = a\,x_{i}^{b}\,ε_{i}​, \quad ln(ε_{i})​ ∼ N(0,σ^2),\quad i=\overline{1,n}$$

In [None]:
epsilon <- rlnorm(n, 0, .8)
i <- 1:n

In [None]:
x <- 1+0.1*i
y <- a*(x^b)*epsilon
x <-log(x)
y <-log(y)
plot(y~x)
plot(exp(y)~exp(x))

In [None]:
plot(y~x)
reg <- lm(y~x)
summary(reg)
abline(reg)

`summary(reg)` выведет значения для линейной модели. Необходимо `exp(Коэффиценты)` 

In [None]:
exp(reg$coefficients)

In [None]:
b_est <- sum(x,y)/sum(x^2)
a_est <- mean(y) - b_est*mean(x)
a_est
b_est

In [None]:
y_est <- a_est+b_est*x
RSS <- sum((y-y_est)^2)
TSS <- sum((y-mean(y))^2)
R_2 <- 1- RSS/TSS
RSS
TSS
R_2

In [None]:
F <- (R_2/(1-R_2))*(n-2)
F
qf(1 - .05, 1, n-2) #Крит значение статистики

In [None]:
S2 <- sum((y - y_est)^2) / (n - 2)
SE <- sqrt(S2)
S2_b <- S2 / sum((x - mean(x))^2)
SE_b <- sqrt(S2_b)
S2_a <- S2 * (mean(x^2)) / sum((x - mean(x))^2)
SE_a <- sqrt(S2_a)
t_value_a <- a_est / SE_a
t_value_b <- b_est / SE_b
t_value_a
t_value_b
qt(1 - .05/2, df = n - 2) #квантиль t распределения

# Часть 3

$$y_{i} = a\,e^{b\,x_{i}}\,ε_{i}​, \quad ln(ε_{i})​ ∼ N(0,σ^2),\quad i=\overline{1,n}$$

In [None]:
epsilon <- rlnorm(n, 0, .8)
i <- 1:n

In [None]:
x <- 1 + .04 * i
y <- a * exp(b * x) * epsilon

y <- log(y)

plot(y ~ x)
plot(exp(y) ~ x)

In [None]:
plot(y~x)
reg <- lm(y~x)
summary(reg)
abline(reg)

`summary(reg)` выведет значения для линейной модели. Необходимо `exp(Коэффиценты)` 

In [None]:
exp(reg$coefficients[1])

In [None]:
b_est <- sum(x,y)/sum(x^2)
a_est <- mean(y) - b_est*mean(x)
a_est
b_est

In [None]:
y_est <- a_est+b_est*x
RSS <- sum((y-y_est)^2)
TSS <- sum((y-mean(y))^2)
R_2 <- 1- RSS/TSS
RSS
TSS
R_2

In [None]:
F <- (R_2/(1-R_2))*(n-2)
F
qf(1 - .05, 1, n-2) #Крит значение статистики

In [None]:
S2 <- sum((y - y_est)^2) / (n - 2)
SE <- sqrt(S2)
S2_b <- S2 / sum((x - mean(x))^2)
SE_b <- sqrt(S2_b)
S2_a <- S2 * (mean(x^2)) / sum((x - mean(x))^2)
SE_a <- sqrt(S2_a)
t_value_a <- a_est / SE_a
t_value_b <- b_est / SE_b
t_value_a
t_value_b
qt(1 - .05/2, df = n - 2) #квантиль t распределения