## Одновыборочный случай

In [1]:
n <- 10
mean <- 0
sigma <- 3
X <- rnorm(n=n, mean=mean, sd=sigma)

Случай 1: Неизвестное мат. ожидание при известной дисперсии

Доверительный интервал для $\mu$:
$(\ \bar{X} - \frac{Z_{1-\alpha/2}*\sigma}{\sqrt{n}}\ ,\ \bar{X} + \frac{Z_{1-\alpha/2}*\sigma}{\sqrt{n}}\ )$

In [2]:
confidence_interval_mju <- function(X, alpha, sigma, n) {
    m <- mean(X)
    q <- qnorm(1 - alpha / 2)
    return (c(m - q * sigma / sqrt(n),
              m + q * sigma / sqrt(n)))
}

confidence_interval_mju(X, 0.05, sigma, n)

Случай 2: Неизвестная дисперсия при известном мат. ожидании

Доверительный интервал для $\sigma$: $(\sqrt{\frac{\sum_{i=1}^{n}(X_i-\mu)^2}{\chi^2_{1-\alpha/2, n}}},\sqrt{\ \frac{\sum_{i=1}^{n}(X_i-\mu)^2}{\chi^2_{\alpha/2, n}}})$

In [3]:
confidence_interval_sigma <- function(X, alpha, mju, n) {
    ch <- sum((X - mju) ** 2)
    q1 <- qchisq(1 - alpha / 2, df = n)
    q2 <- qchisq(alpha / 2, df = n)
    return (c(sqrt(ch / q1),
              sqrt(ch / q2)))
}

confidence_interval_sigma(X, 0.05, mean, n)

Случай 3: Неизвестная дисперсия при неизвестном мат. ожидании

Доверительный интервал для $\sigma$, $\mu$ как выборочное среднее:
$(\sqrt{\frac{\sum_{i=1}^{n}(X_i-\bar{X})^2}{\chi^2_{1-\alpha/2, n-1}}},\sqrt{\ \frac{\sum_{i=1}^{n}(X_i-\bar{X})^2}{\chi^2_{\alpha/2, n-1}}})$

In [4]:
confidence_interval_sm <- function(X, alpha, n) {
    ch <- sum((X - mean(X)) ** 2)
    q1 <- qchisq(1 - alpha / 2, df = n - 1)
    q2 <- qchisq(alpha / 2, df = n - 1)
    return (c(sqrt(ch / q1),
              sqrt(ch / q2)))
}

confidence_interval_sm(X, 0.05, n)

Случай 4: Неизвестное мат. ожидание при неизвестной дисперсии

Доверительный интервал для $\mu$, где $\sigma$ как выборочная дисперсия: $(\bar{X} - \frac{t_{1-\alpha/2, n-1}*S}{\sqrt{n}}, \frac{t_{1-\alpha/2, n-1}*S}{\sqrt{n}} + \bar{X} )$, где ${S}={\sqrt{\frac{1}{n-1}*\sum_{i=1}^{n}(X_i-\bar{X})^2}}$

In [5]:
confidence_interval_ms <- function(X, alpha, n) {
    S <- var(X)
    m <- mean(X)
    t <- qt(1 - alpha / 2, df = n - 1)
    return (c(m - t * S / sqrt(n),
              m + t * S / sqrt(n)))
}

confidence_interval_ms(X, 0.05, n)

## Двувыборочный случай

In [6]:
n <- 10
mean <- 0
sigma1 <- 3
sigma2 <- 4
X <- rnorm(n=n, mean=mean, sd=sigma1)
Y <- rnorm(n=n, mean=mean, sd=sigma2)

Случай 1: Неизвестная разница мат. ожиданий при известных дисперсиях

Тогда получаем доверительный интервал для $\mu_1$ - $\mu_2$  в интервале: $$(\ \bar{X}-\bar{Y}-Z_{1-\alpha/2}*\sqrt{\sigma_1^2/n_1+\sigma_2^2/n_2},\ \bar{X}-\bar{Y}+Z_{1-\alpha/2}*\sqrt{\sigma_1^2/n_1+\sigma_2^2/n_2}\ )$$

In [7]:
confidence_interval_mdiff <- function(X, Y, s1, s2, n1, n2, alpha) {
    mx <- mean(X)
    my <- mean(Y)
    z <- qnorm(1 - alpha / 2)
    s <- sqrt(s1 / n1 + s2 / n2)
    return (c(mx - my - z * s,
              mx - my + z * s))
}

confidence_interval_mdiff(X, Y, sigma1, sigma2, n, n, 0.05)

Случай 2: Неизвестная разница мат. ожиданий при неизвестных, но равных дисперсиях

Тогда получаем доверительный интервал для $\mu_1$ - $\mu_2$  в интервале: $$(\bar{X} - \bar{Y} - t_{1-\alpha/2, n_1 + n_2 - 2}*S*\sqrt{1/n_1 + 1/n_2}, \bar{X} - \bar{Y} - t_{\alpha/2, n_1 + n_2 - 2}*S*\sqrt{1/n_1 + 1/n_2})$$, при
$$S=\sqrt{\frac{\sum_{i=1}^{n1}(X_i-\bar{X})^2 + \sum_{i=1}^{n2}(Y_i-\bar{Y})^2}{n1+n2-2}}$$

In [8]:
confidence_interval_mdiff_eq <- function(X, Y, n1, n2, alpha) {
    mx <- mean(X)
    my <- mean(Y)
    t1 <- qt(1 - alpha / 2, df = n1 + n2 - 2)
    t2 <- qt(alpha / 2, df = n1 + n2 - 2)
    s <- sqrt(sum((X - mean(X)) ** 2) + sum((Y - mean(Y)) ** 2)) / sqrt(n1 + n2 - 2)
    c <- sqrt(1 / n1 + 1 / n2)
    return (c(mx - my - t1 * s * c,
              mx - my - t2 * s * c))
}

confidence_interval_mdiff_eq(X, Y, n, n, 0.05)

Случай 3: Неизвестная разница мат. ожиданий при неизвестных, но не равных дисперсиях

Тогда получаем доверительный интервал для $\mu_1$ - $\mu_2$  в интервале:
$$(\bar{X} - \bar{Y} - t_{1-\alpha/2, k}*T, \bar{X} - \bar{Y} - t_{\alpha/2, k}*T)$$
$$T = \sqrt{s_1^2/n_1+s_2^2/n_2}$$
$$k=\frac{(s_1^2/n_1+s_2^2/n_2)^2}{(s_1^2/n_1)^2/(n_1-1)+(s_2^2/n_2)^2/(n_2-1)}$$
$$s_1^2=\frac{1}{n_1-1}*\sum_{i=1}^{n_1}(X_i-\bar{X})^2$$
$$s_2^2=\frac{1}{n_2-1}*\sum_{i=1}^{n_2}(Y_i-\bar{Y})^2$$

In [9]:
confidence_interval_mdiff_neq <- function(X, Y, n1, n2, alpha) {
    mx <- mean(X)
    my <- mean(Y)
    k <- (var(X) ** 2 / n1 + var(Y) ** 2 / n2) ** 2
    k <- k / ((var(X) ** 2 / n1) ** 2 / (n1 - 1) +
              (var(Y) ** 2 / n2) ** 2 / (n2 - 1))
    t1 <- qt(1 - alpha / 2, df = k)
    t2 <- qt(alpha / 2, df = k)
    t <- sqrt(var(X) ** 2 / n1 + var(Y) ** 2 / n2)
    return (c(mx - my - t1 * t,
              mx - my - t2 * t))
}

confidence_interval_mdiff_neq(X, Y, n, n, 0.05)

### Проверка гипотез про равенство дисперсий

Сначала считаем выборочные дисперсии:
$$s_1^2=\frac{1}{n_1-1}*\sum_{i=1}^{n_1}(X_i-\bar{X})^2$$
$$s_2^2=\frac{1}{n_2-1}*\sum_{i=1}^{n_2}(Y_i-\bar{Y})^2$$

Далее строим статистику: $$F=s_1^2/s_2^2 \sim F(n-1, m-1)$$

In [10]:
hypothesis_check <- function(X, Y, n, m) {
    return (c(df(var(X) / var(Y), df1=n, df2=m) > 0.05))
}
hypothesis_check(X, Y, n, n)

## Реализация функций

Пункт 1

In [11]:
confidence_interval_m <- function(X, alpha, disp=NULL) {
    if (is.null(disp)) {
        confidence_interval_ms(X, alpha, length(X))
    } else {
        confidence_interval_mju(X, alpha, disp, length(X))
    }
}
confidence_interval_m(X, 0.05, 3)

In [12]:
confidence_interval_m(X, 0.05)

Пункт 2

In [13]:
confidence_interval_d <- function(X, alpha, mean=NULL) {
    if (is.null(mean)) {
        confidence_interval_sm(X, alpha, length(X))
    } else {
        confidence_interval_sigma(X, alpha, mean, length(X))
    }
}
confidence_interval_d(X, 0.05, 3)

In [14]:
confidence_interval_d(X, 0.05)

Пункт 3

In [15]:
confidence_interval_diff <- function(X, Y, alpha, s1=NULL, s2=NULL, deq=FALSE) {
    n1 <- length(X)
    n2 <- length(Y)
    if (is.null(s1) || is.null(s2)) {
        if (isTRUE(deq) || hypothesis_check(X, Y, n1, n2)) {
            confidence_interval_mdiff_eq(X, Y, n1, n2, alpha)
        } else {
            confidence_interval_mdiff_neq(X, Y, n1, n2, alpha)
        }     
    } else {
        confidence_interval_mdiff(X, Y, s1, s2, n1, n2, alpha)
    }
}
confidence_interval_diff(X, Y, 0.05)

In [16]:
confidence_interval_diff(X, Y, 0.05, sigma1, sigma2)

In [17]:
confidence_interval_diff(X, Y, 0.05, deq=TRUE)