Задание: **Вам необходимо реализовать на языке R функции вычисления доверительных интервалов для параметров нормального распределения для случаев, рассмотренных на занятии. **

1) Вычисление доверительного интервала для среднего:
* Дисперсия известна
* Дисперсия неизвестна

2) Вычисление доверительного интервала для дисперсии:
* Мат. ожидаение известно
* Мат. ожидаение неизвестно

3) Вычисление доверительных интервалов для разницы мат. ожиданий двух выборок. По умолчанию следует проверять равенство дисперсий при помощи подхода с использованием F-теста, а далее в зависимости от результата:
* либо с предположением о неравенстве дисперсий,
* либо с альтернативой.

Также должна присутствовать возможность задать предположение о равенстве дисперсий через параметры функции явно.

## Функция 1

In [None]:
expectation.respect.to.variance <- function(sample, variance, alpha) {
    sample.mean <- mean(sample)
    .T <- (qnorm(1 - alpha/2, mean=0, sd=1) * variance) / sqrt(length(sample))
    
    left_bound <- sample.mean - .T
    right_bound <- sample.mean + .T
    return(c(left_bound, right_bound))
}


In [None]:
expectation.respect.to.unknown.variance <- function(sample, alpha) {
    .n <- length(sample)
    .mean <- mean(sample)
    
    .S <- sqrt((1/(.n-1)) * sum((sample - .mean)**2))

    .T <- (qt(1 - alpha/2, .n-1) * .S) / sqrt(.n)
    
    left_bound <- .mean - .T
    right_bound <- .mean + .T
    return(c(left_bound, right_bound))
}

In [205]:
func1 <- function(sample, alpha, sigma) {
    if(!missing(sigma)) {
        ### Случай 1: Неизвестное мат. ожидание
        ### при известной дисперсии
        return (expectation.respect.to.variance(sample, variance, alpha))
    } else {
        ### Случай 3: Неизвестное мат. ожидание
        ### при неизвестной дисперсии
        return (expectation.respect.to.unknown.variance(sample, alpha))
    }
}

## Функция 2

In [None]:
variance.respect.to.expectation <- function(sample, expectation, alpha) {
    .n <- length(sample)
    .T <- sum((sample - expectation)**2)

    left_bound <- sqrt(.T/qchisq(1 - alpha/2, .n))
    right_bound <- sqrt(.T/qchisq(alpha/2, .n))
    return(c(left_bound, right_bound))
}

In [None]:
variance.respect.to.unknown.mean <- function(sample, alpha) {
    .n <- length(sample)
    .T <- sum((sample[1:.n-1] - mean(sample[1:.n-1]))**2)

    left_bound <- sqrt(.T/qchisq(1 - alpha/2, .n-1))
    right_bound <- sqrt(.T/qchisq(alpha/2, .n-1))

    return(c(left_bound, right_bound))
}

In [None]:
func2 <- function(sample, alpha, mu) {
    if(!missing(sigma)) {
        ### Случай 2: Неизвестная дисперсия
        ### при известном мат. ожидании
        return (variance.respect.to.expectation(sample, mu, alpha))
    } else {
        ### Случай 4: Неизвестная дисперсия
        ### при известном мат. ожидании
        return (variance.respect.to.unknown.mean(sample, alpha))
    }
}

## Функция 3

In [None]:
fisher.test <- function(sample1, sample2) {
    .n1 <- length(sample1)
    .mean1 <- mean(sample1)
    .s1 <- (1/(.n1-1)*sum((sample1 - .mean1)**2))
    
    .n2 <- length(sample2)
    .mean2 <- mean(sample2)
    .s2 <- (1/(.n2-1)*sum((sample2 - .mean2)**2))
    
    return(df(.s1/.s2, .n1-1, .n2-1))
}

In [None]:
expectations.subs.respect.to.variances <- function(sample1, variance1, sample2, variance2, alpha) {
    .n1 <- length(sample1)
    .mean1 <- mean(sample1)
    
    .n2 <- length(sample2)
    .mean2 <- mean(sample2)
    
    .S <- sqrt(variance1**2/.n1 + variance2**2/.n2)

    .T <- qnorm(1 - alpha/2) * .S
    
    left_bound <- .mean1 - .mean2 - .T
    right_bound <- .mean1 - .mean2 + .T
    return(c(left_bound, right_bound))
}

In [None]:
expectations.subs.respect.to.same.unknown.variances <- function(sample1, sample2, alpha) {
    .n1 <- length(sample1)
    .mean1 <- mean(sample1)
    
    .n2 <- length(sample2)
    .mean2 <- mean(sample2)
    
    .S1 <- sqrt((sum((sample1 - .mean1)**2) + sum((sample2 - .mean2)**2))/(.n1 + .n2 - 2))
    .S2 <- sqrt(1/.n1 + 1/.n2)

    .T.left <- qt(1 - alpha/2, .n1 + .n2 -2) * .S1 * .S2
    .T.right <- qt(alpha/2, .n1 + .n2 -2) * .S1 * .S2
    
    left_bound <- .mean1 - .mean2 - .T.left
    right_bound <- .mean1 - .mean2 - .T.right
    return(c(left_bound, right_bound))
}

In [None]:
expectations.subs.respect.to.unknown.variances <- function(sample1, sample2, alpha) {
    .n1 <- length(sample1)
    .mean1 <- mean(sample1)
    .s1 <- (1/(.n1-1)*sum((sample1 - .mean1)**2))
    
    .n2 <- length(sample2)
    .mean2 <- mean(sample2)
    .s2 <- (1/(.n2-1)*sum((sample2 - .mean2)**2))
    
    .t <- .s1/.n1 + .s2/.n2
    .T <- sqrt(.t)
    
    .k <- (.t**2) / ( (.s1/.n1)**2/(.n1 - 1) + (.s2/.n2)**2/(.n2 - 1) )

    .T.left <- qt(1 - alpha/2, .k) * .T
    .T.right <- qt(alpha/2, .k) * .T
    
    left_bound <- .mean1 - .mean2 - .T.left
    right_bound <- .mean1 - .mean2 - .T.right
    return(c(left_bound, right_bound))
}

In [200]:
func3 <- function(sample1, sample2, sigma1, sigma2, alpha, threshold = 0.05) {
    
    
    # при неизвестных дисперсиях
    if(missing(sigma1) & missing(sigma1)) {
        ### Случай 1: Неизвестная разница мат. ожиданий
        ### при известных дисперсиях
        expectations.subs.respect.to.variances(sample1 = sample1,
                                               variance1 = sigma1,
                                               sample2 = sample2,
                                               variance2 = sigma2,
                                               alpha = alpha)
    } else {
        # проверяем равенство дисперсий Ф-тестом
        is.sigma.same <- (fisher.test(sample1 = sample1, sample2 = sample2) > threshold)
        
        if (is.sigma.same) {
            ### Случай 2: Неизвестная разница мат. ожиданий
            ### при неизвестных, но равных дисперсиях
            expectations.subs.respect.to.same.unknown.variances(sample1 = sample1,
                                                                sample2 = sample2,
                                                                alpha = alpha)
        } else {
            ### Случай 3: Неизвестная разница мат. ожиданий
            ### при неизвестных, но не равных дисперсиях
            expectations.subs.respect.to.unknown.variances(sample1 = sample1,
                                                           sample2 = sample2,
                                                           alpha = alpha)
        }
    }
    
    
}

In [215]:
1 & 0

In [49]:
n <- 1000
sigma <- 3
mu <- 0
alpha <- 0.05
sample <- rnorm(n, mean=mu, sd=sigma)

## Одновыборочный случай

### Случай 1: Неизвестное мат. ожидание при известной дисперсии

Доверительный интервал для $\mu$:
$(\ \bar{X} - \frac{Z_{1-\alpha/2}*\sigma}{\sqrt{n}}\ ,\ \bar{X} + \frac{Z_{1-\alpha/2}*\sigma}{\sqrt{n}}\ )$

In [87]:
expectation.respect.to.variance <- function(sample, variance, alpha) {
    sample.mean <- mean(sample)
    .T <- (qnorm(1 - alpha/2, mean=0, sd=1) * variance) / sqrt(length(sample))
    
    left_bound <- sample.mean - .T
    right_bound <- sample.mean + .T
    return(c(left_bound, right_bound))
}


In [88]:
confidence.interval <- expectation.respect.to.variance(sample = sample, variance = sigma, alpha = alpha) 
c(confidence.interval[1] < mu, mu < confidence.interval[2])

### Случай 2: Неизвестная дисперсия при известном мат. ожидании

Доверительный интервал для $\sigma$: $(\sqrt{\frac{\sum_{i=1}^{n}(X_i-\mu)^2}{\chi^2_{1-\alpha/2, n}}},\sqrt{\ \frac{\sum_{i=1}^{n}(X_i-\mu)^2}{\chi^2_{\alpha/2, n}}})$

In [94]:
variance.respect.to.expectation <- function(sample, expectation, alpha) {
    .n <- length(sample)
    .T <- sum((sample - expectation)**2)

    left_bound <- sqrt(.T/qchisq(1 - alpha/2, .n))
    right_bound <- sqrt(.T/qchisq(alpha/2, .n))
    return(c(left_bound, right_bound))
}

In [98]:
confidence.interval <- variance.respect.to.expectation(sample = sample, expectation = mu, alpha = 0.05) 
c(confidence.interval[1] < sigma, sigma < confidence.interval[2])
confidence.interval

### Случай 3: Неизвестная дисперсия при неизвестном мат. ожидании

Доверительный интервал для $\sigma$, $\mu$ как выборочное среднее:
$(\sqrt{\frac{\sum_{i=1}^{n}(X_i-\bar{X})^2}{\chi^2_{1-\alpha/2, n-1}}},\sqrt{\ \frac{\sum_{i=1}^{n}(X_i-\bar{X})^2}{\chi^2_{\alpha/2, n-1}}})$

In [103]:
variance.respect.to.sample.mean <- function(sample, alpha) {
    .n <- length(sample)
    .T <- sum((sample[1:.n-1] - mean(sample[1:.n-1]))**2)

    left_bound <- sqrt(.T/qchisq(1 - alpha/2, .n-1))
    right_bound <- sqrt(.T/qchisq(alpha/2, .n-1))

    return(c(left_bound, right_bound))
}

In [104]:
confidence.interval <- variance.respect.to.sample.mean(sample = sample, alpha = alpha) 
c(confidence.interval[1] < sigma, sigma < confidence.interval[2])
confidence.interval

### Случай 4: Неизвестное мат. ожидание при неизвестной дисперсии

Доверительный интервал для $\mu$, где $\sigma$ как выборочная дисперсия: $(\bar{X} - \frac{t_{1-\alpha/2, n-1}*S}{\sqrt{n}}, \frac{t_{1-\alpha/2, n-1}*S}{\sqrt{n}} + \bar{X} )$, где ${S}={\sqrt{\frac{1}{n-1}*\sum_{i=1}^{n}(X_i-\bar{X})^2}}$

In [77]:
expectation.respect.to.unkown.variance <- function(sample, alpha) {
    .n <- length(sample)
    .mean <- mean(sample)
    
    .S <- sqrt((1/(.n-1)) * sum((sample - .mean)**2))

    .T <- (qt(1 - alpha/2, .n-1) * .S) / sqrt(.n)
    
    left_bound <- .mean - .T
    right_bound <- .mean + .T
    return(c(left_bound, right_bound))
}

In [78]:
confidence.interval <- expectation.respect.to.unkown.variance(sample = sample, alpha = alpha) 
c(confidence.interval[1] < mu, mu < confidence.interval[2])
confidence.interval

## Двувыборочный случай

In [85]:
mu1 <- 0
sigma1 <- 3
sample1 <- rnorm(n, mean=mu1, sd=sigma1)

mu2 <- 0
sigma2 <- 3
sample2 <- rnorm(n, mean=mu2, sd=sigma2)

### Случай 1: Неизвестная разница мат. ожиданий при известных дисперсиях

Тогда получаем доверительный интервал для $\mu_1$ - $\mu_2$  в интервале: $$(\ \bar{X}-\bar{Y}-Z_{1-\alpha/2}*\sqrt{\sigma_1^2/n_1+\sigma_2^2/n_2},\ \bar{X}-\bar{Y}+Z_{1-\alpha/2}*\sqrt{\sigma_1^2/n_1+\sigma_2^2/n_2}\ )$$

In [41]:
expectations.subs.respect.to.variances <- function(sample1, variance1, sample2, variance2, alpha) {
    .n1 <- length(sample1)
    .mean1 <- mean(sample1)
    
    .n2 <- length(sample2)
    .mean2 <- mean(sample2)
    
    .S <- sqrt(variance1**2/.n1 + variance2**2/.n2)

    .T <- qnorm(1 - alpha/2) * .S
    
    left_bound <- .mean1 - .mean2 - .T
    right_bound <- .mean1 - .mean2 + .T
    return(c(left_bound, right_bound))
}

In [86]:
confidence.interval <- expectations.subs.respect.to.variances(sample1 = sample1, variance1 = sigma1,
                                                              sample2 = sample2, variance2 = sigma2,
                                                              alpha = alpha) 
c(confidence.interval[1] < mu1-mu2, mu1-mu2 < confidence.interval[2])
confidence.interval

### Случай 2: Неизвестная разница мат. ожиданий при неизвестных, но равных дисперсиях

Тогда получаем доверительный интервал для $\mu_1$ - $\mu_2$  в интервале: $$(\bar{X} - \bar{Y} - t_{1-\alpha/2, n_1 + n_2 - 2}*S*\sqrt{1/n_1 + 1/n_2}, \bar{X} - \bar{Y} - t_{\alpha/2, n_1 + n_2 - 2}*S*\sqrt{1/n_1 + 1/n_2})$$, при
$$S=\sqrt{\frac{\sum_{i=1}^{n1}(X_i-\bar{X})^2 + \sum_{i=1}^{n2}(Y_i-\bar{Y})^2}{n1+n2-2}}$$

In [111]:
expectations.subs.respect.to.same.variances <- function(sample1, sample2, alpha) {
    .n1 <- length(sample1)
    .mean1 <- mean(sample1)
    
    .n2 <- length(sample2)
    .mean2 <- mean(sample2)
    
    .S1 <- sqrt((sum((sample1 - .mean1)**2) + sum((sample2 - .mean2)**2))/(.n1 + .n2 - 2))
    .S2 <- sqrt(1/.n1 + 1/.n2)

    .T.left <- qt(1 - alpha/2, .n1 + .n2 -2) * .S1 * .S2
    .T.right <- qt(alpha/2, .n1 + .n2 -2) * .S1 * .S2
    
    left_bound <- .mean1 - .mean2 - .T.left
    right_bound <- .mean1 - .mean2 - .T.right
    return(c(left_bound, right_bound))
}

In [112]:
sigma <- 3

mu1 <- 0
sample1 <- rnorm(n, mean=mu1, sd=sigma)

mu2 <- 0
sample2 <- rnorm(n, mean=mu2, sd=sigma)

In [113]:
confidence.interval <- expectations.subs.respect.to.same.variances(sample1 = sample1, sample2 = sample2, alpha = alpha) 
c(confidence.interval[1] < mu1-mu2, mu1-mu2 < confidence.interval[2])
confidence.interval

### Случай 3: Неизвестная разница мат. ожиданий при неизвестных, но не равных дисперсиях

Тогда получаем доверительный интервал для $\mu_1$ - $\mu_2$  в интервале:
$$(\bar{X} - \bar{Y} - t_{1-\alpha/2, k}*T, \bar{X} - \bar{Y} - t_{\alpha/2, k}*T)$$
$$T = \sqrt{s_1^2/n_1+s_2^2/n_2}$$
$$k=\frac{(s_1^2/n_1+s_2^2/n_2)^2}{(s_1^2/n_1)^2/(n_1-1)+(s_2^2/n_2)^2/(n_2-1)}$$
$$s_1^2=\frac{1}{n_1-1}*\sum_{i=1}^{n_1}(X_i-\bar{X})^2$$
$$s_2^2=\frac{1}{n_2-1}*\sum_{i=1}^{n_2}(Y_i-\bar{Y})^2$$

In [119]:
expectations.subs.respect.to.unknown.variances <- function(sample1, sample2, alpha) {
    .n1 <- length(sample1)
    .mean1 <- mean(sample1)
    .s1 <- (1/(.n1-1)*sum((sample1 - .mean1)**2))
    
    .n2 <- length(sample2)
    .mean2 <- mean(sample2)
    .s2 <- (1/(.n2-1)*sum((sample2 - .mean2)**2))
    
    .t <- .s1/.n1 + .s2/.n2
    .T <- sqrt(.t)
    
    .k <- (.t**2) / ( (.s1/.n1)**2/(.n1 - 1) + (.s2/.n2)**2/(.n2 - 1) )

    .T.left <- qt(1 - alpha/2, .k) * .T
    .T.right <- qt(alpha/2, .k) * .T
    
    left_bound <- .mean1 - .mean2 - .T.left
    right_bound <- .mean1 - .mean2 - .T.right
    return(c(left_bound, right_bound))
}

In [121]:
sigma1 <- 3
sigma2 <- 5

mu1 <- 0
sample1 <- rnorm(n, mean=mu1, sd=sigma1)

mu2 <- 0
sample2 <- rnorm(n, mean=mu2, sd=sigma2)

In [122]:
confidence.interval <- expectations.subs.respect.to.unknown.variances(sample1 = sample1, sample2 = sample2, alpha = alpha) 
c(confidence.interval[1] < mu1-mu2, mu1-mu2 < confidence.interval[2])
confidence.interval

### Проверка гипотез про равенство дисперсий

Сначала считаем выборочные дисперсии:
$$s_1^2=\frac{1}{n_1-1}*\sum_{i=1}^{n_1}(X_i-\bar{X})^2$$
$$s_2^2=\frac{1}{n_2-1}*\sum_{i=1}^{n_2}(Y_i-\bar{Y})^2$$

Далее строим статистику: $$F=s_1^2/s_2^2 \sim F(n-1, m-1)$$

In [137]:
fisher.test <- function(sample1, sample2) {
    .n1 <- length(sample1)
    .mean1 <- mean(sample1)
    .s1 <- (1/(.n1-1)*sum((sample1 - .mean1)**2))
    
    .n2 <- length(sample2)
    .mean2 <- mean(sample2)
    .s2 <- (1/(.n2-1)*sum((sample2 - .mean2)**2))
    
    return(df(.s1/.s2, .n1-1, .n2-1))
}

In [154]:
sigma1 <- 3
sigma2 <- 3

mu1 <- 0
sample1 <- rnorm(n, mean=mu1, sd=sigma1)

mu2 <- 0
sample2 <- rnorm(n, mean=mu2, sd=sigma2)

In [155]:
fisher.test(sample1 = sample1, sample2 = sample2) > 0.05

In [192]:
sigma1 <- 4
sigma2 <- 4

mu1 <- 0
sample1 <- rnorm(n, mean=mu1, sd=sigma1)

mu2 <- 0
sample2 <- rnorm(n, mean=mu2, sd=sigma2)

fisher.test(sample1 = sample1, sample2 = sample2) > 0.05

## Refferences:
* центральная статистика - https://en.wikipedia.org/wiki/Pivotal_quantity
* нормальное распределение - https://ru.wikipedia.org/wiki/%D0%9D%D0%BE%D1%80%D0%BC%D0%B0%D0%BB%D1%8C%D0%BD%D0%BE%D0%B5_%D1%80%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5
* https://stat.ethz.ch/R-manual/R-devel/library/stats/html/Normal.html


* Хи-квадрат https://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5_%D1%85%D0%B8-%D0%BA%D0%B2%D0%B0%D0%B4%D1%80%D0%B0%D1%82
* The (non-central) Chi-Squared Distribution - https://stat.ethz.ch/R-manual/R-devel/library/stats/html/Chisquare.html

* Student
* The Student t Distribution - https://stat.ethz.ch/R-manual/R-devel/library/stats/html/TDist.html

* Распределение фишера - https://stat.ethz.ch/R-manual/R-devel/library/stats/html/Fdist.html


* The Normal Distribution - https://stat.ethz.ch/R-manual/R-devel/library/stats/html/Normal.html