In [7]:
# 1. Известно, что генеральная совокупность распределена нормально со средним 
# квадратическим отклонением, равным 16.
# Найти доверительный интервал для оценки математического ожидания a с надежностью 0.95, 
# если выборочная средняя M = 80, а объем выборки n = 256.

import numpy as np
import pandas as pd
from scipy import stats

M = 80
n = 256
sigma = 16
alpha = 1.96

stats.norm.ppf(0.975)

# Используем формулу для Z-критерия

high_value = M + alpha * sigma / np.sqrt(n) # Верхняя граница интервала

low_value = M - alpha * sigma / np.sqrt(n) # Нижняя граница интервала

print(f'Доверительный интервал будет такой: {low_value} - {high_value}.')


Доверительный интервал будет такой: 78.04 - 81.96.


In [8]:
# 2. В результате 10 независимых измерений некоторой величины X, 
# выполненных с одинаковой точностью, получены опытные данные:
# 6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1
# Предполагая, что результаты измерений подчинены нормальному закону 
# распределения вероятностей, оценить истинное значение величины X при 
# помощи доверительного интервала, покрывающего это значение с 
# доверительной вероятностью 0,95.

data = np.array([6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1])

M_data = np.mean(data) # Среднее значение по измерениям

disp = np.var(data, ddof=1) # Дисперсия

# Используем формулу для критерия Стьюдента

t = stats.t.ppf(0.975, 9) # 9 степеней свободы (10 - 1)

high_value = M_data + t * np.sqrt(disp / 10) # Верхняя граница интервала

low_value = M_data - t * np.sqrt(disp / 10) # Нижняя граница интервала

print(f'Истинное значение найденное по доверительному интервалу равно {(high_value + low_value) / 2}.')

Истинное значение найденное по доверительному интервалу равно 6.590000000000001.


In [12]:
# Рост дочерей 175, 167, 154, 174, 178, 148, 160, 167, 169, 170
# Рост матерей  178, 165, 165, 173, 168, 155, 160, 164, 178, 175
# Используя эти данные построить 95% доверительный интервал для 
# разности среднего роста родителей и детей.

n1 = 10
n2 = 10
data_1 = np.array([175, 167, 154, 174, 178, 148, 160, 167, 169, 170]) # Рост дочерей
data_2 = np.array([178, 165, 165, 173, 168, 155, 160, 164, 178, 175]) # Рост матерей

M_data_1 = np.mean(data_1)
M_data_2 = np.mean(data_2)

delta = M_data_2 - M_data_1

t = stats.t.ppf(0.975, 18) # 18 степеней свободы (20 - 2)

disp_data_1 = np.var(data_1, ddof=1) # Дисперсия для роста дочерей
disp_data_2 = np.var(data_2, ddof=1) # Дисперсия для роста матерей

disp = (disp_data_1 + disp_data_2) / 2 # Дисперсия по выборке разности среднего роста

SE = np.sqrt(disp/n1 + disp/n2)

high_value = delta + t * SE # Верхняя граница интервала

low_value = delta - t * SE # Нижняя граница интервала

print(f'Доверительный интервал будет такой: {low_value} - {high_value}.')

Доверительный интервал будет такой: -6.268418034506846 - 10.068418034506857.
