In [1]:
import numpy as np
from scipy.stats import ttest_1samp

### Задача 1

In [2]:
voltages = [12.9, 11.6, 13.5, 13.9, 12.1, 11.9, 13.0]
hypothetical_mean = 12  

# t-тест для одной выборки
t_stat, p_value = ttest_1samp(voltages, hypothetical_mean)

print("t-статистика:", t_stat)
print("p-значение:", p_value)

alpha = 0.05  # Уровень значимости
if p_value < alpha:
    print(f"Среднее напряжение статистически отличается от {hypothetical_mean} В (отвергаем H0).")
else:
    print(f"Нет оснований отвергать H0: среднее напряжение не отличается от {hypothetical_mean} В.")


t-статистика: 2.1578017974978794
p-значение: 0.07430190210562303
Нет оснований отвергать H0: среднее напряжение не отличается от 12 В.


### Задача 2

In [3]:
from scipy.stats import ttest_rel

method_I = [23.1, 23.2, 26.5, 26.6, 27.1, 48.3, 40.5, 25.0, 38.4, 23.5]
method_II = [22.7, 23.6, 27.1, 27.4, 27.4, 46.8, 40.4, 24.9, 38.1, 23.8]

# t-тест для парных выборок
t_stat, p_value = ttest_rel(method_I, method_II)

print("t-статистика:", t_stat)
print("p-значение:", p_value)

alpha = 0.05 
if p_value < alpha:
    print("Есть статистически значимая разница между двумя методами (отвергаем H0).")
else:
    print("Нет статистически значимой разницы между двумя методами (не отвергаем H0).")


t-статистика: 1.7154884978678027e-15
p-значение: 0.9999999999999987
Нет статистически значимой разницы между двумя методами (не отвергаем H0).


### Задача 3

In [4]:
from scipy.stats import ttest_ind

city_dwellers = [132, 111, 119, 138, 200, 131, 138, 170, 159, 140]
rural_dwellers = [115, 190, 127, 155, 148, 121, 116, 121, 197]

# t-тест для независимых выборок
t_stat, p_value = ttest_ind(city_dwellers, rural_dwellers, alternative='greater')


print("t-статистика:", t_stat)
print("p-значение:", p_value)

alpha = 0.05  # Уровень значимости
if p_value < alpha:
    print("Гипотеза о том, что у горожан более высокое давление, подтверждается (отвергаем H0).")
else:
    print("Нет оснований утверждать, что давление у горожан выше (не отвергаем H0).")

t-статистика: 0.035165199049777565
p-значение: 0.486178812200461
Нет оснований утверждать, что давление у горожан выше (не отвергаем H0).


### Задача 4

In [3]:
from scipy.stats import binomtest

n_men = 2500  # Количество мужчин в выборке
n_total = 5000  # Общий размер выборки
expected_proportion = 0.52  # Доля мужчин среди новорожденных

# Выполнение биномиального теста
result = binomtest(k=n_men, n=n_total, p=expected_proportion, alternative='two-sided')

p_value_binomial = result.pvalue
alpha = 0.05

if p_value_binomial < alpha:
    print(f"p-значение: {p_value_binomial:.5f} - Разница статистически значима. Мы отвергаем нулевую гипотезу.")
else:
    print(f"p-значение: {p_value_binomial:.5f} - Разница не является статистически значимой. Мы не отвергаем нулевую гипотезу.")


p-значение: 0.00485 - Разница статистически значима. Мы отвергаем нулевую гипотезу.


### Задача 5

Причина таких результатов может быть связана с:

1. Размером выборки: в первом эксперименте, где разница в средних значима (p=0.001), выборка могла быть больше. Большой объем выборки уменьшает стандартную ошибку среднего, что увеличивает мощность теста и позволяет выявлять даже небольшие различия. Во втором эксперименте (p=0.8) выборка могла быть маленькой. Маленькая выборка увеличивает стандартную ошибку среднего, снижая вероятность обнаружения значимых различий.

2. Стандартным отклонением (разброс данных): если в первом эксперименте стандартные отклонения были небольшими, данные в выборках были более "сфокусированными" вокруг среднего. Это уменьшает шум в данных, делая t-критерий более чувствительным. Во втором эксперименте стандартные отклонения могли быть большими, что увеличивает разброс данных и снижает возможность обнаружения статистически значимых различий.

3. Разницей между средними и величина эффекта: хотя во втором эксперименте разница между средними (X1=17, X2=36) кажется больше, значимость различий зависит от отношения разницы между средними к стандартной ошибке. Если стандартная ошибка велика (например, из-за большого разброса данных или маленькой выборки), даже большая разница между средними может не быть значимой.

4. Ошибки первого и второго рода: в первом эксперименте вероятность ошибки первого рода (отвержение нулевой гипотезы, когда она истинна) была низкой, так как p=0.001. Это говорит о мощном тесте. Во втором эксперименте, при p=0.8, высока вероятность ошибки второго рода (не отвержение нулевой гипотезы, когда альтернативная гипотеза истинна). Это может быть следствием недостаточной мощности теста.


Чтобы получить значимые результаты во втором эксперименте, следует:
- Увеличить объем выборки
- Понизить разброс данных