# 5 题

方差分析多用于两个及两个以上样本均数差异的显著性检验。为了推断两种降脂药的ACE浓度的影响，采用方差分析。

In [1]:
import scipy.stats as stats

# 数据
control_group = [61.24, 58.65, 46.79, 37.43, 66.54, 59.27]
drug_A_group = [82.35, 56.47, 61.57, 48.79, 62.54, 60.87]
drug_B_group = [26.23, 46.87, 24.36, 38.54, 42.16, 30.33]


F_statistic, p_value = stats.f_oneway(control_group, drug_A_group, drug_B_group)


alpha = 0.05 #按照 alpha=0.05进行检验

print(f"统计量的值为: {F_statistic:.3f}")
print(f"P值为: {p_value:.3f}")
if p_value < alpha:
    print("两组ACE浓度不同")
else:
    print("两组ACE浓度相同")


统计量的值为: 11.208
P值为: 0.001
两组ACE浓度不同


# 第 7 题

为了反映中药组和西药组的致死率是否相同，采用卡方检验进行测试。

In [2]:
import scipy.stats as stats
import numpy as np

data = np.array([[66, 3], # 中药组的观察数和死亡数
                 [14, 2]]) # 西药组的观察数和死亡数

# 卡方值，p值，自由度，期待值
chi2, p_value, dof, expected_val = stats.chi2_contingency(data)

#设置置信度为 95%
prob = 0.95
critical = stats.chi2.ppf(prob, dof) # 临界阈值


print(f"统计量(卡方的值)为: {chi2:.3f}")
print(f"p值为: {p_value:.3f}")

if chi2 > critical:
    print("两组的致死率不同")
else:
    print("两组的致死率相同")

统计量(卡方的值)为: 0.434
p值为: 0.510
两组的致死率相同


# 9 题

In [3]:
import numpy as np
import statsmodels.api as sm

# 体重和体表面积数据
weights = np.array([11.0, 11.8, 12.0, 12.3, 13.1, 13.7, 14.4, 14.9, 15.2, 16.0])
surface_area = np.array([5.283, 5.299, 5.385, 5.602, 5.292, 6.014, 5.830, 6.102, 6.075, 6.411])

# 增加常数项（截距）用于回归
X = sm.add_constant(weights)

# 进行线性回归
model = sm.OLS(surface_area, X)
results = model.fit()

# 获取回归统计量和P值
summary = results.summary()
summary.tables[1]  # 返回回归系数表格
# 获取回归系数和P值
coefficients = results.params
p_values = results.pvalues

alpha = 0.05

# 输出回归系数和P值
coefficients, p_values
print(f"统计量为: {results.fvalue:.3f}")
print(f"p值为: {results.f_pvalue:.5f}")

if results.f_pvalue < alpha:
    print("相关")
else:
    print("不相关")

统计量为: 42.484
p值为: 0.00018
相关


  res = hypotest_fun_out(*samples, **kwds)


# 11 题

为了解决该问题，可以采用非参数检验方法中的秩和检验（如 Mann-Whitney U 检验或 Wilcoxon 秩和检验）来比较两组病人的生存期是否有差别。因为数据中包含右删失的生存时间（如带“+”号的数据表示存活的病例），需要考虑删失数据的特殊性，因此建议采用Log-Rank 检验，这是一种适合生存数据的检验方法。

以下是操作步骤和Python代码实现：
数据准备

甲治疗组（带“+”表示删失）: [5, 7, 13, 13, 23, 30, 30, 38, 42, 42, 45]
删失标记（1表示删失，0表示未删失）：[0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 1]

乙治疗组：[1, 3, 3, 7, 15, 15, 23, 30]
删失标记（1表示删失，0表示未删失）：[0, 0, 0, 0, 0, 0, 0, 0]
使用 Python 进行分析

我们将使用 lifelines 库中的 logrank_test 方法来进行 Log-Rank 检验。代码如下：

这题采用生存分析。

In [4]:
from lifelines.statistics import logrank_test

# 数据准备
group_A_times = [5, 7, 13, 13, 23, 30, 30, 38, 42, 42, 45]
group_A_censorship = [0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 1]

group_B_times = [1, 3, 3, 7, 15, 15, 23, 30]
group_B_censorship = [0, 0, 0, 0, 0, 0, 0, 0]

# Log-Rank 检验
results = logrank_test(
    group_A_times, group_B_times,
    event_observed_A=group_A_censorship,
    event_observed_B=group_B_censorship
)
alpha = 0.05
# 输出结果
print(f"统计量: {results.test_statistic:.3f}")
print(f"P值: {results.p_value:.3f}")

if results.p_value > alpha:
    print("相同")
else:
    print("不相同")

统计量: 0.658
P值: 0.417
相同
