# 結論
## 平均値の積と、積の平均値は基本的に一致しない
## ただし、2つの変数が無相関なら一致する
## 標準偏差の積と、積の標準偏差はまったく一致しない
### （数学的にも証明されているそうです）

## 正規分布に従う乱数を使って検証してみる

In [1]:
# ライブラリの読み込み
import numpy as np
import pandas as pd

In [2]:
# 平均1000、標準偏差100の正規分布に従う乱数を1000個生成
cells = np.random.normal(loc = 1000, scale = 100, size = 1000)

# 平均0.5、標準偏差0.1の正規分布に従う乱数を生成（50％、10％のつもり）
positive_rate = np.random.normal(loc = 0.5, scale = 0.1, size = 1000)

# データフレームにして結合
df_cells = pd.DataFrame(cells)
df_positive_rate = pd.DataFrame(positive_rate)
df = pd.concat([df_cells, df_positive_rate], axis=1)
df.columns = ['cells', 'positive_rate']
df.head(5)

Unnamed: 0,cells,positive_rate
0,1148.079472,0.447671
1,1080.373256,0.475076
2,1002.728656,0.624172
3,832.720773,0.538457
4,998.923528,0.705619


## それぞれの平均と標準編差、2変数の共分散を算出

In [34]:
mean_cells = df['cells'].mean()
sd_cells = df['cells'].std()
mean_positive_rate = df['positive_rate'].mean()
sd_positive_rate = df['positive_rate'].std()
cov_cells_positive_rate = df.cov().iloc[0,1]

print(f'細胞数の平均は{mean_cells}, 標準偏差は{sd_cells}')
print(f'陽性率の平均は{mean_positive_rate}, 標準偏差は{sd_positive_rate}')
print(f'細胞数と陽性率の共分散は, {cov_cells_positive_rate}')

細胞数の平均は1002.8113762047504, 標準偏差は100.56963436792925
陽性率の平均は0.49793805264247487, 標準偏差は0.10211408797440238
細胞数と陽性率の共分散は, 0.05964850170207917


In [35]:
# 陽性数を追加
df['positive'] = df['cells'] * df['positive_rate']
df.head(5)

Unnamed: 0,cells,positive_rate,positive
0,1148.079472,0.447671,513.962228
1,1080.373256,0.475076,513.259199
2,1002.728656,0.624172,625.875465
3,832.720773,0.538457,448.383998
4,998.923528,0.705619,704.859237


### 陽性数の平均と標準偏差を計算し、細胞数と陽性率の平均値、標準偏差の積と比較する

In [39]:
mean_positive = df['positive'].mean()
sd_positive = df['positive'].std()

mean_product = mean_cells * mean_positive_rate
sd_product = sd_cells * sd_positive_rate

print(f'陽性数の平均（積の平均）は{mean_positive}, 標準偏差（積の標準偏差）は{sd_positive}')
print(f'細胞数と陽性率の平均値の積は{mean_product}, 標準偏差の積は{sd_product}')

陽性数の平均（積の平均）は499.39753268831413, 標準偏差（積の標準偏差）は114.29226143947854
細胞数と陽性率の平均値の積は499.3379438351137, 標準偏差の積は10.26957649140021


### 平均のずれは、細胞数と陽性率の共分散に一致

In [37]:
print(f'平均のずれは, {mean_positive - mean_product}')
print(f'共分散は, {cov_cells_positive_rate}')

平均のずれは, 0.05958885320040963
共分散は, 0.05964850170207917
