## 【データサイエンス入門:統計編②】
### 代表値とは(実は色々ある平均の種類)

In [1]:
# 算術平均
import numpy as np
apple_weights = [295, 300, 300, 310, 311]
np.mean(apple_weights)

303.2

In [2]:
# 幾何平均
from scipy import stats
salary_growth = [1.05, 1.1, 1.3]
salary_growth_mean = stats.gmean(salary_growth)
print(salary_growth_mean)

1.1450956868476592


In [4]:
# 調和平均
velocities = [20, 60]
velocities_mean = stats.hmean(velocities)
print(velocities_mean)

30.0


In [6]:
# 算術平均の性質
# 算術平均からの差の合計は常にzero
apple_weights = np.array([295, 300, 300, 310, 311])
apple_weights_mean = np.mean(apple_weights)
deviations = apple_weights - apple_weights_mean
print(deviations)
print(deviations.sum())

[-8.2 -3.2 -3.2  6.8  7.8]
5.684341886080802e-14


## 【データサイエンス入門:統計編③】
### 代表値(中央値と最頻値のポイント)

In [11]:
# 平均よりも中央値の算出には時間がかかる
import numpy as np
import time
# 標準正規分布からランダムで値を抽出
randoms = np.random.randn(10**7)
# 計算前の時間（sec）
before_mean = time.time()
# 平均を計算
mean = np.mean(randoms)
# 平均計算後の時間（sec）
after_mean = time.time()
# {:.2f}は小数点第二位まで表示
print("mean is {}(time:{:.2f}s)".format(mean, after_mean - before_mean))
# 計算前の時間（sec）
before_median = time.time()
# 中央値を計算
median = np.median(randoms)
# 計算後の時間（sec）
after_median = time.time()
print("median is {}(time]{:.2f}s)".format(median, after_median - before_median))

mean is -4.900148576891348e-05(time:0.02s)
median is -0.00010370476371438539(time]0.56s)


In [12]:
# 最頻値の取得
from scipy import stats
# 最頻値とその数を返す
mode, count = stats.mode([6, 2, 4, 5, 1, 3, 5, 3, 4])
# ２つの最頻値があれば小さい方を返す
print(mode)
print(count)

[3]
[2]


In [13]:
# axis=0で列単位で最頻値を検索する
array = np.array([[1, 5, 3, 2],
                  [4, 1, 3, 4],
                  [7, 2, 1, 5],
                  [5, 2, 4, 1]])
mode, count = stats.mode(array, axis=0)
print(mode)
print(count)

[[1 2 3 1]]
[[1 2 2 1]]


In [15]:
# axis=1で行単位で最頻値を検索する
array = np.array([[1, 5, 3, 2],
                  [4, 1, 3, 4],
                  [7, 2, 1, 5],
                  [5, 2, 4, 1]])
mode, count = stats.mode(array, axis=1)
print(mode)
print(count)

[[1]
 [4]
 [1]
 [1]]
[[1]
 [2]
 [1]
 [1]]
