<a href="https://colab.research.google.com/github/yukinaga/minnano_cs/blob/main/section_2/02_complexity.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 計算量
演算の数を減らすことができれば、必要な計算の量は少なくて済みます。  
問題を解決するのに必要な計算量は少ない方が望ましいのですが、計算量の削減のためにはアルゴリズムにおける演算の数を測定する必要があります。  
計算量には、計算時間に関係する**時間計算量**と、メモリに関係する**空間計算量**があります。

## ◎時間計算量
**時間計算量**（time complexity）は、アルゴリズムが問題を解くにあたって実行しなければならない処理のステップ数のことです。  

### $\mathcal{O}$記法
$\mathcal{O}$（ビッグオー）記法は、計算にかかる時間の程度を表す記法です。  
  
処理すべきデータのサイズを$n$とします。  
このとき、処理のステップ総数が$n$に比例する場合は計算量を$\mathcal{O}(n)$と表記します。  
処理のステップ総数が$n^2$に比例する場合は、計算量を$\mathcal{O}(n^2)$と表記します。
  
以下は、$\mathcal{O}$記法による計算量の表記の例です。  
$\mathcal{O}(1)$、$\mathcal{O}(\log{n})$、$\mathcal{O}(n)$、$\mathcal{O}(n\log{n})$、$\log{n^2}$、$\log{2^n}$        

Pythonを使って、$()$内の値の大きさを比較してみましょう。

In [None]:
import math

n_list = [1, 2, 4, 8, 16]  # nの値

for n in n_list:
    print("------ n = " + str(n) + " ------")

    print("O(1)", 1)
    print("O(log n)", math.log(n))
    print("O(n)", n)
    print("O(n log n)", n*math.log(n))
    print("O(n^2)", n**2)
    print("O(2^n)", 2**n)

$\mathcal{O}(1)$はデータのサイズ$n$が増えても計算量は常に一定です。  
$\mathcal{O}(n^2)$や$\mathcal{O}(2^n)$は、$n$が増えると計算量が爆発的に増加します。  
大きなデータサイズが想定される場合、計算量が$\mathcal{O}(n^2)$や$\mathcal{O}(2^n)$となるアルゴリズムは避けた方が賢明でしょう。  

なお、データサイズとアルゴリズムが同じでも、計算に必要な演算数が異なる場合があります。  
これを以下のように整理します。  

* 最善: 最小の演算数で済む場合。
* 最悪: 最大の演算数が必要な場合。
* 平均: 多数のケースにおける演算数の平均。

一般に、この中で最も重要なのは「最悪」のケースです。  
演算数がもっとも多い最悪のケースを仮定して、信頼できる計算量を見積もることになります。


### プログラムの時間計算量
以下のプログラムの時間計算量を求めます。  

In [None]:
n = 100
sample = [0] * n  # 0がn個入ったリスト
print("実行前: ", sample)

#  ------ ここからの時間計算量 ------
sample[0] += 1 # 1回実行

for i in range(n):  # n回実行
    sample[i] += 1

for i in range(n):  # n回実行
    sample[i] += 1

for i in range(n):  # n回実行
    sample[i] += 1

for i in range(n):  # n^2回実行
    for j in range(n):
        sample[i] += 1

for i in range(n):  # n^2回実行
    for j in range(n):
        sample[i] += 1
#  ------ ここまで ------

print("実行後: ", sample)

まずはステップの総数を求めます。  
上記のコードの場合、総ステップ数は以下の通りに表すことができます。  

$$2n^2 + 3n + 1$$

次に、上記から不要なものを除きます。  
まずは、最大次数の項（もっとも影響力のある項）以外の項を除去します。  

$$2n^2$$

最後に、係数を除去します。

$$n^2$$

これを使って、上記のプログラムの計算量を、

$$\mathcal{O}(n^2)$$

と表記することができます。


### 所要時間の測定
実際に、$\mathcal{O}(1)$、$\mathcal{O}(n)$、$\mathcal{O}(n^2)$のケースで計算に要する時間を測定してみましょう。  
Pythonのtimeモジュールを使って、計算に要する時間を測定することができます。


In [None]:
import time

n = 10000
sample = [0] * n  # 0がn個入ったリスト

start = time.time()
sample[0] += 1 # 1回実行
print("O(1)（秒）: ", time.time()-start)

start = time.time()
for i in range(n):  # n回実行
    sample[i] += 1
print("O(n)（秒）: ", time.time()-start)

start = time.time()
for i in range(n):  # n^2回実行
    for j in range(n):
        sample[i] += 1
print("O(n^2)（秒）: ", time.time()-start)

アルゴリズムの種類によって時間計算量は異なります。  
現実的な時間内に問題を解決するためには、時間計算量を考慮して適切なアルゴリズムを選択する必要があります。

## @空間計算量
アルゴリズムを計算機上で実行するためには、進行中の計算の状態を保持するために記憶領域（=メモリ）が必要となります。  
アルゴリズムの実行に必要な作業記憶領域の量は、**空間計算量**（space complexity）と呼ばれます。  

以下の、最小値を求めるアルゴリズムの空間計算量を考えてみましょう。

In [None]:
num_list = [12, 2, 31, 13]  # この中の最小値を求める

min = num_list[0]  # 最小値を格納する変数
for num in num_list:
    if num < min:
        min = num

print(min)

この場合、作業に必要なメモリは最小値を格納する変数`min`のものだけです。  
データの数が増えても空間計算量は常に一定なので、$\mathcal{O}(1)$で表すことができます。  
  

アルゴリズムの種類によって空間計算量は異なりますが、空間計算量が少ないアルゴリズムでも時間計算量が少ないとは限りません。  
計算機のスペックには常に制限があるので、時間計算量とのバランスを考慮して適切なアルゴリズムを選択する必要があります。

## @ 演習

### 演習1
以下のプログラムの「時間計算量」を、$\mathcal{O}$記法で記述しましょう。

In [None]:
n = 10
sample = [0] * n  # 0がn個入ったリスト
print("実行前: ", sample)

#  ------ ここからの時間計算量 ------
sample[0] += 1 # 1回実行

for i in range(n):  # n回実行
    sample[i] += 1

for i in range(n):  # n^2回実行
    for j in range(n):
        sample[i] += 1

i = 0
while i<2**n:  # 2^n回実行
    sample[i%n] += 1
    i += 1

i = 0
while i<2*2**n:  # 2×2^n回実行
    sample[i%n] += 1
    i += 1
#  ------ ここまで ------

print("実行後: ", sample)

### 演習2
以下の画像を表示するプログラムの「空間計算量」を、$\mathcal{O}$記法で記述しましょう。

In [None]:
import numpy as np
import matplotlib.pyplot as plt

n= 16

image = np.zeros((n, n))

for i in range(n):
    for j in range(n):
        image[i, j] = i+j

plt.imshow(image, cmap="gray")
plt.colorbar()
plt.show()

## @解答例

### 演習1
総ステップ数を以下のように表すことができます。  

$$3\times 2^n +n^2 +  n + 1$$

もっとも影響力のある項以外の項を除去し、係数を除去すると以下の形になります。  

$$2^n$$

従って、時間計算量は、

$$\mathcal{O}(2^n)$$

と表記することができます。

### 演習2
画像のサイズが$n\times n$なので、空間計算量は以下のように表記できます。

$$\mathcal{O}(n^2)$$