# 5.4 Cythonによる高速化
　Cythonは言語であり、Pythonのライブラリでもある。Cythonを使うと通常のPythonコードに対して、変数それぞれに型のアノテーションを付加できる。Cythonはそのコードに対してC言語への変換、コンパイルを行い、Python拡張モジュールを作る。このコンパイル済みモジュールは、普通のPythonモジュールから呼び出せる。

　Pythonでは動的な型付けにより多少のパフォーマンスを犠牲にしている分、Cythonでは動的型変換を用いてコード実行を高速化している。
 
　このレシピでは、マンデルブローの例をCythonを使って高速化する。

## 準備
　Cコンパイラは必要になる。またCython自体も要するため、Anacondaならターミナルから
 ```python
 conda install cython
 ```
を実行して、インストールする。

## 手順

### sizeとiterations変数

In [9]:
import numpy as np

In [1]:
size = 200
iterations = 100

### Cythonのインポート

In [10]:
# cythonmagic拡張をインポート
%load_ext cython

### Cythonの使用
　最初に、mandelbrot()関数の前に%%cython magicコマンドを置くだけに場合を試してみる。このセルmagicコマンドは、セルの中身を独立したCythonモジュールにコンパイルする。そのため、必要なインポートは同じセル内で行わなければならない。

In [11]:
%%cython
import numpy as np
def mandelbrot_cython(m, size, iterations):
    """
    The exact same content as in mandelbrot_python (first recipe of this chapter).
    """
    for i in range(size):
        for j in range(size):
            c = -2 + 3./size*j + 1j*(1.5-3./size*i) # 図のサイズに対して設定するボトム値
            z = 0 # 自己相似繰り返し用のカウンタ
            for n in range(iterations): # フラクタル図の作成ループ
                if np.abs(z) <= 10:
                    z = z*z + c # 自己相似図形としての関数
                    m[i, j] = n
                else:
                    break

この実行時間は、3.33秒、となり多少速くなっている。

In [12]:
%%timeit -n1 -r1 m = np.zeros((size, size), dtype=np.int32)
mandelbrot_cython(m, size, iterations)

1 loop, best of 1: 3.33 s per loop


### Cython用にコードを最適化
　今度はPythonコードの中身を少し変更して、cythonを使用してみる。

In [15]:
%%cython
import numpy as np
def mandelbrot_cython(int[:,::1] m, int size, int iterations):
    cdef int i, j, n # 静的型を持つC変数を宣言
    cdef complex z, c
    for i in range(size):
        for j in range(size):
            c = -2 + 3./size*j + 1j*(1.5-3./size*i) # 図のサイズに対して設定するボトム値
            z = 0 # 自己相似繰り返し用のカウンタ
            for n in range(iterations): # フラクタル図の作成ループ
                if z.real**2 + z.imag**2 <= 100:
                    z = z*z + c # 自己相似図形としての関数
                    m[i, j] = n
                else:
                    break

　ここで行ったのは、ローカル変数と関数引数の型を指定したことと、zの絶対値を計算するのにNumPyのnp.abs()を使用しなかったことのみ。Cythonが最適化されたCコードを生成するのに、これらの変更が有効であった。

In [14]:
%%timeit -n1 -r1 m = np.zeros((size, size), dtype=np.int32)
mandelbrot_cython(m, size, iterations)

1 loop, best of 1: 7.42 ms per loop


## 解説
　cdefにより、静的型を持つC変数を宣言できる。動的型の持つオーバーヘッドが軽減されるため、C変数を使うと高速なコードの実行が可能となる。
 
　多重ループ内で使われる変数はcdefで宣言されるべき。コードが最適化されるようアノテーションを使うことが出来る。
 
　CythonではNumPy配列をC変数として宣言する方法を2つ用意している。配列バッファと型付メモリビューである。このレシピは型付メモリビューを使用。
 
　型付メモリビューでは、データバッファをNumPy配列のようなインデックス記法を使ってアクセスできる。例えば、int[:,::1]によりC順序型の整数2次元NumPy配列を宣言出来る。::1は、この次元のデータを連続的に配置することを指示。型付メモリビューはNumPy配列のようにインデックス指定ができる。
 
　しかし、メモリビューではNumPyのような要素ごとの操作はできない。メモリビューは重なったループ内で使える便利なデータコンテナだと言える。NmPyのような要素ごとの操作が必要ならば、配列Jバッファを使うべき。
 
　np.abs呼び出しを別の表現で置き換えることで、大きなパフォーマンス向上が得られた。np.absはNumPyの関数のため、比較的大きめの配列に対して動作するよう設計されている。このオーバ＾ヘッドは、この例のような深いループの中では大きく影響する、このボトルネックは、Cythonアノテーションで見つけられる。
 
#### Cythonアノテーション
　アノテーション（英語：annotation）とは、あるデータに対して関連する情報（メタデータ）を注釈として付与すること。
　%%cython magicコマンドの後に-aフラグを追加すると最適化されていない行は黄色く階調表示される(白:高速、黄色:低速)。

In [18]:
%%cython -a
import numpy as np

def mandelbrot_cython(int[:,::1] m, int size, int iterations):
    cdef int i, j, n
    cdef complex z, c
    for i in range(size):
        for j in range(size):
            c = -2 + 3./size*j + 1j*(1.5-3./size*i)
            z = 0
            for n in range(iterations):
                if z.real**2 + z.imag**2 <= 100:
                    z = z*z + c
                    m[i, j] = n
                else:
                    break