# Numpy実践編
## いよいよ計算していくよ！
---

# Numpyではarray（配列）を前提として計算を行う
例えばこんな感じ。リスト[ ]やタプル( )などをarrayで囲えばよい。  
行列を扱うmatrix型もあるが、行列演算は今回はしないので割愛。

In [2]:
import numpy as np
np.array([1,2,3]) + np.array([4,5,6])

array([5, 7, 9])

Pythonに元々備わっているリストとの違い。  
*元々Pythonに用意されている型は__組み込み型__という。  
参考リンク：[公式ドキュメント](https://docs.python.jp/3/library/stdtypes.html)

リストには何でもごちゃごちゃにして突っ込める

In [16]:
a = ["a", 1, 2.3, True]
print(a)

['a', 1, 2.3, True]


numpyのarrayにも何でも入れられるが...基本的に型は1種類にしないといけない。  
そうしないと全て文字列型（String型）として扱われる。  
高速な数値計算を行うためにnumpyを使っているのに、文字列型になってしまっては計算もクソもない。  
もちろんちょっと頑張れば数値に変換もできるが、最初から数値は数値、文字列は文字列で別々に扱うべきである。

__ダメな例（動くけど）__

In [17]:
b = np.array(["a", 1, 2.3, True])
print(b)
print("文字列型なので\'\'でそれぞれ囲まれている")

['a' '1' '2.3' 'True']
文字列型なので''でそれぞれ囲まれている


__良い例１__

In [25]:
c = np.array([1,2,3,4,5])   # 整数型で揃えた。
print(c)

[1 2 3 4 5]


__良い例2\*__  
\*正確には良くはないが、Pythonなら気にしなくてよい

In [23]:
d = np.array([1.1, 2.2, 3, 4])   # 整数型と浮動小数点型が混在
print(d)

[1.1 2.2 3.  4. ]


すべて浮動小数点型になる（小数点ついてるでしょう？0は省略されている。）  
小数は整数型で表現できないので、型を統一しようとすると自動的にすべて浮動小数点型に変換されているだけ。  
C言語などのコンパイル言語では「型そろえろよ！」と、普通はエラーになる。  
このように型について深く考えなくてよいのがPythonの良さであり、面倒くささでもある（エラーの原因が型だったということが多々ある）。

# なぜリストなら何でも突っ込めて、numpyでは型をそろえる必要があるのか。
→Python組み込みのリストとnumpyではメモリの使い方が異なるため。

メモリの使い方を確認するならid関数でアドレスを見てみればよい。  
以下ではリストとnumpy arrayの要素ごとのアドレスを表示している。  
なお、
```python
print(A)
```
と書いてあるのはAを表示せよという命令です。また、
```python
for i in a:
    なんかの処理
```
というのは、iにaの要素を順番に入れて、内側の段落の処理を実行しろという意味。使い方は後程。

```python
len(a)
```
というのは、aの長さを取得しろという意味。  
aは4要素だったので、4を返す。

__リストの要素ごとのアドレス__

In [29]:
print(a)
for i in a:
    print(id(i))

['a', 1, 2.3, True]
1787431629352
1810914352
1787475064728
1810423904


__numpy arrayの要素ごとのアドレス__

In [30]:
print(c)
for i in c:
    print(id(i))

[1 2 3 4 5]
1787475065352
1787475065376
1787475065352
1787475065376
1787475065352


ぱっと見でわかると思うんですが、リストは要素間のアドレスがバラバラです。  
以前、

↓型がわからない  
↓メモリの占有量がわからない  
↓配列に数値をきれいに並べることができない  

と説明したことを覚えているでしょうか。  
リストには何でも入れられる代わりに、お互いメモリ領域が干渉しないようにバラバラに数値や文字列などを配置してしまいます。  
型を統一して格納すればメモリ上でもちゃんと並んでくれますが、リスト自体に演算機能を持たせるのはナンセンスな気がします。  
なぜなら型を統一してくれるかどうかはプログラマ次第だからです。型がバラバラな時に演算しようとしたらエラーになっちゃいますからね。

### それなら型を統一すればいいじゃない！

はい。つまり型が揃ってりゃメモリ占有量は把握できるので、要素をメモリ上に綺麗に配置できるわけです。

例
- int32型→32 bits
- float64型→64 bits (確認したらどうやらPython3では64bitsじゃないようだが...気にしないことにする。)

### 並ぶと何が嬉しいのか？？  
それは、数値をまとめて扱うことができるようになるためです。  
後は単純にプログラム書くときに便利。C言語などではメモリの配置に気を配る必要があるので、並んでないと困るわけです。

ちなみにPythonというプログラミング言語自体もC言語で作られてます。  
頑張ればC言語で作られたプログラムと連携をとることができます。  
ただこれはかなり高度なテクニックなので、死ぬまで知らなくて大丈夫です。

# 数値をまとめて扱う

リストは型を統一する必要がなかったので、数値をまとめて扱えません。  
以下はその確認です。

__リスト__

In [38]:
# 2つのベクトルを考える。
vec1 = [1,2,3,4]
vec2 = [1,2,3,4]

# この要素ごとの積をとりたい。
vec1*vec2

TypeError: can't multiply sequence by non-int of type 'list'

リストにはこういった演算は定義されていないのでエラーが出る

__numpy array__

In [39]:
# 2つのベクトルを考える。
vec1 = np.array([1,2,3,4])
vec2 = np.array([1,2,3,4])

# この要素ごとの積をとりたい。
vec1*vec2

array([ 1,  4,  9, 16])

numpyでは数値をまとめて処理できる。

では、最後に四則演算をしてみましょう。   
numpyの便利な関数も使っていきますので、わからないところは調べてみてください。  
関数についてすべて書いていたらキリがないし、そもそも私もすべては把握できていません。

↓こんなことをnumpyでできないかな？  
↓ググる！  
という癖をつけましょう。

大体はQiitaというエンジニア専用ブログみたいなサイトとか、  
StackOverflowというエンジニアのQ&A掲示板に答えを見つけることができます。  
というか、ここで見つからなかったら諦めたほうが良いです。

__0-9までの連番を生成し、要素ごとに足したり引いたりかけたり割ったりしてみる。__

In [40]:
arr = np.arange(10)
arr+arr

array([ 0,  2,  4,  6,  8, 10, 12, 14, 16, 18])

In [41]:
arr-arr

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0])

In [42]:
arr*arr

array([ 0,  1,  4,  9, 16, 25, 36, 49, 64, 81])

In [43]:
arr/arr

  """Entry point for launching an IPython kernel.


array([nan,  1.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,  1.])

0/0は演算として定義されていないので、警告が出る。  
そもそも計算ができないので、nan (not a numberの略)と表示されている。   
numpy独自の型であるので、python組み込みの機能では扱えないので注意。  
エラーにせずに、可能なところは計算してくれるのを優しいと思うかクソ仕様と思うかは人次第かもしれない。  
nanの扱いには特に注意を払う必要があるので、以下で知っておくべきことを簡単にまとめておく。

In [44]:
np.nan + 1

nan

In [46]:
np.nan - 1

nan

In [45]:
np.nan * 1

nan

In [47]:
np.nan / np.nan

nan

__nanはどんな計算をしてもnanになる!__  
わかっててエイヤっと計算してしまうなら構わないが、エラーを吐かないので知らずに間違って計算してしまうことがある。  
注意しましょう。

# 課題

$$
y=x^2
$$

のグラフを作ってみてください。  
放物線が見えれば、良いです。

ヒント  
1. np.arangeとかnp.linspaceを使うと便利。  
1. グラフを表示するのでmatplotlibも必要ですね