<a href="https://colab.research.google.com/github/tomonari-masada/course2024-intro2ml/blob/main/04_NumPy_1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# モジュール、パッケージ、ライブラリ
https://docs.python.org/3/tutorial/modules.html
* "A module is a file containing Python definitions and statements."
* "Packages are a way of structuring Python’s module namespace by using “dotted module names”."

https://realpython.com/lessons/scripts-modules-packages-and-libraries/
* "A module is a Python file that’s intended to be imported into scripts or other modules."
* "A package is a collection of related modules that work together to provide certain functionality."
* "A library is an umbrella term that loosely means “a bundle of code.” These can have tens or even hundreds of individual modules that can provide a wide range of functionality."

## mathモジュール

In [None]:
import math

a = 2.0
b = math.sqrt(a)
print(a, b)
b = math.exp(a)
print(a, b)

## reモジュール
* 正規表現

In [None]:
import re

s = 'one two one two'
m = re.finditer('one', s)
for match in m:
  print(match.start())

# NumPyライブラリ

* ベクトルや行列を扱える（他にも様々な機能がある）
 * ベクトルどうしの内積
 * 行列とベクトルの積
 * 行列と行列の積
 * 逆行列

* ndarrayという独自のデータ構造を使う
 * ちゃんとコードを書けば高速（ちゃんと書かないと遅い・・・）


## ndarray（NumPyの配列）の作り方

### Pythonのリストから作る

In [None]:
import numpy as np

a = np.array([-2.0, 1.0, 3.0])
print(a)
b = np.array([[1,2,3], [4,5,6]])
print(b)

print(a.T) #ndarrayの属性の例（転置属性）
print(b.T)

In [None]:
a = np.array([1, 2, 3])
print(a * 3)
print(a + 2)
b = np.array([2, 2, 0])
print(a + b)
print(a / b) #エラーが出る（どんなエラー？）
print(a * b)
print(np.dot(a, b)) #内積

### ndarrayの属性

In [None]:
a = np.array([-2.0, 1.0, 3.0])
b = np.array([[1,2,3], [4,5,6]])

print(type(a)) #ndarray自体のデータ型
print(a.data) #メモリ上での位置
print(a.dtype) #要素のデータ型
print(a.size, b.size)
print(a.itemsize, b.itemsize) #要素のサイズ
print(a.ndim, b.ndim) #次元数
print(a.shape, b.shape) #形状

### ndarrayの作り方のいろいろ

In [None]:
a = np.arange(10)
print(a)
b = np.arange(0, 10, 2)
print(b)
x = np.linspace(0, 10, 15) #0以上10以下を14等分
print(x)

In [None]:
print(np.random.randn()) #正規乱数
a = np.random.randn(2, 3)
print(a)
b = np.random.randn(3, 4)
print(b)
print(np.dot(a, b))
print(np.dot(b, a)) #エラー（なぜ？）

In [None]:
a = np.zeros((3,3)) #()で囲む必要あり
print(a)
b = np.ones((3,3))
print(b)
print(np.dot(b, b)) #なぜこうなる？

c = np.full((2,2), 7)
print(c)

## 配列の要素を指定する

### インデックス

In [None]:
a = np.arange(1, 20, 3)
print(a)
print(a[0])
print(a[1])
a[3] = 11
print(a)
c = np.array([[1,2,3],[4,5,6]])
print(c)
print(c[0,0])
print(c[0,2])
print(c[1,2])

### 良くないコードの例

In [None]:
import time
import numpy as np

x = np.ones(10000000)
y = np.ones(10000000)
s = np.zeros(10000000)
for _ in range(10):
  a = time.time()
  for i in range(10000000):
    s[i] = x[i] + y[i]
  b = time.time()
  print(b - a)

* 上のセルのように書くより、こう書くほうが良い

In [None]:
import time
import numpy as np

x = np.ones(10000000)
y = np.ones(10000000)
s = np.zeros(10000000)
for _ in range(10):
  a = time.time()
  s = x + y
  b = time.time()
  print(b - a)

### スライシング

In [None]:
a = np.arange(1, 20, 3)
print(a)
print(a[1:5])
print(a[0:6:2])
print(a[::-1])
print(a[-2::-1])
print(a[-2:1:-1])

### fancy index

In [None]:
np.random.seed(1234)
a = np.random.randint(10,size=10)
print(a)
m = a % 3 == 0
print(m)
print(type(m))
print(m.dtype)
b = a[m]
print(b)

### where関数

In [None]:
np.random.seed(1234)
a = np.random.randint(10,size=10)
print(a)
m = np.where(a % 3 == 0) #インデックスのtupleを返す
print(m)
print(type(m))
b = a[m]
print(b)

In [None]:
np.random.seed(1234)
a = np.random.randint(10,size=10)
print(a)
m = np.where(a % 2 == 0, 'even', 'odd')
print(m)

print(a[m == 'even'])

## 配列のコピー

### 配列のビュー
* コピーではない

In [None]:
a = np.array([1, 2, 3])
b = a #ビューを作っている
print(id(a) == id(b))

### 復習：リストのコピー

In [None]:
a = [1, 2, 3]
b = a
b[1] = 22
print(a)
print(b)
c = a[:] #リストがコピーされる
c[2] = 234
print(a)
print(c)

## ndarrayの場合の`a[:]`

In [None]:
a = np.array([1, 2, 3])
c = a[:] #コピーされるかどうか？
print(id(a) == id(c))
c[1] = 22
print(a) #変化している

### `copy`メソッド

In [None]:
a = np.array([1, 2, 3])
d = a.copy() #コピーを作る
print(id(a) == id(d))
d[2] = 234
print(a) #変化していない

## in-place演算

In [None]:
a = np.array([1, 2, 3])
c = a #ビューを作る
a = a + 1 #ここで別のオブジェクトになる
print(c)

a = np.array([1, 2, 3])
c = a #ビューを作る
a += 1 #in-place演算
print(c) #変化している

### in-place演算と演算関数の比較

In [None]:
import time
import numpy as np

In [None]:
size = 100000000
x = np.ones(size)
y = np.ones(size)
for _ in range(10):
  a = time.time()
  x = x * 4 + y * 3
  b = time.time()
  print(b - a)
  x = np.ones(size)
  y = np.ones(size)

In [None]:
size = 100000000
x = np.ones(size)
y = np.ones(size)
for _ in range(10):
  a = time.time()
  x *= 4
  y *= 3
  x += y
  b = time.time()
  print(b - a)
  x = np.ones(size)
  y = np.ones(size)

In [None]:
import time
import numpy as np

size = 100000000
x = np.ones(size)
y = np.ones(size)
for _ in range(10):
  a = time.time()
  np.multiply(x, 4, out=x)
  np.multiply(y, 3, out=y)
  np.add(x, y, out=x)
  b = time.time()
  print(b - a)
  x = np.ones(size)
  y = np.ones(size)

## 配列の形状を変更する

In [None]:
a = np.arange(12)
print(a)
b = np.reshape(a, (3, 4)) #NumPyの関数reshape
print(b)
a[3] *= -1
print(a)
print(b) #変化している
c = a.reshape((2,6)) #ndarrayのreshapeメソッド
print(c)