# 4章　線形代数

- 線形代数はベクトル空間を扱う数学の一分野
- ベクトルはオブジェクトであり、有次元空間内の点
- ベクトルは数値データを表現する非常に優れた方法。簡単に数値のリストをn次元のベクトルとして表現できる
- 数値のリストとしてベクトルを表現するのが最も簡単。本章ではfloatのリストである型エイリアスVectorを使って表現する。
- Pythonのリストはベクトル無くベクトル演算の機能が提供されていない

In [2]:
from typing import List

# typingはPython3.5で追加された機能
#  型エイリアスは型をエイリアスに代入することで定義し
# コンテナ内の要素に期待する型を記述できる
# 型アノテーションを無視してしまっても本章はざっくり理解できるかも

Vector = List[float]

height_weight_age = [70, 170, 40]
grades = [95, 80, 75, 62]


In [3]:
# リストはベクトル演算の機能が提供されていないため
# まずベクトルに対する算術演算機能を作る
# ※ベクトルのリストの四則演算、内包表記を使って個々の要素の計算を行なう方法で実現しています

#  加算
def add(v: Vector, w: Vector) -> Vector:
    """対応する要素の和"""
    assert len(v) == len(w), "vectors must be same length"
    return [v_i  + w_i  for v_i, w_i in zip(v, w)]

assert add([1, 2, 3], [4, 5, 6]) == [5,7,9]

In [4]:
# 減算
def subtract(v: Vector, w: Vector) -> Vector:
    assert len(v) == len(w), "vectors must be the same length"
    return [v_i - w_i for v_i, w_i in zip(v, w)]

assert subtract([5,7,9], [4,5,6])  == [1,2,3]

In [5]:
# 要素ごとの和

def vector_sum(vectors: List[Vector]) -> Vector:
    assert vectors, "no vectors rovided!"
    num_elements = len(vectors[0])
    assert all(len(v) == num_elements for v in vectors), "different sizes"
    
    return  [sum(vector[i] for vector in vectors)
             for i in range(num_elements)]

assert vector_sum([[1, 2], [3, 4], [5, 6],[7, 8]]) == [16, 20]

In [6]:
# ベクトルとスカラー（この場合スカラーはベクトルに対して量だけの値）の乗算

def scalar_multiply(c: float, v: Vector) -> Vector:
    return [c * v_i for v_i in v]
assert scalar_multiply(2, [1, 2, 3]) == [2, 4, 6]

In [10]:
# ベクトルの要素ごとの平均
# 上記のvector_sum(), scalar_multiply()を利用

def vector_mean(vectors:List[Vector]) -> Vector:
    n = len(vectors)
    return scalar_multiply(1/n, vector_sum(vectors))

assert vector_mean([[1, 2], [3, 4], [5, 6]]) == [3, 4]

In [13]:
# ドット積（内積）の計算
# ドット積はベクトルvがwの方向にどれだけ広がるかを示す（vとwの角度を示すと考えることもできる）
# ２つのベクトルのドット積は要素ごとの積の総和
# 「出番は多くない」とありますが、ビット化したベクトルでの共起の計算、類似性算出（コサイン類似度）など
# ベクトルの計算で内積を使う頻度は高い（自分比。ただしnumpy.dotで）

def dot(v: Vector, w: Vector) -> float:
    assert len(v) == len(w), "vectors must be same length"
    return sum(v_i * w_i for v_i, w_i  in zip(v, w))

assert dot([1, 2, 3], [4, 5, 6])  == 32


In [14]:
# ベクトルの二乗和の計算
# ※ベクトルの大きさは二乗和の平方根なので、この計算が有用、ということなのかも？

def sum_of_squares(v: Vector) -> float:
    return dot(v, v)
    
assert sum_of_squares([1, 2, 3]) == 14

In [17]:
# ベクトルのマグニチュード（一般的には"ベクトルの大きさ"）
# ３平方の定理による"二乗和の平方根"で算出されていると考えるとわかりやすいかも

import math

def magnitude(v: Vector) -> float:
    return math.sqrt(sum_of_squares(v))

assert magnitude([3, 4]) == 5

In [18]:
# 以上の関数（ベクトルの各要素の減算をするsubtract(), ベクトルの二乗和を計算するsum_of_squares()）と
# 平方根を使ってベクトルのおおきさを計算できる
# ベクトルの距離はこのように二点間のユークリッド距離を指すのが一般的かもしれないが、他にもいろいろあるらしい

def squared_distance (v: Vector, w: Vector) -> float:
    return sum_of_squarese(subtract(v, w))

def distance(v: Vector, w: Vector) -> float: 
    return math.sqrt(squared_distance(v, w))

In [19]:
# 上で定義したmagtnitude()を使うとわかりやすい？
# ベクトルの二乗和を引数にベクトルの大きさを計算するmagnitude()）でも
def distance(v: Vector, w: Vector) -> float:
    return magnitude(subtract(v, w))

## 4.2 行列

- 行列は数値を二次元に配置したもの
- 行列はリストのリストとして表現できる（ここではそう表現する）
- リストの中にある同じ長さのリストが行列の行を表す（Pythonのデータ構造が常に行指向とは限らないので要注意）

In [77]:
#　Numpyを使うと
import numpy as np

a  = np.array([1,2,3])
b = np.array([4,5,6])
actual = a + b
expected = np.array([5, 7, 9])
assert all(actual == expected), "なんか違う"

numpy.ndarray