# 선형대수 기초 2부

1부에서 설명한 내용을 순수 파이썬(pure python)으로 구현한다.
즉, 넘파이(NumPy), 판다스(Pandas) 등 추가 팩키지를 전혀 사용하지 않는다.

__참고:__ 여기서 사용하는 코드는 조엘 그루스(Joel Grus)의 [밑다닥부터 시작하는 데이터 과학](https://blog.insightbook.co.kr/2020/02/28/%EB%8D%B0%EC%9D%B4%ED%84%B0-%EA%B3%BC%ED%95%99-%EB%B6%84%EC%95%BC%EC%9D%98-%EA%B8%B0%EC%B4%88%EB%B6%80%ED%84%B0-%EC%95%8C%EA%B2%8C-%ED%95%B4%EC%A3%BC%EB%8A%94-%EA%B0%95%EB%A0%A5%ED%95%98%EA%B3%A0/)의 
2장에 사용된 소스코드의 일부를 기반으로 작성되었다.
소스코드는 [조엘 그루스의 깃허브](https://github.com/joelgrus/data-science-from-scratch)에서 다운로드 할 수 있다.

__주의사항:__ 아래 코드는 자료형 명시(type annotation)를 사용한다. 
자료형 명시에 대한 자세한 설명은 [강의노트: 자료형 명시](https://codingalzi.github.io/pydata/notebooks/pydata03-python-basics-6.html)를
참고하라.

## 벡터

### 벡터 자료형

In [4]:
from typing import List

Vector = List[float]

* 예제: 3차원 벡터

In [7]:
# (키, 몸무게, 나이)

height_weight_age = [70, 170, 40]

* 예제: 4차원 벡터

In [8]:
# (1차, 2차, 3차, 4차 시험 점수)

grades = [95, 80, 75, 62]

### 벡터 덧셈

In [9]:
def add(v: Vector, w: Vector) -> Vector:
    assert len(v) == len(w), "두 벡터의 길이가 같아야 함"

    return [v_i + w_i for v_i, w_i in zip(v, w)]

* 예제: 3차원 벡터 덧셈

In [10]:
add([1, 2, 3], [4, 5, 6])

[5, 7, 9]

### 벡터 뺄셈

In [11]:
def subtract(v: Vector, w: Vector) -> Vector:
    assert len(v) == len(w), "두 벡터의 길이가 같아야 함"

    return [v_i - w_i for v_i, w_i in zip(v, w)]

* 예제: 3차원 벡터 뺄셈

In [12]:
subtract([5, 7, 9], [4, 5, 6])

[1, 2, 3]

### 벡터 덧셈 일반화

In [6]:
def vector_sum(vectors: List[Vector]) -> Vector:
    assert vectors, "1개 이상의 벡터가 주어져야 함"

    num_elements = len(vectors[0])
    assert all(len(v) == num_elements for v in vectors), "모든 벡터의 크기가 같아야 함"

    # 동일한 위치의 항목을 모두 더함
    return [sum(vector[i] for vector in vectors)
            for i in range(num_elements)]

vector_sum([[1, 2], [3, 4], [5, 6], [7, 8]])

[16, 20]

### 벡터 스칼라 곱셈

In [7]:
def scalar_multiply(c: float, v: Vector) -> Vector:
    return [c * v_i for v_i in v]

scalar_multiply(2, [1, 2, 3])

[2, 4, 6]

#### 에제: 벡터 항목별 평균

In [8]:
def vector_mean(vectors: List[Vector]) -> Vector:
    n = len(vectors)
    return scalar_multiply(1/n, vector_sum(vectors))

vector_mean([[1, 2], [3, 4], [5, 6]])

[3.0, 4.0]

### 벡터 내적

In [9]:
def dot(v: Vector, w: Vector) -> float:
    assert len(v) == len(w), "벡터들의 길이가 동일해야 함"""

    return sum(v_i * w_i for v_i, w_i in zip(v, w))

dot([1, 2, 3], [4, 5, 6]) == 32

True

#### 에제: 벡터 항목별 제곱의 합

In [10]:
def sum_of_squares(v: Vector) -> float:

    return dot(v, v)

sum_of_squares([1, 2, 3]) == 14

True

#### 에제: 벡터의 크기

In [11]:
import math

def magnitude(v: Vector) -> float:
    return math.sqrt(sum_of_squares(v))

magnitude([3, 4])

5.0

#### 에제: 벡터 사이의 거리

In [12]:
def squared_distance(v: Vector, w: Vector) -> float:
    return sum_of_squares(subtract(v, w))

def distance(v: Vector, w: Vector) -> float:
    return math.sqrt(squared_distance(v, w))


def distance(v: Vector, w: Vector) -> float:
    return magnitude(subtract(v, w))

distance([1,2], [2,1])

1.4142135623730951

## 행렬

#### 예제

In [13]:
A = [[1, 2, 3],  # 2 x 3 행렬
     [4, 5, 6]]

B = [[1, 2],     # 3 x 2 행렬
     [3, 4],
     [5, 6]]

#### 행렬 타입 지정하기

In [14]:
Matrix = List[List[float]]

### 행렬 모양(shape)

In [15]:
from typing import Tuple

def shape(A: Matrix) -> Tuple[int, int]:
    num_rows = len(A)
    num_cols = len(A[0]) if A else 0   # number of elements in first row
    return num_rows, num_cols

shape([[1, 2, 3], [4, 5, 6]])

(2, 3)

### 행벡터, 열벡터 구하기

In [16]:
def get_row(A: Matrix, i: int) -> Vector:
    return A[i]             

def get_column(A: Matrix, j: int) -> Vector:
    return [A_i[j] for A_i in A]   

In [17]:
get_row(A,0)

[1, 2, 3]

In [18]:
get_column(A,2)

[3, 6]

### 영행렬

In [19]:
from typing import Callable

def make_matrix(num_rows: int,
                num_cols: int,
                entry_fn: Callable[[int, int], float]) -> Matrix:
    return [[entry_fn(i, j)             # given i, create a list
             for j in range(num_cols)]  #   [entry_fn(i, 0), ... ]
            for i in range(num_rows)]   # create one list for each i

In [20]:
def zero_matrix(n: int, m:int) -> Matrix:
    return make_matrix(n, m, lambda i, j: 0)

zero_matrix(5,7)

[[0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0]]

### 단위행렬

In [21]:
def identity_matrix(n: int) -> Matrix:
    return make_matrix(n, n, lambda i, j: 1 if i == j else 0)

identity_matrix(5)

[[1, 0, 0, 0, 0],
 [0, 1, 0, 0, 0],
 [0, 0, 1, 0, 0],
 [0, 0, 0, 1, 0],
 [0, 0, 0, 0, 1]]

### 행렬 연산

행렬의 덧셈, 뺄셈, 스칼라 곱셈, 곱셈 등을 벡터에 대한 정의와 유사하게 정의할 수 있다.
이를 위해 `make_matrix()`, `dot()` 함수 등을 이용할 수 있으며, 
자세한 사항은 과제로 남긴다.

#### 활용 예제: 친구관계

In [22]:
friendships = [(0, 1), (0, 2), (1, 2), (1, 3), (2, 3), (3, 4),
               (4, 5), (5, 6), (5, 7), (6, 8), (7, 8), (8, 9)]

In [23]:
friend_matrix = [[0, 1, 1, 0, 0, 0, 0, 0, 0, 0],
                 [1, 0, 1, 1, 0, 0, 0, 0, 0, 0],
                 [1, 1, 0, 1, 0, 0, 0, 0, 0, 0],
                 [0, 1, 1, 0, 1, 0, 0, 0, 0, 0],
                 [0, 0, 0, 1, 0, 1, 0, 0, 0, 0],
                 [0, 0, 0, 0, 1, 0, 1, 1, 0, 0],
                 [0, 0, 0, 0, 0, 1, 0, 0, 1, 0],
                 [0, 0, 0, 0, 0, 1, 0, 0, 1, 0],
                 [0, 0, 0, 0, 0, 0, 1, 1, 0, 1],
                 [0, 0, 0, 0, 0, 0, 0, 0, 1, 0]]

__참고:__ `friendsships`를 이용하여 `friend_matrix`를 코딩으로 생성할 수 있다.

0번과 2번 사이의 친구관계

In [24]:
friend_matrix[0][2]

1

0번과 8번 사이의 친구관계

In [25]:
friend_matrix[0][8]

0

5번 사용자의 친구들

In [26]:
friends_of_five = [i
                   for i, is_friend in enumerate(friend_matrix[5])
                   if is_friend]

friends_of_five

[4, 6, 7]