## 학습정리

### 4장. 선형대수 

#### 4.1 벡터
* python에서 가장 간단하게 표현 하는 법 : 리스트
    * Vector : float 객체를 갖고 있는 리스트 타입으로 명시
    * python리스트는 벡터가 아니어서 벡터 연산을 해주는 기본적인 도구가 없음
        * 벡터 덧셈 : 같은 위치의 성분끼리 더하는 것 : zip사용
        * 벡터 곱셈 : 각 원소 마다 스칼라를 곱해 줘야 함 
        * 벡터 내적(dot product) : 각 성분별 곱한 값을 더해준 값
            * 내적을 이용한 각 성분 제곱의 합 : 같은 벡터를 내적
            * 벡터의 크기 : 제곱합의 제곱근  
        * 두 벡터 간의 거리 : (두 벡터의 차)의 제곱합의 제곱근 
        
#### 4.2 행렬
* 행렬(matrix) : 2차원으로 구성된 숫자의 집합, 리스트의 리스트로 표현 가능
    * 리스트 안의 리스트 : 행렬의 행을 나타냄 , 모두 같은 길이를 가짐
    * 행렬A : 행 = len(A) , 열 = len(A[0])
* 행렬의 사용
    1. 여러 벡터로 구성된 데이터 셋을 표현
    2. k차원의 벡터를 n차원 벡터로 변환해주는 선형 함수를 n x k행렬로 표현
    3. 행렬로 이진 관계(binary relationship)를 표현
        * 네트워크의 엣지(edge)들을 (i,j)쌍의 집합으로 표현
        
#### 4.3 더 공부해 보고 싶다면
* 세인트 마이클스 칼리지에서 제공하는 선형대수 교과서
* UC Davis 대학교에서 제공하는 선형대수 교과서
* Linear Algebra Done Wrong
* Numpy를 사용하면 더 편하게 함수 사용가능

## 코드 정리

In [3]:
from typing import List

# Vector : float 객체를 갖고 있는 리스트 타입으로 명시
Vector = List[float]

height_weight_age = [70,
                    170,
                    40]
grades = [95,
          80,
          75,
          62]


In [4]:
# 벡터 덧셈 : 같은 위치의 성분끼리 더하는 것 : zip사용
def add(v: Vector, w: Vector) -> Vector :
    """각 성분끼리 더함"""
    assert len(v) == len(w), "vectors must be the same length" # v,w의 길이가 같아야 함
    return [v_i + w_i for v_i,w_i in zip(v,w)]

assert add([1,2,3],[4,5,6]) == [5,7,9] # 성립 

In [6]:
# 벡터 뻴셈 : 같은 위치의 성분끼리 빼는 것 : zip사용
def subtract(v: Vector, w: Vector) -> Vector :
    """각 성분끼리 뺀다."""
    assert len(v) == len(w), "vectors must be the same length"
    return [v_i - w_i for v_i,w_i in zip(v,w)]

assert subtract([5,7,9],[4,5,6]) == [1,2,3]

In [11]:
# vector의 리스트를 인자로 받음
def vector_sum(vectors : List[Vector]) -> Vector :
    """모든 벡터의 각 성분들 끼리 더함"""
    # vectors가 비어있는지 확인
    assert vectors, "no vectors provided!"
    
    # 모든 벡터의 길이가 동일한지 확인 
    num_elements = len(vectors[0])
    assert all(len(v) == num_elements for v in vectors), "diffrent sizes!" #첫 번째 벡터의 길이와 나머지 길이들을 비교
    
    # i번째 결괏값은 모든 벡터의 i번째 성분을 더한 값
    return [sum(vector[i] for vector in vectors)
           for i in range(num_elements)]

assert vector_sum([[1,2],[3,4],[5,6],[7,8]]) == [16,20]
 

In [9]:
# np.sum( , axis = 0)
np.sum([[1,2],[3,4],[5,6],[7,8]], axis = 0)

array([16, 20])

In [16]:
# 벡터 곱셈 : 각 원소 마다 스칼라를 곱해 줘야 함
def scalar_multiply(c:float, v: Vector)-> Vector :
    """모든 성분을 c로 곱하기"""
    return [c*v_i for v_i in v]

assert scalar_multiply(2,[1,2,3]) == [2,4,6]

In [18]:
def vector_mean(vectors: List[Vector])-> Vector:
    """각 성분별 평균을 계산"""
    n = len(vectors)
    return scalar_multiply(1/n, vector_sum(vectors)) # 모든 성분에 1/벡터길이 곱하기

assert vector_mean([[1,2],[3,4],[5,6]]) == [3,4]

In [7]:
# vector mean
import numpy as np
np.mean([[1,2],[3,4],[5,6]], axis=0)

array([3., 4.])

In [22]:
# 벡터 내적(dot product) : 각 성분별 곱한 값을 더해준 값
def dot(v: Vector, w: Vector) -> float :
    """v_1*w_1+++++v_n*w_n"""
    assert len(v) == len(w), "vectors must be same length" # 벡터끼리 길이가 같아야 내적가능
    
    return sum(v_i*w_i for v_i,w_i in zip(v,w))

assert dot([1,2,3],[4,5,6]) == 32

In [10]:
np.dot([1,2,3],[4,5,6])

32

In [23]:
# 벡터 제곱합
def sum_of_squares(v: Vector) -> float :
    """v_1*v_1+...+v_n*v_n"""
    return dot(v,v)

assert sum_of_squares([1,2,3]) == 14 # 1*1 + 2*2 + 3*3

In [24]:
# 벡터의 크기
import math # math.sqrt : 제곱근

def magnitude(v:Vector) -> float :
    """벡터 v의 크기를 반환"""
    return math.sqrt(sum_of_squares(v))

assert magnitude([3,4]) == 5

In [25]:
# 두 벡터간의 거리

def squared_distance(v: Vector, w: Vector) -> float :
    """(v_1 - w_1) ** 2 +...+ (v_n - w_n) ** 2 """
    return sum_of_squares(subtract(v,w))

def distance(v: Vector, w: Vector) -> float :
    """벡터 v와 w간의 거리를 계산"""
    return math.sqrt(squared_distance(v,w))


In [26]:
# 벡터 끼리 차의 크기 = 거리 
def distance(v: Vector, w:Vector) -> float :
    return magnitude(subtract(v,w))
    

In [27]:
# 행렬 = 리스트 안의 리스트 : 행렬의 행을 나타냄 , 모두 같은 길이를 가짐
Matrix = List[List[float]] # 타입 명시

A = [[1,2,3], # A는 2개의 행과 3개의 열로 구성되어 있다.
     [4,5,6]] 

B = [[1,2], # B는 3개의 행과 2개의 열로 구성되어 있다. 
     [3,4],
     [5,6]]


In [28]:
from typing import Tuple

def shape(A : Matrix) -> Tuple[int, int] :
    """(행의 개수,열의 개수)반환"""
    num_rows = len(A)
    num_cols = len(A[0]) if A else 0 # 첫 번째 행의 원소의 개수
    return num_rows, num_cols

assert shape([[1,2,3],[4,5,6]]) == (2,3) # 2행 , 3열

In [31]:
def get_row(A : Matrix, i :int)-> Vector : 
    """A의 i번째 행을 반환"""
    return A[i]

def get_column(A : Matrix, j : int) -> Vector :
    """A의 j번째 열을 반환"""
    return [A_i[j] for A_i in A]


In [33]:
shape(A)

(2, 3)

In [36]:
print(A)
get_row(A,1)

[[1, 2, 3], [4, 5, 6]]


[4, 5, 6]

In [37]:
# 형태가 주어졌을 때 형태에 맞는 행렬 생성하는 함수
from typing import Callable

def make_matrix(num_rows : int,
               num_cols : int,
               entry_fn : Callable[[int,int],float]) -> Matrix :
    """
    (i,j)번쨰 원소가 entry_fn(i,j)인 num_row x num_cols 리스트를 반환
    """
    return [[entry_fn(i,j)
            for j in range(num_cols)]
           for i in range(num_rows)]

In [39]:
def identity_matrix(n : int)-> Matrix :
    """n x n 단위 행렬을 반환 """
    return make_matrix(n, n, lambda i,j : 1 if i == j else 0) # 대각 행렬만 1


In [3]:
# 네트워크 표현 예제
friendships = [(0,1),(0,2),(1,2),(1,3),(2,3),(3,4),(4,5),(5,6),(5,7),(6,8),(7,8),(8,9)]

         # 사용자  0 1 2 3 4 5 6 7 8 9  
friend_matrix = [[0,1,1,0,0,0,0,0,0,0], # 사용자 0
                 [1,0,1,1,0,0,0,0,0,0], # 사용자 1
                 [1,1,0,1,0,0,0,0,0,0], # 사용자 2
                 [0,1,1,0,1,0,0,0,0,0], # 사용자 3
                 [0,0,0,1,0,1,0,0,0,0], # 사용자 4
                 [0,0,0,0,1,0,1,1,0,0], # 사용자 5
                 [0,0,0,0,0,1,0,0,1,0], # 사용자 6
                 [0,0,0,0,0,1,0,0,1,0], # 사용자 7
                 [0,0,0,0,0,0,1,1,0,1], # 사용자 8
                 [0,0,0,0,0,0,0,0,1,0]] # 사용자 9

# 네트워크 안에 연결된 사용자의 수가 적다면 행렬은 수많은 0을 저장해야 하므로 비효율적
# 하지만 두사용자가 연결되어 있는지 훨씬 빠르게 확인 가능
assert friend_matrix[0][2] == 1 , "참, 사용자 0과 2는 친구다"
assert friend_matrix[0][8] == 0 , "거짓, 사용자 0과 8은 친구가 아니다"                

In [5]:
# 하나의 행만 살펴보면 된다
friends_of_five = [i for i, is_friend in enumerate(friend_matrix[5])
                  if is_friend]
friends_of_five
    
    
    

[4, 6, 7]