## 4.1. 벡터
- 벡터는 벡터끼리 더하거나 상수와 곱해지면 새로운 벡터를 생성하는 개념적인 도구이다.
- 벡터는 어떤 유한한 차원의 공간에 존재하는 점들이다.
- 대부분의 데이터, 특히 숫자로 표현된 데이터는 벡터로 표현할 수 있다.
- 벡터를 가장 간단하게 표현하는 방법은 숫자로 구성된 list로 표현하는 것이다.<br>(예를 들어, 3차원 벡터는 세 개의 숫자로 구성된 list로 표현할 수 있다.)

In [7]:
# from __future__ import division # want 3 / 2 == 1.5
import re, math, random # regexes, math functions, random numbers
import matplotlib.pyplot as plt # pyplot
from collections import defaultdict, Counter
from functools import partial

In [8]:
height_weight_age = [70, 170, 40]  # 인치, 파운드, 나이
grades = [95, 80, 75, 62]  # 시험 1, 2, 3, 4의 점수

In [9]:
def vector_add(v, w):
    '''각 성분끼리 더한다'''
    return [v_i + w_i 
           for v_i, w_i in zip(v, w)]

def vector_subtract(v, w):
    '''각 성분끼리 뺀다'''
    return [v_i - w_i
           for v_i, w_i in zip(v, w)]

In [15]:
print(vector_add(height_weight_age, grades))
print(vector_subtract(height_weight_age, grades))

[165, 250, 115]
[-25, 90, -35]


In [25]:
def vector_sum(vectors):
    '''모든 벡터의 각 성분들끼리 더한다'''
    result = vectors[0]  # 첫 번째 벡터부터 시작해서
    for vector in vectors[1:]:  # 나머지 벡터들을
        result = vector_add(result, vector)  # 더해 준다.
    return result

# 이 방법은 벡터 list에 vector_add를 누적시켜서 적용하는 것과 다를 것이 없다.
# 즉, reduce를 사용해서 더 간략하고 일반적인 함수로 표현할 수도 있다.
def vector_sum(vectors):
    return reduce(vector_add, vectors)

In [None]:
# 아니면 다음과 같이 조금 더 멋있게 표현할 수도 있다.
vector_sum = partial(reduce, vector_add)

In [30]:
# 벡터에 스칼라를 곱해주기
def scalar_multiply(c, v):
    '''c는 숫자, v는 벡터'''
    return[c * v_i for v_i in v]

In [34]:
scalar_multiply(2, grades)

[190, 160, 150, 124]

In [13]:
# 같은 길이의 벡터로 구성된 list가 주어졌을 때 각 성분별 평균을 구할 수 있다.
def vector_mean(vectors):
    '''i번째 성분이 입력된 벡터의 i번째 성분의 평균을 의미하는 벡터를 계산해 준다.'''
    n = len(vectors)
    return scalar_multiply(1/n, vector_sum(vectors))

In [38]:
# 벡터의 내적은 벡터의 각 성분별 곱한 값을 더해 준 값이다.
# 내적은 벡터 v가 벡터 w 방향으로 얼마나 멀리 뻗어 나가는지를 나타낸다.
def dot(v, w):
    '''(v_1 * w_1) + ... + (v_n * w_n)'''
    return sum(v_i * w_i
              for v_i, w_i in zip(v, w))

# 내적의 개념을 사용하면, 각 성분의 제곱 값의 합을 쉽게 구할 수 있다.
def sum_of_squares(v):
    '''(v_1 * v_1) + ... + (v_n * v_n)'''
    return dot(v, v)

# 제곱 값의 합을 이용하면 벡터의 크기를 계산할 수 있다.
import math
def magnitude(v):
    return math.sqrt(sum_of_squares(v))  # math.sqrt는 제곱근을 계산해 주는 함수

def squared_distance(v, w):
    '''(v_1 - w_1) ** 2 + ... + (v_n - w_n) ** 2'''
    return sum_of_squares(vector_subtract(v, w))

def distance(v, w):
    return magnitude(vector_subtract(v, w))

## 4.2. 행렬
- 행렬은 2차원으로 구성된 숫자의 집합이며, list의 list로 표현할 수 있다.
- list 안의 list들은 행렬의 행을 나타내며 모두 같은 길이를 가지게 된다.
- 행렬은 몇 가지 이유로 중요해질 것이다.
>1) 각 벡터를 행렬의 행으로 나타냄으로써 여러 벡터로 구성된 데이터셋을 행렬로 표현할 수 있다.<br>
>2) k차원의 벡터를 n차원 벡터로 변환해주는 선형함수를 n x k 행렬로 표현할 수 있다.<br>
>3) 행렬로 이진관계(binary relationship)를 나타낼 수 있다.

In [39]:
A = [[1, 2, 3], [4, 5, 6]]  # A는 2개의 행과 3개의 열로 구성되어 있다.
B = [[1, 2], [3, 4], [5, 6]]  # B는 3개의 행과 2개의 열로 구성되어 있다.

In [40]:
# 행렬을 list들의 list로 나타내는 경우, 행렬 A는 len(A)개의 행과 len(A[0])개의 열로 구성되어 있다.
def shape(A):
    num_rows = len(A)
    num_cols = len(A[0]) if A else 0  # 첫 번째 행이 갖고 있는 원소의 수
    return num_rows, num_cols

print(shape(A))
print(shape(B))

(2, 3)
(3, 2)


In [42]:
# 행렬이 n개의 행과 k개의 열로 구성되어 있다면 이 행렬을 n x k 행렬이라고 부르자.
# n x k 행렬에서 각 행의 길이는 k이고 각 열의 길이는 n이다.
def get_row(A, i):
    return A[i]  # A[i]는 i번째 행을 나타낸다.

def get_column(A, j):
    return [A_i[j]  # A_i행의 j번째 원소
           for A_i in A]  # 각 A_i행에 대해

print(get_row(A,0))  # A행렬의 0번째 행 출력
print(get_column(A,0))  # A행렬의 0번째 열 출력

[1, 2, 3]
[1, 4]


In [50]:
# 이제 형태가 주어졌을 때, 형태에 맞는 행렬을 생성하고 각 원소를 채워 넣는 함수를 만들어 보자.
# 중첩된 list coprehension을 사용해서 만들어 볼 것이다.
def make_matrix(num_rows, num_cols, entry_fn):
    '''(i, j)번째 원소가 entry_fn(i, j)인 num_rows x num_cols list를 반환'''
    return [[entry_fn(i, j)  # i가 주어졌을 때, list를 생성한다.
            for j in range(num_cols)]  # [entry_fn(i, 0), ...]
            for i in range(num_rows)]  # 각 i에 대해 하나의 list를 생성한다.

In [55]:
# 5x5 단위 행렬(대각선의 원소는 1이고 나머지 원소는 0인 경우)를 생성할 수 있다.
def is_diagonal(i, j):
    '''대각선의 원소는 1, 나머지 원소는 0'''
    return 1 if i == j else 0

identity_matrix = make_matrix(5, 5, is_diagonal)
identity_matrix

[[1, 0, 0, 0, 0],
 [0, 1, 0, 0, 0],
 [0, 0, 1, 0, 0],
 [0, 0, 0, 1, 0],
 [0, 0, 0, 0, 1]]

In [56]:
#          user 0  1  2  3  4  5  6  7  8  9
#
friendships = [[0, 1, 1, 0, 0, 0, 0, 0, 0, 0], # user 0
               [1, 0, 1, 1, 0, 0, 0, 0, 0, 0], # user 1
               [1, 1, 0, 1, 0, 0, 0, 0, 0, 0], # user 2
               [0, 1, 1, 0, 1, 0, 0, 0, 0, 0], # user 3
               [0, 0, 0, 1, 0, 1, 0, 0, 0, 0], # user 4
               [0, 0, 0, 0, 1, 0, 1, 1, 0, 0], # user 5
               [0, 0, 0, 0, 0, 1, 0, 0, 1, 0], # user 6
               [0, 0, 0, 0, 0, 1, 0, 0, 1, 0], # user 7
               [0, 0, 0, 0, 0, 0, 1, 1, 0, 1], # user 8
               [0, 0, 0, 0, 0, 0, 0, 0, 1, 0]] # user 9

In [59]:
friendships[0][2] == 1  # True
friendships[0][8] == 1  # False

False

In [63]:
# 사용자와 누구와 연결되어 있는지 알아보기 위해서는 해당 사용자를 나타내는 열(또는 행)만 살펴보면 된다.
friends_of_five = [i
                  for i, is_friend in enumerate(friendships[5])
                  if is_friend]
friends_of_five

[4, 6, 7]

## 4.3. 더 공부해 보고 싶다면
- UC Davis 대학교에서 제공하는 선형대수 교과서
- 세인트 마이클스 칼리지에서 제공하는 선형대수 교과서
- 만약 조금 더 고급 내용을 탐색해보고 싶다면 Linear Algebra Done Wrong을 참조하자
- NumPy를 사용하면 이번 장에서 만든 모든 함수들을(그리고 훨씬 더 많은 함수들을) 무료로 사용할 수 있다.