### 벡터

- 벡터: 벡터끼리 더하거나 상수와 곱해지면 새로운 벡터를 생성하는 개념적 도구
- 벡터는 어떤 유한한 차원의 공간에 존재하는 점들
- 벡터는 크키와 방향을 갖는다

In [31]:
# 벡터를 연산할 수 있는 함수를 간단히 만들어보자
from __future__ import division

# 벡터를 가장 간단하게 표현하는 방법은 숫자로 구성된 list를 표현하는 것
height_weight_age = [70, # height
                     80, # weight
                     40] # age
grades = [95, # 시험1 점수
         80, # 시험2 점수
         75, # 시험3 점수
         62] # 시험4 점수

# 두 벡터를 더하거나 빼보자
v = [4, 5, 2]
w = [3, 9, 4]

# 덧셈은 zip을 사용해 두 벡터를 묶은 후, 배열의 각 성분끼리 더하는 리스트 컴프리헨션을 적용하면 된다
def vector_add(v, w):
    return [v_i + w_i
           for v_i, w_i in zip(v, w)]

print vector_add(v, w)

# 같은 방법으로 뺄 수도 있다
def vector_substract(v, w):
    return [v_i - w_i
           for v_i, w_i in zip(v, w)]

print vector_substract(v, w)

# 벡터로 구성된 전체 리스트에서 모든 벡터의 각 성분을 더하고 싶은 경우도 있다
vectors = [
    [4, 5, 2],
    [3, 9, 4],
    [1, 7, 2]
]

def vector_sum(verctos):
    result = vectors[0] # 첫 번째 벡터부터 시작해서
    for vector in vectors[1:]:
        result = vector_add(result, vector)
    return result

print vector_sum(vectors)

# reduce로 처리하면 더 간략할 것이다
def vector_sum(vectors):
    return reduce(vector_add, vectors)

print vector_sum(vectors)

# 아래처럼 파샬을 사용해 만들어둬도 좋다
from functools import partial
vector_sum = partial(reduce, vector_add)

print vector_sum(vectors)

# 벡터에 스칼라를 곱해줄 수도 있어야 한다
def scalar_multiply(c, v):
    """c는 곱할 수, v는 벡터"""
    return [c * v_i for v_i in v]

print scalar_multiply(2, v)

# 벡터로 구성된 리스트의 평균을 구할 수도 있을 것이다
def vector_mean(vectors):
    n = len(vectors)
    return scalar_multiply(1/n, vector_sum(vectors))

print vector_mean(vectors)
    
# 벡터의 내적도 구해보자
# 내적은 각 벡터의 성분을 곱한 값의 합이다
def dot(v, w):
    return sum(v_i * w_i
              for v_i, w_i in zip(v, w))

print dot(v, w) # 65 = 12 + 45 + 8

# 내적을 이용해 각 성분의 제곱 값의 합을 쉽게 구할 수 있다
def sum_of_squares(v):
    return dot(v, v)

print sum_of_squares(v) # 45 = 4*4 + 5*5 + 2*2

# 제곱 값의 합을 이용하면 벡터의 크기를 계산할 수 있다
import math

def magnitude(v): # 면적
    return math.sqrt(sum_of_squares(v)) # math.sqrt는 제곱근을 계산

print magnitude(v)

# 두 벡터 간의 거리
# root( (v1 - w1)^2 + ... (vn - wn)^2 )
def squared_distance(v, w):
    return sum_of_squares(vector_substract(v, w))

def distance(v, w):
    return math.sqrt(squared_distance(v, w))

print distance(v, w)

# 아래처럼 수정하면 더 깔끔해진다
def distance(v, w):
    return magnitude(vector_substract(v, w))

print distance(v, w)

# 실제 벡터 연산을 할 땐, NumPy 라이브러리를 활용하자

[7, 14, 6]
[1, -4, -2]
[8, 21, 8]
[8, 21, 8]
[8, 21, 8]
[8, 10, 4]
[2.6666666666666665, 7.0, 2.6666666666666665]
65
45
6.7082039325
4.58257569496
4.58257569496


### 행렬 (Matrix)

행렬은 2차원으로 구성된 숫자의 집합이며, list의 list로 표현할 수 있다.  
list 안의 list들은 행렬의 행을 나타내며 모두 같은 길이를 갖는다.

In [42]:
A = [[1, 2, 3],
    [4, 5, 6]] # A는 2개의 행(row)과, 3개의 열(column)로 구성된다

B = [[1, 2],
     [3, 4],
     [5, 6]] # B는 3개의 행과 2개의 열

# 행렬의 형태를 계산해보자
def shape(A):
    num_rows = len(A)
    num_cols = len(A[0]) if A else 0
    return num_rows, num_cols

print shape(A) # 2x3 행렬
print shape(B) # 3x2 행렬

# nxk 행렬에서 각 행의 길이는 k이고, 열의 길이는 n이다
def get_row(A, i):
    return A[i]

def get_col(A, j):
    return [A_i[j]
           for A_i in A]

print get_row(B, 1) # [3, 4]
print get_col(B, 1) # [2, 4, 6]

# 형태가 주어졌을 때, 형태에 맞는 행렬을 생성하고 채우는 함수를 만들어보자
def make_matrix(num_rows, num_cols, entry_fn):
    """(i, j)번째 원소가 entry_fn(i, j)인 행렬"""
    return [[entry_fn(i, j)
             for j in range(num_cols)]
            for i in range(num_rows)]

def is_diagonal(i, j): # 대각선 원소는 1, 아니면 0
    return 1 if i == j else 0

print make_matrix(5, 5, is_diagonal)

(2, 3)
(3, 2)
[3, 4]
[2, 4, 6]
[[1, 0, 0, 0, 0], [0, 1, 0, 0, 0], [0, 0, 1, 0, 0], [0, 0, 0, 1, 0], [0, 0, 0, 0, 1]]


행렬은 몇 가지 이유로 매우 중요하다
- 벡터를 행렬의 행으로 나타내면, 여러 벡터로 구성된 데이터셋을 행렬로 표현할 수 있다
  - 예를 들어, 1000명에 대한 키, 몸무게, 나이를 1000x3 행렬로 표현할 수 있다
- *k*차원의 벡터를 *n*차원 벡터로 변환해주는 선형함수를 *n*x*k* 행렬로 표현할 수 있다
- 행렬로 **이진 관계(binary relationship)**을 표현할 수 있다
  - 1장에서 네트워크 엣지(edge)를 (i,j) 쌍의 집합으로 표현했는데, 이런 구조를 행렬로 나타낼 수 있다
  - 예를 들어, i와 j가 연결되어 있으면, `A[i][j]`의 값이 1이고, 아니면 0인 행려로 표현할 수 있다

In [47]:
# 1장에서 아래와 같이 표현했다면,
friendships = [(0, 1), (0, 2), (1, 2), (1, 3), (2, 3), (3, 4),
              (4, 5), (5, 4), (5, 7), (6, 8), (7, 8), (8, 9)]

# 아래와 같이 표현할 수 있다
        # 사용자 0   1  2  3  4  5  6  7  8  9
friendships = [[0, 1, 1, 0, 0, 0, 0, 0, 0, 0], # 사용자 0
               [1, 0, 1, 1, 0, 0, 0, 0, 0, 0], # 사용자 1
               [1, 1, 0, 1, 0, 0, 0, 0, 0, 0], # 사용자 2
               [0, 1, 1, 0, 1, 0, 0, 0, 0, 0], # 사용자 3
               [0, 0, 0, 1, 0, 1, 0, 0, 0, 0], # 사용자 4
               [0, 0, 0, 0, 1, 0, 0, 1, 0, 0], # 사용자 5
               [0, 0, 0, 0, 0, 0, 0, 0, 1, 0], # 사용자 6
               [0, 0, 0, 0, 0, 1, 0, 0, 1, 0], # 사용자 7
               [0, 0, 0, 0, 0, 0, 1, 1, 0, 1], # 사용자 8
               [0, 1, 1, 0, 0, 0, 0, 0, 1, 0], # 사용자 9
              ]

# 행렬에서는 두 사용자가 연결되어 있는지 빠르게 확인할 수 있다
print friendships[0][2] == 1 # 사용자 0과 2가 친구인지 여부
print friendships[0][3] == 1 # 사용자 0과 3이 친구인지 여부

# 사용자가 누구와 연결되어 있는지는 해당 사용자를 나타내는 열 또는 행을 살펴보면 된다
friends_of_five = [i
                  for i, is_friend in enumerate(friendships[5])
                  if is_friend]
print friends_of_five

True
False
[4, 7]
