# Python 개인공부
### 출처 : 밑바닥부터 시작하는 데이터 과학(조엘 그루스 지음, 박은정.김한결.하성주 옮김, 인사이트, 2016)
---

# 4장. 선형대수

# 벡터
- 벡터는 벡터끼리 더하거나 상수와 곱해지면 새로운 벡터를 생성하는 개념적인 도구
- 벡터는 어떤 유한한 차원의 공간에 존재하는 점들
- ex) 수많은 사람들의 키, 몸무게, 나이에 대한 데이터 => (키, 몸무게, 나이)로 구성된 3차원 벡터
- 벡터를 가장 간단하게 표현하는 방법은 숫자로 구성된 list로 표현

### 하지만 list로 벡터를 표현하는 방법의 문제점은 list를 통해 벡터 연산을 할 수 없다. => numpy
### list comprehension으로 구성한 벡터 연산

In [25]:
def vector_add(v, w):
    '''각 성분끼리 더한다'''
    return [v_i + w_i 
            for v_i, w_i in zip(v, w)]

In [22]:
def vector_subtract(v, w):
    '''각 성분끼리 뺀다'''
    return [v_i - w_i
           for v_i, w_i in zip(v, w)]

In [3]:
a = [1, 2] 
b = [3, 4]
zip(a,b)

[(1, 3), (2, 4)]

### 가끔씩 벡터로 구성된 list에서 모든 벡터의 각 성분을 더하고 싶은 경우

In [4]:
def vector_sum(vectors):
    '''모든 벡터의 각 성분들끼리 더한다.'''
    result = vectors[0]                         # 첫 번째 벡터부터 시작해서
    for vector in vectors[1:]:                  # 나머지 벡터들을
        result = vector_add(result, vector)     # 더해 준다.
    return result

### 이 방법은 벡터 list에 vector_add를 누적 시켜서 적용하는 것
### reduce 함수 : 순서형 자료(문자열, 리스트, 튜플)의 원소들을 누적적으로 함수에 적용

In [6]:
def vector_sum(vectors):
    return reduce(vector_add, vectors)

In [11]:
from functools import partial

vector_sum = partial(reduce, vector_add)

### 벡터에 스칼라를 곱해 줄 수 있어야 한다. 
### 스칼라 곱셈은 벡터의 각 원소마다 스칼라 값을 곱해 주는 방법으로 간단하게 구현 가능

In [12]:
def scalar_multiply(c, v):
    '''c는 숫자, v는 벡터'''
    return [c * v_i for v_i in v]

### 같은 길이의 벡터로 구성된 list가 주어졌을 때 각 성분별 평균

In [13]:
def vector_mean(vectors):
    '''i번째 성분이 입력된 벡터의 i번째 성분의 평균을
    의미하는 벡터로 계산해 준다.'''
    n = len(vectors)
    return scalar_multiply(1/n, vector_sum(vectors))

### 벡터의 내적 : 벡터의 각 성분별 곱한 값을 더해 준 값

In [15]:
def dot(v, w):
    '''v_1*w_1 + ... + v_n*w_n'''
    return sum(v_i * w_i 
              for v_i, w_i in zip(v, w))

- 내적은 벡터 v가 벡터 w방향으로 얼마나 멀리 뻗어 나가는지를 나타낸다.
- w = [1, 0]이면 dot(v, w)는 v의 첫 번째 성분
- 내적은 v가 w로 투영된 벡터의 길이를 나타낸다.
- 내적의 개념을 사용하면, 각 성분의 제곱 값의 합을 쉽게 구할 수 있다.

In [17]:
def sum_of_squares(v):
    '''v_1*v_1 + ... + v_n*v_n'''
    return dot(v, v)

### 제곱 값의 합을 이용하면 벡터의 크기를 계산할 수 있다.

In [19]:
import math

def magnitude(v):
    return math.sqrt(sum_of_squares(v)) # math.sqrt는 제곱근을 계산해주는 함수

In [20]:
def suqared_distance(v, w):
    '''(v_1 - w_1)**2 + ... + (v_n-w_n)**2'''
    return sum_of_squares(vector_subtract(v, w))

def distance(v, w):
    return math.sqrt(squared_distance(v, w))

### 복소수의 절대값을 구하는 magnitude함수 사용 간단하게 표현가능
### sqrt(x^2 + y^2)

In [26]:
def distance(v, w):
    return magnitude(vector_subtract(v, w))

# 행렬
---
- 행렬은 2차원으로 구성된 숫자의 집합이며, list의 list로 표현할 수 있다.
- list안의 list들은 행렬의 행을 나타내며 모두 같은 길이를 가지게 된다.
- ex) A라는 행렬은 A[i][j]는 i번째 행과 j번째 열에 속한 숫자

In [31]:
A = [[1, 2, 3],
    [4, 5, 6]]

In [32]:
def shape(A):
    num_rows = len(A)
    num_cols = len(A[0]) if A else 0
    return num_rows, num_cols

### 행렬이 n개의 행과 k개의 열로 구성되어 있다면 
### 이 행렬을 n X k행렬이라고 부르자

In [33]:
# A[i]는 i번째 행을 나타낸다.
def get_row(A, i):
    return A[i]

# A_i 행의 j번째 원소
# 각 A_i 행에 대해
def get_column(A, j):
    return [A_i[j]
           for A_i in A]

###  형태가 주어졌을 때, 형태에 맞는 행렬을 생성하고 각 원소를 채워 넣는 함수를 만들어보자.

In [None]:
def make_matrix(num_rows, num_cols, entry_fn):
    '''(i,j)번째 원소가 entry_fn(i,j)인
    num_rows x num_cols list를 반환'''
    return [[entry_fn(i,j)
            for j in range(num_cols)]
            for i in range(num_rows)]

### 위 함수를 이용하여, 5x5 단위 행렬(대각선의 원소는 1이고 나머지 원소는 0)을 생성해보자.

In [36]:
def is_diagonal(i, j):
    '''대각선의 원소는 1, 나머지 원소는 0'''
    return 1 if i == j else 0

identity_matrix = make_matrix(5, 5, is_diagonal)
print identity_matrix

[[1, 0, 0, 0, 0], [0, 1, 0, 0, 0], [0, 0, 1, 0, 0], [0, 0, 0, 1, 0], [0, 0, 0, 0, 1]]


### 행렬의 중요성
1. 각 벡터를 행렬의 행으로 나타냄으로써 여러 벡터로 구성된 데이터셋을 행렬로 표현할 수 있다.
1. k차원의 벡터를 n차원 벡트로 변환해주는 선형함수를 n x k행렬로 표현할 수 있다.
1. 행렬로 이진 관계를 나타낼 수 있다. ex)i와 j가 연결되어 있다면 A[i][j]의 값이 1, 그렇지 않다면 0인 행렬로 네트워크 표현 가능 