# Vector representation of python <br>
* Vector를 파이썬으로 표시하는 다양한 방법 존재
* 최선의 방법은 없음
* 값의 변경 유무, 속성값 유무에 따라 선택할 수 있음
* 여기서는 기본적으로 list로 vector 연산 실시

In [5]:
# 좋지 못한 코드
u = [2, 2]
v = [2, 3]
z = [3, 5]
result = []
for i in range(len(u)):
    result.append(u[i] + v[i] + z[i])

print(result)

[7, 10]


In [6]:
# zip을 사용하여 vector 계산
u = [1, 2, 3]
v = [4, 5, 6]

result = [sum(z) for z in zip(u,v)]
print(result)

[5, 7, 9]


In [3]:
u = [1, 2, 3]
v = [4, 5, 6]
a = 5
[5 * sum(z) for z in zip(u,v)]

[25, 35, 45]

## Vector의 계산 : Scalar Vector product

In [7]:
u = [1, 2, 3]
v = [4, 5, 6]
alpha = 2

result = [alpha*sum(z) for z in zip(u,v)]
print(result)

[10, 14, 18]


# Matrix representation of python <br>
* Matrix 역시 Python으로 표시하는 다양한 방법이 존재
* 특히 dict로 표현할 때는 무궁무진한 방법이 있음
* 여기서는 기본적으로 two-dimensional list 형태로 표현
* [[1번째 row], [2번째 row], [3번째 row]]

In [8]:
vector_a = [1, 2, 10] # List로 표현한 경우
vector_b = (1, 2, 10) # Tuple로 표현한 경우
vector_c = {'x': 1, 'y': 1, 'z': 10} # dict로 표현한 경우

print(vector_a, vector_b, vector_c)

[1, 2, 10] (1, 2, 10) {'x': 1, 'y': 1, 'z': 10}


## Matrix의 계산 : Matrix addition

In [12]:
matrix_a = [[3, 6], [4, 5]]
matrix_b = [[5, 8], [6, 7]]
result = [[sum(row) for row in zip(*t)] # Asterisk로 unpack (2) - zip(3)
             for t in zip(matrix_a, matrix_b)] #Tuple로 묶음 (1)
print(result)

[[8, 14], [10, 12]]


## Matrix의 계산 : Scalar-Matrix Product

In [13]:
matrix_a = [[3, 6], [4, 5]]
alpha = 4
result = [[alpha * element for element in t] for t in matrix_a]

print(result)

[[12, 24], [16, 20]]


## Matrix의 계산 : Matrix Transpose

In [15]:
# Asterisk로 unpack 후 zip으로 col별로 묶임
matrix_a = [[1, 2, 3], [4, 5, 6]]
result = [[element for element in t] for t in zip(*matrix_a)]

print(result)

[[1, 4], [2, 5], [3, 6]]


## Matrix의 계산 : Matrix Product

In [20]:
matrix_a = [[1, 1, 2], [2, 1, 1]]
matrix_b = [[1, 1], [2, 1], [1, 3]]
result = [[sum(a * b for a, b in zip(row_a, column_b)) 
          for column_b in zip(*matrix_b) for row_a in matrix_a]]
print(result)

[[5, 5, 8, 6]]


# 문자를 Vector로 - One-hot Encoding<br>
* 하나의 단어를 Vector의 index로 인식, 단어 존재시 1 없으면 0

## Bag of words <br>
* 단어별로 인덱스를 부여해서, 한 문장(또는 문서)의 단어의 개수를 Vector로 표현

## 유사성 <br>
* 고등학교때 배운 2차원 평면상 거리측정 방법들
* Euclidian distance - 피타고라스 정리, 두 점 사이의 직선의 거리
* Cosine distance - 두 점 사이의 각도
* Cosine distance를 더 사용 많이 함