# Vector, Matrix, Tensor  
Python에서의 Vector, Matrix, Tensor는 각각  
1차원 리스트, 2차원 리스트, 3차원 이상의 리스트로 표현할 수 있습니다.  
## Vector

In [None]:
# Vectors
class Vector:
    def __init__(self,*args):
        self.items=[]
        for arg in args:
            self.items.append(arg)

    def __len__(self):
        return len(self.items)

    def __str__(self):
        return '['+' '.join(str(s) for s in self.items)+']'

    def __getitem__(self,idx):
        return self.items[idx]

u=Vector(1,2)
v=Vector(3,4)

print(u)
print(v)

## Operations between vectors
1. plus(minus)

In [None]:
# Vectors
class Vector(Vector):
    def __add__(self,other):
        if not len(self)==len(other):
            print('Vector size wrong! : {} {}'.format(len(self),len(other)))
            return
        else:
            return Vector(*[a+b for a,b in zip(self,other)])
    def __sub__(self,other):
        if not len(self)==len(other):
            print('Vector size wrong! : {} {}'.format(len(self),len(other)))
            return
        else:
            return Vector(*[a-b for a,b in zip(self,other)])

In [None]:
u=Vector(1,2)
v=Vector(3,4)

In [None]:
w=u+v
print(w)

2. Scala Mutiplication

In [None]:
class Scala:
    def __init__(self,value):
        self.value=value

    def __mul__(self,other):
        # scala multiplication
        if isinstance(other,Vector):
            return Vector(*[self.value*a for a in other])
        elif isinstance(other,int) or isinstance(other,float):
            return self.value*other

    def __str__(self):
        return str(self.value)

In [None]:
k=Scala(3)
u=Vector(1,2)
print(k*u)

3. Dot product

In [None]:
class Vector(Vector):
    def __mul__(self,other):
        if not len(self)==len(other):
            print('Vector size wrong! : {} {}'.format(len(self),len(other)))
            return
        else:
            return Vector(*[a*b for a,b in zip(self,other)])

In [None]:
u=Vector(1,2)
v=Vector(3,4)
w=u*v
print(w)

## Matrix

In [None]:
class Matrix:
    def __init__(self,*items):
        self.items=[]
        for i in range(len(items)):
            row=[]
            for j in range(len(items[i])):
                row.append(items[i][j])
            self.items.append(row)

    def __str__(self):
        line='['
        for i in range(len(self.items)):
            line+='['
            for j in range(len(self.items[i])):
                line+=str(self.items[i][j])
                if not j==len(self.items[i])-1:
                    line+=' '
            line+=']'
            if not i==len(self.items)-1:
                line+='\n'
        line+=']'
        return line

    def size(self):
        return len(self.items),len(self.items[0])

In [None]:
a=Matrix((1,2),(3,4))
b=Matrix([1,2],[3,4])
print(a)
print(b)

## Operations between matrices
1. plus(minus)

In [None]:
class Matrix(Matrix):
    def __add__(self,other):
        if not len(self.items)==len(other.items) or not len(self.items[0])==len(other.items[0]):
            print('Matrix size wrong! : {} {}'.format(self.size(),other.size()))
            return
        else:
            temp=[]
            for i in range(len(self.items)):
                row=[]
                for j in range(len(self.items[i])):
                    row.append(self.items[i][j]+other.items[i][j])
                temp.append(row)
            return Matrix(*temp)
    
    def __sub__(self,other):
        if not len(self.items)==len(other.items) or not len(self.items[0])==len(other.items[0]):
            print('Matrix size wrong! : {} {}'.format(self.size(),other.size()))
            return
        else:
            temp=[]
            for i in range(len(self.items)):
                row=[]
                for j in range(len(self.items[i])):
                    row.append(self.items[i][j]-other.items[i][j])
                temp.append(row)
            return Matrix(*temp)

In [None]:
a=Matrix([1,2],[3,4],[5,6])
b=Matrix([7,8],[9,10])
c=a+b
print(c)

2. Scala Multiplication

In [None]:
class Scala(Scala):
    def __mul__(self,other):
        # scala multiplication
        if isinstance(other,Vector):
            return Vector(*[self.value*a for a in other])

        elif isinstance(other,Matrix):
            temp=[]
            for i in range(len(other.items)):
                row=[]
                for j in range(len(other.items[i])):
                    row.append(self.value*other.items[i][j])
                temp.append(row)
            return Matrix(*temp)
            
        elif isinstance(other,int) or isinstance(other,float):
            return self.value*other

In [None]:
a=Matrix([1,2],[3,4],[5,6])
k=Scala(2)
print(k*a)

3. Matrix Multiplication

In [None]:
class Matrix(Matrix):
    def __mul__(self,other):
        if not len(self.items[0]) == len(other.items):
            print('Matrix size wrong! : {} {}'.format(self.size(),other.size()))
            return
        else:
            temp=[]
            for i in range(len(self.items)):
                row=[]
                for j in range(len(other.items[0])):
                    sum=0
                    for k in range(len(self.items[0])):
                        sum+=self.items[i][k]*other.items[k][j]
                    row.append(sum)
                temp.append(row)
            return Matrix(*temp)

In [None]:
a=Matrix([1,2],[3,4])
b=Matrix([5,6],[7,8])
c=a*b
print(c)

# Optimization  
이번에는 MSE(Mean Squared Error) 손실 함수를 이용하여  
1장에서처럼 무작정 대입하는 것이 아닌 수학적 방법(미분)을 이용하여  
최적의 매개변수를 찾아 보도록 하겠습니다.  

다뤄야 할 매개변수나 상수가 두개 이상이면 편미분이 필요합니다.  
이는 대학 수학에서 다뤄야 할 내용이기 때문에 편의를 위해 모델을 상수항이 없는 1차 함수로 정의하겠습니다.  

$$y=Wx$$
  

손실 함수 MSE는 다음과 같습니다.  
$$J(\Theta)=\cfrac{1}{n}\sum^n_{i=1}(o_i-y_i)^2$$
$$=\cfrac{1}{n}\sum^n_{i=1}({\Theta}x_i-y_i)^2$$
$$=\cfrac{1}{n}\sum^n_{i=1}(\Theta^2{x_i}^2-2\Theta{x_i}{y_i}-{y_i}^2)$$

위 손실 함수를 매개 변수에 대해 미분하면 다음과 같습니다.  

$$\nabla{J}=\cfrac{1}{n}\sum^n_{i=1}(2\Theta{x_i}^2-2x_iy_i)$$  

매개 변수의 갱신은 다음 식으로 이루어집니다.  

$$ \Theta_{new} = \Theta_{old} - \rho\nabla{J}$$

In [None]:
# 손실 함수 정의
def MSE(o,y):
    result=0
    for oi,yi in zip(o,y):
        result+=(oi-yi)**2
    return result/len(o)

In [None]:
# 그래디언트 계산 함수 정의
def gradient_MSE(W,x,y):
    result=0
    for xi,yi in zip(x,y):
        result+=2*W*(xi**2)-2*xi*yi
    return result/len(x)

In [None]:
train_x=[1,2,3,4]
train_y=[2,4,6,8]

test_x=[5,6]
test_y=[10,12]

In [None]:
lr=0.001 # learning rate

In [None]:
def model(x,W):
    return W*x

In [None]:
import random

W=random.uniform(-10,10) # -10이상 10미만의 난수로 매개변수 초기화

print('Initial parameter : {}'.format(W))

W_log=[]
loss_log=[]

for epoch in range(1000):
    preds=[]
    for xi in train_x:
        pred=model(xi,W)
        preds.append(pred)
    loss=MSE(preds,train_y)
    W_log.append(W)
    loss_log.append(loss)
    if epoch % 50==0:
        print('Training Epoch {} : W: {:.6f} Loss : {:.6f}'.format(epoch,W,loss))
    gradient=gradient_MSE(W,train_x,train_y)
    W=W-lr*gradient

In [None]:
import matplotlib.pyplot as plt
%matplotlib inline
plt.plot(W_log,loss_log)

이번에는 약간의 노이즈가 있고,  
데이터가 이전 예시보단 많은(100) 경우에서도  
학습이 제대로 이뤄지는 지 알아보도록 하겠습니다.

In [None]:
train_x=[i for i in range(1,101)]
train_y=[2*i*random.uniform(0.99,1.01) for i in range(1,101)] # y=2x 데이터에 0.99이상 1.01이하의 작은 노이즈를 준다.
plt.plot(train_x,train_y) # 학습 데이터의 x와 y를 그래프로 표시

In [None]:
lr=0.00001 # 데이터가 많아 오버플로우가 발생하므로 이전 실습보다 더 작은 학습률을 지정

In [None]:
import random

W=random.uniform(-5,5) # 오버플로우 방지를 위해 이전 실습보다 더 작은 범위에서 랜덤으로 초기 매개변수 지정

print('Initial parameter : {}'.format(W))

W_log=[]
loss_log=[]

for epoch in range(1000):
    preds=[]
    for xi in train_x:
        pred=model(xi,W)
        preds.append(pred)
    loss=MSE(preds,train_y)
    W_log.append(W)
    loss_log.append(loss)
    if epoch % 50==0:
        print('Training Epoch {} : W: {:.6f} Loss : {:.6f}'.format(epoch,W,loss))
    gradient=gradient_MSE(W,train_x,train_y)
    W=W-lr*gradient

In [None]:
# Loss Graph
plt.plot(W_log,loss_log)

In [None]:
# 실제 학습 y 데이터(파랑)와 학습 결과 모델이 예측한 데이터(주황)과의 비교
plt.plot(train_x,train_y,preds)