## "숫자 인식 머신러닝 알고리즘"

28x28 크기의 숫자 이미지 데이터 x가 입력되면 그 이미지가 어떤 숫자인지를 알려주는 y = y(y1, y2, .., y10)를 출력하는 함수 f를 구축하려고 한다. => **y = f(x, W, V)**

여기서 W, V는 알고리즘이 주어진 *학습 데이터를 이용하여 학습을 통해 정해야 하는 상수 행렬*이다.

숫자인식 머신러닝 알고리즘의 **목표**는 **주어진 학습 데이터로부터 W, V의 값을 잘 구해서, 새로운 이미지가 나타내는 숫자에 대해 함수 y = f(x, W, V)를 이용하여 판별**하는 것이다.

=> 학습 데이터를 이용하여 학습을 통해 정해진 W, V 행렬들을 잘 구해서 새로운거에 적용!

![image.png](attachment:image.png)

![image-2.png](attachment:image-2.png)

![image-3.png](attachment:image-3.png)

In [2]:
import numpy as np
import pickle  # 일반 텍스트를 파일로 저장할 때는 파일 입출력을 이용

def mnist_load(filename):
    Images = open(filename + 'images.bin', 'rb') 
    Labels = open(filename + 'labels.bin', 'rb')
    # open(filename, 'rb') => r은 읽기용으로 열기, b는 이진 모드로 열기. 즉, 이진파일을 읽기전용 모드로 여는 것
    
    X = pickle.load(Images)/255.0
    T = pickle.load(Labels)
    Images.close()
    Labels.close()
    return (X, T)

def sigmoid(x):
    return 1.0/(1.0+np.exp(-x))

def d_sigmoid(u):
    return np.exp(-u)/(1.0+np.exp(-u))**2

(X, T) = mnist_load('train')
input_node = 28*28
hidden_node = 30
output_node =10
np.random.seed(10)

w = 0.1*(2*np.random.random((hidden_node, input_node+1))-1)
v = 0.1*(2*np.random.random((output_node, hidden_node+1))-1)
xl = np.ones((input_node+1, 1))
z = np.ones((hidden_node+1, 1))
y = np.ones((output_node, 1))
eta = 0.05; MaxIter = 50; Tol = 1.0e-10; Resid = Tol*2;
Iter = 1; E1 = 0

for m in range(len(X)):
    xl[1: ,0] = X[m]
    uh = np.dot(w, xl)
    z[1: ,:] = sigmoid(uh)
    uo = np.dot(v, z)
    y = sigmoid(uo)
    t = np.zeros([output_node, 1])
    t[T[m]] = 1.0
    E1 = E1 +np.sum((y-t)**2)
E1 = E1/len(T)
print('%i-th update and error is %f' %(Iter-1, E1))
while Resid >= Tol and Iter <= MaxIter:
    for m in range(len(X)):
        xl[1:,0] = X[m]
        uh = np.dot(w, xl)
        z[1:, :] = sigmoid(uh)
        uo = np.dot(v, z)
        y = sigmoid(uo)
        t = np.zeros([output_node, 1])
        t[T[m]] = 1.0
        del_k = (y-t)*d_sigmoid(uo)
        dEdv = np.dot(del_k, z.T)
        del_j = d_sigmoid(uh)*np.dot(v[:,1:].T,del_k)
        dEdw = np.dot(del_j,xl.T)
        v = v-eta*dEdv
        w = w-eta*dEdw
    E2 = 0;
    for m in range(len(T)):
        xl[1:,0] = X[m]
        uh = np.dot(w,xl)
        z[1:,:] = sigmoid(uh)
        uo = np.dot(v,z)
        y = sigmoid(uo)
        t=np.zeros([output_node,1])		
        t[T[m]] = 1.0
        E2 = E2+np.sum((y-t)**2)
    E2 = E2/len(T)
    Resid = abs(E2-E1)
    E1=E2
    print("%i-th update and error is %f" %(Iter,E1))
    Iter+=1
print("The learning is finished")
np.savez('learningdata', w=w,v=v)

0-th update and error is 2.493259
1-th update and error is 0.140393
2-th update and error is 0.111070
3-th update and error is 0.097252
4-th update and error is 0.088757
5-th update and error is 0.082789
6-th update and error is 0.078272
7-th update and error is 0.074623
8-th update and error is 0.071575
9-th update and error is 0.068964
10-th update and error is 0.066679
11-th update and error is 0.064638
12-th update and error is 0.062764
13-th update and error is 0.061029
14-th update and error is 0.059438
15-th update and error is 0.057989
16-th update and error is 0.056659
17-th update and error is 0.055410
18-th update and error is 0.054226
19-th update and error is 0.053116
20-th update and error is 0.052078
21-th update and error is 0.051115
22-th update and error is 0.050219
23-th update and error is 0.049380
24-th update and error is 0.048594
25-th update and error is 0.047861
26-th update and error is 0.047177
27-th update and error is 0.046535
28-th update and error is 0.04

## K 최근접 이웃 알고리즘을 이용한 필기체 숫자 인식

OpenCV 필기체 숫자 데이터는 OpenCV 깃허브에서 제공하는 숫자데이터를 이용.
https://github.com/opencv/opencv/blob/master/samples/data/digits.png

-------------------------------------------------------------------------------------
**OpenCV(Open Source Computer Vision Library)**: 오픈 소스로 활발하게 개발 되고 있는 컴튜어 비전 및 머신 러닝 라이브러리이며, 머신러닝 알고리즘과 기본적인 영상처리, 객체 검출, 객체 인식, 객체 추적 등등 영상처리 관련 문제 해결을 위한 알고리즘을 제공하고 현재도 활발하게 여러 알고리즘이 개발이 되고 있다.

**OpenCV는 처음 개발을 할 때부터 실시간 처리를 생각하며 개발**되었기 때문에 하드웨어 플랫폼에서도 빠르게 동작한다. 기본적으로 C/C++ 베이스로 개발이 되었지만 Python, Java 등등 여러 인터페이스도 제공을 하며 운영체제도 Window, Linux, MacOS와 Android, IOS 등 모바일 환경에서도 원활하게 동작한다. **라이센스 같은 경우는 BSD 라이센스를 따르기 때문에 연구 및 상업적 용도로 자유롭게 사용 가능하다.**

-------------------------------------------------------------------------------------

### KNN 필기체 숫자 인식
데이터에는 20x20 숫자 영상이 가로 100개, 세로 50개 총 5000개의 숫자가 있다.
각 행에 100개의 데이터가 있고 각 숫자(0~9)는 5줄마다 구분된다.

이 데이터를 이용해서 머신러닝 알고리즘을 학습시키고 추론까지 진행~!

### KNN 필기체 숫자 인식 흐름도
20x20 크기의 영상 하나를 1행으로 나열합니다. (1x400)

전체 벡터를 하나의 행렬로 묶어서 표현합니다. (1x400 크기의 벡터 5000개)

그러면 5000x400 크기의 행렬 1개가 되는데 이를 KNearest에 입력으로 줍니다.

