인공신경망

분석 -> 머신러닝

도메인 전문가가 아닌데도, 머신러닝이 데이터 패턴을 찾기 때문에 머신러닝이 데이터를 분석할 수 있게 된다.
머신러닝에서는 프로그램이 여러 개일 필요가 없다.
데이터 자체로 분석하기 때문에, 대신 데이터가 상당히 많아야 머신러닝이 분석하기 좋다.

EX) 알파고의 경우도 학습 데이터량이 어마어마하게 많다.

입력층 여러개 -> 시그모이드 함수를 넣어 출력값을 뽑아내는 것!-

입력, 출력층이라 '선형'밖에 안 됨!

다층 퍼셉트론: 입력층 -> 은닉층 -> 출력층

MLP; Multi layers perceptron

노드를 두 개를 둘 수 있음.

각 노드 안에 ' 시그마| f '

각 노드 계산 값을 합산해서 출력값에! (각 노드값이 그래프 위에 그려짐)

직관적 설명: 동일한 데이터를 은닉층에서 다르게 보는 것. 그리고 이것을 합산하면, (수학상으로는 w값의 변화) 또 다른 데이터를 볼 수 있다는 것!

히든 노드 1개: 선형

히든 노드 2개: 평행

히든 노드 3개: '다각형' (비선형)

히든 노드 4개 이상: '곡률'

-> 깊이가 깊어질수록 '비선형' 모델!

-> 인공신경망은 다양한 형태의 벡터 모양을 만들어낸다.

-> 우리가 생각하지 못한 아주 다양한 형태의 다항식이 나오고, 생각지도 못한 데이터 결과가 나올 수 있다.

-> 비선형으로 데이터를 정형화할 수 있기 때문에, SVM과 인공신경망은 유용하게 쓰인다.

층이 많고, 노드가 많아지면 속도가 어마어마하게 느려진다.
손실함수 Cost Function == Loss Function
햇 기호 y : 예측치
Hidden Layer가 3층 이상이면, Deep Neural Network (DNN). (굳이 안 나눠도 됨.)
딥러닝: 다층 퍼셉트론(MLP) & 심층 퍼셉트론(DNN)
다층 퍼셉트론과 비슷하게 신경망 모델을 하는 'Word2Vec'
층이 많아지면 w 연산 속도가 엄청 떨어지고, 오버피팅이 생긴다. 같은 데이터를 또 보고 또 보고 하는 것. (결정 트리와 다를 게 없다.) 정확할 수는 있지만, 층이 많아지면 w값을 구하기가 너무 어렵다!! => 역전파 알고리즘으로 해결!!