# CNN

- 합성곱 신경망(Convolutional Neural Network, 이하 CNN)
  - 인간의 시각 처리 방식을 모방한 신경망
  - 이미지 처리가 가능하도록 합성곱(Convolution) 연산 도입


- 합성곱층(Convolutional Layer)
  - 이미지를 분류하는 데 필요한 특징(Feature) 정보들을 추출하는 역할
  - 특징 정보는 필터를 이용해 추출
  - 합성곱층에 필터가 적용되면 이미지의 특징들이 추출된 특성 맵이라는 결과를 얻을 수 있음


- 풀링층(Pooling Layer)
  - 합성곱층의 출력 데이터(특성 맵)를 입력으로 받아서 출력 데이터인 활성화 맵의 크기를 줄이거나 특정 데이터를 강조하는 용도로 사용
  - 풀링층을 처리하는 방법: 최대 풀링, 평균 풀링, 최소 풀링(Min Pooling)
  - 정사각행렬의 특정 영역에서 최댓값을 찾거나 평균값을 구하는 방식으로 동작함


- 완전 연결층(Fully-connected Layer)
  - 합성곱층과 풀링층으로 추출한 특징을 분류하는 역할
  - CNN은 합성곱층에서 특징만 학습하기 때문에 DFN이나 RNN에 비해 학습해야 하는 가중치의 수가 적어 학습 및 예측이 빠르다는 장점
  - 최근에는 CNN의 강력한 예측 성능과 계산상의 효율성을 바탕으로 이미지 뿐만 아니라 시계열 데이터에도 적용해 보는 연구가 활발히 진행


# 워드 임베딩

- 워드 임베딩(Word Embedding)
  - 단어를 벡터로 표현하는 방법
- 원-핫 인코딩(One-hot Encoding)
  - N개의 단어를 각각 N차원의 벡터로 표현하는 방식
  - 단어가 포함되는 자리엔 1을 넣고 나머지 자리에는 0을 넣는 식
    | color | color_red | color_blue | color_green |
    | -- | -- | -- | -- |
    | red | 1 | 0 | 0 |
    | green | 0 | 0 | 1 |
    | blue | 0 | 1 | 0 |
    | red | 1 | 0 | 0 |
- 워드 투 벡터(Word2Vec)
  - 비슷한 컨텍스트에 등장하는 단어들은 유사한 의미를 지닌다는 이론에 기반하여 단어를 벡터로 표현해 주는 기법
  - 주변 단어를 알면 특정 단어를 유추할 수 있다라는 원리 기반
  - 대표적인 모델로는 CBOW와 Skip-gram이 있음
  - CBOW
    - 전체 컨텍스트로부터 특정 단어를 예측하는 것
  - Skip-gram
    - 특정 단어로부터 전체 컨텍스트의 분포(확률)를 예측하는 것


- 워드 투 벡터 예제


In [None]:
from gensim.models import Word2Vec

sentences = [
    ["the", "cat", "sat", "on", "the", "mat"],
    ["the", "dog", "chased", "the", "cat"],
    ["the", "cat", "and", "dog", "are", "friends"],
]

# Word2Vec 모델 학습 (CBOW 방식)
model = Word2Vec(sentences, vector_size=50, window=3, min_count=1, workers=4, sg=0)

# 단어 'cat'의 임베딩 벡터 출력
cat_vector = model.wv["cat"]
print(f"'cat'의 임베딩 벡터: \n{cat_vector}")

# 두 단어 사이의 유사도 계산
similarity = model.wv.similarity("cat", "dog")
print(f"'cat'과 'dog' 사이의 유사도: {similarity:.4f}")

: 

- python 3.11 에서 테스트 진행해야 함


```
'cat'의 임베딩 벡터:
[-0.01631583  0.0089916  -0.00827415  0.00164907  0.01699724 -0.00892435
  0.009035   -0.01357392 -0.00709698  0.01879702 -0.00315531  0.00064274
 -0.00828126 -0.01536538 -0.00301602  0.00493959 -0.00177605  0.01106732
 -0.00548595  0.00452013  0.01091159  0.01669191 -0.00290748 -0.01841629
  0.0087411   0.00114357  0.01488382 -0.00162657 -0.00527683 -0.01750602
 -0.00171311  0.00565313  0.01080286  0.01410531 -0.01140624  0.00371764
  0.01217773 -0.0095961  -0.00621452  0.01359526  0.00326295  0.00037983
  0.00694727  0.00043555  0.01923765  0.01012121 -0.01783478 -0.01408312
  0.00180291  0.01278507]
'cat'과 'dog' 사이의 유사도: 0.0111
```


- TF-IDF
  - 단어마다 가중치를 부여하여 단어를 벡터로 변환하는 방법
  - TF와 IDF의 곱
- TF(Term Frequency)
  - 특정 문서에서 특정 단어가 등장하는 횟수
- DF(Document Frequency)
  - 특정 단어가 등장한 문서의 수
- IDF(Inverse Document Frequency)
  - DF에 반비례하는 수


- Fasttext
  - 페이스북에서 개발한 워드 임베딩 방법
  - 단어를 벡터로 변환하기 위해 부분 단어(Sub Words)라는 개념을 도입
  - N-gram
    - 문자열에서 N개의 연속된 요소를 추출하는 방법
  - 부분 단어를 사용하면 워드투벡터에서 문제가 되는 모르는 단어 문제를 해결할 수 있기 때문에 임베딩에서 만힝 사용되는 모델 중 하나


# 적대적 생성 신경망(GAN)

- 적대적 생성 신경망(Generative Adversarial Network, 이하 GAN)
  - 2개의 신경망 모델이 서로 경쟁하며 더 나은 결과를 만들어 내는 강화학습
  - 이미지 생성 분야에서 뛰어난 성능
  - 기존 인공신경망과는 다르게 두 개의 인공신경망이 서로 경쟁하며 학습 진행
  - 이를 생성 모델(Generator Model)과 판별 모델(Discriminator Model)이라고 하며, 각각은 서로 다른 목적을 가지고 학습
  - 생성 모델
    - 주어진 데이터와 최대한 유사한 가짜 데이터를 생성
  - 판별 모델
    - 진짜 데이터와 가짜 데이터 중 어떤 것이 진짜 데이터인지를 판별
  - GAN의 동작 방식은 위조지폐범 판별 문제로 이해 가능
  - 위조지폐범은 판별 모델을 속이기 위한 진짜 같은 위조지폐를 만들고 판별 모델은 위조지폐범이 만든 위조 지폐를 찾아내기 위해 서로 경쟁적으로 학습
