## 6.3. 이미지 분할을 위한 신경망

**이미지 분할(Image segmentation)**: 이미지를 픽셀 단위로 분할하는 것. 즉, 이미지를 픽셀 단위로 분할하여 이미지에 포함된 객체를 추출.

e.g. 완전 합성곱 네트웤, 합성곱 & 역합성곱 네트워크, U-Net, PSPNet, DeepLabv3/DeepLabv3+

---
#### **완전 합성곱 네트워크 (Fully Convolutional Network, FCN)**
완전연결층의 한계는 고정된 크기의 입력만 받아들이며, 완전연결층을 거친 후에는 위치 정보가 사라진다는 것.

↓

SOL) 완전 합성곱 네트워크: 완전연결층을 1X1 합성곱으로 대체. 이미지 분류에서 우수한 성능을 보인 CNN 기반 모델(AlexNet, VGG16, GooLeNet)을 변형시켜 이미지 분할에 적합하도록 만든 네트워크.
* 입력 이미지에 대한 크게 제약이 사라지는 장점이 있음.
* 여러 단계의 합성곱층과 풀링층을 거치면서 해상도 낮아짐.
* 낮아진 해상도를 복원하기 위해 업 샘플링 방식을 사용하기 때문에 이미지의 세부 정보들을 잃어버리는 문제 발생.

e.g. AlexNet 아래쪽에서 사용되었던 FC층 세계를 1X1 합성곱으로 변환하면 위치 정보가 남아 있기 때문에 객체의 위치 확인 가능.

---
#### **합성곱 & 역합성곱 네트워크 (convoutional & deconvolutional network)**
역합성곱: CNN의 최종 출력 결과를 원래의 입력 이미지와 같은 크기로 만들고 싶을 때 사용. 시멘틱 분할(sementic segmentation) 등에 활용 가능. 업 샘플링(upsampling)이라고도 함.

역합성곱은 특성 맵의 크기를 증가시키는 방식으로 동작.
1. 각각의 픽셀 주위에 제로 패딩을 추가.
2. 이렇게 패딩된 것에 합성곱 연산 수행.

---
#### **U-Net**
바이오 메디컬 이미지 분할을 위한 합성곱 신경망.

* 속도 빠름: 이미 검증이 끝난 패치는 건너뛰기 때문에 속도 빠름.
* 트레이드오프에 빠지지x

U-Net의 구조
* FCN을 기반으로 구축됨. 수축 경로와 확장 경로로 구성됨.
* 수축 경로는 컨텍스트 포착, 확장 경로는 특성 맵을 업샘플링하고 수축 경로에서 포착한 특성 맵의 컨텍스트와 결합하여 정확한 지역화 수행.
* 3X3 Conv층이 주를 이룸. 각 합성곱 블록은 3x3 합성곱 두 개로 구성되어 있으며, 그 사이에 드롭아웃이 있음.
* 각 블록은 최대 풀링을 이용하여 크기를 줄이면서 다음 블록으로 넘어감.

---
#### **PSPNet**
시멘틱 분할 알고리즘.

FC층의 한계를 극복하기 위해 피라미드 풀링 모듈 추가.
1. 이미지 출력이 서로 다른 크기가 되도록 여러 차례 풀링. 즉, 1x1, 2x2, 3x3. 6x6 크기로 풀링을 수행하는데, 이때 1x1 크기의 특성 맵은 가장 광범위한 정보를 담음.
2. 이후 1x1 합성곱을 사용하여 채널 수를 조정. 풀링층 개수를 N개라고 할 때 출력 채널 수=입력 채널수/N.
3. 이후 모듈의 입력 크기에 맞게 특성맵을 업샘플링. 이 과정에서 양선형 보간법이 사용됨.
4. 원래의 특성맵과 위 과정에서 생성한 새로운 특성맵들을 병합.

---
#### **DeepLabv3/DeepLabv3+**
FC 층의 단점을 보완하기 위해 Atrous 합성곱을 사용.

인코더와 디코더 구조를 가지며, 일반적으로 인코더-디코더 구조에서는 불가능했던 인코더에서 추출된 특성맵의 해상도를 Atrous 합성곱을 동비하여 제어할 수 있도록 함.

**Atrous 합성곱**: 필터 내부에 빈 공간을 둔 채로 작동.
* 얼마나 많은 빈 공간을 가질지 결정하는 파리미터로 rate가 있음.
* 파라미터 수를 늘리지 않으면서도 수용 영역을 크게 키울 수 있기 때문에 이미지 분할 분야에서 많이 사용.

## 10장. 자연어처리를 위한 임베딩
1. 희소 표현 기반 임베딩
 * 원-핫 인코딩: 주어진 텍스트를 숫자(벡터)로 변환해 주는 것. 단어가 포함되어 있는 위치에 1, 나머지에는 0 값을 넣어줌.
   * 두 단어에 대한 벡터의 내적을 구해 보면 0을 갖게 되므로 직교를 이룸. 즉, 단어끼리 관계성 없이 서로 독립적.
   * 차원의 저주.
2. 횟수 기반 인베딩: 단어가 출현한 빈도를 고려하여 임베딩하는 방법.
* 카운터 벡터: 문서 집합에서 단어를 토큰으로 생성하고 각 단어의 출현 빈도수를 이용하여 인코딩해서 벡터를 반드는 방법. 즉, 토크나이징과 벡터화가 동시에 가능.
* TF-IDF: 정보 검색론에서 가중치를 구할 때 사용되는 알고리즘.
  * TF: 문서 내에서 특정 단어가 출현한 빈도.
  * DF: 한 단어가 준체 문서에서 얼마나 공통적으로 많이 등장하는지 나타내는 값. 즉, 특정 단어가 나타난 문서 개수.
3. 예측 기반 임베딩: 신경망 구조 혹은 모델을 이용하여 특정 문맥에서 어떤 단어가 나올지 예측하면서 단어를 벡터로 만드는 방법.
* Word2Vec: 신경망 알고리즘으로, 주어진 테긋트에서 텍스트의 각 단어마다 하나씩 일련의 벡터를 출력. 의미론적으로 유사한 단어의 벡터는 서로 가깝게 표현. 은닉층에는 각 단어에 대한 가중치 포함.
  * CVOW: 단어를 여러 개나열한 후 관련된 단어를 추정하는 방식.
  * skip=gram: CBOW 방식과 반대로 특정한 단어에서 문맥이 될 수 있는 단어 예측. 중심 단어에서 주변 단어를 예측하는 방식을 사용.
* 패스트텍스트: Word2Vec의 단점 보완. Word2Vec의 워드 임베딩 방식은 분산 표현을 이용하여 사전에 없는 단어에 대해서는 벡터값 얻을 수x. 또한 Word2Vec는 자주 사용되지 않는 단어데 대해서 학습 불안정.
  * 사전에 없는 단어에 벡터 값을 부여하는 방법: 각 단어를 n-gram으로 표현. n의 설정에 따라 단어의 분리 수준 결정.
  * 자주 사용x 단어에 학습 안정성 확보하는 법: n-gram으로 임베딩하기에 참고할 수 있는 경우의 수가 많음.
4. 횟수/예측 기반 임베딩: 횟수 기반과 예측 기반의 다점을 보완.
* 글로브(GloVe, Global Vectors for Word Representation): 글로벌 동시 발생 확률 정볼르 포함하는 단어 임베딩 방법. 즉, 단어에 대한 통계 정보와 skip-gram을 합친 방식.

In [2]:
# 원-핫 인코딩 적용
import pandas as pd
class2 = pd.read_csv('class2.csv')

from sklearn import preprocessing
label_encoder = preprocessing.LabelEncoder()
ondehot_encoder = preprocessing.OneHotEncoder()

train_x = label_encoder.fit_transform(class2['class2'])
train_x

array([2, 2, 1, 0, 1, 0])

In [3]:
# 코퍼스에 카운터 벡터 족용
from sklearn.feature_extraction.text import CountVectorizer
corpus = [
    'THis is last chance.',
    'and if you do not have this chance.',
    'you will never get any chance.',
    'will you do get this one?',
    'please, get this chance.'
]
vect = CountVectorizer()
vect.fit(corpus)
vect.vocabulary_

{'this': 13,
 'is': 7,
 'last': 8,
 'chance': 2,
 'and': 0,
 'if': 6,
 'you': 15,
 'do': 3,
 'not': 10,
 'have': 5,
 'will': 14,
 'never': 9,
 'get': 4,
 'any': 1,
 'one': 11,
 'please': 12}

In [4]:
# 배열 변환
vect.transform(['you will never get any chance.']).toarray()

array([[0, 1, 1, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 1]])

In [5]:
# 불용어를 제거한 카운터 벡터
vect = CountVectorizer(stop_words=['and','is','please','this']).fit(corpus)
vect.vocabulary_

{'last': 6,
 'chance': 1,
 'if': 5,
 'you': 11,
 'do': 2,
 'not': 8,
 'have': 4,
 'will': 10,
 'never': 7,
 'get': 3,
 'any': 0,
 'one': 9}

In [8]:
# TF-IDF를 적용한 후 행렬로 표현
from sklearn.feature_extraction.text import TfidfVectorizer
doc = ['I like machine learning','I love deep learning','I run everyday']
tfidf_vectorizer = TfidfVectorizer(min_df=1)
tfidf_matrix = tfidf_vectorizer.fit_transform(doc)
doc_distance = (tfidf_matrix * tfidf_matrix.T)
print(f'유사도를 위한 {doc_distance.shape[0]} x {doc_distance.shape[1]} 행렬을 만들었습니다.')
print(doc_distance.toarray())

유사도를 위한 3 x 3 행렬을 만들었습니다.
[[1.       0.224325 0.      ]
 [0.224325 1.       0.      ]
 [0.       0.       1.      ]]


In [10]:
!pip install gensim

Collecting gensim
  Downloading gensim-4.4.0-cp312-cp312-manylinux_2_24_x86_64.manylinux_2_28_x86_64.whl.metadata (8.4 kB)
Downloading gensim-4.4.0-cp312-cp312-manylinux_2_24_x86_64.manylinux_2_28_x86_64.whl (27.9 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m27.9/27.9 MB[0m [31m26.1 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: gensim
Successfully installed gensim-4.4.0


In [14]:
# 데이터셋을 메모리로 로딩하고 토큰화 적용
import nltk
from nltk.tokenize import sent_tokenize, word_tokenize
import warnings
warnings.filterwarnings(action='ignore')
import gensim
from gensim.models import Word2Vec

nltk.download('punkt_tab') # 만약 구버전 NLTK를 쓰신다면 nltk.download('punkt')를 사용해 보세요.
sample = open('peter.txt', 'r', encoding='UTF8')
s = sample.read()

f = s.replace('\n',' ')
data = []

for i in sent_tokenize(f):
  temp = []
  for j in word_tokenize(i):
    temp.append(j.lower())
  data.append(temp)

data

[nltk_data] Downloading package punkt_tab to /root/nltk_data...
[nltk_data]   Unzipping tokenizers/punkt_tab.zip.


[['once',
  'upon',
  'a',
  'time',
  'in',
  'london',
  ',',
  'the',
  'darlings',
  'went',
  'out',
  'to',
  'a',
  'dinner',
  'party',
  'leaving',
  'their',
  'three',
  'children',
  'wendy',
  ',',
  'jhon',
  ',',
  'and',
  'michael',
  'at',
  'home',
  '.'],
 ['after',
  'wendy',
  'had',
  'tucked',
  'her',
  'younger',
  'brothers',
  'jhon',
  'and',
  'michael',
  'to',
  'bed',
  ',',
  'she',
  'went',
  'to',
  'read',
  'a',
  'book',
  '.'],
 ['she', 'heard', 'a', 'boy', 'sobbing', 'outside', 'her', 'window', '.'],
 ['he', 'was', 'flying', '.'],
 ['there', 'was', 'little', 'fairy', 'fluttering', 'around', 'him', '.'],
 ['wendy', 'opened', 'the', 'window', 'to', 'talk', 'to', 'him', '.'],
 ['“', 'hello', '!'],
 ['who', 'are', 'you', '?'],
 ['why', 'are', 'you', 'crying', '”', ',', 'wendy', 'asked', 'him', '.'],
 ['“', 'my', 'name', 'is', 'peter', 'pan', '.'],
 ['my',
  'shadow',
  'wouldn',
  '’',
  't',
  'stock',
  'to',
  'me.',
  '”',
  ',',
  'he',
  'rep

In [16]:
# 데이터셋에 CBOW 적용 후 peter와 wendy의 유사성 확인
model1 = gensim.models.Word2Vec(data, min_count=1, vector_size=100, window=5, sg=0)
print("Cosine similarity between 'peter' "+
      "'wendy' - CBOW : ",
      model1.wv.similarity('peter','wendy'))

Cosine similarity between 'peter' 'wendy' - CBOW :  -0.08294406


In [17]:
# peter와 hook의 유사성 확인
print("Cosine similarity between 'peter' "+
      "'hook' - CBOW : ",
      model1.wv.similarity('peter','hook'))

Cosine similarity between 'peter' 'hook' - CBOW :  -0.058279675


In [19]:
# 데이터셋 skip-gram 적용후 peter와 wendy의 유사성 확인
model2 = gensim.models.Word2Vec(data, min_count=1, vector_size=100, window=5, sg=1)
print("Cosine similarity between 'peter' "+
      "'wendy' - Skip Gram : ",
      model2.wv.similarity('peter','wendy'))

Cosine similarity between 'peter' 'wendy' - Skip Gram :  0.27075687


In [20]:
# peter와 hook의 유사성 확인
print("Cosine similarity between 'peter' "+
      "'hook' - Skip Gram : ",
      model2.wv.similarity('peter','hook'))

Cosine similarity between 'peter' 'hook' - Skip Gram :  0.45573297


In [21]:
# 라이브러리 및 데이터 호출
from gensim.test.utils import common_texts
from gensim.models import FastText

model = FastText('peter.txt', vector_size=4, window=3, min_count=1, epochs=10)



In [22]:
# peter와 wendy의 코사인 유사도
sim_score = model.wv.similarity('peter','wendy')
print(sim_score)

0.4592452


In [23]:
# peter와 hook의 코사인 유사도
sim_score = model.wv.similarity('peter','hook')
print(sim_score)

0.043825686


In [27]:
# 코랩의 기본 경로인 /content 폴더에 바로 다운로드합니다.
!wget https://dl.fbaipublicfiles.com/fasttext/vectors-wiki/wiki.ko.vec -O /content/drive/MyDrive/ESAA/OB/wiki.ko.vec

print("다운로드 완료!")

--2026-02-16 04:23:51--  https://dl.fbaipublicfiles.com/fasttext/vectors-wiki/wiki.ko.vec
Resolving dl.fbaipublicfiles.com (dl.fbaipublicfiles.com)... 3.171.22.118, 3.171.22.33, 3.171.22.68, ...
Connecting to dl.fbaipublicfiles.com (dl.fbaipublicfiles.com)|3.171.22.118|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 2323010599 (2.2G) [binary/octet-stream]
Saving to: ‘/content/drive/MyDrive/ESAA/OB/wiki.ko.vec’


2026-02-16 04:24:54 (35.2 MB/s) - ‘/content/drive/MyDrive/ESAA/OB/wiki.ko.vec’ saved [2323010599/2323010599]

다운로드 완료!


In [None]:
from __future__ import print_function
from gensim.models import KeyedVectors

model_kr = KeyedVectors.load_word2vec_format('/content/drive/MyDrive/ESAA/OB/wiki.ko.vec')

In [None]:
# '노력'과 유사한 단어와 유사도 확인
find_similar_to = '노력'

for similar_word in model_kr.similar_by_word(find_similar_to):
  print('Word: {0}, Similarity: {1:.2f}'.format(similar_word[0], similar_word[1]))

In [None]:
# 동물, 육식동물에는 긍정적이지만 사람에는 부정적인 단어와 유사도 확인
similarities = model_kr.most_similar(positive=['동물','육식동물'], negative=['사람'])
print(similarities)

In [30]:
# 압축을 풀어 현재 경로(/content/)에 txt 파일들을 꺼냅니다.
!unzip /content/drive/MyDrive/ESAA/OB/glove.6B.zip

Archive:  /content/drive/MyDrive/ESAA/OB/glove.6B.zip
  inflating: glove.6B.50d.txt        
  inflating: glove.6B.100d.txt       
  inflating: glove.6B.200d.txt       
  inflating: glove.6B.300d.txt       


In [37]:
# 라이브러리 호출
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
plt.style.use('ggplot')
from sklearn.decomposition import PCA
from gensim.test.utils import get_tmpfile
from gensim.models import KeyedVectors
from gensim.scripts.glove2word2vec import glove2word2vec

glove_file = '/content/glove.6B.100d.txt'
word2vec_glove_file = get_tmpfile('glove.6B.100d.word2vec.txt')
glove2word2vec(glove_file, word2vec_glove_file)

(400000, 100)

In [38]:
# bill과 유사한 단어의 리스트 반환
model = KeyedVectors.load_word2vec_format(word2vec_glove_file)
model.most_similar('bill')

[('legislation', 0.8072139620780945),
 ('proposal', 0.730686366558075),
 ('senate', 0.7142541408538818),
 ('bills', 0.704440176486969),
 ('measure', 0.6958035230636597),
 ('passed', 0.690624475479126),
 ('amendment', 0.6846879720687866),
 ('provision', 0.6845567226409912),
 ('plan', 0.6816462874412537),
 ('clinton', 0.6663140058517456)]

In [39]:
# cherry와 유사한 단어의 리스트 반환
model.most_similar('cherry')

[('peach', 0.688809871673584),
 ('mango', 0.683819055557251),
 ('plum', 0.6684104204177856),
 ('berry', 0.6590359210968018),
 ('grove', 0.658155083656311),
 ('blossom', 0.6503506302833557),
 ('raspberry', 0.6477391719818115),
 ('strawberry', 0.6442098021507263),
 ('pine', 0.6390928626060486),
 ('almond', 0.6379212737083435)]

In [40]:
# cherry와 관련성이 없는 단어의 리스트 반환
model.most_similar(negative=['cherry'])

[('kazushige', 0.48343509435653687),
 ('askerov', 0.4778185784816742),
 ('lakpa', 0.46915265917778015),
 ('ex-gay', 0.4571332633495331),
 ('tadayoshi', 0.4522107243537903),
 ('turani', 0.44810065627098083),
 ('saglam', 0.4469599425792694),
 ('aijun', 0.4435270130634308),
 ('adjustors', 0.44235292077064514),
 ('nyum', 0.4423118233680725)]

In [42]:
# woman, king과 유사성이 높으면서 man과 관령성이 없는 단어 반환
result =  model.most_similar(positive=['woman','king'], negative=['man'])
print('{}: {:.4f}'.format(*result[0]))

queen: 0.7699


In [43]:
# australia, beer, france와 관련성이 있는 단어 반환
def analogy(x1, x2, y1):
  result = model.most_similar(positive=[y1, x2], negative=[x1])
  return result[0][0]
analogy('australia','beer','france')

'champagne'

In [44]:
# tall, tallest, long 단어 기반으로 새로운 단어 유추
analogy('tall','tallest','long')

'longest'

In [47]:
# breakfast cereal lunch 중 유사도가 낮은 단어 반환
print(model.doesnt_match('breakfast cereal dinner lunch'.split()))

cereal
