
## 02.Scikit-learn

#### 파이썬용 머신러닝 라이브러리
- 파이썬으로 머신러닝 모델을 만들 수 있는 최적의 라이브러리
- 딥러닝 모델 : 텐서플로, 케라스, 파이토치 등
- 머신러닝 모델 : 사이킷런 라이브러리
  
- 지도학습 : Naive Bayes, Decision Trees, Support Vector Machines
- 비지도 학습 : 군집화(Clustering), 가우시안 혼합 모델(Gaussian mixture models)

In [1]:
import sklearn

sklearn.__version__

'0.21.2'

In [2]:
from sklearn.datasets import load_iris

iris_dataset = load_iris()
print('iris_dataset key: {}'.format(iris_dataset.keys()))

iris_dataset key: dict_keys(['data', 'target', 'target_names', 'DESCR', 'feature_names', 'filename'])


In [4]:
# print(iris_dataset['data'])
print('shape of data: {}'.format(iris_dataset['data'].shape))

# 데이터는 150개의 데이터가 각각 4개의 feature값을 가지고 있다. 

shape of data: (150, 4)


In [6]:
print(iris_dataset['feature_names'])

['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']


In [7]:
print(iris_dataset['target'])
print(iris_dataset['target_names'])

# 정답, 즉 label 값을 가지고 있다.

[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2
 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
 2 2]
['setosa' 'versicolor' 'virginica']


In [8]:
print(iris_dataset['DESCR'])
# 해당 데이터의 전체적인 요약 정보

.. _iris_dataset:

Iris plants dataset
--------------------

**Data Set Characteristics:**

    :Number of Instances: 150 (50 in each of three classes)
    :Number of Attributes: 4 numeric, predictive attributes and the class
    :Attribute Information:
        - sepal length in cm
        - sepal width in cm
        - petal length in cm
        - petal width in cm
        - class:
                - Iris-Setosa
                - Iris-Versicolour
                - Iris-Virginica
                
    :Summary Statistics:

                    Min  Max   Mean    SD   Class Correlation
    sepal length:   4.3  7.9   5.84   0.83    0.7826
    sepal width:    2.0  4.4   3.05   0.43   -0.4194
    petal length:   1.0  6.9   3.76   1.76    0.9490  (high!)
    petal width:    0.1  2.5   1.20   0.76    0.9565  (high!)

    :Missing Attribute Values: None
    :Class Distribution: 33.3% for each of 3 classes.
    :Creator: R.A. Fisher
    :Donor: Michael Marshall (MARSHALL%PLU@io.arc.nasa.gov)
    :

In [9]:
from sklearn.model_selection import train_test_split
train_input, test_input, train_label, test_label = train_test_split(iris_dataset['data'],
                                                                   iris_dataset['target'],
                                                                   test_size = 0.25,
                                                                   random_state = 42)
# test_size는 25%를 따로 나눠준다는 의미.

In [10]:
print('shape of train_input: {}'.format(train_input.shape))
print('shape of train_label: {}'.format(train_label.shape))
print('shape of test_input: {}'.format(test_input.shape))
print('shape of test_label: {}'.format(test_label.shape))

shape of train_input: (112, 4)
shape of train_label: (112,)
shape of test_input: (38, 4)
shape of test_label: (38,)


### (1) 사이킷런을 이용한 지도학습

- 지도학습 : 모델이 예측하는 결과를 각 데이터의 정답과 비교해서 모델을 반복적으로 학습시킨다.
- k-최근접 이웃 분류기(k-nearest neighbor classifier) :  
예측하고자 하는 데이터에 대해 가장 가까운 거리에 있는 데이터의 라벨과 같다고 예측하는 방법

#### k-최근접 이웃 분류기

k 값은 예측하고자 하는 데이터와 가까운 k 개의 데이터를 참고하는 것인데,  
k 값이 1개의 경우 가장 가까운 1개의 데이터와 같은 라벨이라고 예측하고,  
k 값이 3인 경우 가까운 3개의 데이터 중에서 많은 라벨을 결과로 예측한다

- 데이터에 대한 가정이 없어 단순하다.
- 다목적 분류와 회귀에 좋다.
- 높은 메모리를 요구한다.
- k 값이 커지면 계산이 늦어질 수 있다.
- 관련 없는 기능의 데이터의 규모에 민감하다.

In [11]:
from sklearn.neighbors import KNeighborsClassifier
knn = KNeighborsClassifier(n_neighbors = 1)
# n_neighbors 는 위에서 설명한 k 값이다.

knn.fit(train_input, train_label)

KNeighborsClassifier(algorithm='auto', leaf_size=30, metric='minkowski',
                     metric_params=None, n_jobs=None, n_neighbors=1, p=2,
                     weights='uniform')

In [12]:
# 새로운 데이터를 입력해 예측해보기

import numpy as np
new_input = np.array([[6.1, 2.8, 4.7, 1.2]])

# 4개의 특징값을 직접 입력해서 넘파이 배열로 만들었다.

In [14]:
# 1로 예측하고 있지만 이 값은 임의의 값이기 때문에 정답이 맞는지는 알 수 없다.
knn.predict(new_input)

array([1])

In [15]:
# test 데이터로 측정
predict_label = knn.predict(test_input)
print(predict_label)

[1 0 2 1 1 0 1 2 1 1 2 0 0 0 0 1 2 1 1 2 0 2 0 2 2 2 2 2 0 0 0 0 1 0 0 2 1
 0]


In [16]:
print('test accuracy {:.2f}'.format(np.mean(predict_label == test_label)))

test accuracy 1.00


### (2) 사이킷런을 이용한 비지도학습

- 지도학습 : 지도학습과는 달리 데이터에 대한 정답, 즉 라벨을 사용하지 않고 만들 수 있는 모델
- k-평균 군집화(K-means Clustering) 모델 : 군집(clustering)이란 데이터를 특성에 따라 여러 집단으로 나누는 방법이다.
    (붓꽃 데이터에서는 정답이 3개이므로 3개의 군집으로 나누는 방법을 사용할 것)
    
    1. 우선 k개만큼의 중심을 임의로 설정한다.
    1. 모든 데이터를 가장 가까운 중심에 할당하며, 같은 중심에 할당된 데이터들을 하나의 군집으로 판단
    1. 각 군집 내 데이터들을 가지고 군집의 중심을 새로 구해서 업데이트한다.
    1. 이러한 과정이 반복된다.
    1. 항당되는 데이터에 변화가 없을 때까지 이뤄진다.

In [17]:
from sklearn.cluster import KMeans
k_means = KMeans(n_clusters=3)
k_means.fit(train_input)

KMeans(algorithm='auto', copy_x=True, init='k-means++', max_iter=300,
       n_clusters=3, n_init=10, n_jobs=None, precompute_distances='auto',
       random_state=None, tol=0.0001, verbose=0)

In [18]:
k_means.labels_

array([1, 1, 2, 2, 2, 1, 1, 2, 2, 0, 2, 0, 2, 0, 2, 1, 0, 2, 1, 1, 1, 2,
       2, 1, 1, 1, 2, 1, 2, 0, 1, 2, 2, 1, 2, 2, 2, 2, 0, 2, 1, 2, 0, 1,
       1, 2, 0, 1, 2, 1, 1, 2, 2, 0, 2, 0, 0, 2, 1, 1, 2, 0, 1, 1, 1, 2,
       0, 1, 0, 0, 1, 2, 2, 2, 0, 0, 1, 0, 2, 0, 2, 2, 2, 1, 2, 2, 1, 2,
       0, 0, 1, 2, 0, 0, 1, 0, 1, 0, 0, 0, 2, 0, 2, 2, 2, 2, 1, 2, 2, 1,
       2, 0])

In [25]:
print(train_label)
print(k_means.labels_)

[0 0 2 1 1 0 0 1 2 2 1 2 1 2 1 0 2 1 0 0 0 1 2 0 0 0 1 0 1 2 0 1 2 0 2 2 1
 1 2 1 0 1 2 0 0 1 1 0 2 0 0 1 1 2 1 2 2 1 0 0 2 2 0 0 0 1 2 0 2 2 0 1 1 2
 1 2 0 2 1 2 1 1 1 0 1 1 0 1 2 2 0 1 2 2 0 2 0 1 2 2 1 2 1 1 2 2 0 1 2 0 1
 2]
[1 1 2 2 2 1 1 2 2 0 2 0 2 0 2 1 0 2 1 1 1 2 2 1 1 1 2 1 2 0 1 2 2 1 2 2 2
 2 0 2 1 2 0 1 1 2 0 1 2 1 1 2 2 0 2 0 0 2 1 1 2 0 1 1 1 2 0 1 0 0 1 2 2 2
 0 0 1 0 2 0 2 2 2 1 2 2 1 2 0 0 1 2 0 0 1 0 1 0 0 0 2 0 2 2 2 2 1 2 2 1 2
 0]


In [19]:
# 위의 0이라는 label은 0번째 군집을 의미한다. 하지만 붓꽃 데이터의 라벨 0은 Setosa 종을 의미한다.
print("0 cluster:", train_label[k_means.labels_ == 0])
print("1 cluster:", train_label[k_means.labels_ == 1])
print("2 cluster:", train_label[k_means.labels_ == 2])

0 cluster: [2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 1 2 2 2 2]
1 cluster: [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]
2 cluster: [2 1 1 1 2 1 1 1 1 1 2 1 1 1 2 2 2 1 1 1 1 1 2 1 1 1 1 2 1 1 1 2 1 1 1 1 1
 1 1 1 1 1 1 2 2 1 2 1]


In [22]:
# 임의의 새 데이터를 만들어 예측해보자
import numpy as np
new_input = np.array([[6.1, 2.8, 4.7, 1.2]])

In [23]:
prediction = k_means.predict(new_input)
print(prediction)
# 새롭게 정의한 데이터는 2번째 군집에 포함된다고 예측
# 2번째 군집은 주로 label 1인 종의 붓꽃들이 군집화돼 있기 때문에 새로운 데이터 역시 label 1로 예측할 수 있다.

[2]


In [26]:
predict_cluster = k_means.predict(test_input)
print(predict_cluster)


[2 1 0 2 2 1 2 0 2 2 0 1 1 1 1 2 0 2 2 0 1 2 1 0 0 0 0 0 1 1 1 1 2 1 1 2 2
 1]


In [30]:
# 평가 데이터를 적용시켜 예측한 군집을 이제 각 붗꽃의 종을 의미하는 라벨값으로
# 다시 바꿔줘야 실제 라벨과 비교해서 성능을 측정할 수 있다.

np_arr = np.array(predict_cluster)
np_arr[np_arr == 0], np_arr[np_arr == 1], np_arr[np_arr == 2] = 3, 4, 5
np_arr[np_arr == 3] = 2
np_arr[np_arr == 4] = 0
np_arr[np_arr == 5] = 1
predict_label = np_arr.tolist()
print(predict_label)

[1, 0, 2, 1, 1, 0, 1, 2, 1, 1, 2, 0, 0, 0, 0, 1, 2, 1, 1, 2, 0, 1, 0, 2, 2, 2, 2, 2, 0, 0, 0, 0, 1, 0, 0, 1, 1, 0]


In [31]:
print('test accuracy {:2f}'.format(np.mean(predict_label == test_label)))

test accuracy 0.947368


### (3) 사이킷런을 이용한 특징 추출

_자연어 처리에서 특징 추출이란 ? 텍스트 데이터에서 단어나 문장들을 어떤 특징 값으로 바꿔주는 것을 의미한다._

- CountVectorizer
    - 단순히 각 텍스트에서 횟수를 기준으로 특징을 추출하는 방법
- TfidfVectorizer
    - TF-IDF라는 값을 사용해 텍스트에서 특징을 추출
- HashingVectorizer
    - CountVectorizer와 동일한 방법이지만 텍스트를 처리할 때 해시 함수를 사용하기 때문에 실행 시간을 크게 줄일 수 있음
    - 가장 효율적

#### CountVectorizer
- 보통 텍스트에서 단어를 기준으로 횟수를 측정하는데, 문장을 입력으로 받아 단어의 횟수를 측정한 뒤 벡터로 만든다.
    1. 객체를 만들어야 한다.
    1. 이 객체에 특정 텍스트를 적합시켜야 한다.(적합: 횟수를 셀 단어의 목록을 만드는 과정이다.)
    1. 해당 텍스트를 벡터화한다.

In [32]:
from sklearn.feature_extraction.text import CountVectorizer

text_data = ['나는 배가 고프다', '내일 점심 뭐먹지', '내일 공부 해야겠다', '점심 먹고 공부 해야지']
count_vectorizer = CountVectorizer()

count_vectorizer.fit(text_data)
print(count_vectorizer.vocabulary_)

{'나는': 2, '배가': 6, '고프다': 0, '내일': 3, '점심': 7, '뭐먹지': 5, '공부': 1, '해야겠다': 8, '먹고': 4, '해야지': 9}


In [34]:
# 정의한 텍스트 데이터 중에서 하나만 선택해서 벡터로 만든다.
sentence = [text_data[0]] # '나는 배가 고프다'
print(count_vectorizer.transform(sentence).toarray())

# 단순히 횟수만을 특징으로 잡기 때문에 큰 의미가 없지만 자주 사용되는 단어들,  
# 예를 들면 조사 혹은 지시대명사가 높은 특징 값을 가지기 때문에 유의미하게 사용하기 어려울 수 있다.

[[1 0 1 0 0 0 1 0 0 0]]


#### TfidfVectorizer
- TF-IDF라는 특정한 값을 사용해서 텍스트 데이터의 특징을 추출하는 방법이다.  
  
    1. TF(Term Frequency) : 특정 단어가 하나의 데이터 안에서 등장하는 횟수를 의미
    1. DF(Document Frequency) : 문서 빈도 값으로, 특정 단어가 여러 데이터에 자주 등장하는지를 알려주는 지표
    1. IDF(Inverse Document Frequency) : 이 값(DF)에 역수를 취해서 구할 수 있으며,  
       특정 단어가 다른 데이터에 등장하지 않을수록 커진다는 것을 의미한다.  
         
         
- TF-IDF란 이 두 값(TF와 IDF)을 곱해서 사용하므로 어떤 단어가 해당 문서에 자주 등장하지만  
  다른 문서에는 많이 없는 단어일수록 높은 값을 가지게 된다.
  
- 따라서 조사나 지시대명사처럼 자주 등장하는 단어는 TF 값은 크지만 IDF 값은 작아지므로 CountVectorizer가 가진 문제점을 해결할 수 있다.

In [41]:
from sklearn.feature_extraction.text import TfidfVectorizer

text_data = ['나는 배가 고프다', '내일 점심 뭐먹지', '내일 공부 해야겠다', '점심 먹고 공부 해야지']

tfidf_vectorizer = TfidfVectorizer()
tfidf_vectorizer.fit(text_data)
print(tfidf_vectorizer.vocabulary_)

sentence = [text_data[3]] # '점심 먹고 공부 해야지'

print(tfidf_vectorizer.transform(sentence).toarray())

# TF-IDF 값이 높다는 뜻은 해당 단어의 빈도수가 낮다는 의미

{'나는': 2, '배가': 6, '고프다': 0, '내일': 3, '점심': 7, '뭐먹지': 5, '공부': 1, '해야겠다': 8, '먹고': 4, '해야지': 9}
[[0.         0.43779123 0.         0.         0.55528266 0.
  0.         0.43779123 0.         0.55528266]]


### (4) 자연어 토크나이징 도구

자연어 처리를 위해서는 우선 텍스트에 대한 정보를 단위별로 나누는 것이 일반적이다.  
예를 들어, 영화 리뷰 내용을 예측한다고 하면 한 문장을 단어 단위로 쪼개서 분석할 수 있다.  
예측해야 할 입력 정보(문장 또는 발화)를 하나의 특정 기본 단위로 자르는 것을 토크나이징이라고 한다.

##### 영어 토크나이징 라이브러리
_nltk, spacy_

In [47]:
import nltk
nltk.download('punkt')

[nltk_data] Downloading package punkt to
[nltk_data]     C:\Users\user\AppData\Roaming\nltk_data...
[nltk_data]   Unzipping tokenizers\punkt.zip.


True

In [49]:
from nltk.tokenize import word_tokenize

sentence = "Natural language processing (NLP) is a subfield of computer science,\
            information engineering, and artificial intelligence concerned with the interactions\
            between computers and human (natural) languages, in particular how to program computers\
            to precess and analyze large amounts of natural language data."

# 단어 단위 토크나이징
print(word_tokenize(sentence))

['Natural', 'language', 'processing', '(', 'NLP', ')', 'is', 'a', 'subfield', 'of', 'computer', 'science', ',', 'information', 'engineering', ',', 'and', 'artificial', 'intelligence', 'concerned', 'with', 'the', 'interactions', 'between', 'computers', 'and', 'human', '(', 'natural', ')', 'languages', ',', 'in', 'particular', 'how', 'to', 'program', 'computers', 'to', 'precess', 'and', 'analyze', 'large', 'amounts', 'of', 'natural', 'language', 'data', '.']


In [50]:
# 문장 단위 토크나이징
from nltk.tokenize import sent_tokenize

paragraph = "Natural language processing (NLP) is a subfield of computer science,\
             information engineering, and artificial intelligence concerned with the interactions\
             between computers and human (natural) languages, in particular how to program computers\
             to precess and analyze large amounts of natural language data. Challenges in natural language\
             processing frequently involve speech recognition, natural language understanding, nad natural\
             language generation."

print(sent_tokenize(paragraph))

['Natural language processing (NLP) is a subfield of computer science,             information engineering, and artificial intelligence concerned with the interactions             between computers and human (natural) languages, in particular how to program computers             to precess and analyze large amounts of natural language data.', 'Challenges in natural language             processing frequently involve speech recognition, natural language understanding, nad natural             language generation.']


In [55]:
import spacy

nlp = spacy.load('en')
sentence = "Natural language processing (NLP) is a subfield of computer science,\
            information engineering, and artificial intelligence concerned with the interactions\
            between computers and human (natural) languages, in particular how to program computers\
            to precess and analyze large amounts of natural language data."

doc = nlp(sentence)
doc2 = nlp(paragraph)

In [56]:
word_tokenized_sentence = [token.text for token in doc]
sentence_tokenized_list = [sent.text for sent in doc2.sents]
print(word_tokenized_sentence)
print(sentence_tokenized_list)

['Natural', 'language', 'processing', '(', 'NLP', ')', 'is', 'a', 'subfield', 'of', 'computer', 'science', ',', '           ', 'information', 'engineering', ',', 'and', 'artificial', 'intelligence', 'concerned', 'with', 'the', 'interactions', '           ', 'between', 'computers', 'and', 'human', '(', 'natural', ')', 'languages', ',', 'in', 'particular', 'how', 'to', 'program', 'computers', '           ', 'to', 'precess', 'and', 'analyze', 'large', 'amounts', 'of', 'natural', 'language', 'data', '.']
['Natural language processing (NLP) is a subfield of computer science,             information engineering, and artificial intelligence concerned with the interactions             between computers and human (natural) languages, in particular how to program computers             to precess and analyze large amounts of natural language data.', 'Challenges in natural language             processing frequently involve speech recognition, natural language understanding, nad natural            

##### 한글 토크나이징 라이브러리

_KoNLPy_

In [3]:
import konlpy

In [4]:
from konlpy.tag import Okt

In [5]:
okt = Okt()

-------------------------------------------------------------------------------
Deprecated: convertStrings was not specified when starting the JVM. The default
behavior in JPype will be False starting in JPype 0.8. The recommended setting
for new code is convertStrings=False.  The legacy value of True was assumed for
please file a ticket with the developer.
-------------------------------------------------------------------------------

  """)


In [11]:
text = '한글 자연어 처리는 재밌다 이제부터 열심히 해야지ㅎㅎㅎ'

print(okt.morphs(text))

# 텍스트를 형태소 단위로 나눈다. 옵션으로는 norm과 stem이 있다. 각각 True 혹은 False 값을 받으며,
# norm은 normalize의 약자로서 문장을 정규화하는 역할을 하고, stem은 각 단어에서 어간을 추출하는 기능이다.
# 각각 True로 설정하면 각 기능이 적용된다.

print('Stem = True \n', okt.morphs(text, stem = True)) # 형태소 단위로 나눈 후 어간을 추출


['한글', '자연어', '처리', '는', '재밌다', '이제', '부터', '열심히', '해야지', 'ㅎㅎㅎ']
Stem = True 
 ['한글', '자연어', '처리', '는', '재밌다', '이제', '부터', '열심히', '하다', 'ㅎㅎㅎ']


In [9]:
print(okt.nouns(text))   # 명사만 추출
print(okt.phrases(text)) # 어절을 추출

['한글', '자연어', '처리', '이제']
['한글', '한글 자연어', '한글 자연어 처리', '이제', '자연어', '처리']


In [10]:
print(okt.pos(text))
print('형태소와 품사를 붙여서 리스트화\n', okt.pos(text, join = True))

[('한글', 'Noun'), ('자연어', 'Noun'), ('처리', 'Noun'), ('는', 'Josa'), ('재밌다', 'Adjective'), ('이제', 'Noun'), ('부터', 'Josa'), ('열심히', 'Adverb'), ('해야지', 'Verb'), ('ㅎㅎㅎ', 'KoreanParticle')]
형태소와 품사를 붙여서 리스트화
 ['한글/Noun', '자연어/Noun', '처리/Noun', '는/Josa', '재밌다/Adjective', '이제/Noun', '부터/Josa', '열심히/Adverb', '해야지/Verb', 'ㅎㅎㅎ/KoreanParticle']


#### KoNLPy 데이터

- kolaw  
    한국 법률 말뭉치. 'constitution.txt' 파일로 저장돼 있다.
- kobill  
    대한민국 국회 의안 말뭉치, 각 id 값을 가지는 의안으로 구성돼 있고 파일은 '1809890.txt'부터 '1809899.txt'까지로 구성돼 있다.

In [12]:
from konlpy.corpus import kolaw
from konlpy.corpus import kobill

In [13]:
kolaw.open('constitution.txt').read()[:20]

'대한민국헌법\n\n유구한 역사와 전통에 '

In [14]:
kobill.open('1809890.txt').read()

'지방공무원법 일부개정법률안\n\n(정의화의원 대표발의 )\n\n 의 안\n 번 호\n\n9890\n\n발의연월일 : 2010.  11.  12.  \n\n발  의  자 : 정의화․이명수․김을동 \n\n이사철․여상규․안규백\n\n황영철․박영아․김정훈\n\n김학송 의원(10인)\n\n제안이유 및 주요내용\n\n  초등학교 저학년의 경우에도 부모의 따뜻한 사랑과 보살핌이 필요\n\n한 나이이나, 현재 공무원이 자녀를 양육하기 위하여 육아휴직을 할 \n\n수 있는 자녀의 나이는 만 6세 이하로 되어 있어 초등학교 저학년인 \n\n자녀를 돌보기 위해서는 해당 부모님은 일자리를 그만 두어야 하고 \n\n이는 곧 출산의욕을 저하시키는 문제로 이어질 수 있을 것임.\n\n  따라서 육아휴직이 가능한 자녀의 연령을 만 8세 이하로 개정하려\n\n는 것임(안 제63조제2항제4호).\n\n- 1 -\n\n\x0c법률  제        호\n\n지방공무원법 일부개정법률안\n\n지방공무원법 일부를 다음과 같이 개정한다.\n\n제63조제2항제4호 중 “만 6세 이하의 초등학교 취학 전 자녀를”을 “만 \n\n8세 이하(취학 중인 경우에는 초등학교 2학년 이하를 말한다)의 자녀를”\n\n로 한다.\n\n부      칙\n\n이 법은 공포한 날부터 시행한다.\n\n- 3 -\n\n\x0c신 ·구조문대비표\n\n현      행\n\n개   정   안\n\n제63조(휴직) ① (생  략)\n\n제63조(휴직) ① (현행과 같음)\n\n  ② 공무원이 다음 각 호의 어\n\n  ② -------------------------\n\n느 하나에 해당하는 사유로 휴\n\n----------------------------\n\n직을 원하면 임용권자는 휴직\n\n----------------------------\n\n을 명할 수 있다. 다만, 제4호\n\n-------------.---------------\n\n의 경우에는 대통령령으로 정\n\n---------------------------