# 그리드 서치
- 그리드 서치 (grid search) 는 머신러닝 과정에서 관심 있는 매개 변수들을 대상으로 학습 가능하도록 만드는 방식이다 
- 예를 들어, k-최근접 이웃 알고리즘을 사용한다고 가정하면, k-최근접 이웃 알고리즘에 사용할 수 있는 k 값에는 여러 후보가 존재하는데, 어던 하이퍼라미터 k가 가장 높은 성능을 보일지는 직접 학습하기 전에는 알수가 없다. 학습 시키기 전에 관심이 잇는 k의 후보군을 정해 놓고 학습 시킨 후 모형 선능을 비교한 후 최적의 k을 선정하수 있다. 

In [1]:
from sklearn import datasets
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import train_test_split

from sklearn.metrics import accuracy_score
from sklearn.metrics import confusion_matrix
from sklearn.metrics import classification_report

In [2]:
# 꽃 데이터 불러오기
raw_iris = datasets.load_iris()

# 피쳐 / 타겟
X = raw_iris.data
y = raw_iris.target

# 트레이닝 / 테스트 데이터 분할
X_tn, X_te, y_tn, y_te=train_test_split(X,y,random_state=0)

# 표준화 스케일
std_scale = StandardScaler()
std_scale.fit(X_tn)
X_tn_std = std_scale.transform(X_tn)
X_te_std  = std_scale.transform(X_te)

In [3]:
# 가장 높은 정확도를 나타내는 best_accuracy 라는 변수를 초기화 
best_accuracy = 0

for k in [1,2,3,4,5,6,7,8,9,10]:
    clf_knn =  KNeighborsClassifier(n_neighbors=k) # 해당 k 값을 적용한 k-최근접 이웃 알고리즘 수행
    clf_knn.fit(X_tn_std, y_tn)
    knn_pred = clf_knn.predict(X_te_std)
    accuracy = accuracy_score(y_te, knn_pred)
    if accuracy > best_accuracy:
        best_accuracy = accuracy
        final_k = {'k': k}
    
print(final_k)
print(accuracy)

{'k': 3}
0.9736842105263158
