# KNN을 이용한 고객 등급 분류

- 고객들의 행동을 예측을 하는게 가장 이상적인 비즈니스 상황이다.
- 사실 commerce_data.csv의 시계열을 이용하면, 고객의 잠재성을 예측할 것이라고 기대할 수 있다.
- 하지만 예측을 하는 것은 현재 까다롭기도하고, 과제 기간을 고려했을 때는 진행하기 어렵다고 판단된다.
- 그렇기에 현재의 고객이든 새로운 고객이든 어느 정도로 우리 비즈니스에 대하여 어느정도의 충성 고객인지 분류해보고자 한다.

In [25]:
import pandas as pd
import numpy as np

In [31]:
df = pd.read_csv('RFM_SCORE.csv', index_col=0)
df.head()

Unnamed: 0,최근성_R,빈도_F,총금액_M,RFM_SCORE
12346,0.128689,0.000125,0.015109,1
12347,0.994979,0.022676,0.030297,3
12348,0.799037,0.003758,0.021442,2
12349,0.951425,0.00902,0.021303,2
12350,0.16953,0.002005,0.016288,1


In [32]:
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(
    df.drop('RFM_SCORE', axis=1),
    df.RFM_SCORE, test_size=0.2, random_state=100
)

# 하이퍼파라미터 조정

In [37]:
def tuning(n):
    from sklearn.neighbors import KNeighborsClassifier
    knn = KNeighborsClassifier(n_neighbors=n)
    knn.fit(X_train, y_train)
    pred = knn.predict(X_test)
    
    from sklearn.metrics import accuracy_score
    score = accuracy_score(y_test, pred)
    return score

In [41]:
scores = [(i, tuning(i)) for i in range(1, 21)]
sorted(scores, key=lambda x: x[1], reverse=True)

[(3, 0.9028571428571428),
 (1, 0.8982857142857142),
 (5, 0.8937142857142857),
 (7, 0.8925714285714286),
 (4, 0.8914285714285715),
 (2, 0.8902857142857142),
 (6, 0.8891428571428571),
 (8, 0.8822857142857143),
 (9, 0.8788571428571429),
 (11, 0.8697142857142857),
 (12, 0.8674285714285714),
 (10, 0.8662857142857143),
 (13, 0.8662857142857143),
 (14, 0.8605714285714285),
 (17, 0.8582857142857143),
 (16, 0.8571428571428571),
 (15, 0.8548571428571429),
 (19, 0.8491428571428571),
 (18, 0.8457142857142858),
 (20, 0.8457142857142858)]

# 정확도 가장 좋은 neighbor이 3인 경우로 모델 생성

In [43]:
model = KNeighborsClassifier(n_neighbors=3)
model.fit(X_train, y_train)
import joblib

joblib.dump(model, 'loyal_customer_classifier.pkl') 

['loyal_customer_classifier.pkl']

대체로 인접한 이웃 수를 높일 수록 성능이 떨어지는 것으로 보인다. 그렇기에 추가적으로 이웃 수를 늘려보지 않는다.<br>
정확도가 약 90%로 가장 최적인 이웃 수가 3인 케이스로 모델을 형성했다.