In [None]:
import numpy as np
from collections import Counter
import matplotlib.pyplot as plt

# Euclidean
def e_distance(x1, x2):
  return np.sqrt(sum((x1 - x2) ** 2))

class kNN:

  # initialize
  def __init__(self, k = 3):
    self.k = k

  #
  def fit(self, X, y):
    self.X_train = X
    self.y_train = y

  def predict(self, X):
    predicted_label = [self.__predict(x) for x in X]
    return np.array((predicted_label))

  def __predict(self, x):
    distances = [e_distance(x, x_train) for x_train in self.X_train]
    k_indices = np.argsort(distances)[0:self.k]
    k_nearest_label = [self.y_train[i] for i in k_indices]
    # return tuple (label, numbers of appearance)
    most_common = Counter(k_nearest_label).most_common(1)
    return most_common[0][0]

if __name__ == "__main__":
  np.random.seed(1)
  X = np.random.rand(15, 2)*10
  print(X)
  y = np.array(
    ["tot", "xau", "xau", "tot", "tot", "xau", "tot", "tot", "tot", "xau",
     "tot", "xau", "xau", "xau", "tot"]
  )

  knn = kNN(3)
  knn.fit(X, y)
  # mau du liệu mới có 2 đặc trưng = [5,8]
  X_new = np.array([[5, 8]])
  # dùng knn để dự đoán
  y_pred = knn.predict(X_new)
  # in ra kết quả dự đoán
  print("Prediction", y_pred)
  # tính khoảng cách euclidean giữa mẫu dữ liệu mới và all data trong tập huấn luyện X
  distances = [e_distance(X_new[0], x_train) for x_train in X]
  # Lấy ra chỉ số 3 mẫu gần nhất với X_new
  k_indices = np.argsort(distances)[:3]
  # lấy ra 3 mẫu gần nhất với X_new
  k_nearest_points = [X[i] for i in k_indices]

  fig, ax = plt.subplots()
  # gán màu đỏ cho nhãn "tot", màu đen cho nhãn "xau"
  colors = np.where(y == 'tot', 'r', 'k')
  # vẽ các mẫu dữ liệu trong tập huấn luyện X
  ax.scatter(X[:, 0], X[:, 1], c=colors)
  # vẽ mẫu dữ liệu X_new mới với dấu 'x' màu xanh
  ax.scatter(X_new[:, 0], X_new[:, 1], c='blue', marker='x')
  # vẽ đường nối giữa mâu X_new và 3 mẫu gần với X_new với đường kẻ chấm xanh lá cây
  for point in k_nearest_points:
    ax.plot([X_new[0, 0], point[0]], [X_new[0, 1], point[1]], 'g--')
    # in ra 3 mẫu gần nhất với X_new
    print("3 nearest points", point)

  # tính bán kính của vòng tròn quanh X_new , sử dụng khoảng cách đến mẫu gần nhất thứ 3
  radius = e_distance(X_new[0], k_nearest_points[-1])
  # in ra bán kính
  print(radius)

  # vẽ một vòng tròn xung quanh X_new với bán kính đã tính ở dòng trước
  circle = plt.Circle(X_new[0], radius=radius, color='g', fill=False)
  # Thêm vòng tròn vào plot
  ax.add_artist(circle)
  # plt.show()

X1_new = np.array([[4, 6]])
X2_new = np.array([[6, 8]])
X3_new = np.array([[3, 4]])
# Predict labels for new samples
y_pred1 = knn.predict(X1_new)
y_pred2 = knn.predict(X2_new)
y_pred3 = knn.predict(X3_new)
print("Prediction for X1_new:", y_pred1)
print("Prediction for X2_new:", y_pred2)
print("Prediction for X3_new:", y_pred3)

# Find 3 nearest neighbors for each new sample
distances1 = [e_distance(X1_new[0], x_train) for x_train in X]
distances2 = [e_distance(X2_new[0], x_train) for x_train in X]
distances3 = [e_distance(X3_new[0], x_train) for x_train in X]

k_indices1 = np.argsort(distances1)[:3]
k_indices2 = np.argsort(distances2)[:3]
k_indices3 = np.argsort(distances3)[:3]

k_nearest_points1 = [X[i] for i in k_indices1]
k_nearest_points2 = [X[i] for i in k_indices2]
k_nearest_points3 = [X[i] for i in k_indices3]

# Create the plot
fig, ax = plt.subplots()
colors = np.where(y == 'tot', 'r', 'k')
ax.scatter(X[:, 0], X[:, 1], c=colors)

# Plot the new samples and their nearest neighbors
ax.scatter(X1_new[:, 0], X1_new[:, 1], c='blue', marker='x')
ax.scatter(X2_new[:, 0], X2_new[:, 1], c='green', marker='x')
ax.scatter(X3_new[:, 0], X3_new[:, 1], c='orange', marker='x')

for point in k_nearest_points1:
    ax.plot([X1_new[0, 0], point[0]], [X1_new[0, 1], point[1]], 'g--')
for point in k_nearest_points2:
    ax.plot([X2_new[0, 0], point[0]], [X2_new[0, 1], point[1]], 'g--')
for point in k_nearest_points3:
    ax.plot([X3_new[0, 0], point[0]], [X3_new[0, 1], point[1]], 'g--')

print("3 nearest points for X1_new:", k_nearest_points1)
print("3 nearest points for X2_new:", k_nearest_points2)
print("3 nearest points for X3_new:", k_nearest_points3)

radius1 = e_distance(X1_new[0], k_nearest_points1[-1])
radius2 = e_distance(X2_new[0], k_nearest_points2[-1])
radius3 = e_distance(X3_new[0], k_nearest_points3[-1])
print("Radius for X1_new:", radius1)
print("Radius for X2_new:", radius2)
print("Radius for X3_new:", radius3)

circle1 = plt.Circle(X1_new[0], radius=radius1, color='g', fill=False)
circle2 = plt.Circle(X2_new[0], radius=radius2, color='r', fill=False)
circle3 = plt.Circle(X3_new[0], radius=radius3, color='b', fill=False)
ax.add_artist(circle1)
ax.add_artist(circle2)
ax.add_artist(circle3)

plt.show()
