# Tính Độ Tương Đồng Cosine giữa Hai Vector

Cho hai vector:
- x = [1, 2, 3, 4]
- y = [1, 0, 3, 0]

## Công thức độ tương đồng Cosine:

$$\text{cosine similarity} = \frac{\mathbf{x} \cdot \mathbf{y}}{\|\mathbf{x}\| \|\mathbf{y}\|} = \frac{\sum_{i=1}^n x_i y_i}{\sqrt{\sum_{i=1}^n x_i^2} \sqrt{\sum_{i=1}^n y_i^2}}$$

## Các bước tính toán:

1. Tính tích vô hướng $\mathbf{x} \cdot \mathbf{y}$:
   * $\mathbf{x} \cdot \mathbf{y} = (1 \times 1) + (2 \times 0) + (3 \times 3) + (4 \times 0) = 1 + 0 + 9 + 0 = 10$

2. Tính độ dài của $\mathbf{x}$:
   * $\|\mathbf{x}\| = \sqrt{1^2 + 2^2 + 3^2 + 4^2} = \sqrt{1 + 4 + 9 + 16} = \sqrt{30} \approx 5.4772$

3. Tính độ dài của $\mathbf{y}$:
   * $\|\mathbf{y}\| = \sqrt{1^2 + 0^2 + 3^2 + 0^2} = \sqrt{1 + 0 + 9 + 0} = \sqrt{10} \approx 3.1623$

4. Tính mẫu số:
   * $\|\mathbf{x}\| \|\mathbf{y}\| \approx 5.4772 \times 3.1623 \approx 17.3205$

5. Tính độ tương đồng Cosine:
   * $\text{cosine similarity} = \frac{10}{17.3205} \approx 0.5774$

## Kết quả:

Độ tương đồng Cosine giữa x và y là xấp xỉ 0.5774.

In [1]:
import numpy as np

def cosine_similarity(x, y):
  if len(x) != len(y):
    return -1
  dot_product = np.dot(x, y)
  norm_x = np.linalg.norm(x)
  norm_y = np.linalg.norm(y)
  return dot_product / (norm_x * norm_y)

In [2]:
x = np.array([1, 2, 3, 4])
y = np.array([1, 0, 3, 0])
print(f"Độ tương đồng cosine là: {cosine_similarity(x,y)}")

Độ tương đồng cosine là: 0.5773502691896257
