In [28]:
import random


class LSH:
    def __init__(self, data, hash_size=4):
        self.data = data
        self.hash_size = hash_size
        self.hash_functions = self.generate_hash_functions()

    def generate_hash_functions(self):
        hash_functions = []
        for _ in range(self.hash_size):
            a = random.randint(1, 10)
            b = random.randint(1, 10)
            hash_functions.append(lambda x: (a * x + b) % 2)
        return hash_functions

    def hash(self, value):
        hashes = []
        for hash_func in self.hash_functions:
            hash_value = hash_func(value)
            hashes.append(hash_value)
        return hashes

    def insert(self, value):
        hashes = self.hash(value=value)
        for hash_value in hashes:
            if hash_value in self.data:
                self.data[hash_value].append(value)
            else:
                self.data[hash_value] = [value]

    def query(self, value):
        hashes = self.hash(value=value)
        similar_items = set()
        for hash_value in hashes:
            if hash_value in self.data:
                similar_items.update(self.data[hash_value])
        return similar_items

In [86]:
# Tạo dữ liệu ngẫu nhiên
data = []

for _ in range(100):
    data.append(random.randint(1, 100))

# Tạo đối tượng LSH và chèn dữ liệu
lsh = LSH({})

for value in data:
    lsh.insert(value)

# Tạo một truy vấn ngẫu nhiên
query_value = random.randint(1, 100)

# Tìm kiếm các điểm gần nhau với truy vấn
similar_items = lsh.query(query_value)

print("Giá trị query: ")
print(query_value)

print("Các điểm gần nhau với truy vấn: ")
print(similar_items)

Giá trị query: 
6
Các điểm gần nhau với truy vấn: 
{1, 3, 5, 6, 8, 9, 10, 11, 12, 13, 14, 16, 19, 20, 23, 25, 27, 29, 31, 32, 33, 34, 35, 36, 37, 39, 41, 42, 44, 48, 51, 52, 53, 54, 55, 58, 59, 61, 63, 65, 66, 67, 68, 69, 70, 71, 72, 73, 76, 77, 79, 80, 81, 83, 85, 86, 87, 88, 90, 91, 92, 93, 95, 98, 99, 100}


In [90]:
lsh.hash_functions[1]

<function __main__.LSH.generate_hash_functions.<locals>.<lambda>(x)>