### Sadə Fuzzy Search Alqoritmi

In [7]:
import difflib
import Levenshtein

def fuzzy_search(query, word_list, threshold=0.5):
    
    matches = []
    for word in word_list:
        similarity = Levenshtein.ratio(query.lower(), word.lower())

        if similarity >= threshold:
            matches.append((word, similarity))

    matches.sort(key=lambda x: x[1], reverse=True)

    return matches


word_list = ["kompüter", "kompyuter", "telefon", "kitab", "televizor", "kamera"]

query = "kitap"
result = fuzzy_search(query, word_list)

print("Oxşar sözlər:")
for word, score in result:
    print(f"{word} - Oxşarlıq: {score:.2f}")


Oxşar sözlər:
kitab - Oxşarlıq: 0.80


### Fuzzy Search

In [14]:
import difflib
import Levenshtein

def load_words_from_file(filename):
    try:
        with open(filename, "r", encoding="utf-8") as file:
            words = [line.strip() for line in file if line.strip()]
        return words
    except FileNotFoundError:
        print(f"Error: The file '{filename}' was not found.")
        return []

def fuzzy_search(query, word_list, threshold=0.7):
    matches = []
    
    for word in word_list:
        similarity = Levenshtein.ratio(query.lower(), word.lower())
        if similarity >= threshold:
            matches.append((word, similarity))
    
    matches.sort(key=lambda x: x[1], reverse=True)
    return matches

filename = "words.txt"
word_list = load_words_from_file(filename)

if word_list:
    query = input("Enter a word to search: ")
    result = fuzzy_search(query, word_list)

    print("\nSimilar words:")
    for word, score in result:
        print(f"{word} - Similarity: {score:.2f}")

Enter a word to search: təhsil

Similar words:
təhsil - Similarity: 1.00
təhsilcə - Similarity: 0.86
təhsilli - Similarity: 0.86
təfsil - Similarity: 0.83
təhlil - Similarity: 0.83
təhsin - Similarity: 0.83
təhvil - Similarity: 0.83
təmsil - Similarity: 0.83
əsil - Similarity: 0.80
təhsillən - Similarity: 0.80
təhsillik - Similarity: 0.80
təhsilsiz - Similarity: 0.80
əlhasil - Similarity: 0.77
təhlili - Similarity: 0.77
təsirli - Similarity: 0.77
aztəhsilli - Similarity: 0.75
teletəhsil - Similarity: 0.75
ümumtəhsil - Similarity: 0.75
əskil - Similarity: 0.73
fəsil - Similarity: 0.73
hasil - Similarity: 0.73
kəsil - Similarity: 0.73
nəsil - Similarity: 0.73
rəhil - Similarity: 0.73
təbil - Similarity: 0.73
təcil - Similarity: 0.73
təpil - Similarity: 0.73
təpsi - Similarity: 0.73
təsir - Similarity: 0.73
təsis - Similarity: 0.73
tətil - Similarity: 0.73
xəsil - Similarity: 0.73
müttəsil - Similarity: 0.71
təfsilat - Similarity: 0.71
təfsilən - Similarity: 0.71
təfsilli - Similarity: 0.

### Soundex və Metaphone ilə Fonetika əsaslı Fuzzy Search

In [24]:
from metaphone import doublemetaphone

def load_words_from_file(filename):
    try:
        with open(filename, "r", encoding="utf-8") as file:
            words = [line.strip() for line in file if line.strip()]
        return words
    except FileNotFoundError:
        print(f"Xəta: '{filename}' faylı tapılmadı.")
        return []

def phonetic_fuzzy_search(query, word_list):
    query_code = doublemetaphone(query)[0]
    matches = []
    
    for word in word_list:
        word_code = doublemetaphone(word)[0]
        if query_code == word_code:
            matches.append(word)
    
    return matches

filename = "words.txt"
word_list = load_words_from_file(filename)

if word_list:
    query = input("Axtarmaq istədiyiniz sözü daxil edin: ")
    result = phonetic_fuzzy_search(query, word_list)

    print("\nFonetik olaraq oxşar sözlər:")
    if result:
        for word in result:
            print(f"- {word}")
    else:
        print("Oxşar söz tapılmadı.")

Axtarmaq istədiyiniz sözü daxil edin: fateh

Fonetik olaraq oxşar sözlər:
- fata
- fateh
- fatihə
- fayda
- feod
- fit
- fot
- foto
- fut
- vadi
- vatt
- veda
- veto
- vida
- video


### AI dəstəkli Fuzzy Search (BERT Modeli ilə)

Daxil edilən datadakı sözlə məna uyğunluğu olan sözlərin print edilməsi

In [30]:
from sentence_transformers import SentenceTransformer
from sklearn.metrics.pairwise import cosine_similarity
import numpy as np

model = SentenceTransformer("paraphrase-MiniLM-L6-v2")

def load_words_from_file(filename):
    try:
        with open(filename, "r", encoding="utf-8") as file:
            words = [line.strip() for line in file if line.strip()]
        return words
    except FileNotFoundError:
        print(f"Xəta: '{filename}' faylı tapılmadı.")
        return []

def semantic_fuzzy_search(query, word_list, threshold=0.7):
    query_vec = model.encode([query])
    word_vecs = model.encode(word_list)
    
    similarities = cosine_similarity(query_vec, word_vecs)[0]

    filtered_results = [(word_list[i], similarities[i]) for i in range(len(word_list)) if similarities[i] > threshold]
    
    filtered_results.sort(key=lambda x: x[1], reverse=True)
    
    return filtered_results

filename = "words.txt"
word_list = load_words_from_file(filename)

if word_list:
    query = input("Axtarmaq istədiyiniz sözü daxil edin: ")
    result = semantic_fuzzy_search(query, word_list)

    print("\nMənaya görə oxşar sözlər (0.7-dən yüksək oxşarlıq ilə):")
    if result:
        for word, score in result:
            print(f"- {word} (Oxşarlıq: {score:.2f})")
    else:
        print("Oxşar söz tapılmadı.")

Axtarmaq istədiyiniz sözü daxil edin: kitab

Mənaya görə oxşar sözlər (0.7-dən yüksək oxşarlıq ilə):
- kitab (Oxşarlıq: 1.00)
- kitabça (Oxşarlıq: 0.86)
- kitabdar (Oxşarlıq: 0.84)
- kitabsatan (Oxşarlıq: 0.82)
- kitabə (Oxşarlıq: 0.79)
- kitabxana (Oxşarlıq: 0.78)
- kitabət (Oxşarlıq: 0.77)
- kitabşünas (Oxşarlıq: 0.76)
- kitab-albom (Oxşarlıq: 0.74)
- kitabfüruş (Oxşarlıq: 0.73)
- kitabçı (Oxşarlıq: 0.72)
- kitabsevər (Oxşarlıq: 0.71)
- kitabsevən (Oxşarlıq: 0.71)
