In [None]:
!pip install gensim



In [None]:
!pip install navec

Collecting navec
  Downloading navec-0.10.0-py3-none-any.whl.metadata (21 kB)
Downloading navec-0.10.0-py3-none-any.whl (23 kB)
Installing collected packages: navec
Successfully installed navec-0.10.0


In [None]:
import gensim.downloader as api
from sklearn.metrics.pairwise import cosine_similarity
import numpy as np

In [None]:
# Загрузка предобученных эмбеддингов
print("Загрузка предобученной модели...")
model = api.load("word2vec-google-news-300")

Загрузка предобученной модели...


In [None]:
# Список слов для анализа
words = ["tree", "river", "book", "theater", "robot", "internet", "city", "house", "music", "painting"]
vectors = {}

In [None]:
# Получение векторных представлений
print("Получение векторов для слов...")
for word in words:
    try:
        if word in model:
            vectors[word] = model[word]
            print(f"Слово '{word}' найдено, вектор извлечен.")
        else:
            print(f"Слово '{word}' отсутствует в модели!")
    except Exception as e:
        print(f"Ошибка для слова '{word}':", e)

Получение векторов для слов...
Слово 'tree' найдено, вектор извлечен.
Слово 'river' найдено, вектор извлечен.
Слово 'book' найдено, вектор извлечен.
Слово 'theater' найдено, вектор извлечен.
Слово 'robot' найдено, вектор извлечен.
Слово 'internet' найдено, вектор извлечен.
Слово 'city' найдено, вектор извлечен.
Слово 'house' найдено, вектор извлечен.
Слово 'music' найдено, вектор извлечен.
Слово 'painting' найдено, вектор извлечен.


In [None]:
# Функция для вычисления косинусного сходства
def cosine_similarity_manual(vec1, vec2):
    dot_product = np.dot(vec1, vec2)  # Скалярное произведение
    norm_a = np.linalg.norm(vec1)    # Норма первого вектора
    norm_b = np.linalg.norm(vec2)    # Норма второго вектора
    return dot_product / (norm_a * norm_b)

In [None]:
# Инициализация матрицы сходств
similarity_matrix = np.zeros((len(words), len(words)))

# Заполнение матрицы сходств
print("\nВычисление косинусного сходства между словами...")
for i, word1 in enumerate(words):
    for j, word2 in enumerate(words):
        if word1 in vectors and word2 in vectors:
            similarity_matrix[i, j] = cosine_similarity_manual(vectors[word1], vectors[word2])
        else:
            similarity_matrix[i, j] = None  # Если слово отсутствует, ставим None

# Вывод матрицы сходств
print("\nМатрица косинусного сходства:")
print("   ", "  ".join(f"{word[:6]:>6}" for word in words))
for i, word1 in enumerate(words):
    row = "  ".join(f"{similarity_matrix[i, j]:.4f}" if similarity_matrix[i, j] is not None else "  None" for j in range(len(words)))
    print(f"{word1[:6]:>6} {row}")


Вычисление косинусного сходства между словами...

Матрица косинусного сходства:
      tree   river    book  theate   robot  intern    city   house   music  painti
  tree 1.0000  0.2307  0.1231  0.1005  0.1103  0.0511  0.1481  0.2878  0.1001  0.1645
 river 0.2307  1.0000  0.0720  0.1026  0.0634  0.0828  0.2773  0.2087  0.1171  0.1363
  book 0.1231  0.0720  1.0000  0.1224  0.0097  0.1254  0.0444  0.1611  0.1243  0.2174
theate 0.1005  0.1026  0.1224  1.0000  0.1253  0.1150  0.2116  0.2415  0.3987  0.1883
 robot 0.1103  0.0634  0.0097  0.1253  1.0000  0.1371  0.0605  0.1091  0.0224  0.0625
intern 0.0511  0.0828  0.1254  0.1150  0.1371  1.0000  0.0484  0.1072  0.2714  0.0442
  city 0.1481  0.2773  0.0444  0.2116  0.0605  0.0484  1.0000  0.2373  0.1379  0.1157
 house 0.2878  0.2087  0.1611  0.2415  0.1091  0.1072  0.2373  1.0000  0.0717  0.2292
 music 0.1001  0.1171  0.1243  0.3987  0.0224  0.2714  0.1379  0.0717  1.0000  0.2272
painti 0.1645  0.1363  0.2174  0.1883  0.0625  0.0442  0.1157 

In [None]:
# Вывод наиболее похожих слов
print("\nНаиболее похожие слова:")
for word in words:
    if word in model:
        similar_words = model.most_similar(word, topn=5)
        print(f"Слова, наиболее похожие на '{word}':")
        for similar_word, similarity in similar_words:
            print(f"  {similar_word}: {similarity:.4f}")
    else:
        print(f"Слово '{word}' не найдено в модели!")


Наиболее похожие слова:
Слова, наиболее похожие на 'tree':
  trees: 0.8293
  pine_tree: 0.7622
  oak_tree: 0.7319
  evergreen_tree: 0.6927
  fir_tree: 0.6917
Слова, наиболее похожие на 'river':
  creek: 0.7994
  lake: 0.7920
  rivers: 0.7778
  riverbank: 0.7284
  canal: 0.7222
Слова, наиболее похожие на 'book':
  tome: 0.7486
  books: 0.7379
  memoir: 0.7303
  paperback_edition: 0.6868
  autobiography: 0.6742
Слова, наиболее похожие на 'theater':
  Theater: 0.7018
  Theatre: 0.6768
  cinema: 0.6515
  repertory_theater: 0.6457
  theaters: 0.6415
Слова, наиболее похожие на 'robot':
  robots: 0.8342
  robotic: 0.8093
  Robot: 0.6990
  humanoid: 0.6655
  robotics: 0.6462
Слова, наиболее похожие на 'internet':
  Internet: 0.8345
  online: 0.6505
  Visit_OMNOVA_Solutions: 0.6497
  via_www.mobilebaybears.com: 0.6478
  Earn_Rs.####/day_working: 0.6293
Слова, наиболее похожие на 'city':
  citys: 0.6804
  mayor: 0.6751
  town: 0.6724
  municipality: 0.6531
  municipal: 0.6223
Слова, наиболее по