In [1]:
import pandas as pd
import networkx as nx

users = pd.read_csv('data/users.csv')
items = pd.read_csv('data/items.csv')
reviews = pd.read_csv('data/reviews.csv')

In [2]:
G = nx.DiGraph()

In [5]:
for _, row in items.iterrows():
    G.add_node(row['detail_id'], type='place', name=row['name'], rating=row.get('rating', 0))

for _, row in users.iterrows():
    G.add_node(row['profile_url'], type='user')

for _, row in reviews.iterrows():
    user = row['profile_url']
    place = row['detail_id']
    mark = row['mark']

    if G.has_node(user) and G.has_node(place):  # Проверяем, что узлы существуют в графе
        G.add_edge(user, place, weight=mark)

pagerank_values = nx.pagerank(G, alpha=0.85)

pagerank_places = {
    node: rank for node, rank in pagerank_values.items()
    if G.nodes[node].get('type') == 'place'
}

pagerank_sorted = sorted(pagerank_places.items(), key=lambda x: x[1], reverse=True)[:10]

In [10]:
print("Топ-10 мест по PageRank:")
for place, rank in pagerank_sorted:
    place_name = G.nodes[place]['name']
    print(f"Место: {place_name}, PageRank: {rank:.4f}")

Топ-10 мест по PageRank:
Место: Ботанический Сад  Аптекарский Огород, PageRank: 0.0010
Место: Выставка достижений народного хозяйства (ВДНХ), PageRank: 0.0007
Место: Центральный парк культуры и отдыха им. Горького, PageRank: 0.0007
Место: Московский Метрополитен, PageRank: 0.0007
Место: Музей космонавтики, PageRank: 0.0007
Место: Соборная площадь, PageRank: 0.0007
Место: Государственная Третьяковская Галерея, PageRank: 0.0006
Место: Парк Сокольники, PageRank: 0.0006
Место: Новая Третьяковка, PageRank: 0.0006
Место: Москва-Сити, PageRank: 0.0005
