In [7]:
import torch
import torch.nn.functional as F
from torch_geometric.nn import GCNConv, GAE
from torch_geometric.utils import from_networkx
import networkx as nx
from sklearn.cluster import KMeans
import numpy as np
import os
import csv
import time

# --- Ayarlar ---
EPOCHS = 200
HIDDEN_CHANNELS = 16
OUT_CHANNELS = 8  # Embedding boyutu
NUM_CLUSTERS = 17  # K-Means için küme sayısı (Bunu modülerliğe göre optimize etmek de mümkündür)
LEARNING_RATE = 0.01

def load_data_pyg(adjlist_path):
    """
    Adjlist dosyasını okur ve PyTorch Geometric data objesine çevirir.
    """
    print("Graf yükleniyor ve PyG formatına çevriliyor...")
    G_nx = nx.read_adjlist(adjlist_path)
    
    # Düğümleri sıralı hale getir (Mapping sorunu olmaması için)
    G_nx = nx.convert_node_labels_to_integers(G_nx, first_label=0, ordering='sorted')
    
    # NetworkX'ten PyG Data objesine çevir
    data = from_networkx(G_nx)
    
    # Eğer düğüm özellikleri (feature) yoksa, Birim Matris (Identity) kullanırız.
    # Bu, modelin her düğümü birbirinden ayırt etmesini sağlar.
    num_nodes = G_nx.number_of_nodes()
    
    # Not: Çok büyük graflarda torch.eye bellek hatası verebilir. 
    # O durumda `torch.ones((num_nodes, 1))` kullanılabilir.
    data.x = torch.eye(num_nodes) 
    
    return data, G_nx

# --- GNN Modeli (Encoder) ---
class GCNEncoder(torch.nn.Module):
    def __init__(self, in_channels, out_channels):
        super(GCNEncoder, self).__init__()
        # İlk katman: Girdi boyutu -> 2x Çıkış boyutu
        self.conv1 = GCNConv(in_channels, 2 * out_channels)
        # İkinci katman: 2x Çıkış boyutu -> Çıkış boyutu (Embedding)
        self.conv2 = GCNConv(2 * out_channels, out_channels)

    def forward(self, x, edge_index):
        # ReLU aktivasyon fonksiyonu
        x = self.conv1(x, edge_index).relu()
        return self.conv2(x, edge_index)

def train_gae(data):
    """
    Graph Autoencoder modelini eğitir.
    """
    # Model Kurulumu: Encoder olarak GCN kullanıyoruz
    in_channels = data.x.shape[1]
    model = GAE(GCNEncoder(in_channels, OUT_CHANNELS))
    
    # Optimizer (Adam en yaygın olanıdır)
    optimizer = torch.optim.Adam(model.parameters(), lr=LEARNING_RATE)
    
    print(f"\nGAE Eğitimi Başlıyor ({EPOCHS} epoch)...")
    start_time = time.time()
    
    model.train()
    for epoch in range(EPOCHS):
        optimizer.zero_grad()
        
        # Z: Latent variable (Düğümlerin yeni uzaydaki koordinatları)
        z = model.encode(data.x, data.edge_index)
        
        # Loss: Bağlantıları ne kadar iyi tahmin ettiğimize göre hesaplanır (Reconstruction Loss)
        loss = model.recon_loss(z, data.edge_index)
        
        loss.backward()
        optimizer.step()
        
        if epoch % 20 == 0:
            print(f"Epoch {epoch:03d}, Loss: {loss.item():.4f}")
            
    elapsed_time = time.time() - start_time
    print(f"Eğitim tamamlandı. Süre: {elapsed_time:.2f}sn")
    
    return model, z

def save_gnn_results(communities, algorithm_name="gnn_gae"):
    """
    Senin kodundaki CSV kaydetme yapısına uygun formatta kaydeder.
    """
    output_dir = "community_results"
    if not os.path.exists(output_dir):
        os.makedirs(output_dir)
    
    filename = os.path.join(output_dir, f"{algorithm_name}_communities.csv")
    
    try:
        with open(filename, 'w', newline='') as csvfile:
            writer = csv.writer(csvfile)
            # Dictionary'den listeye çevirip yazıyoruz
            for comm_id, members in communities.items():
                writer.writerow(members)
        print(f"Sonuçlar '{filename}' dosyasına kaydedildi.")
    except Exception as e:
        print(f"CSV kaydetme hatası: {e}")

def main():
    try:
        # 1. Veriyi Yükle
        data, G_nx = load_data_pyg("my.adjlist")
        
        # 2. Modeli Eğit
        model, z = train_gae(data)
        
        # 3. Embeddingleri Al (Gradyan takibini kapatarak)
        embeddings = z.detach().cpu().numpy()
        
        # 4. Clustering (K-Means)
        print(f"\nElde edilen embeddingler üzerinde K-Means ({NUM_CLUSTERS} küme) çalıştırılıyor...")
        kmeans = KMeans(n_clusters=NUM_CLUSTERS, random_state=42, n_init=10)
        labels = kmeans.fit_predict(embeddings)
        
        # 5. Sonuçları Düzenle
        # Format: {cluster_id: [node1, node2, ...]}
        communities = {}
        original_nodes = list(G_nx.nodes()) # Integer mapping'i geri çevirmek istersen
        
        for idx, label in enumerate(labels):
            label = int(label)
            if label not in communities:
                communities[label] = []
            # Eğer orijinal label'ları kullanmak istersen:
            # communities[label].append(original_nodes[idx])
            communities[label].append(str(idx)) 
            
        # 6. Sonuçları Yazdır ve Kaydet
        print(f"\nGNN-GAE Sonuçları:")
        for i, (comm_id, members) in enumerate(communities.items()):
            if i < 17:
                print(f"Community {comm_id}: {len(members)} members")
        
        save_gnn_results(communities)

    except FileNotFoundError:
        print("Hata: 'my.adjlist' dosyası bulunamadı. Lütfen dosya yolunu kontrol et.")
    except Exception as e:
        print(f"Beklenmedik bir hata oluştu: {e}")

if __name__ == "__main__":
    main()

Graf yükleniyor ve PyG formatına çevriliyor...

GAE Eğitimi Başlıyor (200 epoch)...
Epoch 000, Loss: 1.3863
Epoch 020, Loss: 0.9965
Epoch 040, Loss: 0.9078
Epoch 060, Loss: 0.8508
Epoch 080, Loss: 0.8367
Epoch 100, Loss: 0.8282
Epoch 120, Loss: 0.8203
Epoch 140, Loss: 0.8129
Epoch 160, Loss: 0.8059
Epoch 180, Loss: 0.8005
Eğitim tamamlandı. Süre: 297.71sn

Elde edilen embeddingler üzerinde K-Means (17 küme) çalıştırılıyor...

GNN-GAE Sonuçları:
Community 9: 330 members
Community 14: 342 members
Community 15: 298 members
Community 0: 153 members
Community 4: 187 members
Sonuçlar 'community_results\gnn_gae_communities.csv' dosyasına kaydedildi.


In [4]:
import sys
# Mevcut kernel'a kurulum yap
!{sys.executable} -m pip install torch-geometric

Collecting torch-geometric
  Using cached torch_geometric-2.7.0-py3-none-any.whl.metadata (63 kB)
Collecting aiohttp (from torch-geometric)
  Downloading aiohttp-3.13.2-cp310-cp310-win_amd64.whl.metadata (8.4 kB)
Collecting xxhash (from torch-geometric)
  Downloading xxhash-3.6.0-cp310-cp310-win_amd64.whl.metadata (13 kB)
Collecting aiohappyeyeballs>=2.5.0 (from aiohttp->torch-geometric)
  Using cached aiohappyeyeballs-2.6.1-py3-none-any.whl.metadata (5.9 kB)
Collecting aiosignal>=1.4.0 (from aiohttp->torch-geometric)
  Using cached aiosignal-1.4.0-py3-none-any.whl.metadata (3.7 kB)
Collecting async-timeout<6.0,>=4.0 (from aiohttp->torch-geometric)
  Downloading async_timeout-5.0.1-py3-none-any.whl.metadata (5.1 kB)
Collecting frozenlist>=1.1.1 (from aiohttp->torch-geometric)
  Downloading frozenlist-1.8.0-cp310-cp310-win_amd64.whl.metadata (21 kB)
Collecting multidict<7.0,>=4.5 (from aiohttp->torch-geometric)
  Downloading multidict-6.7.0-cp310-cp310-win_amd64.whl.metadata (5.5 kB)
Co


[notice] A new release of pip is available: 25.1.1 -> 25.3
[notice] To update, run: C:\Users\kahra\AppData\Local\Programs\Python\Python310\python.exe -m pip install --upgrade pip


In [5]:
!C:\Users\kahra\AppData\Local\Programs\Python\Python310\python.exe -m pip install --upgrade pip

Collecting pip
  Using cached pip-25.3-py3-none-any.whl.metadata (4.7 kB)
Using cached pip-25.3-py3-none-any.whl (1.8 MB)
Installing collected packages: pip
  Attempting uninstall: pip
    Found existing installation: pip 25.1.1
    Uninstalling pip-25.1.1:
      Successfully uninstalled pip-25.1.1
Successfully installed pip-25.3
