In [None]:
import rdflib
from gensim.models import Word2Vec

# Charger le fichier TTL avec rdflib
def load_ttl_file(file_path):
    graph = rdflib.Graph()
    graph.parse(file_path, format="ttl")
    return graph

# Créer les vecteurs d'attributs pour les entités et relations
def create_attribute_vectors(graph):
    attribute_vectors = {}
    for s, p, o in graph:
        subject_str = str(s)
        object_str = str(o)
        predicate_str = str(p)
        
        # Utiliser les noms des entités, relations et attributs comme attributs
        attributes = [subject_str, object_str, predicate_str]
        
        # Assigner un vecteur de dimension 100 à chaque attribut
        attribute_vectors[subject_str] = [attribute_vectors.get(attr, [0]*100) for attr in attributes]
        attribute_vectors[object_str] = [attribute_vectors.get(attr, [0]*100) for attr in attributes]
        attribute_vectors[predicate_str] = [attribute_vectors.get(attr, [0]*100) for attr in attributes]
    
    return attribute_vectors

# Effectuer l'apprentissage de représentations de graphe (Word2Vec) sur les vecteurs d'attributs
def graph_embedding(attribute_vectors):
    model = Word2Vec(attribute_vectors.values(), size=100, window=5, min_count=1, workers=4)
    return model

# Trouver les entités similaires entre les graphes en utilisant les vecteurs d'attributs
def align_graphs(graph1, graph2, model):
    alignements = []
    for entity1, attributes1 in attribute_vectors_graph1.items():
        for entity2, attributes2 in attribute_vectors_graph2.items():
            similarity = model.wv.similarity(attributes1[0], attributes2[0])
            # Si la similarité dépasse un seuil, ajouter l'alignement
            if similarity > 0.7:
                alignements.append((entity1, entity2, similarity))
    
    return alignements

if __name__ == "__main__":
    # Chargement du fichier TTL
    graph1 = load_ttl_file("chemin/vers/graph1.ttl")
    graph2 = load_ttl_file("chemin/vers/graph2.ttl")
    
    # Création des vecteurs d'attributs pour les entités et relations de chaque graphe
    attribute_vectors_graph1 = create_attribute_vectors(graph1)
    attribute_vectors_graph2 = create_attribute_vectors(graph2)
    
    # Apprentissage de représentations de graphe (Word2Vec) sur les vecteurs d'attributs
    model = graph_embedding(attribute_vectors_graph1)
    
    # Alignement des graphes
    alignements = align_graphs(graph1, graph2, model)
    print(alignements)
