In [2]:
#Module 1 : Introduction à la théorie des graphes


import networkx as nx
import matplotlib.pyplot as plt
%matplotlib inline 

G = nx.read_gml('lesmis.gml')     #import graphe networkx.classes.graph.Graph

pos = nx.fruchterman_reingold_layout(G)     # fct graphe sur l objet G

plt.figure(figsize = (20, 10))     #  cree une figure
nx.draw_networkx_nodes(G, pos)     #  place les points a leur position
nx.draw_networkx_edges(G, pos, edge_color = "#75DFC1")     #liens des points
nx.draw_networkx_labels(G, pos)     # place les labels sur le graphe
plt.show();         #

#-----------------------------------------------------------------------

dict1 = dict(G.degree())   #l argument degree permet de get le nombre de link
for pers in sorted(dict1, key=dict1.get)[-5:-1]:
    print(pers,  "est connecté à", G.degree(pers), "autres personnages")

#-----------------------------------------------------------------------

#méthodes qui permet d'identifier des communautés 
    
#faire tourner la méthode de Louvain sur le graphe
from community.community_louvain import best_partition
best_part = best_partition(G)   #fonction best part (G)

# afficher le résultat de l'algorithme de Louvain
plt.figure(figsize=(20,10))     #figure
plt.axis('off')      #axe invisible

pos = nx.fruchterman_reingold_layout(G)  # fct graphe sur l objet G
node_cluster = list(best_part.values())  # fonction best part (G) value: color

nx.draw_networkx_nodes(G, pos, node_color = node_cluster)   #point
nx.draw_networkx_edges(G, pos, alpha = 0.5)   #link
nx.draw_networkx_labels(G, pos)   #label
plt.show()

#-----------------------------------------------------------------------

#qualité de notre partitionnement 

from networkx.algorithms.community.quality import coverage

# Définir la séquence de la meilleure partition
sequence = [list() for _ in range(6)]
sorted_best_partition = sorted(best_part.items(), key=lambda t: t[1])
for e in sorted_best_partition:
    sequence[e[1]].append(e[0])

# Mesurer la qualité de la méthode de Louvain
print("Ce partitionnement obtient un score de couverture de :", coverage(G, sequence))


In [None]:
#module 2 : Premiers pas 

import networkx as nx
import pandas as pd
%matplotlib inline

df = pd.read_csv ('edgelist.csv')
df.head()

#-----------------------------------------------------------------------

G = nx.from_pandas_edgelist(df)   #networkx.classes.graph.Graph depuis 1 df 
nx.draw_networkx(G)  #trace le graphe

#-----------------------------------------------------------------------

G = nx.Graph()   # Créer un graphe vide

# Ajout de noeuds
#-----------------------------------------------------------------------

H = nx.path_graph(12)  #creation d un graph avec des points
G.add_nodes_from(H)   #ajout de ces noeuds

# Ajout d'arêtes 
#-----------------------------------------------------------------------
G.add_edges_from([(0, 1), (1, 2), (2, 3),    #liens entre les noeuds
                  (3, 4), (7, 8), (8, 9),    #
                  (9, 10), (10, 11)])


#fct et attribut
G.number_of_nodes()
G.number_of_edges()
G.nodes



# Suppression d'un noeud ou d'une arête
#-----------------------------------------------------------------------
G.remove_nodes_from([5, 6, 7])

list(G.nodes)   #verification de la suppression des nodes 



#Degré d'un noeud
#-----------------------------------------------------------------------
# Calculer le degré du sommet 1 du graphe G
G.degree[1]    #degree = 2 le noeud est connecte a deux noeuds


#Matrice d'adjacence
#-----------------------------------------------------------------------
# Calculer la matrice d'adjacence du graphe G
A = nx.adjacency_matrix(G)

# Convertir et afficher la matrice d'adjacence du graphe G
A.todense()
#A noter que la matrice d'adjacence d'un graphe non orienté est toujours symétrique


#Visualisation des graphes
#-----------------------------------------------------------------------
nx.draw_networkx(G)


#personnaliser la représentation graphique d'un graphe
#-----------------------------------------------------------------------
# Définir les paramètres de la représentation graphique du graphe G
options = {
    'node_color': '#75DFC1',
    'edge_color': '#009999',
    'node_size': 500,
    'width': 2,
    'with_labels': True,
    'font_weight': 'bold'
}

# Afficher le graphe G 
nx.draw_circular(G, **options)
#La méthode du dictionnaire d'options est très pratique 
#pour passer les mêmes options en parmaètre de plusieurs graphes.

In [None]:
#module 3 : Algorithmes fondamentaux : Kruskal et Dijkstra


#Importez le package NetworkX sous le nom nx
import networkx as nx
import matplotlib

##
G = nx.Graph()

G.add_nodes_from(range(1, 32))

G.add_edges_from([(1, 3), (2, 9), (2, 10), (10, 19), (10, 20), (10, 3), (20, 11), (20, 21), (21, 22),\
                  (11, 12), (3, 4), (3, 13), (13, 23), (23, 24), (14, 5), (5, 15), (15, 26), (15, 25),\
                  (15, 6), (6, 7), (7, 8), (7, 16), (17, 18), (17, 32), (32, 31), (16, 28), (16, 30),\
                  (30, 29), (28, 27), (17, 8), (16, 32), (28, 6), (28, 26), (6, 27), (1, 5), (1, 4),\
                  (3, 12), (3, 11), (4, 12), (5, 11), (3, 5), (4, 5)])
##
#Affichez le graphe généré
nx.draw_spring(G, with_labels=True)

# ---------------------------------------------------------------

nx.is_connected(G)   #détermine si le graphe  GG  est connexe

print(nx.is_tree(G))     #détermine si le graphe G est un arbre

print(nx.find_cycle(G))     # identifiez une liste d'arrêtes formant un cycle dans ce graphe


#Calcul des nodes et des arretes
# ---------------------------------------------------------------
# Calculer la taille du graphe G
order = nx.number_of_nodes(G)
print("Le graphe a :",order, "noeuds")

# Calculer l'ordre du graphe G
size = nx.number_of_edges(G)
print("Le graphe a :", size, "arêtes")

# Calculer la degré moyen du graphe G
average_degree = 2 * size / order
print("Soit une moyenne de" , average_degree, "arêtes par noeuds")

# Algotrithme de Kruskal
# ---------------------------------------------------------------
#il cherche à optimiser une solution localement en espérant 
# onverger vers l'optimum global.
#tracez un graphe a partir d un fichier texte

import matplotlib.pyplot as plt

G = nx.read_weighted_edgelist('fibre_optique.txt')
V = nx.number_of_edges(G)     #nombre arrete 
print("Ce graphe a", V, "arêtes")

pos = nx.fruchterman_reingold_layout(G)   # fonction applique a g

plt.figure(figsize = (20, 10))
nx.draw_networkx_nodes(G, pos)    #point sur la figure
nx.draw_networkx_edges(G, pos, alpha = 0.3)    #lien sur la figure

labels = nx.get_edge_attributes(G,'weight')  # definition du label

nx.draw_networkx_edge_labels(G,pos,edge_labels=labels)    #label des axes
nx.draw_networkx_labels(G,pos)       #label des points
plt.show()



mst = nx.tree.minimum_spanning_tree(G)   #permet de trouver l'arbre couvrant

plt.figure(figsize = (20, 10))   #creation d une figure
nx.draw_networkx_nodes(mst, pos)   #dessine les points
nx.draw_networkx_edges(mst, pos, alpha = 0.3)   #dessine les links
labels = nx.get_edge_attributes(mst,'weight')   #
nx.draw_networkx_edge_labels(mst,pos,edge_labels=labels)   #dessin les labels links
nx.draw_networkx_labels(mst,pos)   #dessine les labels
plt.show()

print("L'arbre couvrant de poids minimal a", nx.number_of_edges(mst), "arêtes")

# Insérez votre code ici

print("Le coût de construction de tous les canaux de fibre est de", G.size(weight = 'weight'), "k€")
print("Le coût de construction du réseau obtenu par Kruskal est de", mst.size(weight = 'weight'), "k€")



# Algorithme de Dijkstra
# ---------------------------------------------------------------

#La fonction shortest_path du package NetworkX permet de calculer le plus court chemin 
#entre deux points d'un graphe.

#affichez le plus court chemin entre la ville n°9 et la ville n°34
print("Le plus court chemin entre la ville 9 et la ville 34 est :",nx.shortest_path(G, source = '9', target = '34', weight = 'weight'))

#affichez le plus court chezmin depuis la ville n°12 vers toutes les autres villes.
print("La ville 12 est accessible par les chemins :",nx.shortest_path(G, source = '12', weight = 'weight'))

#Calculer la longueur du chemin entre les villes 9 et 34
nx.shortest_path_length(G, source = '9', target = '34', weight = 'weight')

#Comparez le plus court chemin moyen entre le graphe du réseau complet et 
#l'arbre couvrant minimum calculé plus tôt
print("Temps de parcours moyen dans le véritable réseau :\t", nx.average_shortest_path_length(G, weight = 'weight'))
print("Temps de parcours moyen dans le réseau réduit :\t\t", nx.average_shortest_path_length(mst, weight = 'weight'))

In [None]:
# Théorie des graphes et analyse des réseaux sociaux 
# Détection de communautés 

# --------------------------------------------------------------------------
# une communaute : 

# Une communauté est formée par un ensemble d'individus qui interagissent 
# plus souvent entre eux qu'avec les autres. Il s'agit donc de groupes 
# d'individus qui ont formés des liens plus forts ou qui ont 
# des affinités communes.

# --------------------------------------------------------------------------
#Detection de communaute : 

# La détection de communautés a pour rôle de mettre en évidence ces groupes 
# qui se sont formés implicitement, qui ne résultent pas d'un choix explicite.
# Dans une entreprise, à titre d'exemple, les employés forment des communautés 
# explicites (les services), mais certains vont collaborer plus souvent avec 
# d'autres et former des communautés implicites.

#La détection de communautés permet d'identifier des profils types, d'effectuer 
#des actions ciblées, de mieux ajuster les recommandations, réorganisation, 
#d'identifier les acteurs centraux ou influents, etc.

# --------------------------------------------------------------------------
#Représentation d'un réseau social

# Un réseau social peut être représenté par un graphe  G(V,E) où  
# V  représente l'ensemble des sommets (vertices en anglais)   
# E  l'ensemble des arêtes (edges en anglais). 
# On rappelle qu'un graphe peut être représenté à l'aide de sa matrice adjacence  (Aij)(Aij) .

# Au sens du graphe, une communauté est constitué par un ensemble de nœuds 
# qui sont fortement liés entre eux, et faiblement liés avec les nœuds situés 
# en dehors de la communauté.

#-----------------------------------------------------------------------

import numpy as np
import networkx as nx

import matplotlib.pyplot as plt
%matplotlib inline

# Fixer la graine, afin d'avoir des valeurs reproductibles
np.random.seed(1)

# Générer le réseau de karaté de Zachary
z = nx.karate_club_graph()

# Listes des noeuds de chaque communautés
mr_hi_node = [0]
mr_hi_group = [1, 2, 3, 4, 5, 6, 7, 8, 10, 11, 12, 13, 16, 17, 19, 21]
john_a_node = [33]
john_a_group = [9, 14, 15, 18, 20, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32]

# Positionner les noeuds en utilisant l'algorithme Fruchterman-Reingold
# Il permet un positionnement idéal des points sur un graphique pour un eviualisation claire.
pos = nx.fruchterman_reingold_layout(z)

# Afficher les deux communautés du réseau de Karaté
plt.figure(figsize = (20, 10))

nx.draw_networkx_nodes(z, pos, node_size = 400, #point group Mr Hi
                       nodelist = mr_hi_group, 
                       node_color = "#272839")

nx.draw_networkx_nodes(z, pos,              #point Mr Hi
                       node_size = 800, 
                       nodelist = mr_hi_node, 
                       node_color = "#272839")

nx.draw_networkx_nodes(z, pos, node_size = 800,    #point john
                       nodelist = john_a_node, 
                       node_color = "#75DFC1")

nx.draw_networkx_nodes(z, pos, node_size = 400,    #point group john
                       nodelist = john_a_group, 
                       node_color = "#75DFC1")

nx.draw_networkx_edges(z, pos, alpha = 0.3, edge_color = "#48dbc8")
nx.draw_networkx_labels(z, pos, {0:"Hi", 33:"John"}, font_color = "white")
plt.show()

#----------------------------------------------------------------------
# Nombre de sommets et d'arêtes
print("Nombre d'arêtes \t:", z.size())  #nombre d'arêtes du réseau z
print("Nombre de sommets \t:", z.order())  #nombre de sommets du réseau z

# Vérifier que le réseau est connexe
is_connected = nx.is_connected(z)
print("Le réseau de Karaté est", (1 - is_connected) * "non", 'connexe')

# Affecter respectivement aux variables A, diameter 
# density la matrice d'adjacence
A = nx.adjacency_matrix(z)
diameter = nx.diameter(z)
density = nx.density(z)

#-----------------------------------------------------------------------
# Calculer la longueur de plus court chemin entre tous les sommets du graphe z
path_length = dict(nx.all_pairs_shortest_path_length(z))

# Définir la matrice distances
n = len( z.nodes() )
distances = np.zeros((n, n))
for u in path_length.keys() :
    for v in path_length[u].keys() :
        distances[u][v] = path_length[u][v]
        
        

        
from scipy.cluster.hierarchy import linkage

hclust = linkage(distances, method = 'ward')


from scipy.cluster.hierarchy import dendrogram

 
# Initialisaion de la figrue
plt.figure(figsize=(20, 10))
# Affichage du dendrogramme
plt.title("Dendrogramme CAH")
dendrogram(hclust, color_threshold = 17)
plt.show()


#Approche Agglomérative basée sur la maximisation de la modularité
#-----------------------------------------------------------------------

# grouper les sommets

# Importer la classe community_louvain
from community.community_louvain import best_partition

# Calculer et afficher la meilleure répartition des groupes
best_part = best_partition(z)
print('La meilleure répartition est:\n', best_part)



# Afficher les différents groupes de la meilleure répartition du réseau z
plt.figure(figsize=(10,10))
plt.axis('off')
pos = nx.fruchterman_reingold_layout(z)
node_cluster = list(best_part.values())
nx.draw_networkx_nodes(z, pos, node_color = node_cluster)
nx.draw_networkx_edges(z, pos, alpha = 0.5)
nx.draw_networkx_labels(z, pos, {0:"Hi", 33:"John"}, font_color = "white")
plt.show()



#Approche divisive, algorithme de Girvan-Newman
#-----------------------------------------------------------------------
# identifier les arêtes qui font le lien entre des communautés 
#Approche divisive, algorithme de Girvan-Newman
from networkx.algorithms.community import girvan_newman
communities_generator = nx.algorithms.community.girvan_newman(z)

community = next(communities_generator)
community   #premier partitionnement créé par l'algorithme de Girvan-Newman



#Évaluation de l'approche agglomérative
#-----------------------------------------------------------------------

from networkx.algorithms.community.quality import performance

performance(z,community)



# Calculer un itérateur 
communities_generator = nx.algorithms.community.girvan_newman(z)

#On initialise les variables nécessaires à la boucle
best_score = 0
scores = []

# Mesure de la performance de chaque partitionnement
for partition in communities_generator :
    cur_score = performance(z, partition)
    
    if(cur_score >= best_score) :
        best_partition = partition
        best_score = cur_score
        
    scores.append(cur_score)

# Tracer les performances de chaque partitionnement
plt.plot(range(len(scores)), scores);
print(best_partition)

In [None]:
#Algorithme PageRank


# Lecture du fichier 'polblogs.gml'
Gr = nx.read_gml('polblogs.gml')
# Affichage du nombre de noeuds
print('Il y a ',nx.number_of_nodes(Gr),' noeuds.', sep = '')
# Affichage du nombre d'arêtes
print('Il y a ',nx.number_of_edges(Gr),' arêtes.', sep = '')


# Création de la liste L grâce à la méthode adj
L = list(Gr.adj['alternateworlds.blogspot.com'])
# Remplacement de G par son sous-graphe du voisinage de "alternateworlds.blogspot.com"
G = Gr.subgraph(L)


# On définit le nouveau nombre de noeuds de G
N = nx.number_of_nodes(G)
# Création du dictionnaire par compréhension
dic = dict((L[i], i) for i in range(N))



# Création des options du graphe à l'aide de Matplotlib en précisant labels': dic
plt.figure(figsize = (10, 4))
options = {
    'node_color': '#FF0000',
    'edge_color': '#000000',
    'node_size': 700,
    'width': 3,
    'with_labels': True,
    'font_weight': 'bold',
    'labels': dic
}
# Affichage du graphe
nx.draw_circular(G, **options)
plt.show()



# Algorithme Simplifié

def PageRankSimple(G, dic, pagerank_old):
    N = nx.number_of_nodes(G)
    # Création de l'itération+1
    pagerank_new = np.ones(N)
    # On applique l'algorithme à tous les noeuds de G
    for site in G.nodes():
        somme = 0
        # on fait la somme où on attribue à chaque page pointant vers notre page son ancienne probablité divisée par le nombre
        # de pages total
        for voisin in G.predecessors(site):
            somme += pagerank_old[dic[voisin]]/G.out_degree(voisin)
        # Traitement des noeuds qui n'ont pas de liens sortants
        for s in G.nodes():
            if G.out_degree(s) == 0:
                somme += pagerank_old[dic[s]]/N
        # On stock les valeurs dans le nouveau vecteur des poids
        pagerank_new[dic[site]] = somme
    # On actualise les anciennes valeurs des poids
    return(pagerank_new)



# Initialisation des poids
pagerank_old = np.ones(N)/N
for compteur in range(3):
    # On applique l'algorithme à G, son dictionnaire et le vecteur des poids à actualiser
    pagerank_new = PageRankSimple(G, dic, pagerank_old)
    # Le nouveau vecteur des poids devient maintenant l'ancien
    pagerank_old = pagerank_new
    print('La somme des poids vaut ', np.sum(pagerank_new),', ce qui vaut bien approximativement 1.'\
if np.isclose(1,np.sum(pagerank_new)) else "La somme n'est pas proche de 1.", sep = '')


    
    
print('Les 4 plus gros sites Web ont pour indices: ', np.argsort(pagerank_new)[-4:], ' ce qui correspond aux sites\
 Web suivants:', sep = '')
for i in np.argsort(pagerank_new)[-4:]:
    print(list(dic.items())[i][0])
# Graphiquement on peut remarquer la même chose


#Algorithme Facteur Amortissement
#---------------------------------------------------------------------

#'algorithme PageRank avec un facteur d'amortissement.
def PageRankFA(G, dic, pagerank_old, d = 0.85):
    N = nx.number_of_nodes(G)
    # Création de l'itération+1
    pagerank_new = np.ones(N)
    # On applique l'algorithme à tous les noeuds de G
    for site in G.nodes():
        somme = 0
        # Calcul de la somme
        for voisin in G.predecessors(site):
            somme += pagerank_old[dic[voisin]]/G.out_degree(voisin)
        # Traitement des noeuds qui n'ont pas de liens sortants
        for s in G.nodes():
            if G.out_degree(s) == 0:
                somme += pagerank_old[dic[s]]/N
        # On stock les valeurs dans le nouveau vecteur des poids
        pagerank_new[dic[site]] = (1-d)/N+d*somme
    # On actualise les anciennes valeurs des poids
    return(pagerank_new)


# Initialisation des poids
pagerank_old = np.ones(N)/N
for compteur in range(3):
    # On applique l'algorithme à G, son dictionnaire et le vecteur des poids à actualiser
    pagerank_new = PageRankFA(G, dic, pagerank_old)
    # Le nouveau vecteur des poids devient maintenant l'ancien
    pagerank_old = pagerank_new
    print('La somme des poids vaut ', np.sum(pagerank_new),', ce qui vaut bien approximativement 1.'\
if np.isclose(1,np.sum(pagerank_new)) else "La somme n'est pas proche de 1.", sep = '')


print('Les 4 plus gros sites Web ont pour indices: ',np.argsort(pagerank_new)[-4:],' ce qui correspond aux sites\
Web suivants:', sep = '')
for i in np.argsort(pagerank_new)[-4:]:
    print(list(dic.items())[i][0])
# On obtient bien la même chose que précédemment




#Application à tout le graphe
#---------------------------------------------------------------------
L = list(Gr.nodes())
N = len(L)
# Création d'un dictionnaire pour toute la base
dic = dict((L[i], i) for i in range(N))
# Initialisation de la matrice M
M = np.zeros((N,N))
# Remplissage de la matrice par colonne
for j in range(N):
    # Liste des pages sur lesquelles la colonne pointe
    liste = list(Gr.successors(L[j]))
    Nl = len(liste)
    # Remplissage de chacune des cases de ces pages par la formule définit précédemment
    for i in range(Nl):
        M[dic[liste[i]], j] = 1/Nl
# Traitement des colonnes nulles
for j in range (N):
    if np.sum(M[:,j]) == 0:
        M[:,j] = np.ones(N)/N


iter = int(round(np.log(N)))
# Déclaration du facteur d'amortissement
d = 0.85
# Initialisation des poids
pagerank_old = np.ones(N)/N
# Initialisation du nouveau vecteur des poids
pagerank_new = np.ones(N)
# Création du vecteur constant
vconst = np.ones(N)*(1-d)/N
for _i in range(iter):
    pagerank_new = d*np.matmul(M,pagerank_old)+(1-d)/N
    pagerank_old = pagerank_new
np.sum(pagerank_new)
print('La somme des poids vaut ', np.sum(pagerank_new),', ce qui vaut bien approximativement 1.'\
if np.isclose(1,np.sum(pagerank_new)) else "La somme n'est pas proche de 1.", sep = '')




print('Les 10 plus gros sites Web ont pour indices: ',np.argsort(pagerank_new)[-10:],' ce qui correspond aux sites\
 Web suivants:', sep = '')
L = list(Gr.nodes())
dic = dict((L[i], i) for i in range(N))
for i in np.argsort(pagerank_new)[-10:]:
    print(list(dic.items())[i][0])
# On obtient bien la même chose que précédemment



#Idée Algorithmique
#---------------------------------------------------------------------


def marche_aléatoire(G = Gr, pas = 10, init = None):
    N = nx.number_of_nodes(G)
    # Création de la liste des noeuds
    L = list(G.nodes())
    # On va définir la fonction par récursivité, pour ça il faut distinguer les cas où on est déjà au milieu
    # de la marche aléatorie du cas où on est au début du graphe
    if init == None:
        # Si on n'a pas initialisé la marche aléatoire, on choisit un noeud au hasard du graphe
        X = randint(0,N-1)
        Start = L[X]
    else:
        # Sinon on utilise le noeud renseigné
        Start = init
    # On utilise l'algorithme avec facteur d'amortissement
    d = 0.85
    Stop = randint(1,100)
    if Stop > 85:
        return(Start)
    # On définit les successeurs du noeud initial pour savoir où aller
    V = list(G.successors(Start))
    # Si il n'y a pas de voisin, on recommence la marche en choisissant au hasard un nouveau noeud du graphe,
    # on perd donc un pas
    if len(V) == 0:
        return(marche_aléatoire(G = Gr , pas = pas-1, init = None))
    else:
        # On choisit un voisin au hasard dans les successeurs du noeud initial
        Y = randint(0, len(V)-1)
        if pas == 1:
            # Si le pas vaut 1 on retourne ce voisin, on aura fait une marche aléatoire de taille 1
            return(V[Y])
        else:
            # Sinon on réapplique notre fonction avec comme noeud initial, le voisin précédemment choisi
            # et on diminue le pas de 1
            return(marche_aléatoire(G = Gr , pas = pas-1, init = V[Y]))
        
        
        
#fonction trimi qui prendra pour argument 
#une liste et renverra une liste de tuple triée

def trimi(L):
    # On définit un dictionnaire vide
    Di = {}
    taille = len(L)
    # On itère sur chaque élément de la liste pour les rajouter dans le dictionnaire
    for i in range(taille):
        # Si l'élément n'est pas dans le dictionnaire, on le rajoute avec une fréquence de 1
        if L[i] not in Di:
            Di = { **Di, **{ L[i] : 1}}
        # Sinon on augmente de 1 sa fréquence dans le dictionnaire
        else:
            Di[L[i]] += 1
    # On retourne le dictionnaire trié selon les valeurs
    return(sorted(Di.items(), key = lambda val: val[1]))
        
        
L = []
# On crée une liste de 100000 marches aléatoires
for _i in range(10000):
    L.append(marche_aléatoire())
# On l'a tri
tri = trimi(L)
# On affiche les 10 éléments qui reviennent le plus souvant
tri[-10:]
# On se rend compte que c'est quasiment la même chose qu'en utilisant l'algorithme de PageRank
        
        
        
        
    

In [None]:
import matplotlib.pyplot as plt
import networkx as nx
G = nx.read_gml('lesmis.gml')
pos = nx.fruchterman_reingold_layout(G)

plt.figure(figsize=(10,10))
plt.axis('off')

nx.draw_networkx_nodes(G, pos)
nx.draw_networkx_edges(G, pos, alpha = 0.5)
nx.draw_networkx_labels(G, pos, font_color = "white")

nx.draw_networkx (G)




# Importer la classe community_louvain
from community.community_louvain import best_partition


# Afficher les différents groupes de la meilleure répartition du réseau z
plt.figure(figsize=(10,10))
plt.axis('off')
pos = nx.fruchterman_reingold_layout(G)
node_cluster = list(best_part.values())
nx.draw_networkx_nodes(G, pos, node_color = node_cluster)
nx.draw_networkx_edges(G, pos, alpha = 0.5)
nx.draw_networkx_labels(G, pos,  font_color = "white")
plt.show() ;







from community.community_louvain import best_partition
best_part = best_partition(G)   #fonction best part (G)

from networkx.algorithms.community.quality import coverage

# Définir la séquence de la meilleure partition
sequence = [list() for _ in range(6)]
sorted_best_partition = sorted(best_part.items(), key=lambda t: t[1])
for e in sorted_best_partition:
    sequence[e[1]].append(e[0])

# Mesurer la qualité de la méthode de Louvain
print("Ce partitionnement obtient un score de couverture de :", coverage(G, sequence))

Examen 

Théorie des graphes et analyse des réseaux sociaux 



L'exercice est composé de plusieurs questions, faites-les dans l'ordre et faites attention à respecter le nom des variables. N'hésitez pas à contacter l'équipe DataScientest si vous rencontrez des problèmes sur help@datascientest.com

L'objet de cet exercice est d'explorer le réseau social des personnages de la série télévisée Game of Thrones. Après avoir réalisé un travail de visualisation et de caractérisation du réseau social, on cherchera à détecter des communautés parmi les personnages.

Cet exercice porte sur les données got.csv : deux personnages sont reliés si ils partagent une scène dans la première saison de la série Game of Thrones.

Importez le package pandas sous le nom pd
Chargez le fichier got.csv dans un DataFrame appelé df
Affichez les 5 premières lignes de df

In [None]:
import pandas as pd

df = pd.read_csv ('got.csv',index_col=[0])
df.head()

Importez le package NetworkX sous le nom nx
Importez le sous module matplotlib.pyplot sous le nom plt
Transformez le DataFrame df en un graphe z
En utilisant la disposition de Fruchterman-Reignold, affichez le graphe z

In [None]:
import networkx as nx
import matplotlib.pyplot as plt

G = nx.from_pandas_edgelist(df)

pos = nx.fruchterman_reingold_layout(G)    

plt.figure(figsize = (20, 16)) 
plt.axis('off')
nx.draw_networkx_nodes(G, pos)   
nx.draw_networkx_edges(G, pos, edge_color = "#75DFC1")    
nx.draw_networkx_labels(G, pos)     
plt.show();   


Calculez le nombre de connexions moyennes pour un personnage
Calculez la distance entre les deux peronnages les plus éloignés dans le graphe

In [None]:
v1 = G.number_of_nodes()
v2 = G.number_of_edges()

print (v1)
print (v2)

print ('Le nombre de connexions moyennes',v2/v1)

Importez la fonction best_partition du sous package community.community_louvain
A l'aide de la méthode de Louvain, déterminez le partitionnement qui maximise la modularité de ce graphe

In [None]:
from community.community_louvain import best_partition

# Calculer et afficher la meilleure répartition des groupes
best_part = best_partition(G)
print('partitionnement :\n', best_part)




Affichez le graphe en utilisant la disposition de Fruchterman Reignold et en colorant les noeuds selon le cluster auquel ils appartiennent.

In [None]:
plt.figure(figsize=(10,10))
plt.axis('off')
pos = nx.fruchterman_reingold_layout(G)
node_cluster = list(best_part.values())
nx.draw_networkx_nodes(G, pos, node_color = node_cluster)
nx.draw_networkx_edges(G, pos, alpha = 0.5)
nx.draw_networkx_labels(G, pos, font_color = "white")
plt.show()

