In [None]:
!pip install --upgrade scipy

# Import des modules,chargement du fichier et traitement des données

In [None]:
import pandas as pd
import networkx as nx
import matplotlib.pyplot as plt
import json 

# Chargement des données du fichier csv
data = pd.read_csv(r'/kaggle/input/TwitterFriends/data.csv', sep=',(?=\S)', engine='python')

#Traitement des données/ex:enlever les guillmet present dans la colonne id
data['friends'] = [json.loads(x) for x in data.friends]
data['id'] = [int(x.replace('"','')) for x in data.id]
data['screenName'] = [x.replace('"','') for x in data.screenName]

# Création du graphe et affichage du nombre d'arêtes

In [None]:
#Création d'un graph vide
G = nx.Graph()

#Parcour les données du fichier csv  pour créer les liens 
# entre l'utilisateur(id) et sa liste de ses amis
for index, row in data[data.friendsCount < 130].iterrows():
    user_id = row['id'] 
    friends = row['friends']
    for friend_id in friends: #Parocur la liste des amis de l'utilisateur
        G.add_edge(user_id, friend_id) #Ajout d'un arête pour chaque amis

# Créer un graphique à partir des données
nombre_noeuds = G.number_of_nodes()
nombre_arêtes = G.number_of_edges()

print("Nombre de noeuds dans le graph:", nombre_noeuds)
print("Nombre d'arêtes dans le graph", nombre_arêtes)

# Visualisation du graphe qui contient 100 nœuds qui correspondent à un utilisateur dans le fichier CSV

In [None]:
import random

#Sélection de nœuds aléatoirement dans le Graphe G
noeuds_aleatoire = random.sample(G.nodes(), 100)

#création d'un sous-graphe
sousgraphe = G.subgraph(noeuds_aleatoire)

#definit la taille du graphe 10 pouces/10pouces
plt.figure(figsize=(10, 10))

#Dessine le sous-graphe G
nx.draw(sousgraphe, with_labels=False, node_size=30, edge_color='blue')

#Affichage de sous-graphe G
plt.show()

#  Visualisation des nœuds et arêtes pour un utilisateur en particulier - Méthode Artem Kharlamov

In [None]:
#ID du noeud qui correspond à un utilisateur
noeud_id_utilisateur = 99769502
#Le if permet de verifier si le noeug existe bien dans le graph G
if node_id in G:
    #Récupére les voisins du noeud sélectionné
    voisins = list(G.neighbors(noeud_id_utilisateur))
    #Liste les noeuds des voisins et le noeuds de lui-même à dessiner
    noeud_a_dessiner = voisins + [noeud_id_utilisateur]
    #Créer un sous-graphe G sur avec la liste des noeuds
    sousgraphe = G.subgraph(noeud_a_dessiner)
    #Définis la taille du dessin 10pouces/10pouces
    plt.figure(figsize=(10, 10))
    #Permet de positionner les noeuds d'une certaine manière 
    pos = nx.spring_layout(sousgraphe)
    #Dessine le sous-graphe avec la dispotion 
    #des noeuds definis avec le spring_laout
    nx.draw(sousgraphe, pos, with_labels=False, node_size=300, node_color='lightblue')
    #Affichage de sous-graphe
    plt.show()

#  Visualisation des nœuds et arêtes pour un utilisateur en particulier - Avec fontion de networkX

In [None]:
#ID du noeud qui correspond à un utilisateur
noeud_id_utilisateur = 99769502

if noeud_id_utilisateur in G:
    # Créer un sous-graphe centré sur le nœud avec ses voisins
    sousgraphe = nx.ego_graph(G, noeud_id_utilisateur, radius=1)
    #Définis la taille du dessin 10pouces/10pouces
    plt.figure(figsize=(10, 10))
    #Permet de positionner les noeuds d'une certaine manière 
    pos = nx.spring_layout(sousgraphe)
    #Dessine le sous-graphe avec la dispotion 
    #des noeuds definis avec le spring_laout de la variable pos
    nx.draw(sousgraphe, pos, with_labels=False, node_size=200, node_color='lightblue')
    #Affichage du sous-graphe
    plt.show()

# Avant de procéder à la détection de communautés, nous allons identifier les utilisateurs présentant le degré de centralité le plus élevé, c'est-à-dire ceux ayant le plus grand nombre de connexions.

In [None]:
#Calcul du degré de centralité pour chaque noeud dans le graphe G
degre_de_centralite = nx.degree_centrality(G)

#Tri et sélectionne des 5 premiers utilisateurs
best_users = sorted(degre_de_centralite.items(), key=lambda x: x[1], reverse=True)[:5]

#Affichage des resultats
print("Cinq premiers utilisateurs les plus inflents:", best_users)

# Détéction de de communauté - En cours - Non réussi

In [None]:
import community as community_louvain

node_id = 1393409100

#subgraph = nx.ego_graph(G, node_id, radius=1)  

# Créer un sous-graphe centré sur le nœud avec ses voisins
subgraph = G.subgraph(node_id)

# Run the Louvain algorithm
partition = community_louvain.best_partition(subgraph)

# Print the nodes and their assigned communities
for node, community_id in partition.items():
    print(f"Node {node}: Community {community_id}")