# TP - Réseaux sociaux et graphes

__Introduction :__

La notion de «réseau social» apparaît bien avant les réseaux sociaux sur internet ; elle est étudiée à la fin du 19ème siècle en sciences sociales, puis à nouveau dans le courant du vingtième siècle.

Un réseau social est un ensemble de liens entre individus, cet ensemble constituant une communauté qui partage des convictions ou des valeurs. L’analyse des réseaux sociaux utilise des graphes pour représenter un réseau. 

Le terme de «réseau social» désigne également des applications web qui offrent de mettre en relation des internautes afin de discuter de leurs centres d’intérêts.




## Rappel de vocabulaire sur les graphes

Les personnes sont représentées par les **sommets** du graphe et relations d’amitié par les **arêtes**.

La **distance** entre deux sommets est le nombre minimum d’arêtes qu’il faut parcourir pour aller d’un sommet à un autre.

Le **diamètre** d’un graphe est la distance maximale entre deux sommets de ce graphe. 

Le **centre** d’un graphe est l’ensemble des sommets d’écartement minimal. 

Le **rayon** d’un graphe est l’écartement d’un des sommets du centre du graphe. 


<div class="alert alert-info" role="alert">
  <strong>Travail à faire sur le notebook : </strong> <br>
    Pour les cellules suivantes, appuyez sur <strong>shift entrée</strong> pour lancer le code Python contenu dans chaque cellule
</div>

In [None]:
# importation du module "matplotlib" pour créer des graphiques
import matplotlib.pyplot as plt

# importation du module "networkx" pour simuler un réseau social
import networkx as nx
import warnings
warnings.filterwarnings("ignore", category=UserWarning) # pour filtrer erreur sur fonction deprecated

## 1 - Comment tracer un graphe en Python

On veut tracer le graphe de la feuille de TD correspondant aux relations entre 6 personnes A, B,C, D, E et F :
<img src="https://raw.githubusercontent.com/CDERYCKE/SNT-Social/c3315cd7c5bb3366590e09dc1a1c22addc5e86c0/images/graphe1.jpg" title="graphe à tracer" width=700, height=300 align="center" />

In [None]:
# création d'un graphe vide non orienté appelé "monReseau"
monReseau = nx.Graph()

monReseau.add_node("A") # ajoute un sommet / un noeud nommé "A"
monReseau.add_node("B")
monReseau.add_node("C")
monReseau.add_node("D")
monReseau.add_node("E")
monReseau.add_node("F")

# dessine (draw) et affiche (show) le graphe "monReseau"
nx.draw(monReseau, with_labels=True)
plt.show()


Il faut maintenant ajouter les liens entre les différents noeuds (sommets) du réseau :

In [None]:
plt.close() # nécessaire sous basthon pour remettre l'affichage à zéro

# création d'un graphe vide non orienté appelé "monReseau"
monReseau = nx.Graph()

monReseau.add_node("A") # ajoute un sommet / un noeud nommé "A"
monReseau.add_node("B")
monReseau.add_node("C")
monReseau.add_node("D")
monReseau.add_node("E")
monReseau.add_node("F")

# on ajoute les arêtes entre les sommets

monReseau.add_edge("A", "B") # ajoute une arête entre A et B
monReseau.add_edge("A", "C")
monReseau.add_edge("A", "D")
monReseau.add_edge("D", "F")

# dessine (draw) et affiche (show) le graphe "monReseau"
nx.draw(monReseau, with_labels=True)
plt.show()

E est tout seul !

Il manque des liens entre des personnes du réseau !


<div class="alert alert-info" role="alert">
  <strong>Travail à faire sur le notebook : </strong> <br>
    Ajouter ci-dessous les lignes de code nécessaires pour obtenir le graphe voulu :
<img src="https://raw.githubusercontent.com/CDERYCKE/SNT-Social/c3315cd7c5bb3366590e09dc1a1c22addc5e86c0/images/graphe1.jpg" title="graphe à tracer" width=700, height=300 align="center" />
</div>

In [None]:
# votre code ici
plt.close() # nécessaire sous basthon pour remettre l'affichage à zéro

# création d'un graphe vide non orienté appelé "monReseau"
monReseau = nx.Graph()

monReseau.add_node("A") # ajoute un sommet / un noeud nommé "A"
monReseau.add_node("B")
monReseau.add_node("C")
monReseau.add_node("D")
monReseau.add_node("E")
monReseau.add_node("F")

# on ajoute les arêtes entre les sommets

monReseau.add_edge("A", "B") # ajoute une arête entre A et B
monReseau.add_edge("A", "C")
monReseau.add_edge("A", "D")
monReseau.add_edge("D", "F")





# dessine (draw) et affiche (show) le graphe "monReseau"
nx.draw(monReseau, with_labels=True)
plt.show()

<div class="alert alert-warning" role="alert">
    <strong> Travail à faire sur la fiche réponse : </strong> <br>
    --> Répondre aux questions.  
</div>

***

On peut obtenir des informations sur le graphe : nombre de personnes ( noeud ou node en anglais), nombre de liens (arêtes ou edge en anglais)

In [None]:
print("Nombre de personnes =", monReseau.number_of_nodes())
print("Nombre de liens =", monReseau.number_of_edges())

Pour obtenir d'autres informations comme le diamètre, le rayon, le centre, il faut importer d'autres fonctions du module networkx

<div class="alert alert-info" role="alert">
  <strong>Travail à faire sur le notebook : </strong> <br>
    Pour les cellules suivantes, appuyez sur shift entrée pour lancer le code Python contenu dans cette cellule
</div>

In [None]:
from networkx import diameter,radius,center

In [None]:
print("Diamètre=", diameter(monReseau)) 
print("Rayon=", radius(monReseau))
print("Centre=", center(monReseau))

<div class="alert alert-warning" role="alert">
    <strong> Travail à faire sur la fiche réponse : </strong> <br>
    --> Répondre aux questions
</div>

## 2 - Réseaux sociaux et histoire : Les Médicis à Florence

Pourquoi les Médicis ont-ils réussi à s’imposer à Florence, face à des familles et clans tout aussi puissants qu’eux ?

Le pouvoir des Médicis sur la cité florentine s’établit au début du XVe siècle grâce à Cosimo de’ Medici (1389-1464), dit aussi Cosme l’ancien. Leur ascension peut initialement paraître surprenante, les Médicis étant une famille objectivement moins puissante que bien d’autres familles de l’oligarchie alors au pouvoir.

Les Strozzi, par exemple étaient à la fois plus riches, et plus puissants politiquement, possédant notamment plus de sièges dans les instances législatives.

Les relations entre les familles florentines sont déjà codées dans le module networkx.


<div class="alert alert-info" role="alert">
  <strong>Travail à faire sur le notebook : </strong> <br>
    Pour les cellules suivantes, appuyez sur shift entrée pour lancer le code Python contenu dans cette cellule <br>
    
</div>

In [None]:
plt.close()
F=nx.florentine_families_graph() #
nx.draw(F, with_labels=True)

plt.show()

**Que représente ce graphe ?**

liens par mariages entre les familles importantes de la ville de Florence pendant le 15e siècle.

Il s'agit de la période aucours de laquelle les Médicis ont pris le pouvoir dans la ville de Florence.

Plusieurs mariages "clés" ont été organisés par “Cosimo de Medici”

<div class="alert alert-info" role="alert">
  <strong>Travail à faire sur le notebook : </strong> <br>
Le graphe s'appelle F.
En s'inspirant de l'exemple précédent , proposez les lignes de code qui déterminent centre, diamètre et rayon de ce graphe    
</div>

In [None]:
# votre code ici

Les Médicis sont bien au centre du graphe mais ils ne sont pas les seuls !

On peut étudier le degré du noeud correspondant aux Médicis : le degré d'un sommet est le nombre d'arêtes qui partent de ce sommet (ses liens).

In [None]:
F.degree('Medici')

et on peut faire une boucle pour comparer aux autres familles :

In [None]:
for name in F.nodes():
    print( name, F.degree(name))

Notre approche (simpliste) permet de vérifier le rôle crucial tenu par la famille des Médicis grâce aux mariages avec d'autres familles florentines.

***



Approfondissons un peu :-)

Les Médicis sont bien au centre du graphe mais ils ne sont pas les seuls !

Il existe plusieurs méthodes pour explorer la notion de centralité :


<img src="https://raw.githubusercontent.com/CDERYCKE/SNT-Social/master/images/Centralities.jpg " title="graphe à tracer" align="center" />

**La centralité de degré :**

La centralité de degré se mesure au nombre de liens à partir d'un sommet (taille du réseau d’un acteur).  
On peut l’interpréter en disant que plus un acteur est central, plus il est « actif » dans le système.  
  
La centralité de degré peut permettre de répondre aux questions suivantes :

Qui sont les plus grands influenceurs sur un réseau social ?  
Quel aéroport offre le plus grand nombre de destinations ?

In [None]:
nx.degree_centrality(F) # plus le nombre est grand, mieux c'est

**La centralité d'intermédiaire: betweenness :** 

La centralité d’intermédiarité est basée sur l’idée du contrôle exercé par l’acteur sur les interactions entre deux autres acteurs.
Lorsque deux acteurs ne sont pas adjacents, ils dépendent d’autres acteurs du groupe pour leurs échanges, en particulier des acteurs qui se trouvent sur le chemin entre eux et qui ont la capacité d’interrompre la circulation des ressources.
Plus un acteur se trouve « au milieu », passage obligé sur des chemins que d’autres doivent emprunter pour se rejoindre, plus il est central de ce point de vue.

Elle est égale au nombre de fois que ce sommet est sur le chemin le plus court entre deux autres nœuds
quelconques du graphe. Un noeud possède une grande intermédiarité s'il a une grande influence sur les transferts d'informations dans le réseau
(sous l'hypothèse que ces transferts se font uniquement par les chemins les plus courts).  

La centralité d’intermédiarité peut permettre de répondre aux questions suivantes :  

Quels individus connectent plusieurs cellules d’un réseau criminel donné ?  
Dans chaque pays, quelle fermeture d’aéroport aurait l’impact le plus fort sur le réseau de transport aérien ?  
Quelle personne permet de mettre en contact 2 communautés différentes ?

La fonction qui effectue ce calcul est ‘betweenness_centrality' et elle est importée du module networkx (nx en raccourci).  
* Ecrire la ligne de code qui permet d'obtenir les centralités d'intermédiaire.

In [None]:
# votre code ici

**La centralité de proximité d’un acteur - closeness :**  
Elle se mesure au nombre minimum de pas qu’il doit effectuer pour entrer en contact avec les autres acteurs du système.  
De ce point de vue, plus un acteur est central, plus il est « proche » des autres, plus il entre vite en contact ou interagit facilement avec eux.

La centralité de proximité peut permettre de répondre aux questions suivantes :  

Lors d’une épidémie, qui était le patient zéro le plus probable ?  
Qui serait la meilleure personne ou la meilleure marque pour informer le plus de consommateurs à propos d’un produit sur les réseaux sociaux ?  

In [None]:
nx.closeness_centrality(F)

**La centralité de vecteur propre (ressemble au PageRank de classement des pages web) :** 

La centralité de vecteur propre se base sur les nœuds importants connectés à d’autres nœuds importants.  
Les personnes ayant des scores élevés de vecteurs propres ont de nombreuses connexions, et leurs connexions ont de nombreuses connexions, et leurs connexions ont de nombreuses connexions…  
Les individus possédant un vecteur propre de centralité élevé sont considérés comme les leaders du réseau.  
Ce sont souvent des personnalités publiques avec de nombreux liens avec d’autres personnes à haut profil. Ainsi, ils jouent souvent des rôles de leaders d’opinion clés et façonnent la perception du public. 

La centralité de vecteur propre peut permettre de répondre aux questions suivantes :

Existe-t-il des groupes de personnes très influentes sur un réseau social donné ? De qui s’agit-il ?

In [None]:
for node in F.nodes(): 
    print(node, nx.eigenvector_centrality(F, max_iter=1000)[node])

In [None]:
nx.pagerank(F) # plus le nombre est grand, mieux c'est

<div class="alert alert-info" role="alert">
  <strong>Travail à faire sur le notebook : </strong> <br>
    Pouvez-vous confirmer l'approche initiale sur le caractère central de la falille Médicis ?
</div>

<div class="alert alert-success" role="alert">
 <strong> Le travail est terminé !</strong> <br>
</div>