# Atelier d'analyse de réseaux
## Introduction
L'atelier qui suit vise à vous faire pratiquer la programmation *Python* d'une part, mais aussi les notions d'analyse de réseaux qui sont utilisées en sciences.

## Mise en contexte
On vous demande d'analyser le réseau de contributions de publications des professeurs du département de physique, génie physique et optique. Vous avez des données dans le dossier `data`, situé à la racine du dossier `Ateliers` (le chemin relatif à partir d'ici est `../../data`). Dans ce dossier, vous avez plusieurs fichiers `.xls` (des fichiers *Excel*) et le traitement de base a été effectué, de sorte que les liens entre les professeurs pour les publications sont déjà obtenus, ils sont dans le fichier `liens.csv`. Vous trouverez aussi une liste des professeurs dans le fichier `profs.csv`. (Les profs à la retraite ne sont pas présents, sauf pour prof. Nathalie McCarthy)

In [2]:
import pandas as pd
import numpy as np
import networkx as nx
import matplotlib.pyplot as plt

In [5]:
# On extrait les données des fichiers

liens = pd.read_csv("../../data/liens.csv")
profs = pd.read_csv("../../data/profs.csv")
print(liens)
print(profs)

          Auteur1       Auteur2  \
0     Galstian, T  Rainville, S   
1      Bernier, M     Vallee, R   
2      Bernier, M  Messaddeq, Y   
3      Bernier, M     Vallee, R   
4    Messaddeq, Y     Vallee, R   
..            ...           ...   
467       Cote, D     Vallee, R   
468    Bernier, M     Vallee, R   
469    Bernier, M     Vallee, R   
470     Joncas, G     Martel, H   
471    Drissen, L     Martel, H   

                                                 Titre  Citations  
0    Dynamic guiding of bacteria in lyotropic chrom...          0  
1    Femtosecond laser-induced refractive index mod...         20  
2    Towards the development of fiber lasers for th...         33  
3    High mechanical strength fiber Bragg gratings ...         55  
4    Femtosecond laser-induced nanogratings formati...          0  
..                                                 ...        ...  
467  Live animal myelin histomorphometry of the spi...         35  
468  Slow-Light Fiber-Bragg-Grating

On remarque que le fichier `liens.csv` est de la forme `auteur1, auteur2, titre, nombre citations`. Toutes les informations seront importantes.

## Tâche 1: Faire un graphe "vide" avec NetworkX
On a vu dans la présentation sur l'analyse de réseaux que la base des réseaux est la notion mathématique de graphe. Il existe deux grandes familles de graphes: ceux dirigés et ceux non dirigés. On pourrait aussi dire que ces deux familles sont les graphes pondérés et ceux non pondérés. Dans le cas présent, comme il peut exister plusieurs contributions entre deux mêmes professeurs, on utilisera les graphes pondérés. Par contre, comme on ne peut vraiment distinguer un sens entre les contributions, on utilisera les graphes non orientés.

L'utilisation de NetworkX est assez intuitive. On peut créer des graphes orientés ou pas, pondérés ou pas, ainsi que des graphes multi (c'est-à-dire que deux nœuds peuvent avoir plusieurs liens. Dans notre cas, ce pourrait être intéressant, mais nous opterons pour une pondération quantifiant le nombre de contributions entre deux professeurs. Ainsi, la représentation visuelle du réseau sera moins lourde).

In [8]:
G = nx.Graph()  # On crée un graphe vide
for prof in profs:
    G.add_node(prof)  # Étant donné que chaque prof est un noeud, on les ajoute un à la fois

On a maintenant un graphe "vide" avec seulement les nœuds correspondant aux professeurs

## Tâche 2: Calculer la pondération
On sait que deux professeurs peuvent avoir plusieurs collaborations, alors comment fait-on pour calculer la pondération entre ces deux professeurs?