In [None]:
import pandas as pd
import networkx as nx
import matplotlib.pyplot as plt
import numpy as np
import statsmodels.api as sm
import statsmodels.formula.api as smf

from matplotlib.cm import get_cmap
from matplotlib.colors import LinearSegmentedColormap
from matplotlib.lines import Line2D
from statsmodels.iolib.table import SimpleTable, default_txt_fmt

In [None]:
# Lecture des données
data = pd.read_csv('data/flandreau_jobst_internationalcurrencies_data.txt', encoding='cp1252', skiprows=9, header=0, sep='\t')

In [None]:
# Commençons par créer un fichier attributes en ne gardant que les éléments par pays puis supprimant les lignes qui se répètent
attributes = data[["country_A", "gold", "colony", "debtburden", "rlong", "rshort1900", "rshort1890", "rgdp", "rgdpcap", "poldemo", "coverage"]]
# Sort the dataframe to ensure rows with colony=1 come first
attributes = attributes.sort_values(by=["country_A", "colony"], ascending=[True, False])
# Drop duplicates, keeping the first row (colony=1 will be kept if present)
attributes = attributes.drop_duplicates(subset="country_A", keep="first").reset_index(drop=True)
attributes = attributes.rename(columns={"colony": "is_colonized"})

# Récupérons aussi le nombre de colonies
nb_colonies = data.groupby("country_B")["colony"].sum().reset_index()
nb_colonies = nb_colonies.rename(columns={"colony": "has_colonies"})
attributes = nb_colonies.merge(attributes, left_on="country_B", right_on="country_A", how="left")
attributes = attributes.drop(columns=['country_A'])
attributes = attributes.rename(columns={"country_B": "country"})

In [None]:
country_mapping = {
    "ARG": "Argentina",
    "AUS": "Australia",
    "AUH": "United Arab Emirates",
    "BEL": "Belgium",
    "BRA": "Brazil",
    "CAN": "Canada",
    "CEY": "Ceylon",
    "CHE": "Switzerland",
    "CHL": "Chile",
    "CHN": "China",
    "COL": "Colombia",
    "CUB": "Cuba",
    "DEU": "Germany",
    "DNK": "Denmark",
    "ECU": "Ecuador",
    "EGY": "Egypt",
    "ESP": "Spain",
    "FIN": "Finland",
    "FRA": "France",
    "GBR": "United Kingdom",
    "GRC": "Greece",
    "HKG": "Hong Kong",
    "ICH": "Sandwich Islands",
    "IND": "India",
    "ITA": "Italy",
    "JAV": "Java",
    "JPN": "Japan",
    "MEX": "Mexico",
    "NLD": "Netherlands",
    "NOR": "Norway",
    "NZL": "New Zealand",
    "OTT": "Ottoman Empire",
    "PER": "Peru",
    "PHL": "Philippines",
    "PRT": "Portugal",
    "PRS": "Persia",
    "ROM": "Romania",
    "RUS": "Russia",
    "SER": "Serbia",
    "SGP": "Singapore",
    "SIA": "Siam",
    "SWE": "Sweden",
    "URY": "Uruguay",
    "USA": "United States",
    "VEN": "Venezuela"}

attributes["country"] = attributes["country"].map(country_mapping)

In [None]:
data.head(1).style.hide(axis="index")

In [None]:
attributes.head(1).style.hide(axis="index")

# Première approche
***Description de la structure du graph ?***

Il faut d'abord bien préciser la signification des données : un lien allant de $A$ vers $B$ signifie que le pays $B$ possède un marché des changes intégrant la devise du pays $A$. En l'absence de tout autre lien, cela signifie qu'il est nécessaire de passer par le pays $B$ pour échanger la devise du pays $A$, c'est-à-dire que le pays $A$ est dépendant du pays $B$ pour ses échanges extérieurs.

_Je pense que c'est plus compliqué que cela, dès lors que le pays A a lui même un marché des changes domestique, sur lequel on peut raisonnablement penser qu'une des monnaies qui est échangée est la sienne. De ce point de vue, c'est plutôt le pays $B$ qui dépends du pays $A$. Plus un pays à un nombre important de liens pointant vers lui, plus il a accès à une diversité importante de monnaie, sans avoir besoin de recourir à un marché d'un pays tiers. Mais du coup, un pays qui n'a qu'un seul lien pointant vers lui, comme l'Autralie par exemple, n'a accès qu'à une seule devise depuis son territoire. Un pays qui n'a aucun lien pointant vers lui n'a accès à aucune devise._

In [None]:
# Création d'un graph orienté avec la variable 1900 (possible de pondérer le graph pour utiliser les 3 ? Ou de faire avec le commerce ?)
graph_change_1900 = nx.DiGraph()

for _, row in data.iterrows():
    if row["quote1900"] == 1:
        graph_change_1900.add_edge(row["country_A"], row["country_B"])

In [None]:
n = graph_change_1900.number_of_nodes()
L = graph_change_1900.number_of_edges()
density = L/(n*(n-1))
print(f"Nombre de sommets : {n}")
print(f"Nombre d'arêtes : {L}")
print(f"Densité : {density:.4f}")

On constate d'emblée que le réseau est très peu dense, avec seulement 218 liens sur les $45*44=1980$ possibles, ce qui correspond à une densité de 0.11 : ceci indique que la majorité des pays ne sont pas directement connectés sur le marché des changes, autrement dit, que celui-ci fonctionne de manière centralisée, ou que de nombreux pays ne participent pas aux échanges internationaux.

In [None]:
isolates = list(nx.isolates(graph_change_1900))
print(f"Proportion de pays isolés : {len(isolates) / n:.0f}")

no_incoming = [node for node in graph_change_1900.nodes() if graph_change_1900.in_degree(node) == 0]
no_incoming_share = len(no_incoming) / n if n > 0 else 0
print(f"Proportion de pays  sans lien entrant : {100*no_incoming_share:.1f} %")

bidir_edges = sum(1 for u, v in graph_change_1900.edges() if graph_change_1900.has_edge(v, u))
total_edges = graph_change_1900.number_of_edges()
unidir_edges = total_edges - bidir_edges
country_links = unidir_edges + (bidir_edges / 2)
bidir_share = (bidir_edges / 2) / country_links
print(f"Proportion de liens qui ne sont pas réciproques : {100*(1-bidir_share):.1f} %")

print(f"La réciprocité moyenne vaut {nx.reciprocity(graph_change_1900):.3f}")

On ne trouve aucun pays isolé, ce qui écarte l'hypothèse de pays ne participant pas aux échanges internationaux. En revanche, 44,4 % des pays ne sont destinataires d'aucun lien, c'est-à-dire qu'ils doivent utiliser des marchés étrangers pour échanger leur monnaie nationale.

_A noter que c'est clairement un effet de la structure du dataset, qui est construit sous forme d'une edgelist (un peu développée, certes...). Mais un pays isolé n'apparaitrait pas ici. Bon, en même temps, on parle ici de devise, donc à un moment ou un autre ça doit puvoir être écheangable._

Si l'on s'intéresse aux liens entre pays sans considérer leur direction, mais seulement leur caractère unilatéral ou réciproque, on constate que 72,5 % des pays n'entretiennent aucun lien réciproque. _Ici je pense qu'il y a une confusion entre les edges et les nodes_

In [None]:
undirected = graph_change_1900.to_undirected()
print(f"Is the graph connected? {nx.is_connected(undirected)}")
print(f"Average shortest path length: {nx.average_shortest_path_length(undirected):.2f}")

In [None]:
def truncate_colormap(cmap_name, min_val=0.2, max_val=1.0, n=100):
    cmap = plt.get_cmap(cmap_name)
    new_cmap = LinearSegmentedColormap.from_list(
        f"{cmap_name}_trunc", cmap(np.linspace(min_val, max_val, n))
    )
    return new_cmap

trunc_oranges = truncate_colormap("Oranges", 0.2, 1.0)

# Determine edge colors
edge_colors = []
for u, v in graph_change_1900.edges():
    if graph_change_1900.has_edge(v, u):
        edge_colors.append("forestgreen")  # reciprocal
    else:
        edge_colors.append("skyblue")  # unidirectional

# Compute node colors based on total degree (in-degree + out-degree)
degrees = dict(graph_change_1900.degree())
node_colors = [degrees[node] for node in graph_change_1900.nodes()]

# Draw graph
plt.figure(figsize=(16, 8))
pos = nx.spring_layout(graph_change_1900, seed=43)

nodes = nx.draw_networkx_nodes(
    graph_change_1900,
    pos,
    node_size=600,
    node_color=node_colors,
    cmap=trunc_oranges)

edges = nx.draw_networkx_edges(
    graph_change_1900,
    pos,
    edge_color=edge_colors)

labels = nx.draw_networkx_labels(graph_change_1900, pos, font_size=9, font_color="white")

legend_elements = [
    Line2D([0], [0], marker='o', color='w', markerfacecolor='forestgreen', markersize=9, label='Unidirectional'),
    Line2D([0], [0], marker='o', color='w', markerfacecolor='skyblue', markersize=9, label='Bidirectional')
]
plt.legend(handles=legend_elements, loc='upper right')

plt.colorbar(nodes, label="Total Degree")
plt.axis("off")
plt.show()

Une représentation graphique fait apparaître :
- Un marché des changes très intégré entre l'Europe et les Etats-Unis, rassemblant une dizaine de pays (GBR, FRA, DEU, USA notamment)
- Un marché des changes secondaires en Asie, rassemblant une demi-douzaine de pays (HKG, SGP, CHN, IND notamment)
- Un relatif isolement des autres pays, qui entretiennent des liens unilatéraux avec quelques pays appartenants aux groupes précédents

(On pourrait utiliser le nombre de devises échangées plutôt que le nombre de liens pour la coloration.)

_Sauf que l'on a pas cette info dans le dataset, juste le volume du commerce..._

In [None]:
countries = ["USA", "HKG", "EGY"]

fig, axes = plt.subplots(1, 3, figsize=(15, 5))

for i, country_B in enumerate(countries):
    # Get the nodes related to country_B
    neighbors = list(graph_change_1900.neighbors(country_B))
    predecessors = list(graph_change_1900.predecessors(country_B))
    nodes_involved = [country_B] + neighbors + predecessors
    subgraph = graph_change_1900.subgraph(nodes_involved)
    restricted_graph = nx.DiGraph(subgraph)

    edge_colors = []
    for u, v in restricted_graph.edges():
        if restricted_graph.has_edge(v, u):
            edge_colors.append("forestgreen")  # reciprocal
        else:
            edge_colors.append("skyblue")  # unidirectional

    pos = nx.spring_layout(restricted_graph)
    ax = axes[i]
    nx.draw_networkx_nodes(restricted_graph, pos, node_size=600, node_color="chocolate", ax=ax)
    nx.draw_networkx_edges(restricted_graph, pos, edge_color=edge_colors, ax=ax)
    nx.draw_networkx_labels(restricted_graph, pos, font_size=9, font_color="white", ax=ax)
    ax.set_title(f"Graph restricted to {country_B} and its neighbors")

plt.tight_layout()
plt.show()

On peut faire apparaître les marchés intégrés en restreignant le graph aux liens réciproques ou en recherchant les cliques...

In [None]:
graph_change_1900 = nx.DiGraph()

for _, row in data.iterrows():
    if row["quote1900"] == 1:
        graph_change_1900.add_edge(row["country_A"], row["country_B"])

# Filter for reciprocal edges
reciprocal_edges = [(u, v) for u, v in graph_change_1900.edges() if graph_change_1900.has_edge(v, u)]
# Get nodes involved in reciprocal edges
nodes_with_reciprocal_edges = set(u for u, v in reciprocal_edges) | set(v for u, v in reciprocal_edges)

plt.figure(figsize=(8, 5))
pos = nx.spring_layout(graph_change_1900, seed=42)
graph_filtered = graph_change_1900.subgraph(nodes_with_reciprocal_edges)

nx.draw_networkx_nodes(graph_filtered, pos, node_size=600, node_color="chocolate")
nx.draw_networkx_edges(graph_filtered, pos, edgelist=reciprocal_edges, edge_color="forestgreen")
nx.draw_networkx_labels(graph_filtered, pos, font_size=9, font_color="white")

plt.axis("off")
plt.show()

In [None]:
# On peut essayer de formaliser en recherchant des cliques
undirected_graph = graph_change_1900.to_undirected()
cliques = list(nx.find_cliques(undirected_graph ))
largest_cliques = sorted(cliques, key=len, reverse=True)[:1]
print(f"Plus grande clique : {largest_cliques[0]}")

In [None]:
out_degree = graph_change_1900.out_degree()
in_degree = graph_change_1900.in_degree()

out_degree_centrality = nx.out_degree_centrality(graph_change_1900)
in_degree_centrality = nx.in_degree_centrality(graph_change_1900)
betweenness_centrality = nx.betweenness_centrality(graph_change_1900)
eigenvector_centrality = nx.eigenvector_centrality(graph_change_1900)

df = pd.DataFrame({
    "Country": [node for node, _ in out_degree],
    "Out-Degree": [degree for _, degree in out_degree],
    "In-Degree": [degree for _, degree in in_degree],
    "Out-Degree Centrality": [out_degree_centrality.get(node, 0) for node, _ in out_degree],
    "In-Degree Centrality": [in_degree_centrality.get(node, 0) for node, _ in in_degree],
    "Betweenness Centrality": [betweenness_centrality.get(node, 0) for node, _ in out_degree],
    "Eigenvector Centrality": [eigenvector_centrality.get(node, 0) for node, _ in out_degree]
})

df["In / Out ratio"] = df["In-Degree Centrality"] / df["Out-Degree Centrality"]
df = df[[*df.columns[:df.columns.get_loc("In-Degree Centrality")+1], "In / Out ratio", *df.columns[df.columns.get_loc("In-Degree Centrality")+1:].drop("In / Out ratio")]]

df_sorted = df.sort_values(by="Betweenness Centrality", ascending=False)
df_sorted.style.hide(axis="index").format({
    "Out-Degree": "{:.0f}",
    "In-Degree": "{:.0f}",
    "Out-Degree Centrality": "{:.3f}",
    "In-Degree Centrality": "{:.3f}",
    "Betweenness Centrality": "{:.3f}",
    "Average Centrality": "{:.3f}",
    "In / Out ratio": "{:.3f}",
    "Eigenvector Centrality": "{:.3f}",
})

In [None]:
pearson_corr = df['In-Degree'].corr(df['Out-Degree'])
print(f"Corrélation entre les centralités entrantes et sortantes : {pearson_corr:.4f}")

... ou en étudiant la centralité.

La **centralité intermédiaire** fait ressortir quelques marchés constituant des points de passage obligés : GBR et DEU, ainsi dans une moindre mesure que FRA, HKG et DNK.

Le ratio entre les **centralités entrantes et sortantes**, c'est-à-dire entre le nombre de devises échangées localement par un pays, et le nombre de pays échangeant sa propre devise, permet de distinguer des situations plus contrastées.
- Les pays colonisateurs : GBR, FRA et ESP, dont la centralité sortante est très supérieure à la centralité entrante, sans doute parce qu'ils entretiennent des liens unilatéraux avec leurs colonnies et des liens bilatéraux avec les autres pays développés.
- Les pays développés : DEU, IT, USA, etc., dont les centralités entrantes et sortantes sont relativement proches, sans doute parce qu'ils entretiennent surtout des liens bilatéraux entre eux.
- Les pays périphériques / dépendants, qui n'ont aucun lien entrant.

La **centralité vectorielle** n'apporte rien par rapport aux analyses précédentes, elle oppose seulement les pays intégrés aux autres.

_Pas certain là non plus sur la centralité vectorielle, qui semble quand même écarter beaucoup le cas des USA par exemple, bien en dessous de l'Italie, de l'Autriche, la Belgique ou la Hollande..._

In [None]:
# Jetons un oeil à la transitivité
print(f"La transitivité globale est de {nx.average_clustering(graph_change_1900):.3f}")
print(f"La transitivité moyenne est de {nx.transitivity(graph_change_1900):.3f}")

print('La transitivité locale de chaque pays est : ')
for node, coeff in sorted(nx.clustering(graph_change_1900).items(), key=lambda x: x[1]):
    print(f"{node}: {coeff:.3f}")

La transitivité n'est pas très éclairante ? _Pour le coup je ne trouve pas, non..._

## Bonus

**Est-ce qu'on voit des choses différentes en prenant une autre année ?**


In [None]:
# Création d'un graph orienté avec la variable 18900 (possible de pondérer le graph pour utiliser les 3 ? Ou de faire avec le commerce ?)
graph_change_1890 = nx.DiGraph()

for _, row in data.iterrows():
    if row["quote1890"] == 1:
        graph_change_1890.add_edge(row["country_A"], row["country_B"])

In [None]:
n = graph_change_1890.number_of_nodes()
L = graph_change_1890.number_of_edges()
density = L/(n*(n-1))
print(f"Nombre de sommets : {n}")
print(f"Nombre d'arêtes : {L}")
print(f"Densité : {density:.4f}")

In [None]:
def truncate_colormap(cmap_name, min_val=0.2, max_val=1.0, n=100):
    cmap = plt.get_cmap(cmap_name)
    new_cmap = LinearSegmentedColormap.from_list(
        f"{cmap_name}_trunc", cmap(np.linspace(min_val, max_val, n))
    )
    return new_cmap

trunc_oranges = truncate_colormap("Oranges", 0.2, 1.0)

# Determine edge colors
edge_colors = []
for u, v in graph_change_1890.edges():
    if graph_change_1890.has_edge(v, u):
        edge_colors.append("forestgreen")  # reciprocal
    else:
        edge_colors.append("skyblue")  # unidirectional

# Compute node colors based on total degree (in-degree + out-degree)
degrees = dict(graph_change_1890.degree())
node_colors = [degrees[node] for node in graph_change_1890.nodes()]

# Draw graph
plt.figure(figsize=(16, 8))
pos = nx.spring_layout(graph_change_1890, seed=43)

nodes = nx.draw_networkx_nodes(
    graph_change_1890,
    pos,
    node_size=600,
    node_color=node_colors,
    cmap=trunc_oranges)

edges = nx.draw_networkx_edges(
    graph_change_1890,
    pos,
    edge_color=edge_colors)

labels = nx.draw_networkx_labels(graph_change_1890, pos, font_size=9, font_color="white")

legend_elements = [
    Line2D([0], [0], marker='o', color='w', markerfacecolor='forestgreen', markersize=9, label='Unidirectional'),
    Line2D([0], [0], marker='o', color='w', markerfacecolor='skyblue', markersize=9, label='Bidirectional')
]
plt.legend(handles=legend_elements, loc='upper right')

plt.colorbar(nodes, label="Total Degree")
plt.axis("off")
plt.show()

In [None]:
countries = ["DEU", "HKG", "EGY"]

fig, axes = plt.subplots(1, 3, figsize=(15, 5))

for i, country_B in enumerate(countries):
    # Get the nodes related to country_B
    neighbors = list(graph_change_1890.neighbors(country_B))
    predecessors = list(graph_change_1890.predecessors(country_B))
    nodes_involved = [country_B] + neighbors + predecessors
    subgraph = graph_change_1890.subgraph(nodes_involved)
    restricted_graph = nx.DiGraph(subgraph)

    edge_colors = []
    for u, v in restricted_graph.edges():
        if restricted_graph.has_edge(v, u):
            edge_colors.append("forestgreen")  # reciprocal
        else:
            edge_colors.append("skyblue")  # unidirectional

    pos = nx.spring_layout(restricted_graph)
    ax = axes[i]
    nx.draw_networkx_nodes(restricted_graph, pos, node_size=600, node_color="chocolate", ax=ax)
    nx.draw_networkx_edges(restricted_graph, pos, edge_color=edge_colors, ax=ax)
    nx.draw_networkx_labels(restricted_graph, pos, font_size=9, font_color="white", ax=ax)
    ax.set_title(f"Graph restricted to {country_B} and its neighbors")

plt.tight_layout()
plt.show()

In [None]:
graph_change_1890 = nx.DiGraph()

for _, row in data.iterrows():
    if row["quote1890"] == 1:
        graph_change_1890.add_edge(row["country_A"], row["country_B"])

# Filter for reciprocal edges
reciprocal_edges = [(u, v) for u, v in graph_change_1890.edges() if graph_change_1890.has_edge(v, u)]
# Get nodes involved in reciprocal edges
nodes_with_reciprocal_edges = set(u for u, v in reciprocal_edges) | set(v for u, v in reciprocal_edges)

plt.figure(figsize=(8, 5))
pos = nx.spring_layout(graph_change_1890, seed=42)
graph_filtered = graph_change_1890.subgraph(nodes_with_reciprocal_edges)

nx.draw_networkx_nodes(graph_filtered, pos, node_size=600, node_color="chocolate")
nx.draw_networkx_edges(graph_filtered, pos, edgelist=reciprocal_edges, edge_color="skyblue")
nx.draw_networkx_labels(graph_filtered, pos, font_size=9, font_color="white")

plt.axis("off")
plt.show()

In [None]:
out_degree = graph_change_1890.out_degree()
in_degree = graph_change_1890.in_degree()

out_degree_centrality = nx.out_degree_centrality(graph_change_1890)
in_degree_centrality = nx.in_degree_centrality(graph_change_1890)
betweenness_centrality = nx.betweenness_centrality(graph_change_1890)
eigenvector_centrality = nx.eigenvector_centrality(graph_change_1890)

df = pd.DataFrame({
    "Country": [node for node, _ in out_degree],
    "Out-Degree": [degree for _, degree in out_degree],
    "In-Degree": [degree for _, degree in in_degree],
    "Out-Degree Centrality": [out_degree_centrality.get(node, 0) for node, _ in out_degree],
    "In-Degree Centrality": [in_degree_centrality.get(node, 0) for node, _ in in_degree],
    "Betweenness Centrality": [betweenness_centrality.get(node, 0) for node, _ in out_degree],
    "Eigenvector Centrality": [eigenvector_centrality.get(node, 0) for node, _ in out_degree]
})

df["In / Out ratio"] = df["In-Degree Centrality"] / df["Out-Degree Centrality"]
df = df[[*df.columns[:df.columns.get_loc("In-Degree Centrality")+1], "In / Out ratio", *df.columns[df.columns.get_loc("In-Degree Centrality")+1:].drop("In / Out ratio")]]

df_sorted = df.sort_values(by="Betweenness Centrality", ascending=False)
df_sorted.style.hide(axis="index").format({
    "Out-Degree": "{:.0f}",
    "In-Degree": "{:.0f}",
    "Out-Degree Centrality": "{:.3f}",
    "In-Degree Centrality": "{:.3f}",
    "Betweenness Centrality": "{:.3f}",
    "Average Centrality": "{:.3f}",
    "In / Out ratio": "{:.3f}",
    "Eigenvector Centrality": "{:.3f}",
})

In [None]:
# Création d'un graph orienté avec la variable 1910 (possible de pondérer le graph pour utiliser les 3 ? Ou de faire avec le commerce ?)
graph_change_1910 = nx.DiGraph()

for _, row in data.iterrows():
    if row["quote1910"] == 1:
        graph_change_1910.add_edge(row["country_A"], row["country_B"])

In [None]:
n = graph_change_1910.number_of_nodes()
L = graph_change_1910.number_of_edges()
density = L/(n*(n-1))
print(f"Nombre de sommets : {n}")
print(f"Nombre d'arêtes : {L}")
print(f"Densité : {density:.4f}")

In [None]:
def truncate_colormap(cmap_name, min_val=0.2, max_val=1.0, n=100):
    cmap = plt.get_cmap(cmap_name)
    new_cmap = LinearSegmentedColormap.from_list(
        f"{cmap_name}_trunc", cmap(np.linspace(min_val, max_val, n))
    )
    return new_cmap

trunc_oranges = truncate_colormap("Oranges", 0.2, 1.0)

# Determine edge colors
edge_colors = []
for u, v in graph_change_1910.edges():
    if graph_change_1910.has_edge(v, u):
        edge_colors.append("forestgreen")  # reciprocal
    else:
        edge_colors.append("skyblue")  # unidirectional

# Compute node colors based on total degree (in-degree + out-degree)
degrees = dict(graph_change_1910.degree())
node_colors = [degrees[node] for node in graph_change_1910.nodes()]

# Draw graph
plt.figure(figsize=(16, 8))
pos = nx.spring_layout(graph_change_1910, seed=43)

nodes = nx.draw_networkx_nodes(
    graph_change_1910,
    pos,
    node_size=600,
    node_color=node_colors,
    cmap=trunc_oranges)

edges = nx.draw_networkx_edges(
    graph_change_1910,
    pos,
    edge_color=edge_colors)

labels = nx.draw_networkx_labels(graph_change_1910, pos, font_size=9, font_color="white")

legend_elements = [
    Line2D([0], [0], marker='o', color='w', markerfacecolor='forestgreen', markersize=9, label='Unidirectional'),
    Line2D([0], [0], marker='o', color='w', markerfacecolor='skyblue', markersize=9, label='Bidirectional')
]
plt.legend(handles=legend_elements, loc='upper right')

plt.colorbar(nodes, label="Total Degree")
plt.axis("off")
plt.show()

In [None]:
countries = ["DEU", "HKG", "EGY"]

fig, axes = plt.subplots(1, 3, figsize=(15, 5))

for i, country_B in enumerate(countries):
    # Get the nodes related to country_B
    neighbors = list(graph_change_1910.neighbors(country_B))
    predecessors = list(graph_change_1910.predecessors(country_B))
    nodes_involved = [country_B] + neighbors + predecessors
    subgraph = graph_change_1910.subgraph(nodes_involved)
    restricted_graph = nx.DiGraph(subgraph)

    edge_colors = []
    for u, v in restricted_graph.edges():
        if restricted_graph.has_edge(v, u):
            edge_colors.append("forestgreen")  # reciprocal
        else:
            edge_colors.append("skyblue")  # unidirectional

    pos = nx.spring_layout(restricted_graph)
    ax = axes[i]
    nx.draw_networkx_nodes(restricted_graph, pos, node_size=600, node_color="chocolate", ax=ax)
    nx.draw_networkx_edges(restricted_graph, pos, edge_color=edge_colors, ax=ax)
    nx.draw_networkx_labels(restricted_graph, pos, font_size=9, font_color="white", ax=ax)
    ax.set_title(f"Graph restricted to {country_B} and its neighbors")

plt.tight_layout()
plt.show()

In [None]:
graph_change_1910 = nx.DiGraph()

for _, row in data.iterrows():
    if row["quote1910"] == 1:
        graph_change_1910.add_edge(row["country_A"], row["country_B"])

# Filter for reciprocal edges
reciprocal_edges = [(u, v) for u, v in graph_change_1910.edges() if graph_change_1910.has_edge(v, u)]
# Get nodes involved in reciprocal edges
nodes_with_reciprocal_edges = set(u for u, v in reciprocal_edges) | set(v for u, v in reciprocal_edges)

plt.figure(figsize=(8, 5))
pos = nx.spring_layout(graph_change_1910, seed=42)
graph_filtered = graph_change_1910.subgraph(nodes_with_reciprocal_edges)

nx.draw_networkx_nodes(graph_filtered, pos, node_size=600, node_color="chocolate")
nx.draw_networkx_edges(graph_filtered, pos, edgelist=reciprocal_edges, edge_color="skyblue")
nx.draw_networkx_labels(graph_filtered, pos, font_size=9, font_color="white")

plt.axis("off")
plt.show()

In [None]:
out_degree = graph_change_1910.out_degree()
in_degree = graph_change_1910.in_degree()

out_degree_centrality = nx.out_degree_centrality(graph_change_1910)
in_degree_centrality = nx.in_degree_centrality(graph_change_1910)
betweenness_centrality = nx.betweenness_centrality(graph_change_1910)
eigenvector_centrality = nx.eigenvector_centrality(graph_change_1910)

df = pd.DataFrame({
    "Country": [node for node, _ in out_degree],
    "Out-Degree": [degree for _, degree in out_degree],
    "In-Degree": [degree for _, degree in in_degree],
    "Out-Degree Centrality": [out_degree_centrality.get(node, 0) for node, _ in out_degree],
    "In-Degree Centrality": [in_degree_centrality.get(node, 0) for node, _ in in_degree],
    "Betweenness Centrality": [betweenness_centrality.get(node, 0) for node, _ in out_degree],
    "Eigenvector Centrality": [eigenvector_centrality.get(node, 0) for node, _ in out_degree]
})

df["In / Out ratio"] = df["In-Degree Centrality"] / df["Out-Degree Centrality"]
df = df[[*df.columns[:df.columns.get_loc("In-Degree Centrality")+1], "In / Out ratio", *df.columns[df.columns.get_loc("In-Degree Centrality")+1:].drop("In / Out ratio")]]

df_sorted = df.sort_values(by="Betweenness Centrality", ascending=False)
df_sorted.style.hide(axis="index").format({
    "Out-Degree": "{:.0f}",
    "In-Degree": "{:.0f}",
    "Out-Degree Centrality": "{:.3f}",
    "In-Degree Centrality": "{:.3f}",
    "Betweenness Centrality": "{:.3f}",
    "Average Centrality": "{:.3f}",
    "In / Out ratio": "{:.3f}",
    "Eigenvector Centrality": "{:.3f}",
})

Du coup en première approche onauqna même de vraies évolutions, avec le développement d'un marché / d'une clique secondaire en Asie, qui finit par fusionner, la place très croissante des USA (d'ailleurs faudra regarder en détail ce qu'il se passe du côte de la Betweeness Centrality, voir comment on peut expliquer cela). Mais il y a sans doute là de quoi faire un travail déjà...

# Seconde approche
***Expliquer la structure du graph avec les attributs ?***

Intéger les relations commerciales (avec `bitrade`) et financières (avec `rshort`et `rlong`) ? Par exemple, est-ce que l'absence de liens entre pays reflète la faiblesse des échanges commerciaux, ou des différentiels de taux d'intérêt ?

Pour les colonnies : aucun pays Africain dans la base

In [None]:
# Ajoutons les attributs
attributesdata = attributes.set_index('country').to_dict('index').items()
graph_change_1900.add_nodes_from(attributesdata)

print(nx.get_node_attributes(graph_change_1900, 'gold'))

In [None]:
# Création d'un graph des colonies 
graph_colony = nx.DiGraph()

for _, row in data.iterrows():
    if row["colony"] == 1:
        graph_colony.add_edge(row["country_A"], row["country_B"])

print(f"Nombre de sommets : {graph_colony.number_of_nodes()}")
print(f"Nombre d'arêtes : {graph_colony.number_of_edges()}")

nx.draw(graph_colony, with_labels=True, node_size=500, font_size=10)
plt.show()

# Bon par contre ça c'est vraiment un tout petit graph, on a très peu de colonies en fait. Ou plus exactement sans doute, peu de colonies qui ont un marché des changes

## Régressions

Deux approches possibles :
- Régressions **binomiales** sur les liens directionnels
- Régressions **multinomiales** sur les liens bidirectionnels

### Binomiales

In [None]:
# Convert attributes so they qualify directed edges
data['r_short_diff'] = data['rshort1900'] - data['rshort1900_B']
data['r_long_diff'] = data['rlong'] - data['rlong_B']
data['gdp_ratio'] = data['rgdp'] - data['rgdp_B']
data['gold_A_only'] = ((data['gold'] == 1) & (data['gold_B'] == 0)).astype(int)
data['gold_B_only'] = ((data['gold'] == 0) & (data['gold_B'] == 1)).astype(int)
data['gold_both'] = ((data['gold'] == 1) & (data['gold_B'] == 1)).astype(int)
data['gold_none'] = ((data['gold'] == 0) & (data['gold_B'] == 0)).astype(int)

# Replace missing values by 0 for differential interest rates
data.fillna({'r_short_diff': 0, 'r_long_diff': 0}, inplace=True)

# Define and fit the model
formula = 'quote1900 ~ dist + bitrade + colony + r_short_diff + r_long_diff + gdp_ratio + gold_A_only + gold_B_only + gold_both'
model = smf.logit(formula, data=data).fit(cov_type='HC1')

In [None]:
# Add OR to the results
table0 = model.summary().tables[0]
table1 = model.summary().tables[1]

results = table1.data
headers = results[0]
rows = results[1:]
exp_coef = [f"{np.exp(float(row[1])):.4f}" for row in rows]
headers.insert(2, 'OR')
new_rows = [row[:2] + [exp] + row[2:] for row, exp in zip(rows, exp_coef)]
new_table1 = SimpleTable(new_rows, headers, txt_fmt=default_txt_fmt)

table0_lines = table0.as_text().splitlines()
table1_lines = new_table1.as_text().splitlines()
if table1_lines[0].startswith('='):
    table1_lines = table1_lines[1:]

full_summary = "\n".join(table0_lines + table1_lines)
print(full_summary)

Interprétation : outcome = 1 si la monnaie du pays B est échangée localement dans le pays A, 0 sinon

Variables significatives :
- Effet négatif
    - Distance entre A et B => plus A est éloigné de B et moins il est susceptible d'échanger localement sa monnaie
    - Ratio des PIB => plus le PIB de A est élevé relativement à celui de B, moins A est susceptible d'échanger localement la monnaie de B (la variable est égale à log(PIB_A/PIB_B))
- Effet positif
    - Statut colonial => A est plus susceptible d'échanger localement la monnaie de B s'il est une colonie de B
    - Différentiel de taux d'intérêt à CT => A est plus susceptible d'échanger localement la monnaie de B si son taux d'intérêt à CT est supérieur à celui de B
- Effet neutre / pas d'effet
    - Echanges commerciaux, avec un OR quasi-égal à 1
    - Convertibilité en or

### Multinomiales
#### Update the dataset to reflect directed attributes of the edges

In [None]:
data['pair_key'] = data.apply(lambda row: tuple(sorted([row['country_A'], row['country_B']])), axis=1)

def compute_combined_features(group):
    a, b = group['pair_key'].iloc[0]

    a_to_b = group[(group['country_A'] == a) & (group['country_B'] == b)]
    b_to_a = group[(group['country_A'] == b) & (group['country_B'] == a)]

    a_to_b_quote = a_to_b['quote1900'].iloc[0] if not a_to_b.empty else 0
    b_to_a_quote = b_to_a['quote1900'].iloc[0] if not b_to_a.empty else 0

    if a_to_b_quote == 1 and b_to_a_quote == 1:
        currency_market = 3  # or 2 to distinguish only between unidirectional and bidirectional links, their direction not withstanding
    elif a_to_b_quote == 1:
        currency_market = 1
    elif b_to_a_quote == 1:
        currency_market = 2  # or 1 for the same reason
    else:
        currency_market = 0

    a_to_b_colony = a_to_b['colony'].iloc[0] if not a_to_b.empty else 0
    b_to_a_colony = b_to_a['colony'].iloc[0] if not b_to_a.empty else 0

    if a_to_b_colony == 1 and b_to_a_colony == 1:
        colony_status = 3
    elif a_to_b_colony == 1:
        colony_status = 1
    elif b_to_a_colony == 1:
        colony_status = 2
    else:
        colony_status = 0

    a_to_b_gold = a_to_b['gold'].iloc[0] if not a_to_b.empty else 0
    b_to_a_gold = b_to_a['gold'].iloc[0] if not b_to_a.empty else 0

    if a_to_b_gold == 1 and b_to_a_gold == 1:
        gold_status = 3
    elif a_to_b_gold == 1:
        gold_status = 1
    elif b_to_a_gold == 1:
        gold_status = 2
    else:
        gold_status = 0
    
    dist_value = group['dist'].iloc[0]
    bitrade_value = group['bitrade'].iloc[0]

    # Retain all extra variables from the A->B row if available
    extra_columns = ['r_short_diff', 'r_long_diff', 'gdp_ratio']
    
    extras = {}
    if not a_to_b.empty:
        for col in extra_columns:
            extras[col] = a_to_b[col].iloc[0]
    else:
        # If no A->B row exists, fill with NaN
        for col in extra_columns:
            extras[col] = pd.NA

    return pd.Series({
        'country_A': a,
        'country_B': b,
        'currency_market': currency_market,
        'colony': colony_status,
        'gold': gold_status,
        'dist': dist_value,
        'bitrade': bitrade_value,
        **extras
    })

# Apply groupby
synthetic_data = data.groupby('pair_key').apply(compute_combined_features).reset_index(drop=True)
synthetic_data['currency_market'] = synthetic_data['currency_market'].astype('category')
synthetic_data['colony'] = synthetic_data['colony'].astype('category')
synthetic_data['gold'] = synthetic_data['gold'].astype('category')

#### Consistency check for a given row

In [None]:
synthetic_data[(synthetic_data['currency_market']==1) & (synthetic_data['colony']==1)].head(1).style.hide(axis="index")

In [None]:
# Values in the original df are identical
data[(data['country_A']=='AUS') & (data['country_B']=='GBR')].style.hide(axis="index")

In [None]:
# The symetric pair does not exist
synthetic_data[(synthetic_data['country_A']=='GBR') & (synthetic_data['country_B']=='AUS')]

#### Fit the model
Statsmodels does not handle categorical variables natively...

In [None]:
# Create dummies for categorical variables
## Colony, the reference being no country of the pair is a colony of the other
## Must be excluded from the model, which does not fit otherwise. Indeed, colony is ≠ 0 for only 12 observations out of 990.
# colony_dummies = pd.get_dummies(synthetic_data['colony'], prefix='colony', drop_first=True).astype(int)
## Gold, the reference being no country of the pair adheres to the gold standard
gold_dummies = pd.get_dummies(synthetic_data['gold'], prefix='gold', drop_first=True).astype(int)

# Build the dataset
continuous_data = synthetic_data[['dist', 'bitrade', 'r_short_diff', 'r_long_diff', 'gdp_ratio']]
independent_variables = pd.concat([continuous_data, gold_dummies], axis=1)
dependent_variable = synthetic_data['currency_market']

# Define and fit the model
model = sm.MNLogit(dependent_variable, independent_variables).fit(cov_type='HC1')
model.summary()

Interprétation : outcome = 1 si la monnaie du pays B est échangée localement dans le pays A, 2 pour l'inverse, 3 si A et B échangent localement leur monnaie, 0 si aucun des deux n'échange localement la monnaie de l'autre (modalité de référence)

On retrouve à peu près les mêmes variables significatives avec des effets de même signe.
- L'effet de la convertibilité en or devient significatif à 10 % lorsque la monnaie du pays échangeant localement celle de l'autre est convertible en or (gold = 1 si seule la monnaie du pays A est convertible, 2 si seule la monnaie du pays B est convertible, 3 lorsque les deux monnaies sont convertibles, 0 sinon).
- L'effet du différentiel de taux d'intérêt à CT disparaît sur la probabilité que deux pays échangent mutuellement leur monnaie.


*Il est aussi possible de fusionner les modalités 1 et 2 pour comparer seulement l'absence de lien à l'existence de liens unilatéraux ou bilatéraux, sans considérer leur direction. Les différentiels de taux d'intérêt et de PIB ne sont plus significatifs : reste seulement la distance, le volume du commerce (mais avec un coefficient toujours nul) et la convertibilité en or (avec un effet massif, OR de l'ordre de 20).*