In [None]:
#!pip install networkx community

In [None]:
import networkx as nx
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from collections import Counter
import community as community_louvain  
import ast
import random
import tarfile
import json

# Carica dati
edges = pd.read_csv('dataset/spoti/edges.csv')
nodes = pd.read_csv('dataset/spoti/nodes.csv')
nodes_unique = nodes.drop_duplicates(subset=['spotify_id'], keep='first')


In [None]:
# ========== PARAMETRI DI SELEZIONE ==========
TOPLIST = 2000
SELECTION_CRITERION = "degree"
POPULARITY_FIELD = "popularity"
COUNTRY_FILTER = "Italy"  # Opzioni: "Italy", "France", "Germany", "Spain", "United Kingdom", None (per tutti)
SEED = 42

np.random.seed(SEED)
random.seed(SEED)

In [None]:
def is_from_country(nationality, country_filter=None):
    """
    Verifica se un artista appartiene a un paese specifico basandosi sulla nazionalit√†.
    
    Parametri:
    - nationality: stringa con il paese dell'artista (es. "Italy", "United States")
    - country_filter: nome del paese da filtrare (es. "Italy", "France") o None per nessun filtro
    
    Returns:
    - Boolean
    """
    if country_filter is None:
        return True
    
    if pd.isna(nationality):
        return False
    
    # Normalizza per il confronto (case-insensitive)
    nationality_lower = str(nationality).lower().strip()
    country_filter_lower = str(country_filter).lower().strip()
    
    return nationality_lower == country_filter_lower


In [None]:
def parse_genres(genres_field):
    """Converte stringa rappresentante lista in lista Python"""
    if pd.isna(genres_field):
        return []
    if isinstance(genres_field, str):
        try:
            parsed = ast.literal_eval(genres_field)
            return parsed if isinstance(parsed, list) else []
        except:
            return []
    if isinstance(genres_field, list):
        return genres_field
    return []



In [None]:
# ========== FUNZIONE DI SELEZIONE TOP NODI ==========
def select_top_nodes(graph, nodes_df, n=100, criterion="degree", popularity_field="popularity"):
    """
    Seleziona i top n nodi secondo diversi criteri di centralit√†.
    
    Parametri:
    - graph: grafo NetworkX
    - nodes_df: dataframe con attributi degli artisti
    - n: numero di nodi da selezionare
    - criterion: metrica di selezione ("degree", "popularity", "betweenness", "closeness", "eigenvector", "random")
    - popularity_field: nome colonna popolarit√†
    
    Returns:
    - Lista di nodi selezionati
    """
    
    if criterion == "degree":
        # Centralit√† di grado: numero di collaborazioni
        metric = dict(graph.degree())
        description = "numero di collaborazioni"
        
    elif criterion == "popularity":
        # Popolarit√† su Spotify
        metric = {}
        for node in graph.nodes():
            if node in nodes_df['spotify_id'].values:
                pop = nodes_df.loc[nodes_df['spotify_id'] == node, popularity_field].values
                metric[node] = pop[0] if len(pop) > 0 else 0
            else:
                metric[node] = 0
        description = "popolarit√† Spotify"
        
    elif criterion == "betweenness":
        # Centralit√† di intermediazione: broker tra comunit√†
        metric = nx.betweenness_centrality(graph)
        description = "centralit√† di intermediazione"
        
    elif criterion == "closeness":
        # Centralit√† di vicinanza: distanza media dagli altri
        metric = nx.closeness_centrality(graph)
        description = "centralit√† di vicinanza"
        
    elif criterion == "eigenvector":
        # Centralit√† di autovettore: connessione a nodi importanti
        try:
            metric = nx.eigenvector_centrality(graph, max_iter=1000)
            description = "centralit√† di autovettore"
        except:
            print("‚ö†Ô∏è Eigenvector centrality non convergente, uso degree")
            metric = dict(graph.degree())
            description = "grado (fallback)"
            
    elif criterion == "random":
        # Selezione casuale
        all_nodes = list(graph.nodes())
        random.shuffle(all_nodes)
        top_nodes = all_nodes[:n]
        
        print(f"\n[SELEZIONE TOP {n}]")
        print(f"Criterio: {criterion} (seed={SEED})")
        print(f"Primi 5 artisti selezionati casualmente:")
        for i, node in enumerate(top_nodes[:5], 1):
            name = graph.nodes[node].get('name', node)
            print(f"  {i}. {name}")
        
        return top_nodes
    else:
        raise ValueError(f"Criterio '{criterion}' non valido. Opzioni: degree, popularity, betweenness, closeness, eigenvector, random")
    
    # Ordina e seleziona top n (non per random, gi√† gestito sopra)
    sorted_nodes = sorted(metric.items(), key=lambda x: x[1], reverse=True)
    top_nodes = [n for n, v in sorted_nodes[:n]]
    
    print(f"\n[SELEZIONE TOP {n}]")
    print(f"Criterio: {criterion} ({description})")
    print(f"Top 5 artisti selezionati:")
    for i, (node, value) in enumerate(sorted_nodes[:5], 1):
        name = graph.nodes[node].get('name', node)
        print(f"  {i}. {name} (valore: {value:.3f})")
    
    return top_nodes

In [None]:
# ========== FILTRO PER NAZIONALIT√Ä ==========
# Filtra artisti per paese
nodes_country = nodes_unique[
    nodes_unique['nationality'].apply(lambda nat: is_from_country(nat, COUNTRY_FILTER))
]

print(f"‚úì Artisti filtrati per nazionalit√†: {len(nodes_country)}")
if COUNTRY_FILTER:
    print(f"  Paese: {COUNTRY_FILTER}")
else:
    print(f"  Nessun filtro per nazionalit√† (globale)")

# Converti generi da stringa a lista
def parse_genres(genres_str):
    """Converte stringa di generi in lista"""
    if pd.isna(genres_str):
        return []
    if isinstance(genres_str, list):
        return genres_str
    try:
        return ast.literal_eval(genres_str)
    except:
        return []

nodes_country['genres'] = nodes_country['genres'].apply(parse_genres)
genres_with_data = sum(nodes_country['genres'].apply(len) > 0)
print(f"‚úì Generi convertiti: {genres_with_data}/{len(nodes_country)} artisti con genere definito")

# Estrai IDs degli artisti del paese selezionato
country_ids = set(nodes_country['spotify_id'])
print(f"‚úì Artisti {COUNTRY_FILTER if COUNTRY_FILTER else 'globali'} da analizzare: {len(country_ids)}")

# Filtra solo collaborazioni tra artisti dello stesso paese
print(f"\nFiltraggio collaborazioni...")
tt = edges[edges['id_0'].isin(country_ids) & edges['id_1'].isin(country_ids)]
print(f"‚úì Collaborazioni interne: {len(tt)}")

# Creazione grafo completo
print(f"\nCreazione grafo...")
G_country = nx.Graph()
G_country.add_edges_from(tt[['id_0', 'id_1']].values)

# Aggiungi attributi dei nodi (nome, nazionalit√†, generi, ecc.)
attr_dict = nodes_country.set_index('spotify_id').to_dict('index')
nx.set_node_attributes(G_country, attr_dict)

print(f"\n{'='*60}")
print(f"GRAFO {'DEL PAESE: ' + COUNTRY_FILTER.upper() if COUNTRY_FILTER else 'GLOBALE'}")
print(f"{'='*60}")
print(f"Nodi (artisti): {G_country.number_of_nodes()}")
print(f"Archi (collaborazioni): {G_country.number_of_edges()}")

if G_country.number_of_nodes() > 0:
    density = nx.density(G_country)
    avg_degree = 2 * G_country.number_of_edges() / G_country.number_of_nodes()
    print(f"Densit√†: {density:.4f}")
    print(f"Grado medio: {avg_degree:.2f}")

# Visualizza info nazionalit√† nel grafo
print(f"\n{'='*60}")
print(f"DISTRIBUZIONE NAZIONALIT√Ä NEGLI ARTISTI")
print(f"{'='*60}")
nationality_dist = nodes_country['nationality'].value_counts()
print(nationality_dist.head(10))

In [None]:
# ========== CREAZIONE SOTTOGRAFO ANALISI ==========
# Seleziona i top artisti
top_nodes = select_top_nodes(G_country, nodes_country, n=TOPLIST, criterion=SELECTION_CRITERION)

# Crea sottografo con solo i top artisti e le loro collaborazioni
G_top = G_country.subgraph(top_nodes).copy()

print(f"\n[GRAFO TOP {TOPLIST}]")
print(f"Nodi: {G_top.number_of_nodes()}")
print(f"Archi: {G_top.number_of_edges()}")

# ========== STATISTICHE GENERALIZZATE ==========
print(f"\n[SUMMARY PARAMETRI]")
print(f"  Paese: {COUNTRY_FILTER.upper() if COUNTRY_FILTER else 'GLOBALE'}")
print(f"  Criterio selezione: {SELECTION_CRITERION}")
print(f"  Top: {TOPLIST} artisti")
print(f"  Grafo completo: {G_country.number_of_nodes()} nodi, {G_country.number_of_edges()} archi")
print(f"  Grafo analisi: {G_top.number_of_nodes()} nodi, {G_top.number_of_edges()} archi")

In [None]:
print("\n" + "="*60)
print("1. PROPRIET√Ä GLOBALI DELLA RETE")
print("="*60)

# Densit√†: rapporto tra archi esistenti e possibili
density = nx.density(G_top)
print(f"\nDensit√†: {density:.4f}")
print(f"  ‚Üí La rete √® {'molto' if density > 0.1 else 'poco'} connessa")

# Componenti connesse
components = list(nx.connected_components(G_top))
print(f"\nComponenti connesse: {len(components)}")
print(f"  ‚Üí Dimensione componente principale: {len(max(components, key=len))} nodi")

# Lavora sulla componente gigante
G_main = G_top.subgraph(max(components, key=len)).copy()

# Diametro e cammino medio (solo se connesso)
if nx.is_connected(G_main):
    diameter = nx.diameter(G_main)
    avg_path = nx.average_shortest_path_length(G_main)
    print(f"\nDiametro: {diameter}")
    print(f"  ‚Üí Massima distanza tra due artisti: {diameter} passaggi")
    print(f"\nCammino medio: {avg_path:.3f}")
    print(f"  ‚Üí Distanza media tra artisti: {avg_path:.3f} collaborazioni")
else:
    print("\nGrafo non completamente connesso, diametro non calcolabile")

# Coefficiente di clustering
clustering_coeff = nx.average_clustering(G_main)
print(f"\nCoefficient di clustering medio: {clustering_coeff:.4f}")
print(f"  ‚Üí I collaboratori di un artista {'spesso' if clustering_coeff > 0.3 else 'raramente'} collaborano tra loro")


In [None]:
print("\n" + "="*60)
print("2. DISTRIBUZIONE DEI GRADI")
print("="*60)

# Calcola gradi
degrees = [G_main.degree(n) for n in G_main.nodes()]
degree_count = Counter(degrees)

# Statistiche
avg_degree = np.mean(degrees)
median_degree = np.median(degrees)
max_degree = max(degrees)

print(f"\nGrado medio: {avg_degree:.2f}")
print(f"Grado mediano: {median_degree:.0f}")
print(f"Grado massimo: {max_degree}")

# Trova artisti pi√π connessi
top_degree = sorted(G_main.degree(), key=lambda x: x[1], reverse=True)[:10]
print(f"\nTop 10 artisti per numero di collaborazioni:")
for i, (node, deg) in enumerate(top_degree, 1):
    name = G_main.nodes[node].get('name', node)
    print(f"  {i}. {name}: {deg} collaborazioni")

# Test distribuzione power-law
print(f"\nLa distribuzione {'segue' if max_degree > 5*avg_degree else 'non segue'} un pattern scale-free")
print(f"  ‚Üí {'Pochi hub dominano' if max_degree > 5*avg_degree else 'Rete pi√π omogenea'}")


In [None]:
print("\n" + "="*60)
print("3. MISURE DI CENTRALIT√Ä")
print("="*60)

# Calcola diverse centralit√†
degree_cent = nx.degree_centrality(G_main)
betweenness_cent = nx.betweenness_centrality(G_main)
closeness_cent = nx.closeness_centrality(G_main)

try:
    eigenvector_cent = nx.eigenvector_centrality(G_main, max_iter=1000)
except:
    eigenvector_cent = {n: 0 for n in G_main.nodes()}

# Crea dataframe comparativo
centrality_df = pd.DataFrame({
    'artist': [G_main.nodes[n].get('name', n) for n in G_main.nodes()],
    'degree': [degree_cent[n] for n in G_main.nodes()],
    'betweenness': [betweenness_cent[n] for n in G_main.nodes()],
    'closeness': [closeness_cent[n] for n in G_main.nodes()],
    'eigenvector': [eigenvector_cent[n] for n in G_main.nodes()]
})

print("\n[DEGREE CENTRALITY] - Artisti pi√π connessi:")
top_deg = centrality_df.nlargest(5, 'degree')
for idx, row in top_deg.iterrows():
    print(f"  {row['artist']}: {row['degree']:.4f}")

print("\n[BETWEENNESS CENTRALITY] - Artisti bridge tra comunit√†:")
top_bet = centrality_df.nlargest(5, 'betweenness')
for idx, row in top_bet.iterrows():
    print(f"  {row['artist']}: {row['betweenness']:.4f}")

print("\n[CLOSENESS CENTRALITY] - Artisti centrali nella rete:")
top_clo = centrality_df.nlargest(5, 'closeness')
for idx, row in top_clo.iterrows():
    print(f"  {row['artist']}: {row['closeness']:.4f}")

print("\n[EIGENVECTOR CENTRALITY] - Artisti connessi ad altri importanti:")
top_eig = centrality_df.nlargest(5, 'eigenvector')
for idx, row in top_eig.iterrows():
    print(f"  {row['artist']}: {row['eigenvector']:.4f}")


In [None]:
print("\n" + "="*60)
print("4. RILEVAMENTO COMUNIT√Ä")
print("="*60)

# Algoritmo Louvain per community detection
partition = community_louvain.best_partition(G_main)

# Aggiungi community come attributo
nx.set_node_attributes(G_main, partition, 'community')

# Analisi comunit√†
num_communities = len(set(partition.values()))
print(f"\nNumero di comunit√† rilevate: {num_communities}")

# Dimensione comunit√†
community_sizes = Counter(partition.values())
print(f"\nDistribuzione dimensioni comunit√†:")
for comm_id, size in sorted(community_sizes.items(), key=lambda x: x[1], reverse=True)[:10]:
    print(f"  Comunit√† {comm_id}: {size} artisti")

# Modularity
modularity = community_louvain.modularity(partition, G_main)
print(f"\nModularit√†: {modularity:.4f}")
print(f"  ‚Üí {'Forte' if modularity > 0.4 else 'Moderata' if modularity > 0.3 else 'Debole'} struttura a comunit√†")

# Artisti per comunit√† (top 3 comunit√† pi√π grandi)
print(f"\nArtisti principali per comunit√† (top 3 comunit√†):")
for comm_id, size in sorted(community_sizes.items(), key=lambda x: x[1], reverse=True)[:3]:
    print(f"\n  Comunit√† {comm_id} ({size} artisti):")
    comm_nodes = [n for n, c in partition.items() if c == comm_id]
    comm_degrees = [(n, G_main.degree(n)) for n in comm_nodes]
    top_in_comm = sorted(comm_degrees, key=lambda x: x[1], reverse=True)[:5]
    for node, deg in top_in_comm:
        name = G_main.nodes[node].get('name', node)
        print(f"    - {name} ({deg} collab.)")


In [None]:
print("\n" + "="*60)
print("5. BRIDGE ANALYSIS - CONNETTORI TRA COMUNIT√Ä")
print("="*60)

# Identifica edge betweenness
edge_betweenness = nx.edge_betweenness_centrality(G_main)

# Top bridge edges
top_bridges = sorted(edge_betweenness.items(), key=lambda x: x[1], reverse=True)[:10]

print("\nTop 10 collaborazioni-bridge:")
for i, ((u, v), score) in enumerate(top_bridges, 1):
    name_u = G_main.nodes[u].get('name', u)
    name_v = G_main.nodes[v].get('name', v)
    comm_u = partition[u]
    comm_v = partition[v]
    is_bridge = "‚úì" if comm_u != comm_v else "‚úó"
    print(f"  {i}. {name_u} ‚Üî {name_v} (score: {score:.4f}) [Bridge: {is_bridge}]")

# Constraint (Burt's structural holes)
constraint = nx.constraint(G_main)
low_constraint = sorted(constraint.items(), key=lambda x: x[1])[:10]

print("\nArtisti con accesso a structural holes (basso constraint):")
for i, (node, const) in enumerate(low_constraint, 1):
    name = G_main.nodes[node].get('name', node)
    print(f"  {i}. {name} (constraint: {const:.4f})")


In [None]:
print("\n" + "="*60)
print("6. CLIQUES E GRUPPI COESI")
print("="*60)

# Trova cliques massimali
cliques = list(nx.find_cliques(G_main))
clique_sizes = [len(c) for c in cliques]

print(f"\nNumero totale di cliques: {len(cliques)}")
print(f"Dimensione massima clique: {max(clique_sizes)}")
print(f"Dimensione media clique: {np.mean(clique_sizes):.2f}")

# Top 5 cliques pi√π grandi
largest_cliques = sorted(cliques, key=len, reverse=True)[:5]
print(f"\nTop 5 cliques pi√π grandi:")
for i, clique in enumerate(largest_cliques, 1):
    print(f"\n  Clique {i} ({len(clique)} artisti):")
    for node in clique[:10]:  # Mostra max 10
        name = G_main.nodes[node].get('name', node)
        print(f"    - {name}")

# K-core decomposition
k_cores = nx.core_number(G_main)
max_k = max(k_cores.values())

print(f"\nK-core massimo: {max_k}")
print(f"  ‚Üí Esiste un nucleo di artisti con almeno {max_k} connessioni reciproche")

# Artisti nel k-core massimo
max_core_nodes = [n for n, k in k_cores.items() if k == max_k]
print(f"\nArtisti nel {max_k}-core ({len(max_core_nodes)} artisti):")
for node in sorted(max_core_nodes, key=lambda n: G_main.degree(n), reverse=True)[:10]:
    name = G_main.nodes[node].get('name', node)
    degree = G_main.degree(node)
    print(f"  - {name} ({degree} collab.)")


In [None]:
print("\n" + "="*60)
print("7. PROPRIET√Ä SMALL-WORLD")
print("="*60)

# Usa il sottografo principale della tua selezione
# (rinomina G_main ‚Üí G_top o usa qualunque variabile rappresenti il grafo in analisi)
G_analysis = G_top  # Puoi facilmente cambiarlo in G_country o altro in base ai tuoi settings

# Calcola coefficienti su G_analysis
C_real = nx.average_clustering(G_analysis)
if nx.is_connected(G_analysis):
    L_real = nx.average_shortest_path_length(G_analysis)
else:
    L_real = None

# Parametri base del grafo per generare confronto random
n = G_analysis.number_of_nodes()
m = G_analysis.number_of_edges()
if n > 1:
    p = 2 * m / (n * (n - 1))
else:
    p = 0

# Genera grafo random Erd≈ës‚ÄìR√©nyi con stesso numero di nodi e archi attesi
G_random = nx.erdos_renyi_graph(n, p, seed=SEED)
C_random = nx.average_clustering(G_random)

if nx.is_connected(G_random):
    L_random = nx.average_shortest_path_length(G_random)
else:
    # Se non connesso, usa componente gigante
    largest_cc = max(nx.connected_components(G_random), key=len)
    G_random_main = G_random.subgraph(largest_cc)
    L_random = nx.average_shortest_path_length(G_random_main)

# Output generalizzato
print(f"\nRete musicale selezionata:")
print(f"  Clustering: {C_real:.4f}")
if L_real:
    print(f"  Cammino medio: {L_real:.4f}")

print(f"\nGrafo random equivalente:")
print(f"  Clustering: {C_random:.4f}")
print(f"  Cammino medio: {L_random:.4f}")

# Test small-world
if L_real:
    sigma = (C_real / C_random) / (L_real / L_random)
    print(f"\nSmall-world coefficient (œÉ): {sigma:.4f}")
    if sigma > 1:
        print(f"  ‚úì La rete selezionata ha propriet√† SMALL-WORLD")
        print(f"    ‚Üí Alto clustering locale + brevi distanze globali")
    else:
        print(f"  ‚úó La rete selezionata non mostra forti propriet√† small-world")
else:
    print("\nCammino medio non calcolabile (rete non connessa)")


In [None]:
print("\n" + "="*60)
print("8. ANALISI PER GENERE MUSICALE")
print("="*60)

# Verifica se esiste campo genere
if 'genres' in G_main.nodes[list(G_main.nodes())[0]]:
    
    # Estrai generi principali
    genre_dict = {}
    for node in G_main.nodes():
        genres = G_main.nodes[node].get('genres', [])
        if isinstance(genres, list) and len(genres) > 0:
            # Prendi primo genere
            genre_dict[node] = genres[0]
        else:
            genre_dict[node] = 'Unknown'
    
    # Distribuzione generi
    genre_count = Counter(genre_dict.values())
    print(f"\nDistribuzione generi (top 10):")
    for genre, count in genre_count.most_common(10):
        print(f"  {genre}: {count} artisti")
    
    # Assortativit√† per genere
    nx.set_node_attributes(G_main, genre_dict, 'genre')
    
    # Collaborazioni intra vs inter-genere
    intra_genre = 0
    inter_genre = 0
    for u, v in G_main.edges():
        if genre_dict[u] == genre_dict[v]:
            intra_genre += 1
        else:
            inter_genre += 1
    
    total_edges = intra_genre + inter_genre
    print(f"\nCollaborazioni intra-genere: {intra_genre} ({100*intra_genre/total_edges:.1f}%)")
    print(f"Collaborazioni inter-genere: {inter_genre} ({100*inter_genre/total_edges:.1f}%)")
    
    if intra_genre > inter_genre:
        print("  ‚Üí Gli artisti tendono a collaborare dentro lo stesso genere")
    else:
        print("  ‚Üí Forte cross-pollination tra generi diversi")
    
else:
    print("\nAttributo 'genres' non disponibile nel dataset")


In [None]:
import os

# --- Prepara la rete per export ---
# Converti tipi non supportati (list, dict, tuple) in stringa:
for n, data in G_top.nodes(data=True):
    for k, v in data.items():
        if isinstance(v, (list, dict, tuple)):
            G_top.nodes[n][k] = str(v)

# Prepara nome directory e file:
country = COUNTRY_FILTER if COUNTRY_FILTER else "all"
crit = SELECTION_CRITERION
topn = TOPLIST
export_dir = "exports_gexf"
os.makedirs(export_dir, exist_ok=True)
filename = f"{country}_{crit}_top{topn}.gexf"
filepath = os.path.join(export_dir, filename)

# Exporta il grafo
nx.write_gexf(G_top, filepath)

print(f"\n‚úì Esportazione completata!")
print(f"  File GEXF salvato in: {filepath}")
print(f"  ‚Üí Aprilo in Gephi per analisi/visualizzazione.")


In [None]:
# ============================================================================
# ANALISI CONNETTIVIT√Ä DELLA RETE
# ============================================================================

def analyze_network_connectivity(G):
    """
    Analizza la connettivit√† della rete e identifica componenti connesse.
    
    Parametri:
    - G: grafo NetworkX
    
    Returns:
    - Dizionario con statistiche di connettivit√†
    """
    
    print("="*70)
    print("ANALISI CONNETTIVIT√Ä DELLA RETE")
    print("="*70)
    
    # Verifica base
    print(f"\nNodi totali: {G.number_of_nodes()}")
    print(f"Archi totali: {G.number_of_edges()}")
    
    # Controlla se il grafo √® connesso
    is_connected = nx.is_connected(G)
    print(f"\nüîç Grafo completamente connesso: {is_connected}")
    
    if not is_connected:
        print("‚ö†Ô∏è La rete NON √® completamente connessa!")
        print("   Esistono componenti isolate o non raggiungibili.")
    else:
        print("‚úì La rete √® completamente connessa!")
        print("   Tutti i nodi sono raggiungibili da tutti gli altri.")
    
    # ========== COMPONENTI CONNESSE ==========
    print(f"\n{'-'*70}")
    print("COMPONENTI CONNESSE")
    print(f"{'-'*70}")
    
    # Trova tutte le componenti connesse
    components = list(nx.connected_components(G))
    num_components = len(components)
    
    print(f"Numero di componenti connesse: {num_components}")
    
    if num_components == 1:
        print("‚úì C'√® una sola componente: la rete √® connessa")
    else:
        print(f"‚ùå Ci sono {num_components} componenti separate\n")
        
        # Ordina per dimensione
        components_sorted = sorted(components, key=len, reverse=True)
        
        print("Distribuzione delle componenti:")
        for i, comp in enumerate(components_sorted[:10], 1):  # Mostra top 10
            percentage = 100 * len(comp) / G.number_of_nodes()
            print(f"  Componente {i}: {len(comp)} nodi ({percentage:.1f}%)")
        
        if num_components > 10:
            other_count = sum(len(c) for c in components_sorted[10:])
            print(f"  ... e {num_components - 10} altre componenti minori ({100*other_count/G.number_of_nodes():.1f}%)")
    
    # ========== DIAMETRO E DISTANZE ==========
    print(f"\n{'-'*70}")
    print("DISTANZE E DIAMETRO")
    print(f"{'-'*70}")
    
    if is_connected:
        # Se il grafo √® connesso, calcola il diametro
        diameter = nx.diameter(G)
        print(f"Diametro della rete: {diameter}")
        print(f"  (massima distanza tra due nodi qualsiasi)")
        
        # Eccentricit√† dei nodi
        eccentricity = nx.eccentricity(G)
        avg_eccentricity = sum(eccentricity.values()) / len(eccentricity)
        print(f"Eccentricit√† media: {avg_eccentricity:.2f}")
        
        # Raggio
        radius = nx.radius(G)
        print(f"Raggio della rete: {radius}")
        print(f"  (minima eccentricit√†)")
        
    else:
        # Se non connesso, analizza per componente
        print("Analisi per componente connessa:\n")
        for i, comp in enumerate(components_sorted[:5], 1):
            G_sub = G.subgraph(comp)
            if G_sub.number_of_nodes() > 1:
                diam = nx.diameter(G_sub)
                print(f"  Componente {i} (nodi: {len(comp)}): diametro = {diam}")
    
    # ========== LUNGHEZZA MEDIA DEI PATH ==========
    print(f"\n{'-'*70}")
    print("LUNGHEZZA MEDIA DEI PATH (Average Path Length)")
    print(f"{'-'*70}")
    
    if is_connected:
        avg_path_length = nx.average_shortest_path_length(G)
        print(f"Lunghezza media dei path: {avg_path_length:.2f}")
        print(f"  (in media, due artisti sono distanti {avg_path_length:.2f} collaborazioni)")
    else:
        print("Calcolo per componente connessa:\n")
        for i, comp in enumerate(components_sorted[:5], 1):
            G_sub = G.subgraph(comp)
            if G_sub.number_of_nodes() > 1:
                avg_path = nx.average_shortest_path_length(G_sub)
                print(f"  Componente {i}: {avg_path:.2f}")
    
    # ========== COEFFICIENTE DI CLUSTERING ==========
    print(f"\n{'-'*70}")
    print("CLUSTERING (Densit√† Locale)")
    print(f"{'-'*70}")
    
    clustering_coeff = nx.average_clustering(G)
    print(f"Coefficiente di clustering medio: {clustering_coeff:.4f}")
    print(f"  (misura quanto i vicini di un nodo sono connessi tra loro)")
    
    # ========== ANALISI DEI NODI ISOLATI ==========
    print(f"\n{'-'*70}")
    print("NODI ISOLATI E PERIFERICI")
    print(f"{'-'*70}")
    
    isolated_nodes = list(nx.isolates(G))
    print(f"Nodi isolati (grado = 0): {len(isolated_nodes)}")
    
    if len(isolated_nodes) > 0:
        print("  ‚ö†Ô∏è Questi artisti non hanno collaborazioni")
        # Mostra i nomi di alcuni artisti isolati
        if 'name' in G.nodes[list(G.nodes())[0]]:
            isolated_names = [G.nodes[node].get('name', node) for node in isolated_nodes[:5]]
            print(f"  Esempi: {', '.join(isolated_names)}")
    
    # Nodi con basso grado (periferici)
    degrees = dict(G.degree())
    low_degree_nodes = [node for node, degree in degrees.items() if degree <= 2]
    print(f"Nodi periferici (grado ‚â§ 2): {len(low_degree_nodes)}")
    
    # ========== STATISTICHE FINALI ==========
    print(f"\n{'-'*70}")
    print("STATISTICHE FINALI")
    print(f"{'-'*70}")
    
    degree_values = list(dict(G.degree()).values())
    print(f"Grado minimo: {min(degree_values)}")
    print(f"Grado massimo: {max(degree_values)}")
    print(f"Grado medio: {sum(degree_values) / len(degree_values):.2f}")
    
    density = nx.density(G)
    print(f"Densit√† della rete: {density:.4f}")
    print(f"  (0 = grafo vuoto, 1 = grafo completo)")
    
    # Ritorna un dizionario con i risultati
    return {
        'is_connected': is_connected,
        'num_components': num_components,
        'num_nodes': G.number_of_nodes(),
        'num_edges': G.number_of_edges(),
        'density': density,
        'num_isolated': len(isolated_nodes),
        'clustering_coeff': clustering_coeff
    }


# ============================================================================
# ESECUZIONE
# ============================================================================

# Analizza la rete principale
results = analyze_network_connectivity(G_main)

print("\n" + "="*70)
print("INTERPRETAZIONE")
print("="*70)

if results['is_connected']:
    print("‚úì La rete √® COMPLETAMENTE CONNESSA")
    print("  Ogni artista pu√≤ raggiungere ogni altro artista attraverso collaborazioni")
else:
    print("‚ùå La rete NON √® completamente connessa")
    print(f"  Ci sono {results['num_components']} componenti separate")
    print(f"  Solo il {100*results['num_components']/results['num_nodes']:.1f}% dei nodi √® nella componente principale")

if results['num_isolated'] > 0:
    print(f"\n‚ö†Ô∏è ATTENZIONE: {results['num_isolated']} artisti sono isolati (nessuna collaborazione)")

print(f"\nDensit√†: {results['density']:.4f}")
if results['density'] < 0.01:
    print("  ‚Üí Rete molto sparsa (poche collaborazioni)")
elif results['density'] < 0.1:
    print("  ‚Üí Rete moderatamente sparsa")
else:
    print("  ‚Üí Rete densa (molte collaborazioni)")
