In [3]:
import pandas as pd
import networkx as nx
import matplotlib.pyplot as plt
from itertools import combinations

In [4]:
arquivo_csv = "../archives/teams_csvs/all_teams.csv"
df = pd.read_csv(arquivo_csv)

team_followers = df.groupby("team")["user_id"].apply(set).to_dict()

grafo = nx.Graph()
grafo.add_nodes_from(team_followers.keys())

# Add edges with weights based on shared followers
for team1, team2 in combinations(team_followers.keys(), 2):
    shared_followers = team_followers[team1] & team_followers[team2]  # Intersection of followers
    weight = len(shared_followers)
    if weight > 0:
        grafo.add_edge(team1, team2, weight=weight)

# Display graph information
print(f"Número de nós (times): {grafo.number_of_nodes()}")
print(f"Número de arestas (conexões entre times): {grafo.number_of_edges()}")

# Example: List edges with weights
print("Arestas com pesos (times e seguidores em comum):")
for u, v, d in grafo.edges(data=True):
    print(f"{u} -- {v}, Seguidores em comum: {d['weight']}")

Número de nós (times): 20
Número de arestas (conexões entre times): 190
Arestas com pesos (times e seguidores em comum):
athletico -- atletico_go, Seguidores em comum: 366
athletico -- atletico_mg, Seguidores em comum: 486
athletico -- bahia, Seguidores em comum: 527
athletico -- botafogo, Seguidores em comum: 535
athletico -- corinthians, Seguidores em comum: 419
athletico -- criciuma, Seguidores em comum: 218
athletico -- cruzeiro, Seguidores em comum: 436
athletico -- cuiaba, Seguidores em comum: 270
athletico -- flamengo, Seguidores em comum: 199
athletico -- fluminense, Seguidores em comum: 539
athletico -- fortaleza, Seguidores em comum: 497
athletico -- gremio, Seguidores em comum: 457
athletico -- internacional, Seguidores em comum: 412
athletico -- juventude, Seguidores em comum: 350
athletico -- palmeiras, Seguidores em comum: 99
athletico -- red_bull_bragantino, Seguidores em comum: 354
athletico -- sao_paulo, Seguidores em comum: 134
athletico -- vasco, Seguidores em comum:

In [2]:
nx.write_gexf(grafo, "../results/grafo_seguidores.gexf")

In [7]:
arquivo_csv = "../archives/teams_csvs/all_teams.csv"
df = pd.read_csv(arquivo_csv)

# Create a directed graph (or undirected if preferred)
grafo = nx.Graph()  # Use nx.DiGraph() for directed relationships

# Add nodes for teams and users
teams = df["team"].unique()
users = df["user_id"].unique()

grafo.add_nodes_from(teams, type="team")  # Add team nodes
grafo.add_nodes_from(users, type="user")  # Add user nodes

# Add edges from users to teams they follow
for _, row in df.iterrows():
    team = row["team"]
    user = row["user_id"]
    grafo.add_edge(user, team)

# Display graph information
print(f"Número de nós (total): {grafo.number_of_nodes()}")
print(f"Número de arestas (total): {grafo.number_of_edges()}")

# Example: List edges
print("Arestas (usuários e times):")
for u, v in grafo.edges():
    print(f"{u} -- {v}")

Número de nós (total): 317536
Número de arestas (total): 340611
Arestas (usuários e times):
athletico -- did:plc:bgfgkxse3iqqul26tb6uugky
athletico -- did:plc:gew7f57mip3eshmi2stf52tc
athletico -- did:plc:d6t25gd7n52s3bs3hgspjci5
athletico -- did:plc:geqltcldfwr4njrx43nnviet
athletico -- did:plc:2xrugyynmlhxvr2ll7czenyw
athletico -- did:plc:z453dr66ija2khhchjfwf73t
athletico -- did:plc:p5typtyzc7umenbwdn6qmksn
athletico -- did:plc:d2d7u6q7cuq6yfiwv7r3zbai
athletico -- did:plc:pd2fwik5gvi3i4c7745snszm
athletico -- did:plc:kusacj4jok2ucna37zodxnpy
athletico -- did:plc:yaizx72zmetvdt6nh253q4aq
athletico -- did:plc:cszyrsn7khxockcaxo7yceob
athletico -- did:plc:3jb3go3ty46glhthdkg6q6mx
athletico -- did:plc:tbdt3rtaz2ryqypzlnricfcs
athletico -- did:plc:xxsfdcilz6c2ddsyanfsl7rz
athletico -- did:plc:nwwuhppfmrrxdtneigm3clrt
athletico -- did:plc:eqkkh5zqmktuifhzhbxav5qm
athletico -- did:plc:w5bfp72hobwhmgwbf24e3ivx
athletico -- did:plc:eiipy6ytqdtfkejtep5hzrl3
athletico -- did:plc:ssnyookthrbgt

IOPub data rate exceeded.
The Jupyter server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--ServerApp.iopub_data_rate_limit`.

Current values:
ServerApp.iopub_data_rate_limit=1000000.0 (bytes/sec)
ServerApp.rate_limit_window=3.0 (secs)



In [8]:
nx.write_gexf(grafo, "../results/grafo_seguidores_2.gexf")