In [92]:
import pandas as pd

df = pd.read_csv("scopus.csv")
df = df.drop(["Source title", "Cited by", "Link"], axis=1)

print(df)


                                             Authors  \
0  de Oliveira J.M.; Munoz R.; Ribeiro S.; Wu W.;...   
1  Pinheiro D.N.; Gonzalez J.C.; Corso G.; Gebre ...   
2  Azevedo K.S.; de Souza L.C.; Coutinho M.G.F.; ...   
3  Papaiz F.; Dourado M.E.T., Jr.; de Medeiros Va...   
4  Ribeiro R.L.A.; Alves D.K.; de Sousa R.P.R.; O...   
5  Machado M.O.; Fernandes I.F.D.C.; Maia S.M.D.M...   
6  Potapov A.M.; Chen T.-W.; Striuchkova A.V.; Al...   
7  Coutinho M.G.F.; Câmara G.B.M.; Barbosa R.D.M....   
8  Palaniappan K.; Hanumanthu J.R.; Singh S.; Pra...   
9                     Dias S.; Queiroz K.; Araujo A.   

                                   Author full names  \
0  de Oliveira, Juliana M. (57190029155); Munoz, ...   
1  Pinheiro, Daniel N. (57194534817); Gonzalez, J...   
2  Azevedo, Karolayne S. (58139278100); de Souza,...   
3  Papaiz, Fabiano (57695367300); Dourado, Mario ...   
4  Ribeiro, Ricardo Lucio Araujo (59301508300); A...   
5  Machado, Murilo Oliveira (57197830032); Fern

In [93]:
#Utilizando os dados extraídos, vocês deverão criar uma rede de
#co-autoria. Neste grafo, os vértices serão os autores e as arestas
#representarão a colaboração entre eles

import networkx as nx

grafico = nx.Graph()

for index, coluna in df.iterrows():
    autores = coluna['Author(s) ID'].split(';')

    for i in range(len(autores)):
        for j in range(i + 1, len(autores)):
            autor1 = autores[i].strip()
            autor2 = autores[j].strip()
            if autor1 != "" and autor2 != "":
                grafico.add_edge(autor1, autor2)

print("Número de vértices:", grafico.number_of_nodes())
print("Número de arestas:", grafico.number_of_edges())
#print("Vértices:", graph.nodes())
#print("Arestas:", graph.edges())


Número de vértices: 181
Número de arestas: 9550


In [94]:
#Densidade da Rede: Calcular a densidade, que mede o quão
#conectados estão os autores em relação ao número máximo
#possível de conexões.


densidade = nx.density(grafico)
print("Densidade da rede:", densidade)


Densidade da rede: 0.5862492326580724


In [95]:
#Sub-Grafo: Gerar um sub-grafo contendo apenas os vértices que
#possuem pelo menos X vizinhos (X será um valor a ser definido por
#vocês). Calcular a densidade desse sub-grafo.


qtd_vizinhos = 5 # a partir de 7, as arestas estão totalmente ligadas (densidade = 1)

vertices_min_vizinhos = [node for node in grafico.nodes() if grafico.degree(node) >= qtd_vizinhos]
#print(vertices_min_vizinhos)

sub_grafo = grafico.subgraph(vertices_min_vizinhos)
sub_grafo_densidade = nx.density(sub_grafo)

print("Número de vértices no sub-grafo:", sub_grafo.number_of_nodes())
print("Número de arestas no sub-grafo:", sub_grafo.number_of_edges())
print("Densidade:", sub_grafo_densidade)


Número de vértices no sub-grafo: 160
Número de arestas no sub-grafo: 9511
Densidade: 0.7477201257861635


In [96]:
# verificando alguns dos vértices com maiores quantidades de arestas
vertices = ['55938728100', '57193698734', '58070747700']

for vertice in vertices:
  vizinhos = list(grafico.edges(vertice))
  print(f"Vizinhos de {vertice}: {vizinhos}")
  print("qtd arestas:", len(vizinhos))


Vizinhos de 55938728100: [('55938728100', '57193698734'), ('55938728100', '58070747700'), ('55938728100', '6602792035'), ('55938728100', '57209076674'), ('55938728100', '15062499200'), ('55938728100', '58799783400'), ('55938728100', '55883248100'), ('55938728100', '56277787700'), ('55938728100', '15721796800'), ('55938728100', '56394554500'), ('55938728100', '21740569400'), ('55938728100', '56018990300'), ('55938728100', '14021072200'), ('55938728100', '57203957347'), ('55938728100', '7202002538'), ('55938728100', '58094990400'), ('55938728100', '55960549500'), ('55938728100', '23007371200'), ('55938728100', '7005694382'), ('55938728100', '7102386639'), ('55938728100', '55744840100'), ('55938728100', '18041564100'), ('55938728100', '6506001293'), ('55938728100', '6507897185'), ('55938728100', '55553096400'), ('55938728100', '58799857400'), ('55938728100', '7006383635'), ('55938728100', '7003556841'), ('55938728100', '6602945066'), ('55938728100', '54956577100'), ('55938728100', '587997

In [97]:
#Histograma dos Graus: Criar um gráfico de histograma mostrando
#a distribuição do grau dos vértices da rede. O grau de um vértice
#representa o número de co-autores com os quais ele colaborou.

import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px

# Calcula o grau de cada vértice
degree_sequence = [grafico.degree(n) for n in grafico.nodes()]

# Cria o histograma interativo usando Plotly
fig = px.histogram(degree_sequence, nbins=138, title="Histograma de Graus")
fig.update_layout(xaxis_title="Grau de vértices", yaxis_title="Número de vértices")
fig.show()
