### Libs and dataframe imports

In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import networkx as nx
import numpy as np

In [2]:
df = pd.read_csv("/content/drive/MyDrive/Matérias/AED-II/U1T2/scopus.csv")
df

Unnamed: 0,Authors,Author full names,Author(s) ID,Title,Year,Link
0,Santos T.F.; Santos C.M.; Aquino M.S.; Suyambu...,"Santos, Thiago F. (57666539300); Santos, Carol...",57666539300; 57210929095; 57210932472; 5478773...,Towards sustainable and ecofriendly polymer co...,2024,https://www.scopus.com/inward/record.uri?eid=2...
1,Santos N.C.; Almeida R.L.J.; Monteiro S.S.; de...,"Santos, Newton Carlos (57218104648); Almeida, ...",57218104648; 57217715043; 57215822816; 5741784...,Drying of avocado peels using carbonation-ultr...,2024,https://www.scopus.com/inward/record.uri?eid=2...
2,de Sousa B.M.; Júnior J.G.D.; da Silva Neto V.P.,"de Sousa, Bruno Matias (59232843300); Júnior, ...",59232843300; 57218290128; 57423581000,A Novel Wideband Magnetoelectric Dipole Antenn...,2024,https://www.scopus.com/inward/record.uri?eid=2...
3,Duarte Júnior J.G.; D'Assunção A.G.; de A. Bri...,"Duarte Júnior, José G. (57218290128); D'Assunç...",57218290128; 7004474343; 59152883300; 55908415500,An efficient wireless power transfer system pl...,2024,https://www.scopus.com/inward/record.uri?eid=2...
4,dos Santos L.; Maciel D.N.; Barros R.; do Neto...,"dos Santos, Leandro (59345602700); Maciel, Dan...",59345602700; 52264128100; 57196918940; 5934587...,Nonlinear analysis of plane frames considering...,2024,https://www.scopus.com/inward/record.uri?eid=2...
...,...,...,...,...,...,...
3670,Nunes F.D.,"Nunes, Frederico D. (57197416355)",57197416355,Single heterostructure lasers: A picosecond li...,1985,https://www.scopus.com/inward/record.uri?eid=2...
3671,D'assunção A.G.; Giarola A.J.; Rogers D.A.,"D'assunção, A.G. (7004474343); Giarola, A.J. (...",7004474343; 7004822283; 7402049297,Characteristics of broadside-coupled microstri...,1981,https://www.scopus.com/inward/record.uri?eid=2...
3672,Albuquerque M.R.M.L.; D'assunção A.G.; Maia M....,"Albuquerque, Maria Rosa M. L. (7007067734); D'...",7007067734; 7004474343; 7005342497,Full-wave analysis of microstrip lines on ferr...,1989,https://www.scopus.com/inward/record.uri?eid=2...
3673,Dos Santos R.M.Z.; Mariz A.M.; Dos Santos R.R....,"Dos Santos, R. M. Zorzenon (6602651907); Mariz...",6602651907; 6603567837; 7102445256; 7006572244,The three-dimensional quantum Heisenberg ferro...,1985,https://www.scopus.com/inward/record.uri?eid=2...


### Generating and plotting graph from dataframe

In [None]:
import matplotlib.pyplot as plt
from matplotlib.lines import Line2D
GlobalGraph = nx.Graph()

# Iterate through the rows of the DataFrame
for index, row in df.iterrows():

  authors_id_by_paper = row['Author(s) ID'].split(';')  # Assuming authors are separated by ';'
  authors_name_by_paper = row['Authors'].split(';')  # Assuming authors are separated by ';'
  #print(authors_name_by_paper)

  k = 0;

  # Adicionando os nós a partir dos nomes dos autores. Pode ser feito usando os IDs dos autores para evitar confusões ou erros relacionados à escrita dos nomes.
  for id in authors_id_by_paper:
    #authors_by_id.append([ authors_name_by_paper[k]  , id])
    GlobalGraph.add_node(authors_name_by_paper[k])
    k = k + 1

  # Adicionando os vérices do grafo;
  # Para cada linha da tabela scopus.csv que se refere à uma publicação, os autores são percorridos um a um e são ligado aos outros co-autores.
  ##for i in range(len(authors_name_by_paper)):
  for i in range(1):
    for j in range(i + 1, len(authors_name_by_paper)):  # Evitar arestas repetidas (i, j) e (j, i)
      GlobalGraph.add_edge(authors_name_by_paper[i], authors_name_by_paper[j])

#Gerando imagem do grafo e plotando.
##nx.draw(GlobalGraph, with_labels=False)

pos = nx.spring_layout(GlobalGraph, k=0.3, iterations=50)

plt.figure(figsize=(18, 18))  # Aumenta a resolução da imagem gerada

num_nos = GlobalGraph.number_of_nodes()
print(f"Número de nós no grafo: {num_nos}")

# Criando uma legenda manual
legend_elements = [
    Line2D([0], [0], marker='o', color='w', label=f'{num_nos} Nós', markerfacecolor='lightgreen', markersize=10),
    Line2D([0], [0], color='gray', lw=2, label='Arestas')
]

# Adicionando a legenda ao gráfico
plt.legend(handles=legend_elements, loc='lower right')

nx.draw_networkx(GlobalGraph, pos,
                 with_labels=False,
                 node_color='lightgreen',
                 edge_color='gray',
                 node_size=50,  # Diminui o tamanho dos nós
                 font_size=8,   # Diminui o tamanho das labels (rótulos)
                 width=0.5)     # Diminui a espessura das arestas

plt.show()

### Graph's density

Como mostrado na representação gráfica do grafo acima, há 10.478 nós representando os autores das publicações. Para calcularmos a densidade do grafo precisamos dividir a quantidade arestas do grafo pela quantidade máxima possível de arestas. A quantidade máxima de arestas para um grafo não bipartido é: (N(N-1)) / 2 ; Onde N é a quantidade de nós do grafo.

In [None]:
# Quantidade de nós e arestas
n_edges = GlobalGraph.number_of_edges()
n_nodes = GlobalGraph.number_of_nodes()

# Quantidade máxima de arestas possíveis
n_edges_max = (n_nodes*(n_nodes - 1))/2

# Calculando a densidade a partir da fórmula e usando a função density do Networkx
graph_density = n_edges/n_edges_max
graph_density_nx = nx.density(GlobalGraph)

print("Quantidade de arestas:", n_edges)
print("Quantidade máxima de arestas:", n_edges_max)
print("Densidade do grafo usando a fórmula:", graph_density)
print("Densidade do grafo usando o networkx:", graph_density_nx)

### Creating subgraph from global graph

In [None]:
nodes_to_include = []
for node in GlobalGraph.nodes():
  #print(node)
  if GlobalGraph.degree(node) >= 8:
    nodes_to_include.append(node)

#print(nodes_to_include)

# Cria o subgrafo com os nós selecionados
subgraph = GlobalGraph.subgraph(nodes_to_include)

pos = nx.spring_layout(subgraph, k=0.3, iterations=50)
pos = nx.circular_layout(subgraph)

plt.figure(figsize=(18, 18))  # Aumenta a resolução da imagem gerada

num_nos = subgraph.number_of_nodes()
print(f"Número de nós no subgrafo: {num_nos}")

sub_density = round(nx.density(subgraph), 7)
print("Densidade do subgrafo:", sub_density)

# Criando uma legenda manual
legend_elements = [
    Line2D([0], [0], marker='o', color='w', label=f'{num_nos} Nós', markerfacecolor='lightblue', markersize=10),
    Line2D([0], [0], color='gray', lw=2, label='Arestas'),
    Line2D([0], [0], lw=0, label=f'Densidade: {sub_density} arestas por nó.')
]

legend_elements1 = [

]

# Adicionando a legenda ao gráfico
plt.legend(fontsize='15',handles=legend_elements, loc='lower right')

plt.title("Subgrafo com nós que possuem 8 ou mais arestas", fontsize=20)

nx.draw_networkx(subgraph, pos,
                 with_labels=False,
                 node_color='lightblue',
                 edge_color='gray',
                 node_size=50,  # Diminui o tamanho dos nós
                 font_size=8,   # Diminui o tamanho das labels (rótulos)
                 width=0.5)     # Diminui a espessura das arestas

plt.show()

### Degree's Histogram

#### For Global Graph:

In [None]:
# prompt: Limite o eixo horizontal até o número máximo de grau

import matplotlib.pyplot as plt
degree_sequence = [d for n, d in GlobalGraph.degree()]
plt.hist(degree_sequence, bins=range(min(degree_sequence), max(degree_sequence) + 1))
plt.xlabel("Grau")
plt.ylabel("Frequência")
plt.title("Histograma de Grau para o Grafo Global")

print("Número máximo de grau:", max(degree_sequence))

# Limita o eixo horizontal até o número máximo de grau
plt.xlim(0, max(degree_sequence))

plt.show()


#### For subgraph

In [None]:
import matplotlib.pyplot as plt
degree_sequence = [d for n, d in subgraph.degree()]
plt.hist(degree_sequence, bins=range(min(degree_sequence), max(degree_sequence) + 1), rwidth=0.8)

plt.xticks(np.arange(int(min(degree_sequence)), int(max(degree_sequence)) + 1, 1))

plt.xlabel("Grau")
plt.ylabel("Frequência")
plt.title("Histograma de Grau para o subgrafo)

print("Número máximo de grau:", max(degree_sequence))
print("Número mínimo de grau:", min(degree_sequence))

# Limita o eixo horizontal até o número máximo de grau
plt.xlim(0, max(degree_sequence))

plt.show()