# Atividade Prática Supervisionada (APS1)

João Valentim, Luiz Felipe e Marcos Vinícius

## Dataset escolhido
- [Sobre o material](https://snap.stanford.edu/data/act-mooc.html)
- [⬇⬇ link para download do dataset ⬇⬇](https://snap.stanford.edu/data/act-mooc.tar.gz)
- [O que é MOOC](https://pt.wikipedia.org/wiki/MOOC)

## Importações e leitura do dataset

In [1]:
import pandas as pd
import numpy as np
import graph_tool_extras as gte

import netpixi
from graph_tool import draw

In [2]:
df = pd.read_csv('mooc_actions.tsv', sep='\t')

In [3]:
df

Unnamed: 0,ACTIONID,USERID,TARGETID,TIMESTAMP
0,0,0,0,0.0
1,1,0,1,6.0
2,2,0,2,41.0
3,3,0,1,49.0
4,4,0,2,51.0
...,...,...,...,...
411744,411744,7026,8,2572041.0
411745,411745,6842,8,2572043.0
411746,411746,7026,9,2572048.0
411747,411747,6842,5,2572054.0


## Vértices

Os vértices (ou nós), nesse caso, são os usuários + target, que podem ser representados pelos USERID's e TARGETID's.

Podemos definir um vértice de um grafo como sendo um nó ou unidade fundamental que compõe o grafo ou rede em questão.


## Arestas

As arestas, nesse caso, são as ações de cada user, conectando um USERID a um TARGETID.

Uma aresta é a união que conecta dois vértices que pertencem ao grafo em questão. 

| Exemplo | Conceito&nbsp;dos&nbsp;vértices | Conceito&nbsp;das&nbsp;arestas | Operacionalização&nbsp;dos&nbsp;vértices | Operacionalização&nbsp;das&nbsp;arestas |
|:--------|:----------------------|:---------------------|:-------------------------------|:------------------------------|
| 1       | Usuário ou Recurso | Uma aresta entre A e B indica que um usuário A utilizou um recurso B. | Cada vértice corresponde a uma ação de um usuário que utilizou um recurso na plataforma MOOC.  Todas os usuários foram considerados, independente de ter deixado de usuar a ferramenta ou não. | Para cada usuário, contou-se suas atividades. |

In [9]:
print(f'Temos {len(df.USERID.unique()) + len(df.TARGETID.unique())} vértices nessa rede')

Temos 7144 vértices nessa rede


In [10]:
print(f'Temos {len(df.ACTIONID.unique())} arestas nessa rede')

Temos 411749 arestas nessa rede


In [6]:
g = gte.Graph(directed=False) # igual a gte.Graph(), pois directed é falso por padrão

In [12]:
users_id = df.USERID.unique()
targets_id = df.TARGETID.unique() + users_id.max() + 1

In [13]:
users_id.max()

7046

In [14]:
# Add all users
for u in users_id:
    g.add_vertex_by_id(str(u))
    
# Add all users
for t in targets_id:
    g.add_vertex_by_id(str(t))

In [15]:
df['TARGETID'] = (df['TARGETID'] + users_id.max())

In [16]:
df[['USERID', 'TARGETID']].values

array([[   0, 7046],
       [   0, 7047],
       [   0, 7048],
       ...,
       [7026, 7055],
       [6842, 7051],
       [  70, 7069]])

In [17]:
edges = df[['USERID', 'TARGETID']].values

In [18]:
for u, t in edges:
    g.add_edge_by_ids(str(u), str(t)) 

## Visualizing

In [19]:
layout = draw.sfdp_layout(g)

In [20]:
gte.move(g, layout)

In [21]:
gte.save(g, 'mooc-reposicionado.net.gz')

In [23]:
r = netpixi.render('mooc-reposicionado.net.gz',infinite=True)

In [24]:
r.vertex_default(size=4, bwidth=1)

In [25]:
r.edge_default(width=1)