<div style="background-color: #fff1cd; background-image: url('../socnet.svg'); background-position: 1em 1em; background-repeat: no-repeat; background-size: 3em 3em; box-shadow: 0 0 0.25em 0; color: #403c33; font-weight: bold; min-height: 3em; padding: 1em 1em 1em 5em;">Como o nome sugere, você deve usar este notebook como um *caderno de anotações*. Use as células editáveis para tomar notas, principalmente quando os professores estiverem complementando o conteúdo com exposições orais ou exposições na lousa. Crie um *fork* pessoal do repositório, faça *commits* dessas notas e puxe do *upstream* sempre que o repositório for atualizado. Se alguma atualização modificar um notebook existente, essa modificação não envolverá as células editáveis, portanto não causará conflito.</div>

# Redes Sociais: Material do Encontro 5

Imagine que a Rádio Cultura FM estabeleceu uma parceria com o Spotify para promover a música clássica. Essa promoção funciona assim: dentre os *Artistas Relacionados* ao artista que um usuário está escutando, o Spotify pode escolher algum para exibir um ícone de barrinhas de ouro, indicando que esse usuário vai acumular bônus se clicar nesse artista. Esse bônus pode ser convertido em cŕeditos para mensalidade, dentre outros possíveis prêmios.

O problema dessa ideia é que seu custo vai além de simplesmente pagar esses prêmios. O acordo original do Spotify com os distribuidores de música, detentores dos direitos de reprodução de qualquer material fonográfico, não permite que qualquer artista seja privilegiado pelo Spotify através de outra promoção que não seja a sugestão de *Artistas Relacionados* já existente. Após uma longa negociação, ficou acordado que a parceria deverá efetuar um pagamento adicional aos distribuidores de música cada vez que um usuário clicar em um artista com o ícone de barrinhas de ouro. Esse pagamento adicional é proporcional à popularidade do artista.

Os representantes da Rádio Cultura FM estão um pouco preocupados com esse custo inesperado, pois originalmente planejavam usar apenas um critério subjetivo de "mais parecido com música clássica" para escolher os artistas que terão barrinhas. Agora estão pensando em fazer "algo mais inteligente", mas não sabem direito o que isso significa. Portanto, resolveram contratar vocês como Cientistas de Dados para descobrir!

A partir daqui é com vocês! Não contem muito com os clientes, pois eles não conhecem muito sobre análise de dados e não saberiam construir hipóteses para orientar as análises. Lembrem apenas que, apesar do contexto não ser acadêmico, os passos do método científico se aplicam.

0. Qual é a pergunta de pesquisa?
1. Qual é o contexto? Como esse contexto pode ser traduzido para mecanismos?
2. Quais são os mecanismos? Como esses mecanismos podem ser traduzidos para hipóteses?
3. Quais são as hipóteses? Como essas hipóteses podem ser testadas?
4. O que dizem os resultados dos testes? Como esses resultados podem ser interpretados frente às hipóteses?
5. Como as interpretações se relacionam com o contexto original? É possível generalizar as descobertas? O que mais poderia ser agregado às análises em pesquisas futuras?

Lembre-se:

* no material do *Encontro 1*, vimos esses passos;
* no material dos *Encontros 2 e 3*, vimos ferramentas de análise estatística;
* no material do *Encontro 4*, vimos ferramentas de manipulação de grafos;
* a tarefa do fim de semana deu a vocês um grafo dirigido cujos nós são artistas, cada um com um atributo string `label` e um atributo inteiro `popularity`, e no qual uma aresta $(a, b)$ indica que $a$ indica $b$ como relacionado.

É hora de juntar todos esses ingredientes!

# Use o notebook à vontade, inclusive criando outras células!

    0- A pergunta da pesquisa é: Como achar o menor custo de caminho entre os artistas populares e artistas de música clássica? (muito técnica)
    Outra pergunta possível:  Como fazer uma pessoa que percorreu o caminho, passar a escutar musica clássica sem nenhum incentivo?
    Outra pergunta possível: Qual é a eficiencia do método das barrinhas de ouro?
    
    1- O contexto é uma rede de artistas conectados por relações de parecença e usuários que navegam por ela.
    


2) Pessoa que gosta do gênero A <strong style="font-size:20px">»</strong> pessoa escuta gênero A <strong style="font-size:20px">»</strong> influência monetária <strong style="font-size:20px">»</strong> pessoa passa a escutar o gênero B <strong style="font-size:20px">»</strong> pessoa gosta do gênero B


3) Incentivo financeiro <strong style="font-size:20px">»</strong> adesão à artistas longínquos

In [34]:
import sys
sys.path.append("..")
import socnet as sn
from networkx import shortest_path

In [3]:
sn.graph_width = 800
sn.graph_height = 450

sn.node_size = 20
sn.node_color = (255, 255, 255)

sn.edge_width = 2
sn.edge_color = (0, 0, 0)

sn.node_label_position = 'middle center'
sn.edge_label_distance = 10

In [5]:
data = sn.load_graph('whitney-mozart.gml')

In [38]:
data.nodes[0]

{'label': 'Whitney Houston',
 'popularity': 74,
 'color': (255, 255, 255),
 'pos': (0.5132116540965499, 0.4768701521339612)}

In [53]:
lista = shortest_path(data, source=0, target=1)

for i in lista:
    print(data.nodes[i])


{'label': 'Whitney Houston', 'popularity': 74, 'color': (255, 255, 255), 'pos': (0.5132116540965499, 0.4768701521339612)}
{'label': 'Celine Dion', 'popularity': 73, 'color': (255, 255, 255), 'pos': (0.48387219930680647, 0.47916227039951614)}
{'label': 'Susan Boyle', 'popularity': 48, 'color': (255, 255, 255), 'pos': (0.5185224890313301, 0.47283826170597515)}
{'label': 'Libera', 'popularity': 45, 'color': (255, 255, 255), 'pos': (0.572784825633917, 0.5564785316292894)}
{'label': 'Karl Jenkins', 'popularity': 54, 'color': (255, 255, 255), 'pos': (0.6053904878338489, 0.45088531665957254)}
{'label': 'Eric Whitacre', 'popularity': 50, 'color': (255, 255, 255), 'pos': (0.6137153385567915, 0.583288620522525)}
{'label': 'Aaron Copland', 'popularity': 47, 'color': (255, 255, 255), 'pos': (0.5437851396751402, 0.5108403870472347)}
{'label': 'Gustav Holst', 'popularity': 48, 'color': (255, 255, 255), 'pos': (0.5022640604847725, 0.5035383195864233)}
{'label': 'Wolfgang Amadeus Mozart', 'popularity'

In [51]:
data2 = sn.generate_empty_graph(len(lista))

for i in range(len(lista)):
    data2.nodes[i] = lista[i]

TypeError: 'NodeView' object does not support item assignment

## Observações