# DataSciencester - Código

Vamos representar os usuários da rede social Data Sciencester com um datadump -  uma lista em que cada usuário é representado por um dict, que contém o seu **id** e seu **name**.

## Encontrando conectores chave

In [1]:
users = [
    {"id": 0, "name" : "Oda"},
    {"id": 1, "name" : "Boichi"},
    {"id": 2, "name" : "Thomas"},
    {"id": 3, "name" : "Chongao"},
    {"id": 4, "name" : "Darwin"},
    {"id": 5, "name" : "Mandela"},
    {"id": 6, "name" : "Marx"},
    {"id": 7, "name" : "Alli"},
    {"id": 8, "name" : "Lovelace"},
    {"id": 9, "name" : "Roussef"},
]

Também poderíamos representar as amizades entre os usuários com uma lista de pares de IDs (**tuplas**):

In [2]:
friendship_pairs = [(0, 1), (0, 2), (1, 2), (1, 3), (2, 3), (3, 4), (4, 5), (5, 6), (5, 7), (6, 8), (7, 8), (8, 9)]

Mas representar dessa forma não parece muito eficiente, pois para contar o número de amizades de um usuário, seria preciso iterar todos os pares e saber se este usuário está presente nas tuplas. Por isso iremos criar um dict no qual as chaves são os ids dos usuários e os valores serão listas com os ids dos amigos (pesquisar em dicts é muito mais rápido):

In [3]:
# Inicialize o dict com uma lista vazia para cada id de usuário
friendships = {user["id"]: [] for user in users} # Utilizando um for de user in users dentro do dict para preencher uma lista de dicts de users

# Em seguida, execute um loop pelos pares de amigos para preenchê-la
for i,j in friendship_pairs:
    friendships[i].append(j) # Adicione o j como amigo do usuário i
    friendships[j].append(i) # Adicione o i como amigo do usuário j

In [10]:
friendships

{0: [1, 2],
 1: [0, 2, 3],
 2: [0, 1, 3],
 3: [1, 2, 4],
 4: [3, 5],
 5: [4, 6, 7],
 6: [5, 8],
 7: [5, 8],
 8: [6, 7, 9],
 9: [8]}

In [4]:
# Qual número médio de conexões? 
def number_of_friends(user):
    """ Quantos amigos tem o _user_? """
    user_id = user["id"]
    friend_ids = friendships[user_id]
    return len(friend_ids)

total_connections = sum(number_of_friends(user) for user in users) # Calculando o total de amigos

num_users = len(users) # Tamanho da lista de usuários
avg_connections = total_connections / num_users # Número médio de conexões

avg_connections

2.4

Também é fácil encontrar pessoas mais conectadas. Como o número de usuários não é muito grande, podemos colocá-los em ordem descrecente, dos que têm "mais amigos" para os que têm "menos amigos".

In [5]:
# Crie uma lista (user_id, number_of_friends)

num_friends_by_id = [(user["id"], number_of_friends(user)) for user in users]

num_friends_by_id.sort(key=lambda id_and_friends: id_and_friends[1], reverse=True) # Classifique a lista por num_friends do maior para o menor

num_friends_by_id # Cada par é (user_id,  num_friends)

[(1, 3),
 (2, 3),
 (3, 3),
 (5, 3),
 (8, 3),
 (0, 2),
 (4, 2),
 (6, 2),
 (7, 2),
 (9, 1)]

## Cientista de Dados que você talvez conheça