# Encontrando Conectores-Chave

Case: O vice-presidente de Networking lhe faz várias perguntas sobre os usuários, e quer que você identifique os "conectores-chave" entre os cientistas de dados e, para isso, lhe dá um data dump da rede da DataSciencester.

Data dump
  - Lista em que cada usuário é representado por um dict, que contém
    - id - numérico
    - name - nomes

In [3]:
# data dump
users = [
    {"id": 0, "name": "Hero"},
    {"id": 1, "name": "Dunn"},
    {"id": 2, "name": "Sue"},
    {"id": 3, "name": "Chi"},
    {"id": 4, "name": "Thor"},
    {"id": 5, "name": "Clive"},
    {"id": 6, "name": "Hicks"},
    {"id": 7, "name": "Devin"},
    {"id": 8, "name": "Kate"},
    {"id": 9, "name": "Klein"},
]

A tupla (0, 1) indica que o cientista de dados com o id 0 (Hero) e o cientista de dados com o id 1 (Dunn) são amigos.

![image.png](attachment:image.png)

In [4]:
# "amizades"
friendship_pairs = [(0, 1), (0, 2), (1, 2), (1, 3), (2, 3), (3, 4), (4, 5), (5, 6), (5, 7), (6, 8), (7, 8), (8, 9)]

In [10]:
# Inicialize o dict com uma lista vazia para cada id de usuário
friendships = {user["id"]: [] for user in users}
friendships

{0: [], 1: [], 2: [], 3: [], 4: [], 5: [], 6: [], 7: [], 8: [], 9: []}

In [11]:
# Execute um loop pelos pares de amigos para preenchê-las
for i, j in friendship_pairs:
    friendships[i].append(j) # Adicione j como amigo do usuário i
    friendships[j].append(i) # Adicione i como amigo do usuário j
friendships

{0: [1, 2],
 1: [0, 2, 3],
 2: [0, 1, 3],
 3: [1, 2, 4],
 4: [3, 5],
 5: [4, 6, 7],
 6: [5, 8],
 7: [5, 8],
 8: [6, 7, 9],
 9: [8]}

Pergunta 1: Qual é o número médio de conexões?
  - Em média, cada usuário possui 2.4 conexões, ou, aproximadamente, 2 conexões.

In [14]:
# Calcula o número total de conexões, somando os tamanhos de todas as listas de friends
# O usuário de id = 0 é conectado com o usuário de id = 1 e id = 2, possuindo, assim, duas conexões
def number_of_friends(user):
    "Quantos amigos tem o user?"
    user_id = user["id"]
    friend_ids = friendships[user_id]

    return len(friend_ids)

total_connections = sum(number_of_friends(user) for user in users) # 24
total_connections

24

In [18]:
# Divide pelo número de usuários
num_users = len(users)
avg_connections = total_connections / num_users # 24 / 10 = 2.4
avg_connections

2.4

Quais as pessoas com mais conexões?
  - Pessoas com maior número de amigos
  - Objetivo: Identificar as pessoas que são centrais para a rede
    - Métrica: Centralidade de Grau

  - Aparentemente, o id = 4 deveria estar mais centralizado

![image.png](attachment:image.png)

In [19]:
# Cria uma lista (user_id, number_of_friends)
num_friends_by_id = [(user["id"], number_of_friends(user)) for user in users]
# Classifica a lista em ordem decrescente, por number_of_friends
num_friends_by_id.sort(key=lambda id_and_friends: id_and_friends[1], reverse=True)
num_friends_by_id

[(1, 3),
 (2, 3),
 (3, 3),
 (5, 3),
 (8, 3),
 (0, 2),
 (4, 2),
 (6, 2),
 (7, 2),
 (9, 1)]

# Cientistas de dados que você talvez conheça

# Salários e Experiências

# Contas Pagas

# Tópicos de Interesse