## 01 들어가기

### 1 핵심인물 찾기

사용자 데이터 `users` 와 그들간의 친구관계를 표현한 데이터 `friendships`

In [1]:
users = [
    {"id": 0, "name": "Hero"},
    {"id": 1, "name": "Dunn"},
    {"id": 2, "name": "Sue"},
    {"id": 3, "name": "Chi"},
    {"id": 4, "name": "Thor"},
    {"id": 5, "name": "Clive"},
    {"id": 6, "name": "Hicks"},
    {"id": 7, "name": "Devin"},
    {"id": 8, "name": "Kate"},
    {"id": 9, "name": "Klein"}
]

In [2]:
friendships = [(0,1),(0,2),(1,2),(1,3),(2,3),(3,4),(4,5),(5,6),(5,7),(6,8),(7,8),(8,9)]

위 정보를 이용해서 각 사용자별 친구목록을 `users`에 추가

In [3]:
for user in users:
    user["friends"] = []

for i, j in friendships:
    users[i]["friends"].append(users[j])
    users[j]["friends"].append(users[i])

각 사용자별 평균 친구수는 몇명인가 ?

In [4]:
def number_of_friends(user):
    return len(user["friends"])

def total_connections(users):
    return sum(number_of_friends(user) for user in users)

def avg_connections(users):
    return total_connections(users) / len(users) 

In [5]:
avg_connections(users)

2.4

친구가 많은 사람부터 적은 사람 순으로 정렬

In [6]:
def sort_by_numFriend(users):
    num_friends_by_id = [(user["id"], number_of_friends(user)) for user in users]
    return sorted(num_friends_by_id, key = lambda num_friend : num_friend[1], reverse=True)

In [7]:
sort_by_numFriend(users)

[(1, 3),
 (2, 3),
 (3, 3),
 (5, 3),
 (8, 3),
 (0, 2),
 (4, 2),
 (6, 2),
 (7, 2),
 (9, 1)]

### 2. 데이터 과학자 추천하기

친구의 친구들 찾기

In [40]:
def friends_of_friend_ids_bad(user):
    return [foaf["id"]
            for friend in user["friends"]
            for foaf in friend["friends"]]

In [41]:
friends_of_friend_ids_bad(users[0])

[0, 2, 3, 0, 1, 3]

위 함수는 이름 뒤에 `_bad`를 붙인 만큼, 나쁜 함수 입니다.
결과를 보면 같은 사람이 중복으로 여러번 들어가 있습니다.
그러나 위 결과로 친구 사이에 같이 아는 친구(mutual friends)가 있다는 사실을 확인할 수 있습니다.

이번에는 `mutual friends`(함께 아는 친구) 와 중복을 제외하는 것을 만들어 보겠습니다.

In [43]:
def not_the_same(user, other_user):
    return user["id"] != other_user["id"]

def not_friends(user, other_user):
    return all(not_the_same(friend, other_user) for friend in user["friends"])

from collections import Counter

def friends_of_friend_ids(user):
    return Counter(foaf["id"]
                    for friend in user["friends"]
                    for foaf in friend["friends"]
                    if  not_the_same(user, foaf) and not_friends(user, foaf))

In [44]:
friends_of_friend_ids(users[3])

Counter({0: 2, 5: 1})