# 완주하지 못한 선수

문제: [완주하지 못한 선수](http://j.mp/2piYxLy)

In [1]:
# 문제에서 제공한 예제를 테스트 코드로 작성했습니다.

def test_example1():
    participant = ['leo', 'kiki', 'eden']
    completion = ['eden', 'kiki']
    loser = 'leo'
    assert find_incompletion(participant, completion) == loser


def test_example2():
    participant = ['marina', 'josipa', 'nikola', 'vinko', 'filipa']
    completion = ['josipa', 'filipa', 'marina', 'nikola']
    loser = 'vinko'
    assert find_incompletion(participant, completion) == loser


def test_example3():
    participant = ['mislav', 'stanko', 'mislav', 'ana']
    completion = ['stanko', 'ana', 'mislav']
    loser = 'mislav'
    assert find_incompletion(participant, completion) == loser

In [2]:
# 테스트를 실행하면 “find_incompletion”가 없다는 에러가 발생합니다.

test_example1()

# => NameError: name 'find_incompletion' is not defined

NameError: name 'find_incompletion' is not defined

In [3]:
# 먼저, 두 집합의 차이를 구하는 아이디어를 실험해 봅니다.

def find_incompletion(participant, completion):
    incompletion = set(participant) - set(completion)
    # 풀이하시다 어려운 게 있으면 중간에 print 등으로 어떤 일이 벌어지고 있는지 확인하셔도 됩니다.
    print(incompletion)
    return list(incompletion)[0]

In [4]:
test_example1()

{'leo'}


In [5]:
test_example2()

{'vinko'}


In [6]:
# 동명이인이 있을 때는 실패합니다.

test_example3()

# => IndexError: list index out of range

set()


IndexError: list index out of range

In [7]:
# 완주하지 못한 선수 목록을 직접 관리합니다.
# 중간 단계를 print로 확인해 봤습니다.

def find_incompletion(participant, completion):
    incompletion = participant.copy()
    print(incompletion)
    for runner in completion:
        incompletion.remove(runner)
        print(incompletion)
    return incompletion[0]

In [8]:
test_example1()

['leo', 'kiki', 'eden']
['leo', 'kiki']
['leo']


In [9]:
test_example2()

['marina', 'josipa', 'nikola', 'vinko', 'filipa']
['marina', 'nikola', 'vinko', 'filipa']
['marina', 'nikola', 'vinko']
['nikola', 'vinko']
['vinko']


In [10]:
test_example3()

['mislav', 'stanko', 'mislav', 'ana']
['mislav', 'mislav', 'ana']
['mislav', 'mislav']
['mislav']


In [11]:
# remove가 비효율적이기 때문에 문제가 됩니다.
# 위의 코드는 풀어서 쓰면 다음과 같습니다.

def find_incompletion(participant, completion):
    incompletion = participant.copy()
    for runner in completion:
        # remove를 풀어서 쓰면 이렇습니다.
        for i in range(len(incompletion)):
            if incompletion[i] == runner:
                del incompletion[i]
                break
    return incompletion[0]

In [12]:
test_example1()
test_example2()
test_example3()

알고리즘의 효율성을 따질 땐 시간 복잡도란 개념을 쓰는데,
위의 코드는 `O(n^2)`의 시간 복잡도를 갖는다고 표현합니다.
마라톤 주자가 많아지면 말 그대로 기하급수적으로 느려지게 되죠.

이 문제를 해결하기 위해 `remove` 대신 다른 걸 사용해야 하고,
이렇게 하기 위해 `list`가 아니라 `dictionary`를 써봅시다.

In [13]:
# 참석자를 좀 단순한 형태로 바꿔서 보겠습니다.
participant = ['a', 'a', 'b', 'c']

# 중복 문제의 효율을 위해 횟수를 파악해 참석자 목록을 이렇게 key-value 형태로 정리할 수 있습니다.
incompletion = {'a': 2, 'b': 1, 'c': 1}
print(incompletion)

for runner in ['a', 'b', 'c']:
    # 효율에 문제가 있던 remove 대신 dictionary를 활용합니다.
    # 여기선 dictionary가 상수시간 O(1)에 가깝게 작동한다고 가정합니다.
    incompletion[runner] -= 1
    print(incompletion)

# value가 0이 아닌 key를 찾으면 됩니다.
for k, v in incompletion.items():
    if v > 0:
        print('완주하지 못한 선수:', k)

{'a': 2, 'b': 1, 'c': 1}
{'a': 1, 'b': 1, 'c': 1}
{'a': 1, 'b': 0, 'c': 1}
{'a': 1, 'b': 0, 'c': 0}
완주하지 못한 선수: a


In [14]:
# 참석자 list를 dictionary로 바꿔봅시다.

participant = ['a', 'a', 'b', 'c']

# 초기값
incompletion = {}
print(incompletion)

# 누산
for runner in participant:
    if runner not in incompletion:
        incompletion[runner] = 0
    incompletion[runner] += 1
    print(incompletion)

{}
{'a': 1}
{'a': 2}
{'a': 2, 'b': 1}
{'a': 2, 'b': 1, 'c': 1}


In [15]:
# dictionary의 get을 활용하면 if를 제거할 수 있습니다.

participant = ['a', 'a', 'b', 'c']

# 초기값
incompletion = {}
print(incompletion)

# 누산
for runner in participant:
    incompletion[runner] = incompletion.get(runner, 0) + 1
    print(incompletion)

{}
{'a': 1}
{'a': 2}
{'a': 2, 'b': 1}
{'a': 2, 'b': 1, 'c': 1}


In [16]:
# 이제 다시 문제로 돌아와서 dictionary를 사용하게 고쳐보죠.

def find_incompletion(participant, completion):
    incompletion = {}
    for runner in participant:
        incompletion[runner] = incompletion.get(runner, 0) + 1
    print(incompletion)

    for runner in completion:
        incompletion[runner] -= 1
        print(incompletion)

    for runner, count in incompletion.items():
        if count > 0:
            return runner

    # 완주하지 못한 선수가 항상 있다는 걸 전제로 합니다.

In [17]:
test_example1()

{'leo': 1, 'kiki': 1, 'eden': 1}
{'leo': 1, 'kiki': 1, 'eden': 0}
{'leo': 1, 'kiki': 0, 'eden': 0}


In [18]:
test_example2()

{'marina': 1, 'josipa': 1, 'nikola': 1, 'vinko': 1, 'filipa': 1}
{'marina': 1, 'josipa': 0, 'nikola': 1, 'vinko': 1, 'filipa': 1}
{'marina': 1, 'josipa': 0, 'nikola': 1, 'vinko': 1, 'filipa': 0}
{'marina': 0, 'josipa': 0, 'nikola': 1, 'vinko': 1, 'filipa': 0}
{'marina': 0, 'josipa': 0, 'nikola': 0, 'vinko': 1, 'filipa': 0}


In [19]:
test_example3()

{'mislav': 2, 'stanko': 1, 'ana': 1}
{'mislav': 2, 'stanko': 0, 'ana': 1}
{'mislav': 2, 'stanko': 0, 'ana': 0}
{'mislav': 1, 'stanko': 0, 'ana': 0}


In [20]:
# 갯수를 셀 때 collections 모듈의 Counter를 쓰면 더 간단합니다.

from collections import Counter


def find_incompletion(participant, completion):
    # 여기를 간단하게 만들었습니다.
    incompletion = Counter(participant)
    print(incompletion)

    for runner in completion:
        incompletion[runner] -= 1
        print(incompletion)

    for runner, count in incompletion.items():
        if count > 0:
            return runner

In [21]:
test_example1()

Counter({'leo': 1, 'kiki': 1, 'eden': 1})
Counter({'leo': 1, 'kiki': 1, 'eden': 0})
Counter({'leo': 1, 'kiki': 0, 'eden': 0})


In [22]:
test_example2()

Counter({'marina': 1, 'josipa': 1, 'nikola': 1, 'vinko': 1, 'filipa': 1})
Counter({'marina': 1, 'nikola': 1, 'vinko': 1, 'filipa': 1, 'josipa': 0})
Counter({'marina': 1, 'nikola': 1, 'vinko': 1, 'josipa': 0, 'filipa': 0})
Counter({'nikola': 1, 'vinko': 1, 'marina': 0, 'josipa': 0, 'filipa': 0})
Counter({'vinko': 1, 'marina': 0, 'josipa': 0, 'nikola': 0, 'filipa': 0})


In [23]:
test_example3()

Counter({'mislav': 2, 'stanko': 1, 'ana': 1})
Counter({'mislav': 2, 'ana': 1, 'stanko': 0})
Counter({'mislav': 2, 'stanko': 0, 'ana': 0})
Counter({'mislav': 1, 'stanko': 0, 'ana': 0})


In [24]:
# Counter는 subtract가 가능합니다.

def find_incompletion(participant, completion):
    incompletion = Counter(participant)
    print(incompletion)

    # 이번엔 여기를 간단하게 만들어 봤습니다.
    incompletion.subtract(Counter(completion))
    print(incompletion)

    for runner, count in incompletion.items():
        if count > 0:
            return runner

In [25]:
test_example1()
print()
test_example2()
print()
test_example3()

Counter({'leo': 1, 'kiki': 1, 'eden': 1})
Counter({'leo': 1, 'kiki': 0, 'eden': 0})

Counter({'marina': 1, 'josipa': 1, 'nikola': 1, 'vinko': 1, 'filipa': 1})
Counter({'vinko': 1, 'marina': 0, 'josipa': 0, 'nikola': 0, 'filipa': 0})

Counter({'mislav': 2, 'stanko': 1, 'ana': 1})
Counter({'mislav': 1, 'stanko': 0, 'ana': 0})


In [26]:
# “subtract”를 “-” 연산자로도 표현할 수 있습니다.

def find_incompletion(participant, completion):
    incompletion = Counter(participant)
    print(incompletion)

    # 마이너스 연산자 사용
    incompletion -= Counter(completion)
    print(incompletion)

    for runner, count in incompletion.items():
        if count > 0:
            return runner

In [27]:
test_example1()
print()
test_example2()
print()
test_example3()

Counter({'leo': 1, 'kiki': 1, 'eden': 1})
Counter({'leo': 1})

Counter({'marina': 1, 'josipa': 1, 'nikola': 1, 'vinko': 1, 'filipa': 1})
Counter({'vinko': 1})

Counter({'mislav': 2, 'stanko': 1, 'ana': 1})
Counter({'mislav': 1})


In [28]:
# Counter에 list를 사용하면 완주하지 못한 선수 목록을 쉽게 알 수 있습니다.

def find_incompletion(participant, completion):
    incompletion = Counter(participant)
    print(incompletion)

    incompletion -= Counter(completion)
    print(incompletion)

    runners = list(incompletion)
    print(runners)

    return runners[0]

In [29]:
test_example1()
print()
test_example2()
print()
test_example3()

Counter({'leo': 1, 'kiki': 1, 'eden': 1})
Counter({'leo': 1})
['leo']

Counter({'marina': 1, 'josipa': 1, 'nikola': 1, 'vinko': 1, 'filipa': 1})
Counter({'vinko': 1})
['vinko']

Counter({'mislav': 2, 'stanko': 1, 'ana': 1})
Counter({'mislav': 1})
['mislav']


In [30]:
# 좀 더 줄여봅시다.

def find_incompletion(participant, completion):
    incompletion = Counter(participant) - Counter(completion)
    runners = list(incompletion)
    return runners[0]

In [31]:
test_example1()
test_example2()
test_example3()

In [32]:
# 좀 더 줄여봅시다.

def find_incompletion(participant, completion):
    runners = list(Counter(participant) - Counter(completion))
    return runners[0]

In [33]:
test_example1()
test_example2()
test_example3()

In [34]:
# 좀 더 줄여봅시다.

def find_incompletion(participant, completion):
    return list(Counter(participant) - Counter(completion))[0]

In [35]:
test_example1()
test_example2()
test_example3()

In [36]:
# list가 아니라 elements와 next를 활용할 수도 있습니다.

def find_incompletion(participant, completion):
    return next((Counter(participant) - Counter(completion)).elements())

In [37]:
test_example1()
test_example2()
test_example3()