# zip

zip() 빌트인 함수는 두 개 이상의 시퀀스에서 각각의 항목을 뽑아 묶어주는 이터레이터 역할을 담당합니다.

만약 두 개의 시퀀스가 있다면 각각의 n 번째 항목을 순서대로 뽑아 튜플로 리턴을 하나씩 해 줍니다. 두 개의 시퀀스 중에 먼저 끝나게 되면 해당 이터레이션을 종료합니다. 만약 1개의 시퀀스가 오면 1개의 항목을 가진 튜플을 리턴합니다.

zip() 함수는 다음과 같이 표현될 수 있는데,

    def zip(*iterables):
        # zip('ABCD', 'xy') --> Ax By
        sentinel = object()
        iterators = [iter(it) for it in iterables]
        while iterators:
            result = []
            for it in iterators:
                elem = next(it, sentinel)
                if elem is sentinel:
                    return
                result.append(elem)
            yield tuple(result)
        

zip() 함수는 서로 길이가 다른 두 개의 시쿼스라면 킨 시쿼스의 나머지 항목은 무시되는 것을 알아야 합니다.

다음과 같은 예를 보면,

## 예제

In [1]:
x = [1,2,3]
y = [4,5,6]

# 위에 두 리스트에서 각 항목을 쌍으로 묶어줍니다
[x for x in zip(x,y)]

[(1, 4), (2, 5), (3, 6)]

만약 서로 다른 길이의 리스트를 적용해 보면?

In [2]:
x = [1,2,3]
y = [4,5,6,7,8]

# 위에 두 리스트에서 각 항목을 쌍으로 묶어줍니다
[x for x in zip(x,y)]

[(1, 4), (2, 5), (3, 6)]

위와 같이 서로 다른 길이인 경우에는 적은 길이의 목록의 항목 만큼의 결과를 묶어줍니다. 두 리스트의 길이가 똑 같다는 보장이 없다면 위와 같이 나머지 결과를 원하지 않았는데도 사라지는 경우가 발생할 수 있으므로 조심해서 사용해야 합니다.

만약 리스트가 아니라 사전(dictionary) 자료형을 zip에 이용하면 어떤 결과가 나올까요?

In [3]:
d1 = {'a':1,'b':2}
d2 = {'c':4,'d':5}

[x for x in zip(d1,d2)]

[('a', 'c'), ('b', 'd')]

사전인 경우에는 위에서 처럼 키에 대해서만 묶어 주는 것을 확인할 수 있습니다. 키 뿐만 아니라 값도 이용하려면 어떻게 하면 될까요?

In [4]:
[x for x in d1.values()]

[1, 2]

In [5]:
[x for x in d2.values()]

[4, 5]

In [6]:
[x for x in zip(d2,d1.values())]

[('c', 1), ('d', 2)]

위에서 확인해 보면, d1 대신 d1.values()를 이용하여 키 대신 value 목록에서 결과를 가져오는 것을 확인할 수 있습니다.

마지막으로 두 사전에서 키와 값을 서로 교환하는 것을 만들어 보겠습니다.

In [7]:
def switcharoo(d1,d2):
    dout = {}
    
    for d1key,d2val in zip(d1,d2.values()):
        dout[d1key] = d2val
    
    return dout

In [9]:
switcharoo(d1,d2)

{'a': 4, 'b': 5}