## 여러 이터레이터에 대해 나란히 루프를 수행하려면 zip 을 사용하라

리스트 컴프리헨션을 사용하면 소스 list에서 새로운 list를 파생시키기 쉽다.

In [1]:
names = ['Cecilia', '남궁민수', 'aadd']
counts = [len(n) for n in names]
print(counts)

[7, 4, 4]


두 개의 리스트를 동시에 이터레이션 해서 가장 긴 문자열을 찾는다면...?

In [2]:
longest_name = None
max_count = 0

for i in range(len(names)):
    count = counts[i]
    if count > max_count:
        longest_name = names[i]
        max_count = count
        
print(longest_name)

Cecilia


In [3]:
# 잡음이 많으 코드를 사용하는 것보다는...
# zip 을 이용해보자.

In [4]:
longest_name = None
max_count = 0

for name, count in zip(names, counts):
    if count > max_count:
        longest_name = name
        max_count = count

zip은 자신이 감싼 이터레이터 원소를 하나씩 소비. 따라서 메모리를 다 소모해서 프로그램이 중단되는 위험 없이 아주 긴 입력도 처리 가능

입력 이터레이터의 길이가 서로 다를 때는 zip이 어떻게 동작할까?

In [5]:
names.append('Rosalind')

for name, count in zip(names, counts):
    print(name)

Cecilia
남궁민수
aadd


Rosalind 가 없는 이유는 zip이 그렇게 동작하기 때문ㅇ
- zip은 자신이 감싼 이터레이터 중 어느 하나가 끝날 때까지 튜플을 내놓는다.
- 따라서 출력은 가장 짧은 입력의 길이와 같다.
- 이걸 방지를 하려면 ....?

In [6]:
import itertools

for name, count in itertools.zip_longest(names, counts):
    print(f'{name}: {count}')

Cecilia: 7
남궁민수: 4
aadd: 4
Rosalind: None


In [7]:
itertools.zip_longest?

[0;31mInit signature:[0m [0mitertools[0m[0;34m.[0m[0mzip_longest[0m[0;34m([0m[0mself[0m[0;34m,[0m [0;34m/[0m[0;34m,[0m [0;34m*[0m[0margs[0m[0;34m,[0m [0;34m**[0m[0mkwargs[0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0;31mDocstring:[0m     
zip_longest(iter1 [,iter2 [...]], [fillvalue=None]) --> zip_longest object

Return a zip_longest object whose .__next__() method returns a tuple where
the i-th element comes from the i-th iterable argument.  The .__next__()
method continues until the longest iterable in the argument sequence
is exhausted and then it raises StopIteration.  When the shorter iterables
are exhausted, the fillvalue is substituted in their place.  The fillvalue
defaults to None or can be specified by a keyword argument.
[0;31mType:[0m           type
[0;31mSubclasses:[0m     


In [8]:
# fillvalue= 를 이용하면 값이 없는 경우에 대해서 대응이 가능하다.

for name, count in itertools.zip_longest(names, counts, fillvalue="999"):
    print(f'{name}: {count}')

Cecilia: 7
남궁민수: 4
aadd: 4
Rosalind: 999
