# Python's List Comprehension

파이썬에서 **List Comprehension** 이란 **'리스트를 쉽게, 짧게 한 줄로 만들 수 있는 파이썬의 문법'** 이다.<br>
List Comprehension 을 사용하면 다음 코드를 더욱 쉽고, 짧게 변경 가능하다.

In [1]:
some_list = []
for i in range(10):
    some_list.append(i)

In [2]:
some_list = [i for i in range(10)]

위의 두 패턴은 같다. 1번 패턴을 2번 패턴으로 변경할 수 있도록 가능한 파이썬 문법이 **'List Comprehension'** 이다. <br>
## 왜 사용할까?

- 3줄로 이루어진 코드를 누구나 이해 가능하도록 간결하게 1줄로 줄여주었다.
- 더 빠르다.
- comprehension 을 사용한 코드가 'Pythonic'하다. -> Python의 코드 스타일 가이드라인에 알맞다.

### 왜 더 빠를까?
1. runtime 시 리스트의 사이즈를 resize 하는 거 대신, 리스트에 원소를 추가하기 전에 리스트의 메모리에 먼저 할당한다.
2. 'append' 의 호출을 피할 수 있다.

하지만 list comprehension 을 사용한다고 해서 **무조건! 코드가 예쁘고 간결하게 나타나는 것은 아니다.** <br>
이러한 경우 추상화된 함수를 만드는 방법 등으로 리팩토링이 가능할 것이다.

### Refactoring Code

다음 함수는 a 라는 파라미터로 0 ~ a 까지 loop 를 수행하며 값을 list 에 추가한다. 추가되는 값은 짝수일 경우와 홀수일 경우가 다르다. <br>
List Comprehension 을 사용하지 않은 코드는 다음과 같다.

In [3]:
def some_function(a):
    some_list = []
    for i in range(a):
        if i%2 == 0:
            some_list.append((i * 2) % 13)
        else:
            some_list.append((i * 3) % 21)

list comprehension 을 사용하면 다음과 같다.

In [5]:
a = 20
some_lsit = [(i*2)%13 if i%2 ==0 else (i*3)%21 for i in range(a)]

6 줄로 된 코드가 list comprehension 을 사용하니 1줄로 줄여졌다. <br>
- 과연 이 코드가 남들이 보기에 바로 이해가 가능한 코드일까? 
- 과연 이 코드가 확장성이 있을까?
- 과연 이 코드가 유지보수성이 좋은 코드일까? <br>

**아니다. 그렇기에 이를 모두 고려한 추상화된 함수를 만들 필요가 있다. (리팩토링)**

In [9]:
# 여러 조건과 숫자로 수행되는 로직은 다음과 같은 추상화 함수를 만들어주는 것이 효과적!
def conversion(i, prod, mod):
    return (i * prod) % mod

def new_function(i):
    if i % 2 == 0:
        return conversion(i, 2, 13)
    else:
        return conversion(i, 3, 21)

In [10]:
some_list = [new_function(i) for i in range(a)]

다음과 같이 추상화된 함수를 생성하고 이를 이용해서 list comprehension 을 사용했다. <br>
그럼 다음과 같이 생각할 수 있다. <br>
**코드 line 이 더 많아졌는데???** <br>
그렇다. 하지만, code line 에 대한 bit 수가 많아졌지만 **maintainability**, **legibility**, **scalability** 를 모두 고려하면 위의 코드가 더욱 효율적이다!


## 여러 List Comprehension 활용

### 조건문 필터링
List Comprehension은 조건문을 통해 특정 값을 필터링할 수 있다.

In [5]:
size = 10
some_list = [n for n in range(1, size) if n % 2 == 0]
print(some_list)

[2, 4, 6, 8]


* 조건문 **AND, OR 연산자는 가능**한가??<br>
=> **모두 가능하지만 표현법에 대해 차이가 있다.**
<br><br>
바로 위의 코드에서 **2의 배수 and 3의 배수만** 리스트에 담는 경우를 코드로 나타내면 다음과 같다.

In [14]:
# and 연산자의 경우 따로따로 조건문을 써줘야한다.
size = 30
some_list = [n for n in range(1, size) if n % 2 == 0 if n % 3 == 0]
print(some_list)

[6, 12, 18, 24]


In [15]:
# 다음과 같이 and 연산자를 쓰면 에러가 발생한다.
some_list = [n for n in range(1, size) if n % 2 == 0 and if n % 3 == 0]
print(some_list)

SyntaxError: invalid syntax (1909126742.py, line 2)

**2의 배수 or 3의 배수**를 리스트에 담는 case

In [16]:
# or 연산자의 경우 하나로 묶어줘야 한다.
some_list = [n for n in range(1, size) if (n % 2 == 0 or n % 3 == 0)]
print(some_list)

[2, 3, 4, 6, 8, 9, 10, 12, 14, 15, 16, 18, 20, 21, 22, 24, 26, 27, 28]


### matrix 를 vector 로 차원축소

In [11]:
matrix = [[1, 2, 3],
          [4, 5, 6],
          [7, 8, 9]]
vector = [n for row in matrix for n in row]
vector

[1, 2, 3, 4, 5, 6, 7, 8, 9]

조금 복잡하다. for 반복문이 2개가 쓰였는데 **먼저 행을 다루는 for문이 나오고, 뒤에 행 안에 열을 다루는 for문**이 나온다. 잘 기억해두자.

### 2차원 행렬의 단순 데이터 조작

위 코드의 matrix 변수에 할당된 2차원 행렬을 유지하면서 모든 값만 변경한다고 하면 다음과 같다.

In [12]:
matrix2 = [[n ** 2 for n in row] for row in matrix]
matrix2

[[1, 4, 9], [16, 25, 36], [49, 64, 81]]

## 성능 향상 측정
실제로 for-loop 와 같은 코드의 list comprehension 식을 비교해보자.

In [14]:
import time

BIG = 20000000

def f(k):
    return 2*k

# for-loop
def list_a():
    a_list = []
    for i in range(BIG):
        a_list.append(f(i))

# list comprehension
def list_b():
    list_b = [f(i) for i in range(BIG)]
    
# filter + for-loop
def list_a_filtered():
    a_list = []
    for i in range(BIG):
        if i%2 == 0:
            a_list.append(f(i))
# filter + comprehension
def list_b_filtered():
    b_list = [f(i) for i in range(BIG) if i%2 == 0]
    
# 해당 함수 수행 시간 측정
def benchmark(function, function_name):
    start = time.time()
    function()
    end = time.time()
    print("{0} seconds for {1}".format(round(end - start, 2), function_name))

benchmark(list_a, "list_a")
benchmark(list_b, "list_b")
benchmark(list_a_filtered, "list_a_filtered")
benchmark(list_b_filtered, "list_b_filtered")  

1.65 seconds for list_a
1.3 seconds for list_b
1.26 seconds for list_a_filtered
1.07 seconds for list_b_filtered


위의 결과와 같이 list comprehension 을 사용하면 **21%** 만큼 속도가 높아진 것을 확인할 수 있다. <br>
또한, filter 식이 포함된 경우 list comprehension 사용시 **15%**가 높아졌다.<br>

이러한 결과가 나오는 가장 큰 이유는 각 iteration 에서 **append 함수 호출을 skip** 했기 때문이다.

## 다른 data type 으로의 확장

지금까진 list 만을 다뤘다. 그럼 comprehension 을 list 가 아닌 set, dict, tuple 에도 사용이 가능할까?? <br>
**list comprehension 식으로 다른 내장 구조인 set, dict, tuple도 만들 수 있다.**

### set
set은 생성 기호 {}를 사용한다.

In [19]:
# 0 ~ 9 까지의 값을 다른 값으로 치환을 하고 싶다면 comprehension 이 유용!!
some_set = {n ** 2 for n in range(10)}
print(some_set)

# 단순 0 ~ 9까지의 값을 가지는 set 을 만들고 싶다면 다음과 같이 써줘도 된다.
print(set(range(10)))

{0, 1, 64, 4, 36, 9, 16, 49, 81, 25}
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}


### dict
1. list 내 dict 객체들을 값으로 추가
2. 0 ~ 10 까지 키는 '1'~'9', 값은 2*키를 갖는 dict을 만들자! 
3. 키는 'a'~'z'까지 갖고 값은 1 ~ 26 인 dict을 만들자!

In [20]:
# 1. list 내 dict 객체들을 값으로 추가
def dict_obj(k):
    return {'number':k, 'double':2*k}

dict_list = [dict_obj(k) for k in range(10)]
print(dict_list, '\n')

# 2. 0 ~ 10 까지 키는 '1'~'9', 값은 2*키를 갖는 dict을 만들자! 
dict_of_doubles = {
    str(k) : 2*k for k in range(1, 10)
}
print(dict_of_doubles,'\n')

# 3. 키는 'a'~'z'까지 갖고 값은 1 ~ 26까지 값을 갖는 dict 생성
from string import ascii_lowercase as LOWERS

make_dict = {c: n for c , n in zip(LOWERS, range(1, 27))}
print(make_dict, '\n')

print(dict(zip(LOWERS, range(1, len(LOWERS) + 1)))) # 다음과 같이 표현 가능!

[{'number': 0, 'double': 0}, {'number': 1, 'double': 2}, {'number': 2, 'double': 4}, {'number': 3, 'double': 6}, {'number': 4, 'double': 8}, {'number': 5, 'double': 10}, {'number': 6, 'double': 12}, {'number': 7, 'double': 14}, {'number': 8, 'double': 16}, {'number': 9, 'double': 18}] 

{'1': 2, '2': 4, '3': 6, '4': 8, '5': 10, '6': 12, '7': 14, '8': 16, '9': 18} 

{'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5, 'f': 6, 'g': 7, 'h': 8, 'i': 9, 'j': 10, 'k': 11, 'l': 12, 'm': 13, 'n': 14, 'o': 15, 'p': 16, 'q': 17, 'r': 18, 's': 19, 't': 20, 'u': 21, 'v': 22, 'w': 23, 'x': 24, 'y': 25, 'z': 26} 

{'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5, 'f': 6, 'g': 7, 'h': 8, 'i': 9, 'j': 10, 'k': 11, 'l': 12, 'm': 13, 'n': 14, 'o': 15, 'p': 16, 'q': 17, 'r': 18, 's': 19, 't': 20, 'u': 21, 'v': 22, 'w': 23, 'x': 24, 'y': 25, 'z': 26}


* zip 함수
여러 개의 순회 가능한(iterable) 객체를 인자로 받고, 각 객체가 담고 있는 원소를 튜플의 형태로 차례로 접근할 수 있는 반복자(iterator)를 반환

In [22]:
# zip 함수 예
numbers = [1, 2, 3]
letters = ["A", "B", "C"]
for pair in zip(numbers, letters):
    print(pair)

(1, 'A')
(2, 'B')
(3, 'C')


### tuple

tuple 의 경우 list comprehension 에서 단순히 [ ] 대신 ()를 사용하면 다른 객체가 생성이 된다.

In [23]:
some_tuple = (n for n in range(10))
print(some_tuple)

<generator object <genexpr> at 0x110e376d0>


위의 코드는 Generator Comprehension 이다. 
- **Generator Comprehension: 어떤 일련의 값을 연속해서 반환할 예정이 되어 있는 순회 객체**

In [24]:
# tuple comprehension
some_tuple = tuple(n for n in range(10))
print(some_tuple)

(0, 1, 2, 3, 4, 5, 6, 7, 8, 9)


위의 코드와 같이 tuple 생성자에 괄호 없는 comprehension 식을 넣어야 의도한대로 tuple 객체가 생성된다.