# Comprehensions

Comprehensions는 다른 시퀀스로 부터 새로운 시퀀스를 구성하도록 해준다. Python2.0 에서 List comprehensions가 도입된 후에 Python3.0 에서 dictionary 와  set comprehensions를 도입했다.

- https://docs.python.org/3/tutorial/datastructures.html#list-comprehensions
- https://python-3-patterns-idioms-test.readthedocs.io/en/latest/Comprehensions.html

참고:
- https://wikidocs.net/22795
- https://wikidocs.net/22797

## List Comprehensions

A list comprehension consists of the following parts:

- An Input Sequence. 입력 시퀀스
- A Variable representing members of the input sequence : 변수가 입력 시퀀스의 멤버를 표현
- An Optional Predicate expression. : 선택한 함축 표현
- An Output Expression producing elements of the output list from members of the Input Sequence that satisfy the predicate

<img src="https://python-3-patterns-idioms-test.readthedocs.io/en/latest/_images/listComprehensions.gif" width="450">

In [1]:
# 일반적 리스트
results = []
for num in [1, 2, 3, 4, 5, 6, 7, 8]:
    result = num * num
    results.append(result)

In [1]:
# 컴프리헨션
results = [ num * num for num in [1, 2, 3, 4, 5, 6, 7, 8] ]
results

[1, 4, 9, 16, 25, 36, 49, 64]

In [4]:
results = [ num * num for num in [1, 2, 3, 4, 5, 6, 7, 8] if num % 2 == 0]
results

[4, 16, 36, 64]

## 조건문

### `[실습]`문자열 리스트에서 길이가 2 이하인 문자열 리스트 만들기


In [12]:
# 문자열 리스트에서 길이가 2 이하인 문자열 리스트 만들기
strings = ['a', 'as', 'bat', 'car', 'dove', 'python']

strings = [s for s in strings if len(s) <= 2]
print(strings)

['a', 'as']


### `[실습] ` 1~100 사이에 있는 수에서 짝수인 리스트 만들기

In [13]:
# 1~100 사이의 수중에 짝수 리스트 만들기

results = [num for num in range(1, 101) if num % 2 == 0]
results

[2,
 4,
 6,
 8,
 10,
 12,
 14,
 16,
 18,
 20,
 22,
 24,
 26,
 28,
 30,
 32,
 34,
 36,
 38,
 40,
 42,
 44,
 46,
 48,
 50,
 52,
 54,
 56,
 58,
 60,
 62,
 64,
 66,
 68,
 70,
 72,
 74,
 76,
 78,
 80,
 82,
 84,
 86,
 88,
 90,
 92,
 94,
 96,
 98,
 100]

### `[실습] ` 1~100 사이에 3, 6, 9 가 있는 수 리스트 만들기

In [2]:
# 1~100 사이에 3, 6, 9 가 있는 수 리스트 만들기

results = [num for num in range(1,101) if '3' in str(num) or '6' in str(num) or '9' in str(num)]
results

[3,
 6,
 9,
 13,
 16,
 19,
 23,
 26,
 29,
 30,
 31,
 32,
 33,
 34,
 35,
 36,
 37,
 38,
 39,
 43,
 46,
 49,
 53,
 56,
 59,
 60,
 61,
 62,
 63,
 64,
 65,
 66,
 67,
 68,
 69,
 73,
 76,
 79,
 83,
 86,
 89,
 90,
 91,
 92,
 93,
 94,
 95,
 96,
 97,
 98,
 99]

### `[실습]` 문자열 리스트에서 문자열 길이를 순차 자료형으로 저장해 보자


In [16]:
# 문자열 리스트에서 문자열 길이를 순차 자료형으로 저장해 보자
strings = ['a', 'as', 'bat', 'car', 'dove', 'python']

lens = [len(s) for s in strings]

In [17]:
lens

[1, 2, 3, 3, 4, 6]

### `[실습]`리스트 숫자 자료를 제곱한 결과를 순차 자료형으로 저장해 보자


In [8]:
# `[실습]`리스트 숫자 자료를 제곱한 결과를 순차 자료형으로 저장해 보자
foo = [1, 4, '5', 10, True, '10', 8]
results = [i**2 if type(i) == int else i for i in foo]
results

[1, 16, '5', 100, True, '10', 64]

# Nested Comprehensions

크기 n인 단위행렬(identity matrix)는 대각이 1이고 나머지는 0으로 채워진 n X n  매드릭스이다.

파이썬에서 리스트의 리스트로서 행을 리스트로 이런 단위행렬을 표현할 수 있다.

```python
[ [1,0,0],
  [0,1,0],
  [0,0,1] ]
```

이 행렬을 아래같은 중첩된 컴프리헨션 표현식으로 포함할 수 있다.

```python
[ [ 1 if item_idx == row_idx else 0 for item_idx in range(0, 3) ] for row_idx in range(0, 3) ]
```

In [4]:
# 3x3 행렬





### `[실습]` 현재 디렉토리에서 .ipynb 확장자를 가진 파일의 리스트


디렉토리 구조에서 .py 로 끝나는 자료:
 - os.walk():

```python
# Comprehensions/os_walk_comprehension.py
import os
restFiles = [os.path.join(d[0], f) for d in os.walk(".")
             for f in d[2] if f.endswith(".py")]
for r in restFiles:
    print(r)
```   

In [None]:
# 현재 디렉토리에서 .ipynb 확장자를 가진 파일!!
import os




## `[실습]`어느 기업의 2015에서 2018년도 재무자료중 일부로 영업이익과 영업현금흐름 자료가 있다. 영업이익을 현금흐름으로 비교해 계산해 보자.



In [9]:
# 2015~2018
celtrion_profits = {
    "영업이익": [2590, 2497, 5220, 2947],  
    "영업현금흐름": [594, 2614, 5238, 2518]
}
celtrion_profits

{'영업이익': [2590, 2497, 5220, 2947], '영업현금흐름': [594, 2614, 5238, 2518]}

### 영업이익과 영업현금흐름과 비교

In [10]:
# for 반복문을 이용해 영업이익과 현금흐름 비율을 비교 계산하자
for x, y in zip(celtrion_profits['영업현금흐름'], celtrion_profits['영업이익']):
    print(int(x)/int(y))

0.22934362934362934
1.0468562274729676
1.0034482758620689
0.8544282321004412


컴프리헨션

In [16]:
# 컴프리헨션을 이용해 영업이익과 현금흐름 비율을 비교 계산하자
[int(x)/int(y)
 for x, y in zip(celtrion_profits['영업현금흐름'], celtrion_profits['영업이익'])]

[0.22934362934362934,
 1.0468562274729676,
 1.0034482758620689,
 0.8544282321004412]

In [6]:
# celtrion_profits에 `영업이익대비현금흐름`으로 저장하자.
celtrion_profits['영업이익대비현금흐름'] = [int(
    x)/int(y) for x, y in zip(celtrion_profits['영업현금흐름'], celtrion_profits['영업이익'])]

In [9]:
celtrion_profits

{'영업이익': [2590, 2497, 5220, 2947],
 '영업현금흐름': [594, 2614, 5238, 2518],
 '영업이익대비현금흐름': [0.22934362934362934,
  1.0468562274729676,
  1.0034482758620689,
  0.8544282321004412]}

# Set Comprehensions

Set에 리스트 같은 포함 표현식을 사용해 구성할 수 있다.

### 어떤 리스트애서 특정한 결과를 추출.

```python
names = [ 'Bob', 'JOHN', 'alice', 'bob', 'ALICE', 'J', 'Bob' ]
```

#### 첫 문자를 대문자로한 세트를 원한다:

```python
{ 'Bob', 'John', 'Alice' }
```

#### 대문자로 쓰여지고, 2글자 이상의 문자 세트

In [18]:
names = [ 'Bob', 'JOHN', 'alice', 'bob', 'ALICE', 'J', 'Bob' ]
{ name[0].upper() + name[1:].lower() for name in names if len(name) > 1 }

{'Alice', 'Bob', 'John'}

### 글자 수가 2개 이상인 항목만 추출한다.

In [11]:
strings = ['a', 'as', 'bat', 'car', 'dove', 'python']
strings = {s for s in strings if len(s) <= 2}
print(strings)

{'a', 'as'}


# Dictionary Comprehensions


### 어떤 단어 리스트를 단어의 수를 가진 딕트로 표현

In [17]:
strings = ['a', 'as', 'bat', 'car', 'dove', 'python']
dict = {s: len(s) for s in strings}
print(dict)

{'a': 1, 'as': 2, 'bat': 3, 'car': 3, 'dove': 4, 'python': 6}


In [None]:
type(dict)

### 어떤 단어와 단어의 수를 가진 딕트를 소문자 단어로 변환

In [18]:
mcase = {'a':10, 'b': 34, 'A': 7, 'Z':3}
mcase_frequency = {
    k.lower() : mcase.get(k.lower(), 0) + mcase.get(k.upper(), 0) for k in mcase.keys()
}
mcase_frequency

{'a': 17, 'b': 34, 'z': 3}