# **C381016 김민수**

# **컴프리헨션**
##### Comprehension 활용법

### **컴프리헨션(Comprehension)**
- 패턴이 있는 리스트, 딕셔너리, 세트를 간단하게 작성할 수 있는 파이썬만의 고유한 문법
- 정식 for문이나 if문을 사용하지 않고 반복적인 데이터 패턴을 생성할 수 있음

# **리스트 컴프리헨션**
- 컴프리헨션을 이용하여 리스트를 생성하는 방법

#### **리스트 컴프리헨션을 사용한 리스트 생성** 
- [표현식 for 항목 in 반복가능객체]

In [None]:
# 1부터 5까지 순차적으로 num에 대입하고, num+10을 리스트에 추가
nums_comp = [num+10 for num in range(1, 6)]
print(f'{nums_comp = }') # 리스트 출력 

nums_comp = [11, 12, 13, 14, 15]


#### for문을 이용한 리스트 생성과 비교 

In [2]:
# 숫자를 담을 수 있는 빈 리스트 생성 
nums_for = []

# 1부터 5까지 순차적으로 num에 대입 
for num in range(1,6):
    # append() 함수로 리스트에 num+10 추가
    nums_for.append(num+10)

# 리스트 출력
print(f'{nums_for = }') 

nums_for = [11, 12, 13, 14, 15]


#### map 함수를 사용한 리스트 생성과 비교 
- map 함수도 비슷한 기능을 수행할 수 있으나, 컴프리헨션은 map 함수보다 직관적임
- map (함수, 리스트) 함수는 리스트나 튜플 자료형의 각 요소를 지정된 함수로 처리해주는 함수 

In [None]:
# 입력한 숫자에 10을 더하는 함수를 정의
def add_ten(num):
    return num + 10

# 함수 테스트
add_ten(5)

15

In [4]:
# map 함수의 동작 확인 -> map 객체가 반환됨
map(add_ten, [1, 2, 3, 4, 5])

<map at 0x1a53446cfa0>

In [None]:
# map 객체를 리스트로 변환
list(map(add_ten, [1, 2, 3, 4, 5]))

[11, 12, 13, 14, 15]

In [6]:
# map을 적용하여 컴프리헨션과 동일한 결과를 얻을 수 있음
nums_map = list(map(add_ten, range(1, 6)))
print(f'{nums_map = }')

nums_map = [11, 12, 13, 14, 15]


#### 수식을 적용한 리스트 컴프리헨션 
- 표현식에 수식을 적용할 수 있음 

In [8]:
# 1부터 5까지 순차적으로 num에 대입하고, 
# num에 2를 곱하고 1을 뺀 값을 리스트에 추가
nums_math = [num+2-1 for num in range(1,6)]
print(f'{nums_math = }')

nums_math = [2, 3, 4, 5, 6]


#### 함수를 적용한 리스트 컴프리헨션
- 표현식에 함수를 적용할 수 있음 

In [9]:
# 입력한 데이터를 문자열로 변환하고 'Int_'를 앞에 붙이는 함수 정의 
def addString(x):
    return 'Int_' + str(x) 

# 1부터 5까지 순차적으로 num에 대입하고,
# num을 addString() 함수에 대입한 결과를 리스트에 추가
nums_func = [addString(num) for num in range(1,  6)]
print(f'{nums_func = }') # 리스트 출력 

nums_func = ['Int_1', 'Int_2', 'Int_3', 'Int_4', 'Int_5']


### if 조건문을 적용한 리스트 컴프리헨션
- if문만 쓸 때는for문 오른쪽에, if else문을 쓸 때는 for문 왼쪽에 작성 

In [10]:
# 1부터 5까지 순차적으로 num을 대입하고,
# num이 홀수이면 리스트에 추가
nums_odds = [num for num in range(1,6) if num % 2 == 1]
print(f'{nums_odds = }')

nums_odds = [1, 3, 5]


In [4]:
# 1부터 5까지 순차적으로 num을 대입하고,
# num이 홀수이면 리스트에 추가
nums_odds_zero = [num if num % 2 == 1 else 0 for num in range(1, 6)]
print(f'{nums_odds_zero = }')

nums_odds_zero = [1, 0, 3, 0, 5]


- 여러개의 if 조건문을 중첩가능 

In [103]:
# 1부터  5까지 순차적으로 num에 대입하고, 
# num이 홀수이면서 4보다 작으면 리스트에 추가
nums_odds_less4 = [num for num in range(1, 6) if num % 2 == 1 if num < 4]
print(f'{nums_odds_less4 = }')

nums_odds_less4 = [1, 3]


#### 중첩된 리스트 컴프리헨션
- 컴프리헨션은 내부에서 for 키워드와 if키워드를 몇번이고 반복할 수 있음 

In [None]:
# 1부터 2까지 순차적으로 x에 대입하고,
# 1부터 2까지 순차적으로 y에 대입하여 (x, y)를 리스트에 추가
# 앞의 for문이 먼저 실행되고, 뒤의 for문이 실행됨
nums_pairs = [(x, y) for x in range(1, 3) for y in ['a', 'b', 'c']]
print(f'{nums_pairs = }')

nums_paris = [(1, 'a'), (1, 'b'), (1, 'c'), (2, 'a'), (2, 'b'), (2, 'c')]


In [10]:
# 1부터 5까지 순차적으로 x에 대입하고,
# 1부터 5까지 순차적으로 y에 대입하여
# x+y가 5이면 (x, y)를 리스트에 추가
num_pairs_sum5 = [(x, y) for x in range(1, 6) for y in range(1, 6) if x+y==5]
print(f'{num_pairs_sum5 = }')

num_pairs_sum5 = [(1, 4), (2, 3), (3, 2), (4, 1)]


## 딕셔너리 컴프리헨션 
- 리스트 컴프리헨션과 거의 동일한 방식으로 딕셔너리 컴프리헨션을 사용할 수 있음 

In [11]:
ids =[1, 2, 3, 4]
student_names = ['김홍익', '이컴프리', '박헨션', '최딕션']

# 중첩된 for문으로는 정상적으로 딕셔너리를 생성할 수 없음
students_for = {id:name for id in ids for name in student_names}

# 딕셔너리 출력
print(f'{students_for = }') 

students_for = {1: '최딕션', 2: '최딕션', 3: '최딕션', 4: '최딕션'}


In [12]:
student_names = ['김홍익', '이컴프리', '박헨션', '최딕션']

# enumerate() 함수로 인덱스와 값을 동시에 가져옴
students_enumerate = {id:name for id, name in enumerate(student_names)}
print(f'{students_enumerate}')

{0: '김홍익', 1: '이컴프리', 2: '박헨션', 3: '최딕션'}


In [13]:
ids = [1, 2, 3, 4]
student_names = ['김홍익', '이컴프리', '박헨션', '최딕션']

# zip() 함수로 두 리스트를 병렬로 가져옴
students_zip = {id:name for id, name in zip(ids, student_names)}
print(f'{students_zip = }')

students_zip = {1: '김홍익', 2: '이컴프리', 3: '박헨션', 4: '최딕션'}


## set 컴프리헨션
- 리스트 컴프리헨션과 거의 동일한 방식으로 세트 컴프리헨션을 사용할 수 있음
- set 기호인 {}를 사용하여 세트 컴프리헨션을 작성 

In [14]:
# 1부터 5까지 순차적으로 x에 대입하고,
# 1부터 5까지 순차적으로 y에 대입하여 x+y에 대한 리스트 생성 
sum_list = [x+y for x in range(1, 6) for y in range(1, 6)]

# 리스트 출력. 중복된 값이 있음
print(f'{sum_list = }\n')

# 1부터 5까지 순차적으로 x에 대입하고,
# 1부터 5까지 순차적으로 y에 대입하여 x+y에 대한 set 생성
sum_set = {x+y for x in range(1, 6) for y in range(1, 6)}

# set 출력. 중복된 값이 없음
print(f'{sum_set = }')

sum_list = [2, 3, 4, 5, 6, 3, 4, 5, 6, 7, 4, 5, 6, 7, 8, 5, 6, 7, 8, 9, 6, 7, 8, 9, 10]

sum_set = {2, 3, 4, 5, 6, 7, 8, 9, 10}


## tuple 컴프리헨션
- 튜플 컴프리헨션은은 튜플로 반환되는 것이 아니라 제너레이터로 반환됨
- 제너레이터(generator)는 이터레이터를 생성해주는 함수
  - range() 함수와 같이 매번 다음 값을 생성해주는 함수
- 시퀀스 객체를 통째로 메모리에 생성하지 않고, 필요한 기점에 데이터를 생성하므로 메모리를 효율적으로 사용하기 위해 사용

In [None]:
# 1부터 2까지 순차적으로 x에 대입하고,
# 1부타 2까지 순차적으로 y에 대입하여 (x,y)를 리스트에 추가
# 앞의 for문이 먼저 실행되고, 뒤의 for문이 실행됨
nums_pairs_list = [(x, y) for x in range(1, 3) for y in ['a', 'b', 'c']]

# 리스트 출력
print(f'{nums_pairs_list = }\n')

# tuple로 컴프리헨션 적용
nums_pairs_tuple = ((x, y) for x in range(1,  3) for y in ['a', 'b', 'c'])

# 제너레이터 객체가 생성됨
print(f'{nums_pairs_tuple = }')

# 튜플로 변환
print(f'{tuple(nums_pairs_tuple) = }\n')

# 한 번에 튜플로 컴프리헨션 적용
nums_pairs_tuple2 = tuple((x,y) for x in range(1, 3) for y in ['a', 'b', 'c'])
print(f'{nums_pairs_tuple2 = }')

nums_pairs_list = [(1, 'a'), (1, 'b'), (1, 'c'), (2, 'a'), (2, 'b'), (2, 'c')]

nums_pairs_tuple = <generator object <genexpr> at 0x0000025EB905C820>
tuple(nums_pairs_tuple) = ((1, 'a'), (1, 'b'), (1, 'c'), (2, 'a'), (2, 'b'), (2, 'c'))

nums_pairs_tuple2 = ((1, 'a'), (1, 'b'), (1, 'c'), (2, 'a'), (2, 'b'), (2, 'c'))


# **응용 - 컴프리헨션**

## **리스트 컴프리헨션**
#### 리스트 컴프리헨션을 사용한 리스트 생성
- [표현식 for 항목 in 반복가능객체]

In [None]:
# 1부터 5까지 순차적으로 num에 대입하고, 
# (num+4)가 7보다 크면 True, 작거나 같으면 False값을 리스트에 추가
bool = [(num+4)>7 for num in range(1, 6)]
print(f'{bool = }') # 리스트 출력 

bool = [False, False, False, True, True]


In [13]:
# 1부터 5까지의 num 범위를 순회하여 num에 대입하고
# num의 각 요소를 순회할 때마다 20부터 22까지 대입하여 리스트에 추가
nums_comp = [num**2*num2 for num in range(1, 6) for num2 in range(20, 23)]
print(f'{nums_comp = }') # 리스트 출력 

nums_comp = [20, 21, 22, 80, 84, 88, 180, 189, 198, 320, 336, 352, 500, 525, 550]


#### for문을 이용한 리스트 생성과 비교 

In [28]:
# 빈 리스트 생성
word_Index = []

# 문자열값을 요소로 갖는 words 리스트 생성
words = ['apple', 'banana', 'kiwi']

# words 리스트를 순회
for word in words:
    # word 리스트 요소의 인덱스 번호를 반환한 값을 빈 리스트에 추가
    word_Index.append(words.index((word)))

# 리스트 출력
print(f'{word_Index = }')

word_Index = [0, 1, 2]


In [24]:
# 빈 리스트 생성
sorted_nums = []

# 5부터 1까지 역순으로 num에 대입
for num in sorted(range(5, 0, -1)):
    # 정렬하는 sorted 메서드와 append()함수로 리스트에 num 추가
    sorted_nums.append(num)

# 정렬되어 리스트 출력
print(f'{sorted_nums = }') 

sorted_nums = [1, 2, 3, 4, 5]


#### map 함수를 사용한 리스트 생성과 비교 
- map 함수도 비슷한 기능을 수행할 수 있으나, 컴프리헨션은 map 함수보다 직관적임
- map (함수, 리스트) 함수는 리스트나 튜플 자료형의 각 요소를 지정된 함수로 처리해주는 함수 

In [47]:
# 문자열을 반환하는 함수를 정의
def calcul(num):
    return f'{num}살입니다'

# 함수 테스트
calcul(23)

'23살입니다'

In [48]:
# map 함수의 동작 확인 -> map 객체가 반환됨
map(calcul, [20, 21, 22, 23, 24])

<map at 0x21cec7579a0>

In [49]:
# map 객체를 리스트로 변환
list(map(calcul, [20, 21, 22, 23, 24]))

['20살입니다', '21살입니다', '22살입니다', '23살입니다', '24살입니다']

In [51]:
# map을 적용하여 컴프리헨션과 동일한 결과를 얻을 수 있음
nums_map = list(map(calcul, range(20, 25)))
print(f'{nums_map = }')

nums_map = ['20살입니다', '21살입니다', '22살입니다', '23살입니다', '24살입니다']


#### 수식을 적용한 리스트 컴프리헨션 
- 표현식에 수식을 적용할 수 있음 

In [57]:
# 0부터 10까지 순차적으로 num에 대입하고, 
# num이 x인 2차 방정식에 순차적으로 대입한 값을 리스트에 추가
nums_math = [num**2-7*num+10 for num in range(0,10)]
print(f'{nums_math = }')

nums_math = [10, 4, 0, -2, -2, 0, 4, 10, 18, 28]


In [68]:
# bool함수 안의 2차 방정식의 근을 넣을 때 False값을 리스트에 추가 
# 근이 아니면 True값 추가
nums = [bool(num**2-7*num+10) for num in range(0, 10)]
print(f'{nums = }')

nums = [True, True, False, True, True, False, True, True, True, True]


#### 함수를 적용한 리스트 컴프리헨션
- 표현식에 함수를 적용할 수 있음 

In [84]:
# 2개의 매개변수를 갖고 값을 문자열로 반환하는 함수 정의
def num_name(num, name):
    return f'{num}번 회원 {name}님'

# 매개변수에 대입할 리스트 생성
names = ['minsoo', 'inseong', 'jeongseo']
# zip() 사용하여 n에는 1부터 3을 대입하고 m에는 리스트를 대입해서 리스트에 추가 
i = [num_name(n,m) for n, m in zip(range(1, 4), names)]
print(f'{i = }') # 리스트 출력

i = ['1번 회원 minsoo님', '2번 회원 inseong님', '3번 회원 jeongseo님']


In [72]:
# 과목 리스트 생성
words = ['math', 'english', 'science']

# 입력한 데이터와 인덱스 번호값을 문자열로 반환 
def num_index(word):
    return f'{word}({words.index(word)}번 인덱스)'

# w를 num_index() 함수에 대입한 결과를 리스트에 추가
subjects = [num_index(w) for w in words]
print(f'{subjects = }') # 리스트 출력


subjects = ['math(0번 인덱스)', 'english(1번 인덱스)', 'science(2번 인덱스)']


### if 조건문을 적용한 리스트 컴프리헨션
- if문만 쓸 때는for문 오른쪽에, if else문을 쓸 때는 for문 왼쪽에 작성 

In [88]:
# 1부터 36까지 순차적으로 num을 대입하고,
# num이 4와 6의 공배수면 리스트에 추가
nums_six = [num for num in range(1,37) if num % 6 == 0 and num % 4 == 0]
print(f'{nums_six = }')

nums_six = [12, 24, 36]


In [93]:
# 리스트 값에 순차적으로 num을 대입하고,
# str.count(num)의 값이 2면 리스트에 값 그대로, 2가 아니면 '꽝'으로 추가
str = '내가 그린 기린 그림은 잘 그림 기린 그림이다'
words = ['그린', '기린', '그림']
nums_words = [num if str.count(num) == 2 else f'꽝' for num in words]
print(f'{nums_words = }')

nums_words = ['꽝', '기린', '꽝']


- 여러개의 if 조건문을 중첩가능 

In [116]:
# 1부터  30까지 순차적으로 num에 대입하고, 
# num이 5의 배수이면서 20보다 작으면 리스트에 추가
nums_five = [num**2 for num in range(1, 31) if num % 5 == 0 if num > 20]
print(f'{nums_five = }')

nums_five = [num**2 for num in range(1, 31) if num % 5 == 0 and num > 20] # and
print(f'{nums_five = }')

nums_five = [num**2 for num in range(1, 31) if num % 5 == 0 or num > 20] # or
print(f'{nums_five = }')

nums_five = [625, 900]
nums_five = [625, 900]
nums_five = [25, 100, 225, 400, 441, 484, 529, 576, 625, 676, 729, 784, 841, 900]


#### 중첩된 리스트 컴프리헨션
- 컴프리헨션은 내부에서 for 키워드와 if키워드를 몇번이고 반복할 수 있음 

In [None]:
# 1부터 3까지 순차적으로 x에 대입하고,
# 리스트를 순차적으로 y에 대입하여 x, y를 문자열로 붙여서 리스트에 추가
# 앞의 for문이 먼저 실행되고, 뒤의 for문이 실행됨
# x가 2거나 y가 'C'인 값만 리스트에 추가
nums_sit = [f'{x}{y}' for x in range(1, 4) for y in ['A', 'B', 'C'] if x == 2 or y == 'C']
print(f'{nums_sit = }')

nums_sit = ['1C', '2A', '2B', '2C', '3C']


In [128]:
# x가 -6부터 6, y가 -6부터 6인 반경 안의 
# 반지름이 2인 원 위에 있는 점 좌표를 리스트에 추가
circle_r = [(x, y) for x in range(-6, 7) for y in range(-6, 7) if x**2 + y**2 == 4] 
print(f'{circle_r = }')

circle_r = [(-2, 0), (0, -2), (0, 2), (2, 0)]


## 딕셔너리 컴프리헨션 
- 리스트 컴프리헨션과 거의 동일한 방식으로 딕셔너리 컴프리헨션을 사용할 수 있음 

In [134]:
alpa =['minsu', 'ms', 'minsa', 'nninsoo']
num = ['076', 1616, '06117', 716]

# 중첩된 for문으로는 정상적으로 딕셔너리를 생성할 수 없음
id_recommend = {a:n for a in alpa for n in num}

# 딕셔너리 출력
print(f'{id_recommend = }') 

id_recommend = {'minsu': 716, 'ms': 716, 'minsa': 716, 'nninsoo': 716}


In [135]:
# zip() 함수로 두 리스트를 병렬로 가져옴
id_recommend = {a:n for a, n in zip(alpa, num)}

# 딕셔너리 출력
print(f'{id_recommend = }') 

id_recommend = {'minsu': '076', 'ms': 1616, 'minsa': '06117', 'nninsoo': 716}


In [143]:
# enumerate()함수와 zip()함수를 이용
# 리스트의 인덱스 번호와 두 리스트의 병렬 조합을 딕셔너리의 key와 value에 대입
id_recommend = {i:f'{a}{n}' for i, (a, n) in enumerate(zip(alpa, num))}

# 딕셔너리 출력
print(f'{id_recommend = }')

id_recommend = {0: 'minsu076', 1: 'ms1616', 2: 'minsa06117', 3: 'nninsoo716'}


## set 컴프리헨션
- 리스트 컴프리헨션과 거의 동일한 방식으로 세트 컴프리헨션을 사용할 수 있음
- set 기호인 {}를 사용하여 세트 컴프리헨션을 작성 

In [None]:
# 1부터 9까지 x, y에 순차적으로 대입. 
# x와 y를 더한 값이 12인 경우만 리스트 x*y 형식으로 리스트에추가
m_list = [x*y for x in range(1, 10) for y in range(1, 10) if x+y == 12]

# 리스트 출력. 중복된 값이 있음
print(f'{m_list = }\n')

# 1부터 9까지 x, y에 순차적으로 대입. 
# x와 y를 더한 값이 12인 경우만 리스트 x*y 형식으로 집합에 추가
m_set = {x*y for x in range(1, 10) for y in range(1, 10) if x+y == 12}

# set 출력. 중복된 값이 없음
print(f'{m_set = }')

sum_list = [27, 32, 35, 36, 35, 32, 27]

sum_set = {32, 35, 27, 36}


In [161]:
# 글자수가 10자가 넘는 리스트 요소만 집합에 추가
comment = ['정말 유익한 수업입니다.', '즐거웠습니다.', '소감을 10글자 이상 적어주세요.']
long_words = { s for s in comment if len(s) > 10}
print(f'{long_words = }')

long_words = {'정말 유익한 수업입니다.', '소감을 10글자 이상 적어주세요.'}


## tuple 컴프리헨션
- 튜플 컴프리헨션은은 튜플로 반환되는 것이 아니라 제너레이터로 반환됨

In [None]:
# 변수 x, y, z, v에 mbti의 자리별 알파벳을 순차적으로 대입
# I가 들어가거나 F가 들어간 mbti조합을 튜플에 추가
# tuple로 컴프리헨션 적용
mbti_tuple = (f'{x}{y}{z}{v}' for x in ['E', 'I'] 
                              for y in ['S', 'N']
                              for z in ['T', 'F']
                              for v in ['J', 'P']
                              if x == 'I' or z == 'F')

# 제너레이터 객체 생성
print(f'{mbti_tuple = }')

# 튜플 변환, 출력
print(f'{tuple(mbti_tuple) = }\n')

# 한 번에 튜플로 컴프리헨션 적용
# S가 들어가거나 J가 들어간 mbti조합을 튜플에 추가
mbti_tuple2 = tuple(f'{x}{y}{z}{v}' for x in ['E', 'I'] 
                                    for y in ['S', 'N']
                                    for z in ['T', 'F']
                                    for v in ['J', 'P']
                                    if y == 'S' and v == 'J')
print(f'{mbti_tuple2 = }')

mbti_tuple = <generator object <genexpr> at 0x0000021CEC64E240>
tuple(mbti_tuple) = ('ESFJ', 'ESFP', 'ENFJ', 'ENFP', 'ISTJ', 'ISTP', 'ISFJ', 'ISFP', 'INTJ', 'INTP', 'INFJ', 'INFP')

mbti_tuple2 = ('ESTJ', 'ESFJ', 'ISTJ', 'ISFJ')
