# CHAPTER13 람다와 맵 : 편리한 파이썬 기법

## 13.1 람다식의 기초

### 13.1.1 익명 함수 만들기

- def 로 정의하는 것이 아닌 lambda식으로 간단하게 정의할 수 있다
- 람다식을 이용해 pow2 변수에 계산식을 저장할 수 있다
- lambda 인수 : 반환값

In [1]:
def pow1(x):
    return x**2

pow2 = lambda x: x**2

In [2]:
a = 4

def func1(a):
    return 2*a**2 - 3*a + 1

func2 = lambda x:2*x**2 - 3*x + 1

print(func1(a))
print(func2(a))

21
21


### 13.1. 람다에 의한 계산

- 람다식으로 다변수 함수(둘 이상의 독립변수를 갖는 함수)를 작성하고 싶을땐 
- add1 = lambda x, y: x + y 이렇게 사용한다

In [3]:
print((lambda x,y : x + y) (3,5))

8


In [4]:
x,y,z = 5,6,2

def func3(x,y,z):
    return x+y+z

func4 = lambda x,y,z : x+y+z

print(func3(x,y,z))
print(func4(x,y,z))

13
13


### 13.1.3 if를 이용한 람다

- 람다는 def로 정의한 함수와 달리 반환값 부분에 식만 넣을 수 있다

In [5]:
def say_hello():
    print('hello')

def lower_three1(x):
    if x < 3:
        return x*2
    else:
        return x/3 + 5

In [6]:
lower_three2= lambda x: x * 2 if x < 3 else x/3 + 5
# 조건을만족할 경우의 처리 if 조건 else 조건을 만족하지 않을 경우의 처리

In [7]:
a1, a2 = 13, 32

func5 = lambda x: x**2 - 40*x + 350 if 10 <= x <30 else 50

print(func5(a1))
print(func5(a2))

-1
50


## 13.2 편리한 표기법


### 13.2.1 리스트 분할 (하나의 기호로 분할)

In [8]:
test_sentence = 'this is a sentence'
test_sentence.split(' ')

['this', 'is', 'a', 'sentence']

In [9]:
self_data = 'my name is yuri'
self_data.split(' ')[-1]

'yuri'

### 13.2.2 리스트 분할(여러 기호로 분할)
- split() 함수에서는 한번에 여러 기호로 문자열을 분할할 수 없다
- re.split()을 이용하면 가능
- re.split('[구분 기호]', 분할할 문자열)

In [10]:
import re

test = 'this,is a.test,sentence'

print(re.split('[, .]', test))
print(re.split('[.]', test))
print(re.split('[,]', test))
print(re.split('[ ]', test))
print(re.split('', test))

['this', 'is', 'a', 'test', 'sentence']
['this,is a', 'test,sentence']
['this', 'is a.test', 'sentence']
['this,is', 'a.test,sentence']
['', 't', 'h', 'i', 's', ',', 'i', 's', ' ', 'a', '.', 't', 'e', 's', 't', ',', 's', 'e', 'n', 't', 'e', 'n', 'c', 'e', '']


In [11]:
time = '2020/1/5_22:15'

time_list = re.split('[/ _ :]', time)
print(time_list[1])
print(time_list[-2])

1
22


### 13.2.3 고차 함수(map)

- 다른 함수를 인수로 취하는 함수를 고차함수라 한다
- 리스트의 각 요소에 함수를 적용할 때 map()을 사용한다
- for문으로 루프를 사용하는 대신 한번에 적용 가능하다
- map(적용하려는 함수, 배열) : 반복자(계산 방법 저장)를 반환하며 계산은 하지않음
- list(map(함수,배열)) : 리스트에 저장하는 방법

In [12]:
a = [1,-2,3,-4,5]

new = []
for x in a:
    new.append(abs(x))
new

[1, 2, 3, 4, 5]

In [13]:
a = [1,-2,3,-4,5]

list(map(abs,a))

[1, 2, 3, 4, 5]

### 13.2.4 filter
- 리스트의 각 요소에서 조건에 맞는 요소만 꺼내고 싶을때 filter()를 이용한다
- filter(조건이 되는 함수, 배열)
- list(filter(함수,배열))
- 조건이 되는 함수는 입력에 대해 True/False를 반환하는 함수

In [14]:
a = [1,-2,3,-4,5]

list(filter(lambda x:x>0,a))

[1, 3, 5]

In [15]:
time = [
    '2006/11/26_2:40',
    '2009/1/16_23:35',
    '2014/5/4_14:26',
    '2017/8/9_7:5',
    '2020/1/5_22:15'
]

f = lambda x : int(re.split('[/_:]',x)[1]) -7 < 0

dd = list(filter(f,time))
dd

['2009/1/16_23:35', '2014/5/4_14:26', '2020/1/5_22:15']

### 13.2.5 sorted

- sort()로 리스트를 정렬할 수 있지만 더 복잡한 기준으로 정렬시 sorted()를 쓴다
- 요소가 두 개인 배열을 요소 갖는 중첩 배열에서 두 번째 요소가 오름차순이 되게 정렬할 수 있다
- sorted(정렬하려는 배열, key=키가 되는 함수, reverse=True/False

In [16]:
nest = [
    [0,9],
    [1,8],
    [2,7],
    [3,6],
    [4,5]
]

sorted(nest, key = lambda x: x[1])

[[4, 5], [3, 6], [2, 7], [1, 8], [0, 9]]

In [17]:
time = [ # 년 월 일 시 분
    [2006,11,26,2,40],
    [2009,1,16,23,35],
    [2014,5,4,14,26],
    [2017,8,9,7,5],
    [2020,1,5,22,15]
]

sorted(time, key=lambda x : x[-2])

[[2006, 11, 26, 2, 40],
 [2017, 8, 9, 7, 5],
 [2014, 5, 4, 14, 26],
 [2020, 1, 5, 22, 15],
 [2009, 1, 16, 23, 35]]

## 13.3 리스트 내포


### 13.3.1 리스트 생성

- map은 반복자 작성에 특화되어 있으며 list()함수로 배열을 생성할 때 계산 시간이 늘어난다
- 따라서 map과 같은 방법으로 단순히 배열을 생성하려면 for루프의 리스트 내포를 이용한다
- [ 적용하려는 함수(요소) for 요소 in 적용할 원본 배열 ]

In [18]:
a = [1,-2,3,-4,5]
[abs(x) for x in a]

[1, 2, 3, 4, 5]

In [19]:
list(map(abs,a))

[1, 2, 3, 4, 5]

In [20]:
min = [30,155,180,74,11,60,82]

f = lambda x : [x//60, x%60]
m = [f(x) for x in min]
m

[[0, 30], [2, 35], [3, 0], [1, 14], [0, 11], [1, 0], [1, 22]]

### 13.3.2 if문을 이용한 루프

- 리스트 내포에 조건 분기를 시키면 filter함수와 같은 조작이 가능하다
- [ 적용할 함수(요소) for 요소 in 필터링할 배열 if 조건 ]

In [21]:
a = [1,-2,3,-4,5]

[x for x in a if x>0]

[1, 3, 5]

In [22]:
min = [30,155,180,74,11,60,82]

hm = [x for x in min if x%60 == 0]
hm

[180, 60]

### 13.3.3 여러 배열을 동시에 루프시키기

- 여러 배열을 동시에 루프시킬 땐 zip()함수를 사용한다

In [23]:
a = [1,-2,3,-4,5]
b = [9,8,-7,-6,-5]

for x,y in zip(a,b):
    print(x,y)

1 9
-2 8
3 -7
-4 -6
5 -5


In [24]:
[x**2 + y**2 for x,y in zip(a,b)]

[82, 68, 58, 52, 50]

In [25]:
h = [0,2,3,1,0,1,1]
m = [30,35,0,14,11,0,22]

f = lambda x,y : x*60 + y
mm = [f(x,y) for x,y in zip(h,m) ]
mm

[30, 155, 180, 74, 11, 60, 82]

### 13.3.4 다중 루프

In [26]:
a = [1,-2,3]
b = [9,8]

for x in a:
    for y in b:
        print(x,y)

1 9
1 8
-2 9
-2 8
3 9
3 8


In [27]:
[[x,y] for x in a for y in b]

[[1, 9], [1, 8], [-2, 9], [-2, 8], [3, 9], [3, 8]]

In [28]:
# 이진수의 셋째자리 three, 둘째자리 two, 첫째자리 one을 사용해 십진수로 0에서 7까지의 숫자를 배열로 만들어 출력

three = [0,1]
two = [0,1]
one = [0,1]

[x*4 + y*2 + z for x in three for y in two for z in one]

[0, 1, 2, 3, 4, 5, 6, 7]

## 13.4 딕셔너리 객체

### 13.4.1 defaultdict

- 파이썬 딕셔너리형 객체는 새 key를 추가하려면 매번 key를 초기화해야 하므로 번거롭다
- 리스트의 요소를 key, 동일한 값을 가진 요소가 나온 횟수를 value로 하여 딕셔너리에 저장하려면 조건분기가 필요하다

In [29]:
d = {}
lst = ['foo', 'bar', 'pop', 'foo', 'popo']

for key in lst:
    if key in d:
        d[key] += 1
    else:
        d[key] = 1

d

{'foo': 2, 'bar': 1, 'pop': 1, 'popo': 1}

- collections 모듈의 defaultdict 클래스로 이 문제를 해결할 수 있다


In [30]:
from collections import defaultdict

d = defaultdict(int)
lst = ['foo', 'bar', 'pop', 'foo', 'popo']
for key in lst:
    d[key] += 1

d

defaultdict(int, {'foo': 2, 'bar': 1, 'pop': 1, 'popo': 1})

In [31]:
de = 'artificial intelligence ( AI, also machine intelligence, MI) is intelligence exhibited by machines, rather than humans or other animals (natural intelligence, NI)'

char_freq = defaultdict(int)
for i in de:
    char_freq[i] += 1

sorted(char_freq.items(), key=lambda x:x[1], reverse=True)[:10]

[(' ', 21),
 ('e', 18),
 ('i', 17),
 ('n', 14),
 ('a', 12),
 ('l', 12),
 ('t', 10),
 ('c', 7),
 ('h', 7),
 ('r', 6)]

### 13.4.2 value 내 요소 추가

- value가 리스트형이므로 딕셔너리[key].append(요소) 로 value에 요소를 추가할 수 있다


In [32]:
d = {}
price = [
    ('apple',50),
    ('banana',120),
    ('grape',500),
    ('apple',70),
    ('lemon',150),
    ('grape',1000)
]

for key, value in price:
    if key in d: # 딕셔너리 안에 key값이 있으면 해당 key의 value를 추가
        d[key].append(value)
    else:
        d[key] = [value] # 없으면 새로 추가

d

{'apple': [50, 70], 'banana': [120], 'grape': [500, 1000], 'lemon': [150]}

In [33]:
price = [
    ('apple',50),
    ('banana',120),
    ('grape',500),
    ('apple',70),
    ('lemon',150),
    ('grape',1000)
]

d = defaultdict(list)

for key,value in price:
    d[key].append(value)

[sum(x) / len(x) for x in d.values()]

[60.0, 120.0, 750.0, 150.0]

### 13.4.3 Counter

- 요소의 열거에 특화된 클래스
- for 루프를 사용하지 않기에 defaultdict보다 실행 시간이 짧으며 간결하게 열거 가능
- d = Counter(열거할 데이터)
- 열거할 데이터에는 단어를 분해한 배열이나 문자열, 딕셔너리 등을 넣을 수 있다
- Counter 클래스에는 열거를 돕는 여러 함수가 있는데 most_common() 함수는 요소를 출현 빈도의 내림차순으로 정렬한 배열을 반환한다



In [34]:
from collections import Counter 

lst = ['foo', 'bar', 'pop', 'foo', 'popo']
d = Counter(lst)
d

Counter({'foo': 2, 'bar': 1, 'pop': 1, 'popo': 1})

In [36]:
d = Counter('A Counter is a dict subclass for counting hashable objects')
d.most_common(5)

[(' ', 9), ('s', 6), ('o', 4), ('t', 4), ('a', 4)]

In [37]:
de = 'artificial intelligence ( AI, also machine intelligence, MI) is intelligence exhibited by machines, rather than humans or other animals (natural intelligence, NI)'

d = Counter(de)
d.most_common(10)

[(' ', 21),
 ('e', 18),
 ('i', 17),
 ('n', 14),
 ('a', 12),
 ('l', 12),
 ('t', 10),
 ('c', 7),
 ('h', 7),
 ('r', 6)]

In [40]:
a = 8
basic = lambda x : x*5 if x<8 else x/2
basic(8)

4.0

In [52]:
import re

time = [
    '2018/1/23_19:40',
    '2016/5/7_5:25',
    '2018/8/21_10:50',
    '2017/8/9_7:5',
    '2015/4/1_22:15'
]

get_month = lambda x: int(re.split('[/_:]',x)[1])
month_list = list(map(get_month, time))
month_list

[1, 5, 8, 8, 4]

In [46]:
for i in time:
    ddd = re.split('[/_:]', i)
    print(ddd)

['2018', '1', '23', '19', '40']
['2016', '5', '7', '5', '25']
['2018', '8', '21', '10', '50']
['2017', '8', '9', '7', '5']
['2015', '4', '1', '22', '15']


In [54]:
length = [3,1,6,2,8,2,9]
side = [4,1,15,18,7,2,19]
height = [10,15,17,13,11,19,18]

volume = [x*y*z for x,y,z in zip(length, side, height)]
volume

[120, 15, 1530, 468, 616, 76, 3078]

In [59]:
from collections import defaultdict, Counter

price = [
    ('strawberry',520),
    ('pear',200),
    ('peach',400),
    ('apple',170),
    ('lemon',150),
    ('grape',1000),
    ('strawberry',750),
    ('pear',400),
    ('peach',500),
    ('strawberry',70),
    ('lemon',300),
    ('strawberry',700),
]

d = defaultdict(list)

price_key_count = []

for key,value in price:
    d[key].append(value)
    price_key_count.append(key)

[sum(x) / len(x) for x in d.values()]

[510.0, 300.0, 450.0, 170.0, 225.0, 1000.0]

In [60]:
key_count = Counter(price_key_count)
key_count

Counter({'strawberry': 4,
         'pear': 2,
         'peach': 2,
         'apple': 1,
         'lemon': 2,
         'grape': 1})