In [1]:
# 여러 단어를 시작 글자에 따라 사전에 리스트로 저장하고 싶다면?

words = ['apple', 'bat', 'bar', 'atom', 'book']

by_letter = {}

for word in words:
    letter = word[0]
    if letter not in by_letter: 
        by_letter[letter] = [word]
    else:
        by_letter[letter].append(word)
        
by_letter

{'a': ['apple', 'atom'], 'b': ['bat', 'bar', 'book']}

In [2]:
# 사전의 값으로는 값이 바뀌지 않는 객체만 가능
# '해시 가능' 해야 한다
# 해시 가능한지의 검사는 해시 함수로 할 수 있다

hash('string')

3251570905444038900

In [3]:
# 리스트를 키로 사용하기 위한 방법은 리스트를 튜플로 변경하는 것

d = {}

d[tuple([1, 2, 3])] = 5

d

{(1, 2, 3): 5}

In [4]:
# 집합
# 유일한 원소만 담는 정렬되지 않은 자료형
# set 함수 사용, 혹은 중괄호를 이용해서 생성

set([2, 2, 2, 1, 3, 3])

{1, 2, 3}

In [5]:
{2, 2, 2, 1, 3, 3}

{1, 2, 3}

In [6]:
# 합집합 - 두 집합의 모든 원소를 모은 집합
# union 메소드 or | 이항 연산자 이용

a = {1, 2, 3, 4, 5}
b = {3, 4, 5, 6, 7, 8}

a.union(b)

{1, 2, 3, 4, 5, 6, 7, 8}

In [7]:
a|b

{1, 2, 3, 4, 5, 6, 7, 8}

In [8]:
# 교집합 - 두 집합에 공통으로 존재하는 원소만 모은 집합
# intersection 메소드 or & 이항 연산자 이용

a.intersection(b)

{3, 4, 5}

In [9]:
a & b

{3, 4, 5}

In [10]:
# 파이썬 집합 연산 모음 - p. 107

In [11]:
# 어떤 집합이 다른 집합의 부분집합인지 확대집합인지 검사 가능

a_set = {1, 2, 3, 4, 5}

{1, 2, 3}.issubset(a_set)

True

In [12]:
a_set.issuperset({1, 2, 3})

True

In [13]:
# 리스트 표기법
# 간결한 표현으로 새로운 리스트를 만들 수 있다
# 기본 형식 : [expr for val in collection if condition]

In [14]:
# ex. 문자열의 길이가 2 이하인 문자열은 제외하고 나머지를 대문자로 바꾸기

strings = ['a', 'as', 'bat', 'car', 'dove', 'python']

[x.upper() for x in strings if len(x) > 2]

['BAT', 'CAR', 'DOVE', 'PYTHON']

In [15]:
# 집합 표기법
# set_comp = {expr for value in collection if condition}

In [16]:
# 리스트 내의 문자열들의 길이를 담고 있는 집합을 생성하려면?

unique_lengths = {len(x) for x in strings}
unique_lengths

{1, 2, 3, 4, 6}

In [17]:
# map 함수를 이용한 함수적 표현

set(map(len, strings))

{1, 2, 3, 4, 6}

In [18]:
# 사전 표기법
# dict_comp = {key-expr : value-expr for value in collection if condition}

# 리스트에서 문자열의 위치를 담고 있는 사전을 생성해보자

loc_mapping = {val: index for index, val in enumerate(strings)}
loc_mapping

{'a': 0, 'as': 1, 'bat': 2, 'car': 3, 'dove': 4, 'python': 5}

In [19]:
# 중첩된 리스트 표기법

# 영어 이름과 스페인어 이름을 담고 있는 리스트의 리스트가 있다
# 영어 / 스페인어 이름을 따로 저장, 각 이름에서 e가 2개 이상 포함된 이름의 목록을 구할 때

all_data = [['John', 'Emily', 'Michael', 'Mary', 'Steven'],['Maria', 'Juan', 'Javier', 'Natalia', 'Pilar']]

names_of_interest = []

for names in all_data:
    enough_es = [name for name in names if name.count('e') >= 2]
    names_of_interest.extend(enough_es)

In [20]:
names_of_interest

['Steven']

In [21]:
# 중첩된 리스트 표기법을 사용한다면?

result = [name for names in all_data for name in names if name.count('e') >= 2]
result

['Steven']

In [22]:
# 함수

def my_function(x, y, z=1.5): 
    if z > 1: 
        return z * (x + y)
    else:
        return z / (x + y)

# x, y는 일반인자, z는 키워드 인자
# 키워드 인자는 기본값 혹은 부수적인 인자를 지정하기 위해 사용된다

my_function(5, 6, z=0.7)

0.06363636363636363

In [23]:
my_function(3.14, 7, 3.5)

35.49

In [24]:
my_function(10, 20)

45.0

In [25]:
# 여러 값 반환하기
# 파이썬에서는 함수에서 여러 값을 반환하는 것이 가능하다

def f():
    a = 5
    b = 6
    c = 7
    return a, b, c

a, b, c = f()

In [26]:
a, b, c

(5, 6, 7)

In [27]:
return_value = f()

In [28]:
return_value
# 세 개의 값을 가지고 있는 튜플이 된다

(5, 6, 7)

In [29]:
# 여러 개의 값을 반환할 때, 사전 형태로 반환할 수도 있다

def f(): 
    a = 5
    b = 6
    c = 7
    return {'a' : a, 'b' : b, 'c' : c}

In [30]:
f()

{'a': 5, 'b': 6, 'c': 7}

In [31]:
# 설문 조사 결과 데이터 등에서 엉망인 결과를 받았을 때
# 문자열 리스트를 어떻게 정형화할 것인가?

states = ['Alabama', 'Georgia!', 'Georgia', 'georgia', 'FlOrIda', 'southcarolina##', 'West virginia?']

In [32]:
# re 표준 라이브러리를 활용해보자
# 문자열 메서드와 정규 표현식을 위한 라이브러리

import re

def clean_strings(strings):
    result = []
    for value in strings: 
        value = value.strip()
        value = re.sub('[!#?]', '', value)
        value = value.title()
        result.append(value)
    return result

In [33]:
clean_strings(states)

['Alabama',
 'Georgia',
 'Georgia',
 'Georgia',
 'Florida',
 'Southcarolina',
 'West Virginia']

In [34]:
# 익명 함수 (lambda 함수)

def short_function(x):
    return x*2


equiv_anon = lambda x : x * 2

In [36]:
# ex. 다음 문자열 리스트를 각 문자열에서 다양한 문자가 포함된 순서로 정렬

strings = ['foo', 'card', 'bar', 'aaaa', 'abab']

strings.sort(key = lambda x : len(set(list(x))))
strings

['aaaa', 'foo', 'abab', 'bar', 'card']

In [37]:
# 커링 : 함수에서 일부 인자만 취하는 새로운 함수를 만드는 기법

def add_numbers(x, y): 
    return x+y

# add_numbers의 두 번째 인자를 커링해서 5를 더해주는 새로운 함수 생성
add_five = lambda y : add_numbers(5, y)

In [38]:
# 제너레이터 표현식을 이용한 제너레이터 생성
# 제너레이터는 순회 가능한 객체를 생성하는 간단한 방법

gen = (x**2 for x in range (100))
gen

<generator object <genexpr> at 0x000001753DDBCD00>

In [39]:
for x in gen: 
    print(x, end=' ')

0 1 4 9 16 25 36 49 64 81 100 121 144 169 196 225 256 289 324 361 400 441 484 529 576 625 676 729 784 841 900 961 1024 1089 1156 1225 1296 1369 1444 1521 1600 1681 1764 1849 1936 2025 2116 2209 2304 2401 2500 2601 2704 2809 2916 3025 3136 3249 3364 3481 3600 3721 3844 3969 4096 4225 4356 4489 4624 4761 4900 5041 5184 5329 5476 5625 5776 5929 6084 6241 6400 6561 6724 6889 7056 7225 7396 7569 7744 7921 8100 8281 8464 8649 8836 9025 9216 9409 9604 9801 

In [41]:
# 예외처리 - try/except 블록 활용

def attempt_float(x): 
    try: 
        return float(x)
    except: 
        return x

attempt_float('1.2345')

1.2345

In [42]:
attempt_float('something')

'something'

In [43]:
# ValueError 등 처리할 예외의 종류를 명시해서 그 예외만 처리하고 싶다면?

def attempt_float(x): 
    try: 
        return float(x)
    except ValueError: 
        return x
    
attempt_float((1,2))

TypeError: float() argument must be a string or a number, not 'tuple'

In [46]:
# finally
# 다음 코드에서 파일 핸들 f는 항상 닫히게 된다
# path 때문에 에러가 뜨는 것은 정상적

f = open(path,'w')

try: 
    write_to_file(f)
finally: 
    f.close()

NameError: name 'path' is not defined

In [47]:
# 파일과 운영체제 부분은 p.126 ~ 129를 참고할것