#  파이썬에 대한 이해

In [1]:
## 이 책에서는 코딩 테스트 문제 풀이를 통해 파이썬에 대해 매우 깊이 있는 내용까지 상세히 다룰 예정이다

## 대부분의 삽질은 제대로 알지 못하는 데에서 비롯된다. 

## 이 책에서는 문제 풀이와 함께 파이썬을 제대로 살펴볼 것이다. 웬만한 파이썬 서적 이상으로 깊이 있는 내용까지
## 함께 다루게 된다. 

# 파이썬 문법

### 인덴트

In [2]:
## 인덴트(indent)는 공식 가이드인 PEP8에 따라 공백 4칸을 원칙으로 한다.
## 파이참을 이용하면 별도로 신경쓰지 않아도 코딩 가이드를 자동으로 맞춰준다.

### 네이밍 컨벤션

In [3]:
## 파이썬의 변수명 네이밍 컨벤션(naming convention)은 자바와 달리 각 단어를 밑줄(_)로 구분하여 표기하는
## 스네이크 케이스(snake case)를 따른다. 이는 함수명도 마찬가지다.

### 타입 힌트

In [4]:
## 파이썬은 대표적인 동적 타이핑 언어임에도, 타입을 지정할 수 있는 type hint가 PEP 484 문서에 추가됐다.
## 이 기능은 파이썬 버전 3.5부터 사용할 수 있다.

## 다음과 같은 형태로 선언할 수 있다.

In [6]:
a: str = "1"
b: int = 1

In [7]:
def func(a):
    pass

def func(a: int) -> bool:
    pass

In [10]:
## 이처럼 타입 힌트를 사용하게 되면 이제 func() 함수의 파라미터 a가 정수형임을 분명하게 알 수 있으며
## 리턴 값으로 True 또는 False를 리턴할 것이라는 점도 확실하게 알 수 있다.


## 다음과 같이 문자열에 정수를 할당하는 등의 사용 방식은 절대 지양해야 한다.

In [11]:
a: str = 1
type(a)

int

### 리스트 컴프리헨션

In [12]:
## 파이썬은 map, filter와 같은 함수형(Functional) 기능을 지원하며 다음과 같은 람다 표현식도 지원한다.

In [14]:
## map은 리스트의 요소를 지정된 함수로 처리해주는 함수입니다.

## list(map(함수, 리스트))
## tuple(map(함수, 튜플))

In [15]:
## lambda expression은 간단히 말해 메소드를 하나의 식으로 표현한 것입니다.

## (lambda 매개변수들: 식)(인수들)

In [21]:
(lambda x: x + 10)(1)

11

In [22]:
list(map(lambda x: x + 10, [1, 2, 3]))

[11, 12, 13]

In [23]:
## 리스트 컴프리헨션(List Comprehension)이란 기존 리스트를 기반으로 새로운 리스트를 만들어내는 구문

In [24]:
[n * 2 for n in range(1, 11) if n % 2 == 1]

[2, 6, 10, 14, 18]

In [25]:
## 위 식을 풀어서 코드를 작성하면

In [26]:
a = []

for n in range(1, 11):
    if n % 2 == 1:
        a.append(n * 2)

In [27]:
a

[2, 6, 10, 14, 18]

In [28]:
## 버전 2.7 이후에는 다음과 같이 리스트 외에도 딕셔너리 등이 가능하도록 추가됐다.

In [30]:
original = {'key1':'value1', 'key2':'value2'}

a = {}

for key, value in original.items():
    a[key] = value

In [31]:
a

{'key1': 'value1', 'key2': 'value2'}

In [32]:
a = {key:value for key, value in original.items()}

In [33]:
a

{'key1': 'value1', 'key2': 'value2'}

### 제너레이터

In [34]:
## 제너레이터(Generator)는 루프의 반복(iteration) 동작을 제어할 수 있는 루틴 형태를 말한다.

## 예를 들어, 임의의 조건으로 숫자 1억개를 만들어내 계산하는 프로그램을 작성한다고 가정하면
## 메모리 어딘가에 만들어낸 숫자 1억개를 보관하고 있어야 한다.
## 그러나 제너레이터를 이용하면, 단순히 제너레이터만 생성해두고 필요할 때 언제든지 숫자를 만들어낼 수 있다.

In [36]:
## yield 구문을 사용하면 제너레이터를 리턴할 수 있다.

## 기존 함수는 return 구문을 마주치면 값을 리턴하고 모든 함수의 동작을 종료한다.
## 그러나 yield는 중간 값을 리턴한 다음 함수는 종료되지 않고 계속 맨 끝에 도달할 때까지 실행된다.

In [37]:
def get_natural_number():
    n = 0
    while True:
        n += 1
        yield n

In [39]:
## 함수의 리턴 값이 제너레이터이다

get_natural_number()

<generator object get_natural_number at 0x000001EE3D198040>

In [43]:
## 다음 값을 생성하려면 next()로 추출하면 된다. 
## 예를 들어 10개의 값을 생성하고 싶다면 다음과 같이 10번 동안 next()를 수행하면 된다.

g = get_natural_number()

for _ in range(0, 10):
    print(next(g), end=' ')

1 2 3 4 5 6 7 8 9 10 

### range

In [44]:
## 제너레이터의 방식을 활용하는 대표적인 함수로 range()가 있다.

In [45]:
list(range(5))

[0, 1, 2, 3, 4]

In [46]:
range(5)

range(0, 5)

In [49]:
type(range(5))

range

In [50]:
## range()는 range 클래스를 리턴하며, for 문에서 사용할 경우 내부적으로는 제너레이터의 next()를 호출하듯
## 매번 다음 숫자를 생성해낸다.

In [51]:
a = [n for n in range(100000)]
b = range(100000)

In [52]:
len(a)

100000

In [53]:
len(b)

100000

In [54]:
## len()으로 길이를 비교해 보면 둘 다 동일한 10만 개가 출력된다.
## 그러나 a에는 이미 생성된 값이 담겨 있고, b는 생성해야 한다는 조건만 존재한다.

In [56]:
b

range(0, 100000)

In [58]:
type(a)

list

In [57]:
type(b)

range

In [59]:
## 둘 사이의 메모리 점유율을 비교하면 range 클래스를 리턴하는 방식의 장점이 쉽게 와닿을 것이다.

In [60]:
import sys

sys.getsizeof(a)

824456

In [61]:
sys.getsizeof(b)

48

In [62]:
## 미리 생성하지 않은 값은 인덱스 접근이 안 될 거라 생각할 수 있으나, 인덱스로 접근 시에는 바로 생성하도록
## 구현되어 있기 때문에 다음과 같이 list와 동일한 느낌으로 사용할 수 있다

In [63]:
b[999]

999

### enumerate

In [64]:
## enumerate() 는 열거하다는 뜻의 함수로, 순서가 있는 자료형(list, set, tuple, etc..)을 인덱스를 포함한 enumerate 객체로 리턴한다.

In [65]:
a = [1, 2, 3, 2, 45, 2, 5]
a

[1, 2, 3, 2, 45, 2, 5]

In [66]:
enumerate(a)

<enumerate at 0x1ee3d1c6940>

In [67]:
list(enumerate(a))

[(0, 1), (1, 2), (2, 3), (3, 2), (4, 45), (5, 2), (6, 5)]

In [68]:
## 이처럼 list()로 결과를 추출할 수 있는데, 인덱스를 자동으로 부여해주기 때문에 매우 편리하게 활용할 수 있다.

## 그러다면 리스트가 있을 때 리스트의 인덱스와 값을 함께 추출하려면 어떻게 해야할까?

In [69]:
b = ['b1', 'b2', 'b3']

for i in range(len(b)):
    print(i, b[i])

0 b1
1 b2
2 b3


In [70]:
## 위 코드는 값을 가져오기 위해 불필요한 b[i] 조회 작업이 존재

In [72]:
i = 0
for v in b:
    print(i, v)
    i += 1

0 b1
1 b2
2 b3


In [73]:
## 값은 깔끔하게 처리했으나 이 경우 인덱스를 위한 별도의 변수를 관리하는 형태라 깔끔하지 않다

In [74]:
for i, v in enumerate(b):
    print(i, v)

0 b1
1 b2
2 b3


### // 나눗셈 연산자

In [75]:
5 / 3

1.6666666666666667

In [77]:
## 몫을 구하는 연산

5 // 3

1

In [78]:
type(5 / 3)

float

In [79]:
type(5 // 3)

int

In [80]:
int(5 / 3)

1

In [81]:
type(int(5 / 3))

int

In [82]:
## 나머지 
5 % 3

2

In [83]:
## 몫과 나머지를 동시에 구하려면 divmod() 함수를 사용하면 된다.

divmod(5, 3)

(1, 2)

### print

In [84]:
## 코딩 테스트 문제 풀이 과정에서 디버깅을 할 때 가장 자주 쓰는 명령은 print()다. 

In [85]:
print('a1', 'b2')

a1 b2


In [86]:
print('a1', 'b2', sep=',')

a1,b2


In [87]:
print('a1', 'b2', sep=':')

a1:b2


In [88]:
## print() 함수는 항상 줄바꿈을 하기 때문에 긴 루프의 값을 반복적으로 출력하면 디버깅 하기가 어렵다.

In [90]:
print('aa')
print('bb')

print('aa', end=' ')
print('bb')

aa
bb
aa bb


In [91]:
## 리스트를 출력할 때는 join()으로 묶어서 처리한다.

In [93]:
a = ['A', 'B']
print(' '.join(a))

A B


In [94]:
## idx 와 fruit이 정의되어 있을 때, idx에 1을 더해서 fruit과 함께 출력하는 방법

In [95]:
idx = 1
fruit = "Apple"

In [98]:
print('{0}:{1}:{2}'.format(idx, fruit, idx + 1))

1:Apple:2


In [99]:
print('{}:{}'.format(idx + 1, fruit))

2:Apple


In [100]:
## f-string(formated string literal)

In [101]:
print(f'{idx + 1}:{fruit}')

2:Apple


### pass

In [102]:
## 파이썬에서 pass는 널 연산(Null Operation)으로 아무것도 하지 않는 기능이다.
## 이렇게 pass는 먼저 mockup 인터페이스부터 구현한 다음에 추후 구현을 진행할 수 있게 한다.

### locals

In [103]:
## locals()는 로컬 심볼 테이블 딕셔너리를 가져오는 메소드로 업데이트 또한 가능하다.

## 여기서는 딕셔너리를 가져오는 부분에 집중해서 살펴보면
## 우선 로컬에 선언된 모든 변수를 조회할 수 있는 강력한 명령이므로 디버깅에 많은 도움이 된다.

## 특히 로컬 스코프에 제한해 정보를 조회할 수 있기 때문에
## 클래스의 특정 메소드 내부에서나 함수 내부의 로컬 정보를 조회해 잘못 선언한 부분이 없는지 확인하는 용도로 활용할 수 있다.

In [107]:
## pprint로 출력하게 되면 보기 좋게 줄바꿈 처리를 해주기 때문에 가독성이 높다.

## import pprint

## pprint.pprint(locals())

# 코딩 스타일

In [108]:
## 점수만을 놓고 순위를 가리는 경쟁 대회가 아니라, 채용을 위한 코딩 테스트는 조금 다르다. 
## 점수만 보지 않는 대신, 제출한 코드의 품질을 평가할 수 있기 때문이다.

In [109]:
## 파이썬의 PEP8과 구글의 파이썬 스타일 가이드는 좀 더 실용적인 관점에서 좋은 파이썬 코드를 작성하는 데 많은 도움이 된다.
## 특히 PyCharm과 같은 IDE를 사용하게 되면 PEP8 기준ㅇ로 자동으로 경고를 띄워주므로 좋은 코드를 작성할 수 있도록
## 가이드를 받을 수 있다.

In [110]:
## 좋은 코드는 가능한 한 많은 사람이 좋아하며 선호하는 방식을 택하는 것이 중요하다.
## 개발은 혼자서 하는 것이 아니며, 좋은 코드란 모두가 이해할 수 있을 때 더 높은 가치를 발휘하기 때문이다.

### 변수명과 주석

In [140]:
from typing import List
S = "T"
words = "This is a Apple"

def numMatchingSubseq(S: str, words: List[str]) -> int:
    matched_count = 0
    
    for word in words:
        pos = 0
        for i in range(len(word)):
            #Find matching position for each character.
            found_pos = S[pos:].find(word[i])
            if found_pos < 0:
                matched_count -= 1
                break
            else:# if found, take step position forward.
                pos += found_pos + 1
        matched_count += 1
        
    return matched_count

In [141]:
a = numMatchingSubseq(S, words)

In [142]:
a

1

In [143]:
## 특히 파이썬에서는 간단한 주석을 부여하는 편이 훨씬 더 가독성이 높아 보인다

## 변수명도 의미 없는 이름보다는 각각의 의미를 부여해 작명했다

## 주석은 영어로 작성하는 것에도 부담이 없어야 한다.
## 영어로 주석을 달아서 제출하는 편이 좀 더 프로페셔널하다는 인상을 줄 수 있다.

### 리스트 컴프리헨션

In [144]:
## 리스트 컴프리헨션은 파이썬의 매우 강력한 기능 중 하나이며, 파이썬을 대표하는 특징 중 하나다.
## 하지만 지나차게 남발하게 되면 파이썬의 가독성을 떨어뜨리는 요인이 되기도 한다.
## 리스트 컴프리헨션은 대체로 표현식이 2개를 넘지 않아야 한다.

### 구글 파이썬 스타일 가이드

In [145]:
## PEP8과 함께, 여기서 소개하는 구글 파이썬 스타일 가이드는 구글에서 정한 스타일 가이드로
## PEP8에서 설명하지 않는 좋은 코드를 위한 지침들이 여럿 있는 편이다
## 특히 가독성을 높이기 위한 지침들이 많다

In [146]:
## 먼저 함수의 기본 값으로 가변 객체(Mutable Object)를 사용하지 않아야 한다.
## 함수가 객체를 수정하면 기본값이 변경되기 때문이다