[![Colab Badge](http://img.shields.io/badge/Colaboratory-black?style=for-the-badge&logo=google-colab)](https://colab.research.google.com/github/curieuxjy/Cotegorithm/blob/main/ecote/appendix_a.ipynb)

# 코딩 테스트를 위한 파이썬 문법

> 기초적인 문법들이지만 자주 사용하지 않아 놓치기 쉬운 부분들과 잘몰랐었던 부분들을 요약
> 
> 자세한 내용은 책과 강의에 잘 나와있으므로 빠르게 훑어볼 수 있는 checklist처럼 활용

## 1. 자료형

- 2진수 체계에서는 0.9를 정확히 표현할 수 없어 최대한 가깝게 표현하여 오차가 발생한다. `round()`함수를 이용하여 해결한다.

In [None]:
a = 0.3+0.6
print(a)

if a==0.9:
    print(True)
else:
    print(False)

0.8999999999999999
False


In [None]:
a = 0.3+0.6
print(round(a, 4))

if round(a, 4)==0.9:
    print(True)
else:
    print(False)

0.9
True


- 리스트 컴프리헨션을 이용하여 2차원 리스트를 초기화할 때 사용한다. 단순히 2중 `*`연산자로 초기화할 경우 의도치 않는 경우가 나올 수 있으니 주의한다.

In [None]:
n = 3 # row
m = 4 # col
array = [[0]*m for _ in range(n)]
print(array)

[[0, 0, 0, 0], [0, 0, 0, 0], [0, 0, 0, 0]]


In [None]:
array2 = [[0] * m] * n 
print(array2)

[[0, 0, 0, 0], [0, 0, 0, 0], [0, 0, 0, 0]]


In [None]:
# 특정 위치의 원소를 5로 치환
array[1][1] = 5
print(array)

array2[1][1] = 5 # 내부의 [[0]*m]을 모두 같은 객체로 인식
print(array2)

[[0, 0, 0, 0], [0, 5, 0, 0], [0, 0, 0, 0]]
[[0, 5, 0, 0], [0, 5, 0, 0], [0, 5, 0, 0]]


- `remove()`는 특정 값의 원소를 1개만 제거하므로 모두 제거를 하기 원한다면 별도의 코드가 필요하다.

In [None]:
a = [1, 4, 3, 2, 1, 1, 5]
a.remove(1)
print(a)

[4, 3, 2, 1, 1, 5]


In [None]:
a = [1, 4, 3, 2, 1, 1, 5]
remove_set = {1, 2}

a = [i for i in a if i not in remove_set]
print(a)

[4, 3, 5]


- 튜플은 서로다른 데이터들의 순서쌍을 만들 때나 Hashing key로 사용. 리스트보다 메모리 효율이 좋다.(공간복잡도를 낮출 수 있음)

- 사전은 데이터의 검색 및 수정에 $O(1)$ 상수시간에 처리할 수 있다.(Hash Table)

- 사전에서 `keys()`, `values()`로 키나 값을 가져올 수 있는데 각각 `dict_keys`, `dict_values` 객체로 반환되므로 한번 `list()`로 변환하여 사용한다.

In [None]:
data = {'A':1, 'B':2}
print(data.keys())
print(data.values())
print(list(data.keys()))
print(list(data.values()))

dict_keys(['A', 'B'])
dict_values([1, 2])
['A', 'B']
[1, 2]


- 집합에서 한 개의 원소를 추가할 때는 `add()`를 여러개의 원소를 추가할 때는 `update()`를 사용한다. (자주 사용하는 자료형이 아니라서 조금 낯설다.)

In [None]:
data = set([2, 4, 1, 4, 5])
print(data)

data.add(6)
print(data)

data.update([3, 0])
print(data)

data.remove(2)
print(data)

{1, 2, 4, 5}
{1, 2, 4, 5, 6}
{0, 1, 2, 3, 4, 5, 6}
{0, 1, 3, 4, 5, 6}


## 2. 조건문

- 조건부 표현식(Conditional Expression)을 활용하여 한줄에 코드를 작성해보자. 리스트에 있는 원소의 값을 변경해서, 또 다른 리스트를 만들고자 할 때 매우 간결하게 사용할 수 있다.(리스트 컴프리헨션 참고)

In [None]:
score = 85
result = "Success" if score >= 80 else "Fail"
print(result)

Success


In [None]:
a = [1, 2, 3, 4, 5, 5, 5]
remove_set={3, 5}
result = [i for i in a if i not in remove_set]
print(result)

[1, 2, 4]


- 파이썬에서는 삼항 비교연산이 가능하다.

In [None]:
x = 15
if 0 < x < 20:
    print("x는 0이상 20이하")

x는 0이상 20이하


## 3. 반복문
- 특별히 새로운 내용이 없다. for 문이 while보다 더 소스코드가 짧은 경우가 많다고 한다.

## 4. 함수

- 람다 표현식을 사용하여 간단한 함수들을 정의하자. 정렬 라이브러리(`sorted()`)를 사용할 때 정렬 기준(Key)을 설정할 때 자주 사용된다.

In [None]:
array = [('A', 50), ('B', 95), ('C', 70)]
print(sorted(array, key=lambda x:x[1]))

[('A', 50), ('C', 70), ('B', 95)]


In [None]:
list1 = [1,2,3,4,5]
list2 = [6,7,8,9,10]

result = map(lambda a, b:a+b, list1, list2)
print(list(result)) # map은 lazy evaluation

[7, 9, 11, 13, 15]


## 5. 입출력

- 입력을 처리할 때 거의 반사적으로 사용하게 되는 코드

In [None]:
n = int(input())
data = list(map(int, input().split()))

data.sort(reverse=True)
print(data)

 3
 1 3 4


[4, 3, 1]


- 입력 데이터 수가 **적을 때**는 바로 packing을 하자.

In [None]:
n, m, k = map(int, input().split())
print(n, m, k)

 5 7 9


5 7 9


- 입력 데이터 수가 **많을 때**는 `sys` 라이브러리를 이용하자. `readline()`은 엔터가 줄 바꿈 기호로 입력되어서 이 공백 문자를 `rstrip()`으로 제거해준다.

    ```python
    import sys
    import time

    start = time.time()
    data = sys.stdin.readline().rstrip() # jupyuter에서 stdin 작동 안됨
    print(time.time()-start)

    start = time.time()
    data = input() 
    print(time.time()-start)
    ```
    - OUTPUT

    ```
    hello
    1.8883404731750488
    hello
    3.0959155559539795
    ```

- 3.6버젼 이상이면 f-string을 사용할 수 있으므로 데이터의 자료형을 신경안쓰고 출력할 수 있다.

In [None]:
answer = 7
print(f"THe answer is {answer}")

THe answer is 7


## 6. 주요 라이브러리의 문법과 유의점

- 내장함수 활용하자. `sum()`, `min()`, `max()`, `eval()`, `sorted()`-단 iterable 객체는 기본으로 `sort()`함수가 있음

In [None]:
result = eval("(3+5)*7") # 잘 몰랐던 내장함수 eval(). 수학 수식이 문자열 형식으로 들어오면 계산한 결과를 반환.
print(result)

56


- `itertools`는 순열과 조합을 나타내야할 때 유용하다. `permutations`, `combinations`, `product`(중복순열), `combinations_with_replacement`(중복조합)
    - 다 클래스이므로 객체 초기화 후에 리스트 자료형으로 변환해야 한다.

In [None]:
from itertools import permutations, combinations, product, combinations_with_replacement

data = ['a', 'b', 'c']
print(list(permutations(data, 2)))
print(list(combinations(data, 2)))
print(list(product(data, repeat=2)))
print(list(combinations_with_replacement(data, 2)))

[('a', 'b'), ('a', 'c'), ('b', 'a'), ('b', 'c'), ('c', 'a'), ('c', 'b')]
[('a', 'b'), ('a', 'c'), ('b', 'c')]
[('a', 'a'), ('a', 'b'), ('a', 'c'), ('b', 'a'), ('b', 'b'), ('b', 'c'), ('c', 'a'), ('c', 'b'), ('c', 'c')]
[('a', 'a'), ('a', 'b'), ('a', 'c'), ('b', 'b'), ('b', 'c'), ('c', 'c')]


- `Counter`를 가지고 등장 횟수를 세는 기능을 사용한다. wordcloud 등과 같은 것을 만들 때 사용한다.

In [None]:
from collections import Counter

counter = Counter(['a', 'b', 'c', 'd', 'a', 'a', 's', 'c'])

print(counter['a'])
print(counter['c'])
print(counter['t'])
print(dict(counter)) # 사전 자료형으로 반환

3
2
0
{'a': 3, 'b': 1, 'c': 2, 'd': 1, 's': 1}


- 최대 공약수, 최대 공배수는 `math`의 `gcd()`함수를 이용해서 구한다.

In [None]:
import math

print(math.gcd(21, 14))
print(math.gcd(13, 17))

7
1


In [None]:
# gcd()를 활용하여 최소 공배수 구하는 함수 구현
def LCM(a, b):
    return a*b // math.gcd(a, b)

print(LCM(21, 14))

42


## 7. 강의에서 다루지 않았지만 추가

> 책에만 나와있는 것들 중 기억하고 싶은 내용들

- `heapq` : heap 기능을 위한 라이브러리. 우선순위 큐 기능을 구현할 때 사용.(`PriorityQueue`보다 빠름)
    - 삽입: `heapq.heappush()`
    - 꺼내기: `heapq.heappop()`

In [None]:
import heapq

def heapsort(iterable):
    h = []
    result = []
    # 모든 원소를 차례대로 힙에 삽입
    for value in iterable:
        heapq.heappush(h, value)
    # 힙에 삽입된 모든 원소를 차례대로 꺼내어 담기
    for i in range(len(h)):
        result.append(heapq.heappop(h))
    return result

result = heapsort([1, 3, 4, 6, 2, 5, 8, 0])
print(result)

[0, 1, 2, 3, 4, 5, 6, 8]


- 최대 힙은 기본 제공되지 않으므로 원소의 부호를 임시로 변경하는 방식을 사용하여 구현한다.

In [None]:
def max_heapsort(iterable):
    h = []
    result = []
    # 모든 원소를 차례대로 힙에 삽입
    for value in iterable:
        heapq.heappush(h, - value)
    # 힙에 삽입된 모든 원소를 차례대로 꺼내어 담기
    for i in range(len(h)):
        result.append(- heapq.heappop(h))
    return result
    
result = max_heapsort([1, 3, 4, 6, 2, 5, 8, 0])
print(result)

[8, 6, 5, 4, 3, 2, 1, 0]


- `bisect`는 이진 탐색을 쉽게 구현할 수 있도록 도와주는 라이브러리. 
    - `bisect_left()`: 정렬 순서를 유지하며 리스트에 새로운 데이터를 삽입할 가장 `왼쪽` 인덱스를 찾음
    - `bisect_right()`: 정렬 순서를 유지하며 리스트에 새로운 데이터를 삽입할 가장 `오른쪽` 인덱스를 찾음

In [None]:
from bisect import bisect_left, bisect_right

a = [1,2,4,4,8]
x = 4

print(bisect_left(a, x))
print(bisect_right(a, x))

2
4


- **정렬된 리스트**에서 **값이 특정 범위에 속하는 원소의 개수**를 구할려고 할 때 `bisect`가 유용하다.

In [None]:
def count_by_range(a, left_value, right_value):
    right_index = bisect_right(a, right_value)
    left_index = bisect_left(a, left_value)
    return right_index - left_index

a = [1, 2, 3, 3, 3, 3, 4, 4, 8, 9] # 정렬되어 있음
print(count_by_range(a, 4, 4))

print(count_by_range(a, -1, 3))

2
6


- `deque`: 큐이나 스택의 기능 모두 포함. 리스트와 다르게 인덱싱, 슬리이싱을 사용할 수는 없지만 시작부분이나 끝부분에 원소 추가와 제거의 시간 복잡도가 $O(1)$로 낮다.
    - `popleft()`: 첫 번째 원소 제거
    - `pop()`: 마지막 원소 제거
    - `appendleft(x)`: 첫 번째 인덱스에 원소 x 삽입
    - `append(x)`: 마지막 인덱스에 원소 x 삽입

In [None]:
from collections import deque

data = deque([2, 3, 4])
data.appendleft(1)
data.append(5)

print(data)
print(list(data))

deque([1, 2, 3, 4, 5])
[1, 2, 3, 4, 5]
