Create Standard Library.md

cpprhtn · cpprhtn · commit b2d29e374e84 · 2025-02-06T18:35:57.000+09:00
diff --git a/docs/Standard Library.md b/docs/Standard Library.md
@@ -0,0 +1,300 @@
+# **Standard Library**
+
+Python이 기본 제공하는 모듈들  
+
+## **1. collections**
+Python의 `collections` 모듈은 다양한 데이터 구조를 쉽게 다룰 수 있도록 도와줌.
+
+Counter, defaultdict, deque, OrderedDict, namedtuple 등이 자주 사용된다.
+
+### 1.1 **collections.Counter (요소 개수 세기)**
+리스트 요소의 개수를 쉽게 세는 기능.
+
+#### dict 사용
+```python
+words = ["apple", "banana", "apple", "cherry", "banana", "apple"]
+word_count = {}
+for word in words:
+    if word in word_count:
+        word_count[word] += 1
+    else:
+        word_count[word] = 1
+print(word_count)
+```
+
+- dict를 사용하면 키가 존재하는지 매번 확인해야 하므로 코드가 복잡하고 비효율적.
+
+#### collections.Counter 사용
+```python
+from collections import Counter
+
+words = ["apple", "banana", "apple", "cherry", "banana", "apple"]
+word_count = Counter(words)
+print(word_count)
+```
+
+- 내부적으로 최적화되어 있어 요소 개수를 더 빠르고 간결하게 계산.
+
+### 1.2 **collections.deque (빠른 리스트 연산)**
+앞쪽 원소 삽입/삭제 시 `list`는 O(n)이지만 `deque`는 O(1)로 동작.
+
+#### 리스트 사용 (비효율적)
+```python
+lst = [1, 2, 3]
+lst.insert(0, 0)  # O(n) 연산
+lst.pop(0)  # O(n) 연산
+```
+
+- list는 앞쪽 원소를 삽입/삭제할 때 모든 요소를 이동해야 하므로 O(n) 시간이 걸림.
+
+#### deque 사용 (효율적)
+```python
+from collections import deque
+
+dq = deque([1, 2, 3])
+dq.appendleft(0)  # O(1)
+dq.popleft()  # O(1)
+```
+
+- deque는 양쪽 끝에서 O(1)로 삽입/삭제 가능하여 효율적.
+
+---
+
+## **2. itertools**
+반복 가능한 객체를 다루는 다양한 기능 제공.
+
+count, cycle, chain, permutations, starmap 등을 사용하여 반복문과 조건문을 간단하고 효율적으로 처리할 수 있도록 도와준다.
+
+### 2.1 **itertools.permutations (순열 조합 구하기)**
+
+#### 재귀 함수 사용
+```python
+def permute(arr, path=[]):
+    if not arr:
+        print(path)
+        return
+    for i in range(len(arr)):
+        permute(arr[:i] + arr[i+1:], path + [arr[i]])
+
+permute([1, 2, 3])
+```
+
+- 재귀 호출로 인해 비효율적이고 코드가 길어짐.
+
+#### itertools.permutations 사용
+```python
+from itertools import permutations
+
+arr = [1, 2, 3]
+perm_list = list(permutations(arr))
+print(perm_list)
+```
+
+- 내부적으로 최적화되어 간결하고 빠름.
+
+### 2.2 **itertools.starmap (튜플 언패킹 최적화)**
+`map()` 대신 사용하면 성능 향상.
+
+#### 일반 map() 사용
+```python
+def add(a, b):
+    return a + b
+
+pairs = [(1, 2), (3, 4), (5, 6)]
+result = list(map(lambda x: add(*x), pairs))
+```
+
+- lambda로 언패킹해야 함.
+
+#### starmap() 사용
+```python
+from itertools import starmap
+
+def add(a, b):
+    return a + b
+
+pairs = [(1, 2), (3, 4), (5, 6)]
+result = list(starmap(add, pairs))
+```
+
+- 불필요한 lambda 호출을 줄여 성능이 향상됨.
+
+## **3. functools**
+함수 최적화 및 고차 함수 지원.
+
+lru_cache, partial, reduce, update_wrapper, total_ordering 등 여러 고차 함수들을 통해 반복적인 작업을 최적화하고, 코드의 가독성 및 재사용성을 높이는 데 유용하다.
+
+### 3.1 **functools.lru_cache (재귀 최적화)**
+
+#### 사용하지 않음 (느림)
+```python
+def fib(n):
+    if n <= 1:
+        return n
+    return fib(n-1) + fib(n-2)
+
+print(fib(30))  # 매우 느림
+```
+
+- 동일한 값을 여러 번 재귀 호출 → 중복 계산 발생 (O(2^n))
+- 호출 깊이가 커질수록 기하급수적으로 느려짐
+
+#### lru_cache 사용 (빠름)
+```python
+from functools import lru_cache
+
+@lru_cache(maxsize=None)
+def fib(n):
+    if n <= 1:
+        return n
+    return fib(n-1) + fib(n-2)
+
+print(fib(30))  # 훨씬 빠름
+```
+
+- 한 번 계산한 값은 캐싱 → 중복 호출 없이 O(n)
+- 불필요한 연산을 제거해 실행 속도 대폭 향상
+
+## **4. datetime**
+날짜 및 시간 다루기.
+
+날짜, 시간, 시간 차이, 시간대 변환 등을 손쉽게 처리할 수 있는 기능을 제공한다.
+
+datetime 객체의 메소드를 사용하면 날짜와 시간 연산을 간단하게 할 수 있으며, 다양한 형식으로 날짜와 시간을 출력하거나 변환할 수 있다.
+
+### 4.1 **datetime.datetime (시간 정보 가져오기)**
+
+#### time 사용
+```python
+import time
+
+timestamp = time.time()
+year = 1970 + timestamp // (365 * 24 * 3600)
+print(f"현재 연도: {int(year)}")
+```
+
+- Unix 타임스탬프를 직접 변환 → 연도 계산이 번거롭고 가독성 낮음
+
+#### datetime 사용
+```python
+from datetime import datetime
+
+now = datetime.now()
+print(f"현재 연도: {now.year}")
+```
+
+- 즉시 연도 반환
+
+## **5. pathlib**
+파일 시스템 경로 다루기.
+
+pathlib는 파일 경로를 다루는 다양한 메소드를 제공한다. 예를 들어, joinpath()로 경로를 이어 붙이거나, stem, suffix와 같은 속성을 이용해 파일명이나 확장자도 쉽게 다룰 수 있다.
+
+또한 운영 체제에 맞는 경로 구분자를 자동으로 처리한다. 즉, Windows에서는 백슬래시(\), UNIX-like 시스템에서는 슬래시(/)를 자동으로 다루어 주므로, 플랫폼에 상관없이 코드가 안정적으로 실행된다.
+
+### 5.1 **pathlib.Path (파일 존재 여부 확인)**
+
+#### os 사용
+```python
+import os
+
+filepath = "example.txt"
+if os.path.exists(filepath):
+    print("파일 존재함")
+```
+
+- 문자열 경로 처리
+
+#### pathlib.Path 사용
+```python
+from pathlib import Path
+
+filepath = Path("example.txt")
+if filepath.exists():
+    print("파일 존재함")
+```
+
+- Path 객체 사용 → 경로 조작이 직관적이고 가독성 향상
+
+## **6. array**
+메모리 효율적인 배열 사용.
+
+메모리 절약, 인덱스 접근 속도 향상 등의 장점도 있지만 데이터 타입을 고정해야 하므로, 서로 다른 데이터 타입을 저장할 수 있는 리스트보다 유연성이 떨어진다.
+
+### 6.1 **array.array**
+
+#### 리스트 사용 (비효율적)
+```python
+lst = [1, 2, 3, 4, 5]  # 객체 포인터 저장
+```
+
+- 객체 포인터 저장 → 메모리 사용량 증가
+
+#### array 사용 (효율적)
+```python
+from array import array
+
+arr = array('i', [1, 2, 3, 4, 5])  # 'i'는 정수(int) 타입 지정
+```
+
+- 연속된 메모리 블록 사용 → 메모리 절약, 성능 향상
+
+## **7. 병렬 처리**
+
+### 7.1 **multiprocessing (CPU 병렬 처리)**
+
+#### 단일 프로세스 실행 (느림)
+```python
+def work(n):
+    return sum(i*i for i in range(n))
+
+nums = [10**6, 10**6, 10**6, 10**6]
+results = [work(n) for n in nums]  # 한 개씩 실행 (느림)
+```
+
+- 한 번에 하나씩 처리 → CPU 코어 활용 부족
+
+#### multiprocessing 사용 (빠름)
+```python
+from multiprocessing import Pool
+
+def work(n):
+    return sum(i*i for i in range(n))
+
+nums = [10**6, 10**6, 10**6, 10**6]
+with Pool() as pool:
+    results = pool.map(work, nums)  # 병렬 실행 (빠름)
+```
+
+- 여러 코어에서 병렬 실행 → 실행 속도 향상
+
+### 7.2 **concurrent.futures.ThreadPoolExecutor (I/O 최적화)**
+
+#### 단일 스레드 실행 (느림)
+```python
+import requests
+
+urls = ["https://example.com"] * 10
+
+for url in urls:
+    response = requests.get(url)
+    print(response.status_code)
+```
+
+- 한 번에 하나씩 처리 → I/O 작업에 시간이 많이 소요됨
+
+#### ThreadPoolExecutor 사용 (빠름)
+```python
+from concurrent.futures import ThreadPoolExecutor
+import requests
+
+urls = ["https://example.com"] * 10
+
+with ThreadPoolExecutor() as executor:
+    results = executor.map(requests.get, urls)
+
+for response in results:
+    print(response.status_code)
+```
+
+- 여러 스레드에서 병렬 실행 → I/O 대기 시간 동안 다른 요청 처리 가능, 속도 향상