# Module

- 모듈(라이브러리)은 이미 존재하는 함수나 클래스를 가져와서 사용하는 것
- 파이썬이 기본적으로 갖고 있는 모듈이나 다른 사람들이 만들어서 공개한 모듈도 있음
- .py 형태로 만들어진 파일들이 모듈로 사용된다고 생각하면 됨

## 모듈 사용 방법
- 일반적으로 __import 모듈이름__ 의 형태로 사용함
- 모듈의 특정 함수만 사용하고 싶다면 __from 모듈이름 import 함수이름__ 의 형태로 불러옴

## 기본 모듈  
- 파이썬 설치 시 자동으로 함께 설치되는 모듈을 말함  


```python
import 모듈이름
from 모듈이름 import 변수, 함수, 클래스이름
from 모듈이름 import *
import 모듈이름.{변수,함수,클래스이름}

import 모듈이름 as 별칭
```

**Example**

```python
import os
from copy import deepcopy
from copy import *
import copy.deepcopy

import numpy as np
```

# copy

- 객체를 복사할 때 주로 사용

In [1]:
a = [1,2,3]
b = a
print(f'a: {a}')
print(f'id(a): {id(a)}')
print(f'id(b): {id(b)}')

a: [1, 2, 3]
id(a): 139775179286592
id(b): 139775179286592


In [2]:
b[0] = 9
print(f'a: {a}')
print(f'b: {b}')

a: [9, 2, 3]
b: [9, 2, 3]


In [3]:
import copy

In [4]:
a = [1,2,3]
b = copy.copy(a)
b[0] = 9
print(f'a: {a}')
print(f'b: {b}')

a: [1, 2, 3]
b: [9, 2, 3]


In [5]:
print(f'id(a): {id(a)}')
print(f'id(b): {id(b)}')

id(a): 139775179286208
id(b): 139775179285376


In [6]:
from copy import copy, deepcopy

In [7]:
a = [[1,2,3], [4,5,6]]
b = copy(a)
b[0][0] = 9

print(f'a: {a}')
print(f'b: {b}\n')

print(f'id(a): {id(a)}')
print(f'id(b): {id(b)}\n')

print(f'id(a[0]): {id(a[0])}')
print(f'id(b[0]): {id(b[0])}')

a: [[9, 2, 3], [4, 5, 6]]
b: [[9, 2, 3], [4, 5, 6]]

id(a): 139775179309120
id(b): 139775179309952

id(a[0]): 139775179309760
id(b[0]): 139775179309760


In [8]:
a = [[1,2,3], [4,5,6]]
b = deepcopy(a)
b[0][0] = 9

print(f'a: {a}')
print(f'b: {b}\n')

print(f'id(a): {id(a)}')
print(f'id(b): {id(b)}\n')

print(f'id(a[0]): {id(a[0])}')
print(f'id(b[0]): {id(b[0])}')

a: [[1, 2, 3], [4, 5, 6]]
b: [[9, 2, 3], [4, 5, 6]]

id(a): 139775179063808
id(b): 139775179309568

id(a[0]): 139775179310400
id(b[0]): 139775179310144


# os

- 경로 및 파일 및 폴더 관련 작업할 때 주로 사용됨

In [9]:
import os

In [10]:
# 현재 작업 경로 확인
os.getcwd()

'/content'

In [11]:
# 입력 경로 위치에 존재하는 파일 리스트 확인
os.listdir('./sample_data')

['README.md',
 'anscombe.json',
 'california_housing_test.csv',
 'mnist_test.csv',
 'california_housing_train.csv',
 'mnist_train_small.csv']

In [12]:
# 파일명을 수정하는 경우 source 파일 경로와 destination 파일 경로를 지정하여 이름 변경 가능
os.rename(
    src='./sample_data/mnist_test.csv',
    dst='./sample_data/MNIST_test.csv'
)

In [13]:
os.listdir('./sample_data')

['README.md',
 'anscombe.json',
 'MNIST_test.csv',
 'california_housing_test.csv',
 'california_housing_train.csv',
 'mnist_train_small.csv']

In [14]:
# 폴더 생성
os.mkdir('temp')

In [15]:
# 단, 상위 폴더가 생성되어 있지 않을 때는 계층적으로 폴더를 생성이 불가능함
os.mkdir('temp2/test')

FileNotFoundError: [Errno 2] No such file or directory: 'temp2/test'

In [16]:
# 상위 폴더가 생성되어 있지 않아도 계층적으로 폴더를 생성하는 경우 사용
os.makedirs('temp2/test')

In [17]:
# 이미 폴더가 존재하는 경우 에러 발생
os.makedirs('temp2/test')

FileExistsError: [Errno 17] File exists: 'temp2/test'

In [18]:
# 이미 지정한 위치에 폴더가 존재하는 경우, 에러가 발생하지 않도록 하기위해서는 exist_ok를 True로 설정
os.makedirs('temp2/test', exist_ok=True)

In [19]:
# 입력 arguments로 경로 생성
os.path.join('data', 'dataname')

'data/dataname'

In [20]:
# 입력 경로에 대한 절대 경로를 반환함
os.path.abspath('./sampled_data')

'/content/sampled_data'

In [21]:
# 입력 경로의 기본 이름을 반환함
os.path.basename('./sample_data/mnist_test.csv')

'mnist_test.csv'

In [22]:
# 입력 경로의 상위 폴더명을 반환함
os.path.dirname('./sample_data/mnist_test.csv')

'./sample_data'

# glob

- 사용자가 제시한 조건에 맞는 파일명을 리스트 형식으로 반환함
- '*'나 '?'와 같은 와일드카드를 사용할 수 있음

In [23]:
from glob import glob

In [25]:
glob('./sample_data')

['./sample_data']

In [26]:
glob('./sample_data/*')

['./sample_data/README.md',
 './sample_data/anscombe.json',
 './sample_data/MNIST_test.csv',
 './sample_data/california_housing_test.csv',
 './sample_data/california_housing_train.csv',
 './sample_data/mnist_train_small.csv']

In [27]:
glob('*')

['temp2', 'temp', 'sample_data']

In [28]:
glob('*/*')

['temp2/test',
 'sample_data/README.md',
 'sample_data/anscombe.json',
 'sample_data/MNIST_test.csv',
 'sample_data/california_housing_test.csv',
 'sample_data/california_housing_train.csv',
 'sample_data/mnist_train_small.csv']

In [29]:
glob('temp?/*')

['temp2/test']

In [30]:
glob('sample_*/*')

['sample_data/README.md',
 'sample_data/anscombe.json',
 'sample_data/MNIST_test.csv',
 'sample_data/california_housing_test.csv',
 'sample_data/california_housing_train.csv',
 'sample_data/mnist_train_small.csv']

In [31]:
glob('**')

['temp2', 'temp', 'sample_data']

In [32]:
glob('**', recursive=True)

['temp2',
 'temp2/test',
 'temp',
 'sample_data',
 'sample_data/README.md',
 'sample_data/anscombe.json',
 'sample_data/MNIST_test.csv',
 'sample_data/california_housing_test.csv',
 'sample_data/california_housing_train.csv',
 'sample_data/mnist_train_small.csv']

# time, datetime

- Python에서 시간과 관련된 내용을 다룰 때 주로 사용됨

In [33]:
import time

In [34]:
# 현재 시간을 초 단위로 알려줌. 소수점 아래는 마이크로(micro) 초단위를 의미함
time.time()

1758075058.9000905

In [35]:
start = time.time()
s = 0
for _ in range(10000000):
    s += 1
end = time.time() - start
print(f'{end} seconds')

1.4738426208496094 seconds


In [36]:
# 잠시 코드를 멈추는 용도로 사용됨. 입력값은 초단위
time.sleep(2)

In [37]:
start = time.time()
time.sleep(5)
end = time.time() - start
print(f'{end} seconds')

5.000396490097046 seconds


In [38]:
import datetime

In [39]:
print(datetime.timedelta(seconds=10000))

2:46:40


In [40]:
# datetime의 timedelta를 통해 초단위 시간을 h:mm:ss.ms 포맷으로 변환할 수 있음
start = time.time()
s = 0
for _ in range(100000000):
    s += 1
end = time.time() - start
print(datetime.timedelta(seconds=end))

0:00:12.311891


In [41]:
%%time
# jupyter에서는 시간을 계산해주는 기능이 있음
'''
1. CPU times: CPU 실행 시간
- user: 사용자 모드에서 CPU 시간 (코드 실행에 소요된 시간)
- sys: 시스템 모드에서 CPU 시간 (시스템 호출 및 리소스 관리에 소요된 시간)

2. Wall time: 실제 시간
- 코드 블록이 실행되는데 걸린 실제 시간
'''

time.sleep(5.12)

CPU times: user 780 µs, sys: 0 ns, total: 780 µs
Wall time: 5.12 s


# math

- Python에서 수학 관련된 내용을 다룰 때 주로 사용됨

In [42]:
import math

In [43]:
# 올림
math.ceil(2.23)

3

In [44]:
# 내림
math.floor(2.23)

2

In [45]:
# 반올림
round(2.23)

2

In [46]:
# 절대값
math.fabs(-223)

223.0

In [47]:
# factorial
math.factorial(10)

3628800

In [48]:
# log. 첫 번째 인자는 진수, 두 번째 인자는 밑수
math.log(10, 10)

1.0

In [49]:
# 밑의 기본값은 e
math.log(10)

2.302585092994046

In [50]:
# e를 밑으로 하는 x+1 로그
math.log1p(9)

2.302585092994046

In [51]:
math.log1p(0)

0.0

In [52]:
# 2를 밑으로 하는 로그
math.log2(10)

3.321928094887362

In [53]:
# 10을 밑으로 하는 로그
math.log10(10)

1.0

In [54]:
# math.pow(x, y) == x ** y를 말함
math.pow(2, 3)

8.0

In [55]:
# 삼각함수
math.cos(10)

-0.8390715290764524

In [56]:
math.sin(10)

-0.5440211108893698

In [57]:
math.tan(10)

0.6483608274590866

In [58]:
# 상수
print('math.pi: ',math.pi)
print('math.e: ',math.e)
print('math.tau: ',math.tau)

math.pi:  3.141592653589793
math.e:  2.718281828459045
math.tau:  6.283185307179586


# random

- 난수를 생성할 때 사용됨

In [59]:
import random

In [60]:
# [0,1), 0 <= x < 1 사이의 값을 반환함
random.random()

0.35941172909499364

In [61]:
# random.uniform(a,b): a <= b 일 때 a <= N <= b, b < a 일 때 b <= N <= a를 만족하는 임의의 부동 소수점 숫자 N을 반환함
random.uniform(0,1)

0.579827718886654

In [62]:
random.uniform(0,3)

1.6392862145598808

In [63]:
# random.randrange(start, stop, step): range 함수와 동일한 범위 내에서 특정 간격을 나타내는 리스트 중 정수 값을 반환함
random.randrange(0, 3)

2

In [64]:
random.randrange(10)

9

In [65]:
random.randrange(0, 4, 2)

2

In [66]:
# random.randint(a, b): a <= N <= b를 만족하는 임의의 정수 N을 반환함
random.randint(0, 1)

1

In [67]:
random.randint(0, 10)

3

In [68]:
# 입력 sequence에서 하나의 원소를 반환함
random.choice(['철수', '짱구', '맹구', '훈'])

'짱구'

In [69]:
# random.choices(population, weights=None, *, cum_weights=None, k=1)
# 입력 sequence에서 복원 추출로 사용자가 설정한 weights에 따라 k개 만큼 반환함
random.choices(['철수','짱구','맹구','훈'], k=2)

['철수', '철수']

In [70]:
random.choices(['철수','짱구','맹구','훈'], weights=[40,40,10,10], k=2)

['맹구', '짱구']

In [71]:
# 입력 sequence의 순서를 섞음
a = [1,2,3,4]
random.shuffle(a)
print(a)

[4, 1, 3, 2]


In [72]:
# random.sample(population, k, *, counts=None)
# 입력 sequence를 비복원 추출로 k개 만큼 추출
random.sample(['철수','짱구','맹구','훈'], k=2)

['훈', '맹구']

In [73]:
# counts는 입력 sequence 순서에 맞게 sample 수를 늘림
# 아래는 random.sample(['철수','철수','짱구','짱구','맹구','훈'], k=2) 와 같음
random.sample(['철수','짱구','맹구','훈'], counts=[2,2,1,1], k=2)

['짱구', '철수']

In [74]:
# 난수를 고정할 때 사용
random.seed(223)
random.random()

0.33210216729275965

# collections

In [75]:
import collections

In [76]:
# 입력 sequence에서 unique 원소를 찾고 각 개수를 반환함
collections.Counter(['철수','철수','짱구','짱구','맹구','훈'])

Counter({'철수': 2, '짱구': 2, '맹구': 1, '훈': 1})

In [77]:
# dictionary의 value 값의 기본값을 지정할 수 있음
temp = collections.defaultdict(list)
temp['k1'].append('v1')

In [79]:
# 기존 방식대로 하면 'k1'이라는 key가 존재하지 않았기 때문에 에러가 발생함
temp = {}
temp['k1'].append('v1')

KeyError: 'k1'

# tqdm

- 진행 상황을 표시하기 위해 사용됨

In [81]:
from tqdm.notebook import tqdm
import time

In [82]:
for i in tqdm(range(10)):
    time.sleep(1)

  0%|          | 0/10 [00:00<?, ?it/s]

In [83]:
# progress bar에 대한 description도 작성 가능
for i in tqdm(range(10), desc='Progress test'):
    time.sleep(1)

Progress test:   0%|          | 0/10 [00:00<?, ?it/s]

In [84]:
# 다중 for 문에도 사용 가능
for i in tqdm(range(3), desc='loop1'):
    for j in tqdm(range(5), desc=f'loop2 - {i}'):
        time.sleep(1)

loop1:   0%|          | 0/3 [00:00<?, ?it/s]

loop2 - 0:   0%|          | 0/5 [00:00<?, ?it/s]

loop2 - 1:   0%|          | 0/5 [00:00<?, ?it/s]

loop2 - 2:   0%|          | 0/5 [00:00<?, ?it/s]

In [85]:
# 진행이 끝난 progress bar를 없애기 위해서는 leave=False로 지정
for i in tqdm(range(3), desc='loop1'):
    for j in tqdm(range(5), desc=f'loop2 - {i}', leave=False):
        time.sleep(1)

loop1:   0%|          | 0/3 [00:00<?, ?it/s]

loop2 - 0:   0%|          | 0/5 [00:00<?, ?it/s]

loop2 - 1:   0%|          | 0/5 [00:00<?, ?it/s]

loop2 - 2:   0%|          | 0/5 [00:00<?, ?it/s]