# 모듈(Module), 패키지(Package)
- 모듈 : 변수, 함수, 클래스를 모아놓은 `.py` 확장자 파일
  - `.py` 파일 : 마크다운이나 셀 같은 정보는 없고, 순수한 파이썬 코드만 존재
  - `.ipynb` 파일 : 데이터 분석가들이 파이썬 언어와 데이터로 작업하고 실험할수 있도록 도와주는 Interactive 한 계산 환경(Jupyter Notebook 환경에서 실행되는 파일)
- 패키지 : 모듈의 기능을 디렉토리(폴더) 별로 정리해 놓은 개념
    - 모듈을 모아놓은 폴더, 라이브러리라고 부르기도함.
    - 엄밀히 말하면 라이브러리는 패키지의 집합으로 패키지보다 큰 개념
    - 패키지 생성: 디렉토리(폴더)를 만든 것과 비슷한 작업

```python
# 모듈 불러오기
import <모듈명>

# 패키지에서 모듈 불러오기
from <패키지명> import <모듈명>

# 모듈에서 안에 함수 혹은 클래스 불러오기
from <모듈명> import <함수 or 클래스>

# 별칭 주기
import <모듈명> as <별칭>

# 패키지 안에 패키지가 있고 그안에 모듈이 있는경우
from <상위패키지.하위패키지> import <모듈명>
```

In [1]:
from mypkg.agg import get_std

안녕


In [2]:
get_std([1,2,3,4,5,6])

1.707825127659933

In [3]:
from mypkg import prep

In [4]:
prep.MinMaxScaler([1,2,3])

<mypkg.prep.MinMaxScaler at 0x245b4edc730>

In [5]:
from mypkg.prep import MinMaxScaler, StandardScaler

In [6]:
MinMaxScaler([1,2,3])

<mypkg.prep.MinMaxScaler at 0x245b4edca60>

In [7]:
import mypkg.prep as mp

In [8]:
scaler = mp.MinMaxScaler([1,2,3])
scaler.fit_transform()

[0.0, 0.5, 1.0]

In [9]:
import mypkg

In [10]:
mypkg.agg # __init__.py 로 모듈 호출해야 사용가능

<module 'mypkg.agg' from 'c:\\practice\\01_python_basic\\mypkg\\agg.py'>

# `sys`, `os` 모듈 사용해보기

In [11]:
import sys, os

In [12]:
sys.path

['c:\\Users\\kwon3\\AppData\\Local\\Programs\\Python\\Python310\\python310.zip',
 'c:\\Users\\kwon3\\AppData\\Local\\Programs\\Python\\Python310\\DLLs',
 'c:\\Users\\kwon3\\AppData\\Local\\Programs\\Python\\Python310\\lib',
 'c:\\Users\\kwon3\\AppData\\Local\\Programs\\Python\\Python310',
 '',
 'C:\\Users\\kwon3\\AppData\\Roaming\\Python\\Python310\\site-packages',
 'C:\\Users\\kwon3\\AppData\\Roaming\\Python\\Python310\\site-packages\\win32',
 'C:\\Users\\kwon3\\AppData\\Roaming\\Python\\Python310\\site-packages\\win32\\lib',
 'C:\\Users\\kwon3\\AppData\\Roaming\\Python\\Python310\\site-packages\\Pythonwin',
 'c:\\Users\\kwon3\\AppData\\Local\\Programs\\Python\\Python310\\lib\\site-packages']

- 버전 확인하기

In [13]:
sys.version

'3.10.8 (tags/v3.10.8:aaaf517, Oct 11 2022, 16:50:30) [MSC v.1933 64 bit (AMD64)]'

- cpu 코어 개수 확인하기

In [14]:
os.cpu_count()

12

- 폴더 만들기

In [15]:
os.mkdir("data")

FileExistsError: [WinError 183] 파일이 이미 있으므로 만들 수 없습니다: 'data'

- 폴더명과 파일명 변경하기

In [7]:
os.rename("data", "data1")

- 폴더 삭제!!!

In [8]:
os.rmdir("data1")

- 폴더 존재 여부 확인

In [9]:
os.path.isdir("data1")

False

- 파일 존재 여부 확인

In [16]:
os.path.isfile("메모.txt")

True

- 폴더 및 파일 존재 여부 확인

In [17]:
os.path.exists("메모.txt")

True

- 파일 삭제하기

In [12]:
os.remove("메모.txt")

FileNotFoundError: [WinError 2] 지정된 파일을 찾을 수 없습니다: '메모.txt'

# random 모듈 사용

In [13]:
import random

- random 함수
    - 0 ~ 1 사이에 랜덤한 실수를 반환

In [18]:
random.random()

0.3283427675536056

- uniform 함수
    - 2개의 숫자 사이의 랜덤한 실수를 반환

In [22]:
random.uniform(1,10)

8.925862642005548

- randint 함수
    - 2개의 숫자 사이의 랜덤한 정수를 반환

In [27]:
random.randint(1,10)

1

In [32]:
random.randrange(1,10,2)

3

- choice 함수
    - 전달 받은 자료에서 랜덤하게 요소를 추출 해줌.

In [38]:
lst = [1,2,3,4,5,6]
random.choice(lst)

3

- shuffle 함수
    - 전달받은 수정가능한 객체를 섞는다.

In [39]:
lst = [1,2,3,4,5,6]
random.seed(42)
random.shuffle(lst)
lst

[4, 2, 3, 5, 1, 6]

# collections 모듈
- 파이썬의 내장모듈의 자료구조
- 기존 자료구조를 확장하여 제작된 파이썬 내장 모듈

## deque

In [40]:
from collections import deque

In [41]:
dq = deque() # 덱 객체가 반환
dq

deque([])

- append 메서드
    - 전달된 인수를 뒤에 추가

In [50]:
dq.append(100)
dq

deque([100])

- appendleft 메서드
    - 전달된 인수를 앞에 추가

In [51]:
dq.appendleft(300)
dq

deque([300, 100])

In [52]:
dq = deque(range(10)) # 반복가능한 객체를 전달하면 dq 객체로 반환해준다!!
dq

deque([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

- rotate 메서드
    - 전달된 인수 만큼 회전한다.
    - 양수를 전달하면 오른쪽 방향으로 회전
    - 음수를 전달하면 왼쪽 방향으로 회전

In [53]:
dq.rotate(2)

In [54]:
dq

deque([8, 9, 0, 1, 2, 3, 4, 5, 6, 7])

In [55]:
dq.rotate(-1)
dq

deque([9, 0, 1, 2, 3, 4, 5, 6, 7, 8])

In [56]:
dq[5]

4

In [57]:
# dq[:] # 슬라이싱 안됨

```
dq 객체는 메모리를 효율적으로 사용하고, 속도가 빠르다라고 파이썬에서 소개
```

In [58]:
%%timeit
dq = deque()
for i in range(1000000):
    dq.append(i)

39.9 ms ± 1.32 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [59]:
%%timeit
lst = []
for i in range(1000000):
    lst.append(i)

47.6 ms ± 2.23 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [60]:
%%timeit
lst = [i for i in range(1000000)]

37.2 ms ± 2.12 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


## defaultdict

In [61]:
from collections import defaultdict

In [62]:
dd = defaultdict(lambda : 0)
dd

defaultdict(<function __main__.<lambda>()>, {})

In [63]:
dd["key1"]

0

In [64]:
dd

defaultdict(<function __main__.<lambda>()>, {'key1': 0})

In [65]:
tup_list = [
    ("경제", "10시 기사내용"),
    ("정치", "10시 기사내용"),
    ("사회", "10시 기사내용"),
    ("정치", "14시 기사내용"),
    ("사회", "15시 기사내용"),
]
d = {}
for k, v in tup_list:
    if d.get(k) is None:
        d[k] = []
    d[k].append(v)

In [66]:
dd = defaultdict(list)
for k,v in tup_list:
    dd[k].append(v)
dd

defaultdict(list,
            {'경제': ['10시 기사내용'],
             '정치': ['10시 기사내용', '14시 기사내용'],
             '사회': ['10시 기사내용', '15시 기사내용']})

In [19]:
from collections import OrderedDict
od = OrderedDict()
od["사과"] = 2000
od["딸기"] = 5000

od

OrderedDict([('사과', 2000), ('딸기', 5000)])

## Counter

In [22]:
from collections import Counter

Counter("aaabbc")

Counter({'a': 3, 'b': 2, 'c': 1})

In [25]:
d = {
    "딸기" : 5,
    "사과" : 3,
    "포도" : 10,
    "참외" : 4
}
counter = Counter(d)
counter

Counter({'포도': 10, '딸기': 5, '참외': 4, '사과': 3})

In [26]:
counter.most_common() # 리스트 반환

[('포도', 10), ('딸기', 5), ('참외', 4), ('사과', 3)]

In [27]:
counter.most_common(2) # 필요한만큼 반환 가능

[('포도', 10), ('딸기', 5)]

In [28]:
list(counter.elements())

['딸기',
 '딸기',
 '딸기',
 '딸기',
 '딸기',
 '사과',
 '사과',
 '사과',
 '포도',
 '포도',
 '포도',
 '포도',
 '포도',
 '포도',
 '포도',
 '포도',
 '포도',
 '포도',
 '참외',
 '참외',
 '참외',
 '참외']

# 파이썬 속도 향상을 위한 팁

- 단순하게 반복해서 데이터를 담아야 하는 경우

In [29]:
# bad
lst = []
for i in range(1,1000):
    if i % 2 == 0:
        lst.append(i)

In [30]:
# good
lst = [ i for i in range(1,1000) if i % 2 == 0]

- 여러개의 변수들 초기화 해야 할 때

In [31]:
# bad
a = None
b = 0
c = ""

In [32]:
# good
a, b, c = None, 0, "" # 튜플로 만들어서 선언

- 컬렉션에 있는 문자열 단순하게 연결할 때

In [33]:
# bad
lst = [
    ("A반", "90점"),
    ("B반", "80점"),
    ("C반", "70점"),
]
for s1, s2 in lst:
    print(f"{s1} {s2}")

A반 90점
B반 80점
C반 70점


In [34]:
# good
for s in lst:
    print(*s)
    # print( " ".join(s)  )

A반 90점
B반 80점
C반 70점


- 함수 호출은 컴퓨팅 비용이 많이 든다.

In [35]:
%%timeit
def square(n):
    return n**2

lst = []
for i in range(1000000):
    lst.append(square(i))

247 ms ± 5.07 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [36]:
%%timeit
def square():
    lst = []
    for i in range(1000000):
        lst.append(i**2)
    return lst
lst = square()

215 ms ± 3.15 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


- 모듈을 불러 올때

In [37]:
#bad
import collections

In [38]:
counter = collections.Counter()

In [39]:
# good
from collections import Counter

In [40]:
counter = Counter()