# 모듈(Module), 패키지(Package)
- 모듈: 변수, 함수 , 클래스를 모아놓은 `.py` 확장자 파일
  - `.py` 파일: 마크다운이나 셀같은 정보는 없고 순수한 파이썬 코드만 존재
  - `.ipynb`파일: 데이터 분석가(과학자)들이 파이썬 언어와 데이터로 작업하고 실험할수 있도록 도와주는 interactuve한 개발 환경에서 실행되는 파일
- 패키지: 모듈의 기능을 폴더별로 정리한 개념
    - 패키지생성: 기능별로 폴더를 정리하는것과 비슷한 개념

```python
# 모듈불러오기
import <모듈명>

# 패키지에서 모듈 불러오기
from <패키지명> import <모듈명>

# 모듈안에 함수에 클래스 불러오기
from <모듈명> import <함수 or 클래스>

# 별칭주기
import <모듈명> as <별칭>
```

# sys,os 모듈 사용해보기

In [1]:
import sys,os

In [2]:
sys.path

['/content',
 '/env/python',
 '/usr/lib/python37.zip',
 '/usr/lib/python3.7',
 '/usr/lib/python3.7/lib-dynload',
 '',
 '/usr/local/lib/python3.7/dist-packages',
 '/usr/lib/python3/dist-packages',
 '/usr/local/lib/python3.7/dist-packages/IPython/extensions',
 '/root/.ipython']

In [3]:
os.getcwd()

'/content'

In [4]:
sys.version

'3.7.13 (default, Apr 24 2022, 01:04:09) \n[GCC 7.5.0]'

- cpu 개수 확인하기

In [5]:
os.cpu_count()

2

- 폴더만들기
  - 폴더가 이미 있을 경우 에러발생

In [6]:
os.mkdir("data")

In [7]:
os.mkdir("/content/data/files")

- 폴더 또는 파일명 변경하기

In [8]:
os.rename("data","data2")

- 폴더 삭제하기

In [9]:
os.rmdir("data2/files")

- 폴더 존재 여부확인

In [10]:
os.path.isdir("data1") , os.path.isdir("data2")

(False, True)

- 파일 존재 여부 확인

In [11]:
os.path.isfile("demo.py")

False

- 파일 및 폴더 존재 여부 확인

In [12]:
os.path.exists("data2") , os.path.exists("demo.py")

(True, False)

- 파일 삭제하기

In [13]:
os.remove("demo.py")

FileNotFoundError: ignored

# random 모듈 사용해보기

In [None]:
import random

- random 함수
 - 0~1 사이에 랜덤한 실수를 반환한다.

In [None]:
random.random()

- uniform함수
  - 두개의 숫자 사이의 랜덤함 실수를 반환한다.

In [None]:
random.uniform(1,10)

- randint 함수
  - 2개의 숫자사이의 랜덤한 정수를 반환한다.

In [None]:
random.randint(0,999999)

- randrange 함수
  - start,stop,step 으로 만들어지는 정수 중에 랜덤값을 반환한다.

In [None]:
random.randrange(1,9,2)

- choice 함수
  - 시퀀스 자료형에서 랜덤하게 하나의 요소를 선택해서 반환한다.

In [None]:
lst = [1,2,3,4,5,6]
random.choice(lst)

- sample 함수
  - 시퀀스 자료형에서 랜덤하게 두번째 인수의 개수로 선택해서 반환

In [None]:
lst = [1,2,3,4,5,6]
random.sample(lst,4)

- shuffle 함수
  - 요소의 순서를 램덤하게 변경한다.

In [None]:
lst =[1,2,3,4,5,6]
random.shuffle(lst) # 원본을 변경한다.
lst

In [None]:
random.seed(42)
lst = [1,2,3,4,5,6,]
random.shuffle(lst)
lst

# collections 모듈
- 파이선의 내장 자료 구조
- 기존 자료구조를 확장하여 제작된 파이썬 내장모듈

# deque

In [None]:
from collactions import deque

In [None]:
dq.append(100)
dq

- 디큐 객체 생성시 장족 가늫한 객체를 인자로 넣러고

- lotate
    -  여

In [None]:
[:]tmp[:] # 슬라이싱은 지원안된다.

- 속도 비교해 봅시다.

In [None]:
%%timeit
dq = deque()
for i in range(1000000):
    dq.append(i)

In [None]:
%%timeit
lst = []
for i in range(1000000):
    dq.append(i)

## defaultdict
- 딕셔너리의 단점으로 없는 key 접근시 에러가 발생하는 단점을 보완
- 딕셔너리에 없는 key에 접근시 지정한 기본값을 이용하여 key, value 를 생성

In [None]:
d = {}
d["key1"]

In [None]:
from collections import defaultdict

default_dict = defaultdict(lambda:0)
default_dict["key1"]

# defaultdict 활용방법

In [None]:
tup_list = [
    ("경제","10시 경제기사"),
    ("정치","10시 경제기사"),
    ("사회","10시 경제기사"),
    ("경제","14시 경제기사"),
    ("정치","15시 경제기사"),
]

news_dict = {}
for k,v in tup_list:
    if news_dict.get(k) is None:
        news_dict[k] = []
    news_dict[k].append(v)
news_dict

In [None]:
news_dict = defaultdict(list)
for k,v in tup_list:
    news_dict[k].append(v)
news_dict


## OrderedDict
- 순서를 가진 딕셔너리 객체
- key, value 생성한 순서대로 저장된다.

In [None]:
from collections import OrderedDict
order_dict = OrderedDict()
order_dict ["사과"] = 200
order_dict ["딸기"] = 100
order_dict ["포도"] = 500

for k,v in order_dict.items():
    print(k,v)

## Counter
- 시쿠너스 자료형의 데이터의 값의 개수를 딕셔너리 형태로 변환

In [None]:
from collections import Counter
Counter("aaabbc")

In [None]:
Counter = Counter({"사과":3,"포도":2,"딸기":1,"참외":4})
Counter

- most_common
    - value 를 기준으로 내림차순 정렬하여 key,value 를 튜플에 담고 반환

In [None]:
Counter.most_common()

# elements
    - value의 갯수만큼key를 반복할수있는 객체 반환

In [None]:
for i in Counter.elements()

# 파이썬 속도 향상팁
- 단순하게 반복해서 데이터를 담아야하는 경우

In [None]:
# bad
lst =[]
for i in range(1,1000):
    if i % 2 == 0:
        lst.append(i)

In [None]:
# good
lst = [i for i in range(1,1000) if i % 2 == 0]

- 여러개의 변수를 초기화 할때 ...

In [None]:
# bad
a = None
b = 0
c = ""

In [None]:
#good
a,b,c, = None,0,""

- 컬랙션에 있는 문자열을 연결할때

In [None]:
#bad
lst = [
    ("A반","90점"),
    ("B반","88점"),
    ("C반","95점")
]
for s1,s2 in lst:
    print(f'{s1},{s2}')

In [None]:
#good
for s in lst:
    print(" ".join(s))

- 함수 호출은 컴퓨팅 비용이 많이 든다.

In [None]:
#bad
%%timeit
def square(n):
    return n**2
square_list = []
for i in range(1000000):
    square_list.append(square(i))

In [None]:
#good
%%timeit
def square():
    square_list = []
    for i in range(1000000):
        square_list.append(i**2)
    return square_list
square()

- 모듈을 불러올때

In [None]:
# bad
import collections
Counter = collections.Counter()
Counter

In [None]:
#good
from collections import Counter
Counter = Counter()
Counter