# Bài 15: Modules & Packages

## 1. Modules

### 1.1. Tại sao dùng module?
- Chương trình lớn nên được tách ra thành những phần nhỏ hơn (modules) để dễ quản lý, debug, và maintain *(divide & conquer)*
- Nhiều hàm tiện ích có thể dùng đi dùng lại cho nhiều chương trình khác nhau nên được đóng thành một module khi nào cần thì có thể "import" để dùng mà không cần copy/paste code *(code reuse)*

### 1.2. Tổng quan
- Bất kỳ file `.py` hợp lệ nào đều là một Python module.
- Tên module là tên file `.py`. VD: `weather.py` thì tên module là `weather`.
- Tên module phải tuân theo quy tắc đặt tên biến (chỉ chứa chữ cái, chữ số, `_` và không được bắt đầu bởi chữ số).
- Thường module là một collectuon chứa định nghĩa các biến và hàm liên quan đến một tác vụ nào đó.
- Module có thể import các module khác.

### 1.3. Phân loại
- Standard Library (built-in): các modules có sẵn khi cài Python. VD: `os, math, random, statistics, ...`
- Community: các modules được cộng đồng phát triển. VD: `pandas, numpy, sklearn, ...`
- User-define: các modules do lập trình viên tự viết.

### 1.4. Import built-in và community modules

#### Cách 1: import dùng tên module

In [None]:
# Import
import math

In [None]:
# Sử dụng
print(math.pi)
print(math.sqrt(25))

#### Cách 2: Import module dưới một tên khác (alias)

In [None]:
# Import
import numpy as np

In [None]:
# Sử dụng
a = np.array([1, 2, 5])
print(a ** 2)
print(np.sqrt(a))

#### Lưu ý: 

- Import bằng cách này thì tên numpy không khả dụng 
- Vì vậy không thể gọi numpy.array hay numpy.sqrt

#### Cách 3 (không khuyến khích): import cụ thể biến, hàm trong module
- Tăng rủi ro name clashing (namespace pollution)

In [None]:
# Import
from numpy import array, sqrt, abs

In [None]:
a = array([1, 2, -5])
b = abs(a)

In [None]:
print(a)
print(b)
print(sqrt(b))

#### Không khuyến khích cách này vì:
- Không tường minh
    - Người dùng khó keep track được các tên như array, sqrt, abs từ đâu ra
    - Nếu dùng dùng np.array, np.sqrt người dùng biết ngay là từ module numpy.

- Tăng nguy cơ đụng độ tên (name collision)
    - Trong VD trên, tên abs của gói numpy trùng với hàm abs có sẵn của Python. Hoặc trong trường hợp khác, numpy và math đều có hàm tên sqrt.
    - Mặc dù Python có thể tự resolve trong một số trường hợp dựa vào context, nhưng có những trường hợp không thể.
    - Ngoài ra, điều này cũng làm tăng nguy cơ người dùng sử dụng nhầm.

#### Cách 4 (càng không khuyến khích): Import tất cả các tên trong module

In [None]:
# Import
from math import *

In [None]:
# Sử dụng
print(sin(0))
print(cos(0))

### 1.5. Import user-defined modules
- Hoàn toàn tương tự như 1.4
- Tên module là tên file `.py` (không kèm đuôi `.py`)
- Trước khi import phải insert đường dẫn đến thư mục chứa module vào search path (dùng `sys.path.insert`)

Tạo một file hello.py trong thư mục gốc (VD: `C:/Users/tue/Desktop/pycourse`) với nội dung như sau:

```python
greetings = "Hello user!"

def say_hi(name):
    print("Hi {}".format(n
```

#### Trường hợp 1: 

Nếu notebook và file .py cùng thư mục -> chỉ cần import

In [None]:
# Import (1)
import hello

# Import (2)
import hello as hi

In [None]:
# Sử dụng (1)
print(hello.greetings)
hello.say_hi("Obama")

In [None]:
# Sử dụng  (2)
print(hi.greetings)
hi.say_hi("Obama")

#### Trường hợp 2:

Note book và file .py khác thư mục -> trước hết phải chèn đường dẫn đến thư mục vào search path để Python có thể định vị được file .py

In [None]:
# Insert path first
import sys
sys.path.insert(0, "C:/Users/tue/Desktop/pycourse")

In [None]:
# Import (1)
import hello

# Import (2)
import hello as hi2

In [None]:
# Sử dụng (1)
print(hello.greetings)
hello.say_hi("Obama")

In [None]:
# Sử dụng (2)
print(hi2.greetings)
hi.say_hi("Obama")

### 1.6. Reload một module
- Mặc định Python chỉ load module 1 lần cho mỗi session ở lần import đầu tiên.
- Lý do: hành động import khá costly nên Python ko import lại.
- Nếu user sửa code trong file `.py` và run lại câu lệnh import thì sẽ không có tác dụng.
- Muốn thay đổi được take effect thì cần reload lại module

In [None]:
# Sửa lại nội dung file hello.py
# Thêm hàm add() như sau
def add(a, b):
    return a + b

In [None]:
# Try to reimport
import hello

In [None]:
# Try to use add (error)
hello.add(1, 2)

In [None]:
# Reload
import imp
imp.reload(hello)

In [None]:
# Try to use add (OK)
hello.add(1, 2)

Notes: 

1. Reload chỉ áp dụng được những đối tượng được import theo tên, VD:
```python
import hello
import hello as hi
import imp
imp.reload(hello)
imp.reload(hi)
```

2. Reload không áp dụng được cho trường hợp import *
```python
from hello import *
```

## 2. Packages

### 2.1. Tổng quan
- Nhiều file `.py` đặt chung trong một thư mục tạo thành package.
- Các file `.py` có thể nằm trong các thư mục con tạo thành subpackages.
- Ví dụ về cấu trúc của một package:

```
sound/                          Top-level package
      __init__.py               Initialize the sound package
      formats/                  Subpackage for file format conversions
              __init__.py
              wavread.py
              wavwrite.py
              aiffread.py
              aiffwrite.py
              auread.py
              auwrite.py
              ...
      effects/                  Subpackage for sound effects
              __init__.py
              echo.py
              surround.py
              reverse.py
              ...
      filters/                  Subpackage for filters
              __init__.py
              equalizer.py
              vocoder.py
              karaoke.py
              ...
```

### 2.1. Import modules trong package

#### Cách 1:
```python
# Import
import sound.effects.echo


# Sử dụng
sound.effects.echo.echofilter(input, output, delay=0.7, atten=4)
```

#### Cách 2: 
```python
# Import
from sound.effects import echo

# Sử dụng
echo.echofilter(input, output, delay=0.7, atten=4)
```

#### Cách 3:
```python
# Import
from sound.effects.echo import echofilter

# Sử dụng
echofilter(input, output, delay=0.7, atten=4)
```