# 模块&包

### 模块概述

Python 中的一个 `.py` 文件就是一个模块。模块包含了变量、函数、类等功能代码。通过使用模块，我们可以将特定功能的代码集中在一个文件中，提高代码的复用性和可维护性，也能避免名称冲突。

### 创建模块

创建一个模块时，我们只需编写一个 `.py` 文件。
比如，创建一个 `my_add.py` 模块来实现加法功能。
```python
# my_add.py
num = 100

def add(a, b):
    """求两个数的和"""
    return a + b
```
创建一个 `my_multi.py` 模块来实现乘法功能。
```python
# my_add.py
num = 200

def multi(a, b):
    """求两个数的和"""
    return a * b
```

模块名区分大小写，且不能与 Python 自带的标准模块重名。

### 导入模块

#### 全部导入 (`import`)

使用 `import` 导入整个模块，使用模块名.成员名的方式访问其中的内容。

In [1]:
import my_add

print(my_add.add(1, 2))
print(my_add.num)

3
100


你也可以给模块起个别名：

In [2]:
import my_add as a1

print(a1.add(1, 2))
print(a1.num)

3
100


#### 局部导入 (`from ... import ...`)

你可以只导入模块的部分成员，并直接使用成员名访问。

In [3]:
from my_add import add

print(add(1, 2))  # 可以直接使用 add，但不能访问 num

3


如果多个模块有同名的成员，后一次导入会覆盖前一次导入：

In [4]:
from my_add import add, num
from my_multi import num  # 导入另一个模块中的 num

print(add(1, 2))
print(num)  # 使用 my_multi 中的 num

3
200


也可以通过别名区分同名成员：

In [5]:
from my_add import num as a1
from my_multi import num as m1

print(a1)
print(m1)

100
200


#### 局部导入所有成员

可以使用 `from ... import *` 导入模块中所有不以单下划线 `_` 开头的成员：

In [6]:
from my_add import *

print(add(1, 2))
print(num)

3
100


#### 模块搜索顺序

当导入模块时，Python 会按以下顺序查找模块：

1. 当前目录
2. PYTHONPATH 环境变量中的目录
3. 标准 Python 模块目录

你可以通过 `sys.path` 查看当前模块搜索路径：

In [7]:
import sys
print(sys.path)

['/Users/shenjiuyang/workspace/llm-learning', '/Applications/PyCharm.app/Contents/plugins/python-ce/helpers/pydev', '/Applications/PyCharm.app/Contents/plugins/python-ce/helpers/jupyter_debug', '/opt/homebrew/Cellar/python@3.12/3.12.10/Frameworks/Python.framework/Versions/3.12/lib/python312.zip', '/opt/homebrew/Cellar/python@3.12/3.12.10/Frameworks/Python.framework/Versions/3.12/lib/python3.12', '/opt/homebrew/Cellar/python@3.12/3.12.10/Frameworks/Python.framework/Versions/3.12/lib/python3.12/lib-dynload', '', '/Users/shenjiuyang/workspace/llm-learning/.venv/lib/python3.12/site-packages']


还可以使用 `sys.path.append()` 动态添加目录：

In [8]:
import sys
sys.path.append("./..")
print(sys.path)

['/Users/shenjiuyang/workspace/llm-learning', '/Applications/PyCharm.app/Contents/plugins/python-ce/helpers/pydev', '/Applications/PyCharm.app/Contents/plugins/python-ce/helpers/jupyter_debug', '/opt/homebrew/Cellar/python@3.12/3.12.10/Frameworks/Python.framework/Versions/3.12/lib/python312.zip', '/opt/homebrew/Cellar/python@3.12/3.12.10/Frameworks/Python.framework/Versions/3.12/lib/python3.12', '/opt/homebrew/Cellar/python@3.12/3.12.10/Frameworks/Python.framework/Versions/3.12/lib/python3.12/lib-dynload', '', '/Users/shenjiuyang/workspace/llm-learning/.venv/lib/python3.12/site-packages', './..']


#### `__all__`

通过在模块中定义 `__all__`，可以控制 `from ... import *` 导入哪些内容。

```python
# my_add.py
__all__ = ["num", "add"]

num = 100
num1 = 200
_str1 = "abc"

def add(a, b):
    return a + b
```

如果 `__all__` 中没有列出某个成员，那么 `from ... import *` 时将无法访问该成员。

In [9]:
from my_add import *

print(add(1, 2))
print(num)
# print(num1)  # NameError: name 'num1' is not defined

3
100


使用 `import` 导入整个模块时，可以访问所有成员：

In [10]:
import my_add

print(my_add.add(1, 2))
print(my_add.num)
print(my_add.num1)
print(my_add._str1)

3
100
200
abc


#### `__name__`

`__name__` 是一个特殊的内置变量，用于表示当前模块的名称。若模块被直接运行，`__name__` 为 `"__main__"`；若模块被导入，`__name__` 为模块的文件名（不包含 `.py` 后缀）。

为了避免导入模块时执行测试代码，可以使用 `if __name__ == "__main__":` 保护测试代码：

```python
# my_add.py
__all__ = ["num", "add"]

num = 100
num1 = 200
_str1 = "abc"

def add(a, b):
    return a + b

if __name__ == "__main__":
    print(add(10, 20))
```

此时，只有在模块被直接运行时，`add(10, 20)` 才会被执行。

In [11]:
import my_add  # 不会执行 my_add 中的测试代码

### `dir()`

`dir()` 是一个内置函数，用于列出对象的属性和方法，或者列出当前作用域中定义的名称。

* 查看模块的内容：

In [12]:
import math
print(dir(math))

['__doc__', '__file__', '__loader__', '__name__', '__package__', '__spec__', 'acos', 'acosh', 'asin', 'asinh', 'atan', 'atan2', 'atanh', 'cbrt', 'ceil', 'comb', 'copysign', 'cos', 'cosh', 'degrees', 'dist', 'e', 'erf', 'erfc', 'exp', 'exp2', 'expm1', 'fabs', 'factorial', 'floor', 'fmod', 'frexp', 'fsum', 'gamma', 'gcd', 'hypot', 'inf', 'isclose', 'isfinite', 'isinf', 'isnan', 'isqrt', 'lcm', 'ldexp', 'lgamma', 'log', 'log10', 'log1p', 'log2', 'modf', 'nan', 'nextafter', 'perm', 'pi', 'pow', 'prod', 'radians', 'remainder', 'sin', 'sinh', 'sqrt', 'sumprod', 'tan', 'tanh', 'tau', 'trunc', 'ulp']


* 查看对象的属性和方法：

In [13]:
class MyClass:
    def __init__(self):
        self.x = 1
        self.y = 2

    def method1(self):
        pass

obj = MyClass()
print(dir(obj))

['__class__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getstate__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', 'method1', 'x', 'y']


* 查看当前作用域中定义的名称：

In [14]:
def my_function():
    pass

variable = 10
print(dir())

['In', 'MyClass', 'Out', '_', '__', '___', '__builtin__', '__builtins__', '__doc__', '__loader__', '__name__', '__package__', '__session__', '__spec__', '_dh', '_i', '_i1', '_i10', '_i11', '_i12', '_i13', '_i14', '_i2', '_i3', '_i4', '_i5', '_i6', '_i7', '_i8', '_i9', '_ih', '_ii', '_iii', '_oh', '_pydevd_bundle', 'a1', 'add', 'exit', 'get_ipython', 'm1', 'math', 'my_add', 'my_function', 'num', 'obj', 'open', 'pydev_jupyter_vars', 'quit', 'remove_imported_pydev_package', 'sys', 'variable']


### 包概述

包是管理 Python 模块命名空间的方式，它类似于文件夹。每个包目录下必须包含一个 `__init__.py` 文件，告诉 Python 该目录是一个包。包可以包含多个子模块和子包。

例如，一个音频处理的包结构可能如下：

```
sound/                 # 包
    __init__.py        # 初始化 sound 包
    formats/           # 用于文件格式转换的子包
        __init__.py
        wavread.py
        wavwrite.py
    effects/           # 用于音效的子包
        __init__.py
        echo.py
        surround.py
    filters/           # 用于滤镜的子包
        __init__.py
        equalizer.py
        vocoder.py
```

### 创建包

包的创建方式是将多个相关模块放入一个文件夹中，并确保该文件夹中包含一个 `__init__.py` 文件。

假设我们创建一个 `graphic` 包，包含 `circle.py` 和 `rectangle.py` 模块：

```python
# circle.py
radius = 10
PI = 3.1415926

def area(radius):
    return PI * radius * radius

def perimeter(radius):
    return 2 * PI * radius

# rectangle.py
rectangle_width = 10
rectangle_height = 10

def area(width, height):
    return width * height

def perimeter(width, height):
    return 2 * (width + height)
```

### 导入包

#### 全局导入 (`import`)

可以通过 `import` 导入包中的模块：

In [15]:
import graphic.circle

print(graphic.circle.area(10))  # 314.15926

314.15926


#### 局部导入模块 (`from ... import ...`)

通过 `from ... import ...` 可以导入包中的指定模块：

In [16]:
from graphic import circle

print(circle.area(10))  # 314.15926

314.15926


#### 局部导入模块的成员 (`from ... import ...`)

可以从模块中直接导入指定的成员：

In [17]:
from graphic.circle import area

print(area(10))  # 314.15926

314.15926


#### `from ... import *` 从包中导入模块

当使用 `from ... import *` 导入时，需要在 `__init__.py` 中定义 `__all__`，明确指定要导入的模块：

```python
# __init__.py
__all__ = ["circle"]
```

### 常用标准库（包）

Python 提供了许多内置标准库，涵盖操作系统、数学、网络等各个方面的功能。例如：

* `os`：操作系统接口
* `sys`：系统相关功能
* `math`：数学函数
* `random`：伪随机数
* `datetime`：日期和时间处理

### 引入第三方库

使用 `pip` 安装第三方库：

* 查看已安装的库：`pip list`
* 安装库：`pip install 包名`
* 卸载库：`pip uninstall 包名`

可以通过指定不同的镜像源加速下载：

```bash
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ 包名
```

### 打包自己的库并安装

打包自己的 Python 库并通过 `pip` 安装：

1. 安装 `setuptools`：

```bash
pip install setuptools
```

2. 创建 `setup.py` 文件：

```python
from distutils.core import setup

setup(
    name="graphic",  # 包名
    version="1.0",   # 版本
    py_modules=["graphic.circle", "graphic.rectangle"],  # 需要打包的模块
)
```

3. 构建并安装：

```bash
python setup.py install
```
