# Python 模块与包学习指南

## 目录
1. [模块与包的概念](#模块与包的概念)
2. [import导入模块](#import导入模块)
3. [标准库的使用](#标准库的使用)
4. [第三方库的使用](#第三方库的使用)
5. [自定义模块的创建](#自定义模块的创建)
6. [自定义包的创建](#自定义包的创建)
7. [模块搜索路径](#模块搜索路径)
8. [实践练习](#实践练习)


## 模块与包的概念

### 模块（Module）
- **模块**是包含Python代码的文件，通常以`.py`为扩展名
- 模块可以包含函数、类、变量等
- 模块可以被其他程序导入和重用

### 包（Package）
- **包**是包含多个模块的目录
- 包必须包含一个`__init__.py`文件（Python 3.3+可以省略，但建议保留）
- 包可以组织相关的模块，形成层次结构

### 模块与包的关系
```
包（Package）
  ├── __init__.py
  ├── 模块1.py
  ├── 模块2.py
  └── 子包（Subpackage）
      ├── __init__.py
      └── 模块3.py
```


## import导入模块

Python提供了多种导入模块的方式，每种方式都有其适用场景。


### 1. 基本导入：import 模块名

使用`import`关键字导入整个模块，使用时需要通过模块名访问其中的内容。


In [None]:
# 导入标准库模块math
import math

# 使用模块中的函数，需要通过模块名.函数名的方式访问
print(f"圆周率: {math.pi}")
print(f"2的平方根: {math.sqrt(2)}")
print(f"10的对数: {math.log10(10)}")


### 2. 导入并重命名：import 模块名 as 别名

使用`as`关键字可以为模块指定别名，简化代码或避免命名冲突。


In [None]:
# 导入模块并指定别名
import datetime as dt
import pandas as pd

# 使用别名访问模块内容
now = dt.datetime.now()
print(f"当前时间: {now}")

# pandas通常使用pd作为别名
# pd.DataFrame() 比 pandas.DataFrame() 更简洁


### 3. 从模块导入特定内容：from 模块名 import 函数/类/变量

只导入模块中的特定内容，可以直接使用，无需模块名前缀。


In [None]:
# 从math模块导入特定的函数和常量
from math import sqrt, pi, sin

# 直接使用，无需math.前缀
print(f"圆周率: {pi}")
print(f"16的平方根: {sqrt(16)}")
print(f"90度的正弦值: {sin(pi/2)}")


### 4. 导入多个内容：from 模块名 import 内容1, 内容2, ...

可以一次导入模块中的多个内容。


In [None]:
# 从os模块导入多个函数
from os import getcwd, listdir, path

# 直接使用导入的函数
current_dir = getcwd()
print(f"当前目录: {current_dir}")

# 注意：path是os.path模块，需要os.path.join()这样使用
# 或者使用 from os.path import join


### 5. 导入所有内容：from 模块名 import *

使用`*`可以导入模块中的所有公共内容（不以下划线开头的），但不推荐使用，因为可能导致命名冲突。


In [None]:
# 从math模块导入所有内容（不推荐）
from math import *

# 可以直接使用所有函数和常量，无需前缀
print(f"圆周率: {pi}")
print(f"e的近似值: {e}")
print(f"2的平方根: {sqrt(2)}")
print(f"90度的余弦值: {cos(pi/2)}")

# 注意：这种方式可能导致命名冲突，应谨慎使用


### 6. 导入子模块：from 包名 import 模块名

从包中导入特定的子模块。


In [None]:
# 从urllib包导入request子模块
from urllib import request

# 使用子模块中的功能
# request.urlopen() 用于打开URL
print("已导入urllib.request模块")


### 7. 相对导入（在包内部使用）

在包内部的模块中，可以使用相对导入来导入同一包内的其他模块。


In [None]:
# 相对导入示例（需要在包内部使用）
# 假设在 mypackage/module1.py 中：
# from . import module2        # 导入同级模块
# from .module2 import func    # 从同级模块导入函数
# from .. import parent_module # 导入父级包中的模块
# from ..subpackage import module3  # 导入兄弟子包中的模块

print("相对导入需要在包内部的模块文件中使用")
print("单个点(.)表示当前包，两个点(..)表示父级包")


## 标准库的使用

Python标准库是随Python安装自带的库集合，无需额外安装即可使用。


### 常用标准库模块示例


In [None]:
# 1. os模块 - 操作系统接口
import os

# 获取当前工作目录
print(f"当前目录: {os.getcwd()}")

# 获取环境变量
print(f"Python路径: {os.environ.get('PATH', '未找到')[:50]}...")


In [None]:
# 2. sys模块 - 系统相关参数和函数
import sys

# 获取Python版本
print(f"Python版本: {sys.version}")

# 获取模块搜索路径
print(f"模块搜索路径数量: {len(sys.path)}")
print(f"第一个搜索路径: {sys.path[0]}")


In [None]:
# 3. datetime模块 - 日期和时间处理
from datetime import datetime, timedelta

# 获取当前时间
now = datetime.now()
print(f"当前时间: {now}")

# 格式化时间
print(f"格式化时间: {now.strftime('%Y-%m-%d %H:%M:%S')}")

# 时间计算
tomorrow = now + timedelta(days=1)
print(f"明天此时: {tomorrow}")


In [None]:
# 4. json模块 - JSON数据处理
import json

# 将Python对象转换为JSON字符串
data = {
    "name": "Python",
    "version": "3.9",
    "features": ["简单", "易学", "强大"]
}
json_str = json.dumps(data, ensure_ascii=False, indent=2)
print("JSON字符串:")
print(json_str)

# 将JSON字符串转换为Python对象
parsed_data = json.loads(json_str)
print(f"\n解析后的数据: {parsed_data}")


In [None]:
# 5. random模块 - 随机数生成
import random

# 生成随机整数
print(f"随机整数(1-100): {random.randint(1, 100)}")

# 生成随机浮点数
print(f"随机浮点数(0-1): {random.random()}")

# 从列表中随机选择
fruits = ["苹果", "香蕉", "橙子", "葡萄"]
print(f"随机水果: {random.choice(fruits)}")


In [None]:
# 6. collections模块 - 特殊容器数据类型
from collections import Counter, defaultdict

# Counter - 计数器
words = ["apple", "banana", "apple", "orange", "banana", "apple"]
counter = Counter(words)
print(f"单词计数: {counter}")
print(f"apple出现次数: {counter['apple']}")

# defaultdict - 带默认值的字典
dd = defaultdict(int)
dd["a"] += 1
dd["b"] += 2
print(f"defaultdict: {dict(dd)}")


## 第三方库的使用

第三方库需要通过`pip`等包管理工具安装后才能使用。


### 安装第三方库

使用`pip`命令安装第三方库：
```bash
pip install 库名
```

例如：
```bash
pip install requests
pip install pandas
pip install numpy
```


In [None]:
# 示例：使用第三方库requests（如果已安装）
# 如果未安装，运行: pip install requests

try:
    import requests
    
    # 发送HTTP GET请求
    response = requests.get("https://www.python.org", timeout=5)
    print(f"请求状态码: {response.status_code}")
    print(f"响应内容长度: {len(response.text)} 字符")
except ImportError:
    print("requests库未安装，请运行: pip install requests")
except Exception as e:
    print(f"请求出错: {e}")


In [None]:
# 检查库是否已安装
import sys

def check_module(module_name):
    """检查模块是否已安装"""
    if module_name in sys.modules:
        return True
    try:
        __import__(module_name)
        return True
    except ImportError:
        return False

# 检查常用第三方库
modules = ["requests", "pandas", "numpy", "matplotlib"]
for module in modules:
    status = "已安装" if check_module(module) else "未安装"
    print(f"{module}: {status}")


### 查看已安装的库

使用`pip list`查看所有已安装的包，或使用`pip show 库名`查看特定库的信息。


In [None]:
# 在Python中查看已安装的包（需要pip模块）
try:
    import pkg_resources
    
    # 获取所有已安装的包
    installed_packages = [d.project_name for d in pkg_resources.working_set]
    print(f"已安装的包数量: {len(installed_packages)}")
    print("\n部分已安装的包:")
    for pkg in sorted(installed_packages)[:10]:  # 显示前10个
        print(f"  - {pkg}")
except ImportError:
    print("无法获取已安装包列表")
    print("可以在命令行运行: pip list")


## 自定义模块的创建

创建自定义模块就是创建一个包含Python代码的`.py`文件。


### 创建简单的模块

创建一个包含函数和变量的模块文件。


In [None]:
# 示例：创建一个简单的模块文件 mymath.py
# 在实际项目中，你需要创建一个独立的 .py 文件

# 以下是 mymath.py 的内容示例：
mymath_code = '''
# mymath.py - 自定义数学模块

# 定义常量
PI = 3.14159
E = 2.71828

# 定义函数
def add(a, b):
    """加法函数"""
    return a + b

def multiply(a, b):
    """乘法函数"""
    return a * b

def circle_area(radius):
    """计算圆的面积"""
    return PI * radius ** 2

def power(base, exponent):
    """计算幂"""
    return base ** exponent
'''

print("模块代码示例:")
print(mymath_code)


In [None]:
# 在实际使用中，如果mymath.py在当前目录，可以这样导入：
# import mymath
# 
# 或者：
# from mymath import add, multiply, PI

# 这里演示如何动态创建和使用模块
import types

# 创建一个模块对象
mymath = types.ModuleType('mymath')

# 在模块中定义内容
mymath.PI = 3.14159
mymath.E = 2.71828

def add(a, b):
    return a + b

def multiply(a, b):
    return a * b

mymath.add = add
mymath.multiply = multiply

# 使用模块
print(f"PI的值: {mymath.PI}")
print(f"3 + 5 = {mymath.add(3, 5)}")
print(f"3 * 5 = {mymath.multiply(3, 5)}")


### 模块的__name__属性

当模块被直接运行时，`__name__`为`'__main__'`；当被导入时，`__name__`为模块名。


In [None]:
# 演示__name__属性的用法
# 在模块文件中可以这样写：

example_code = '''
# mymodule.py

def hello():
    print("Hello from mymodule!")

# 当模块被直接运行时执行
if __name__ == '__main__':
    print("模块被直接运行")
    hello()
else:
    print("模块被导入")
'''

print("当前模块的__name__:", __name__)
print("\n示例代码:")
print(example_code)


### 模块的__all__属性

`__all__`定义了使用`from module import *`时导入的内容。


In [None]:
# __all__属性示例
# 在模块文件中定义：

example_all = '''
# mymodule.py

# 定义__all__，控制from module import *的行为
__all__ = ['public_function', 'PUBLIC_CONSTANT']

def public_function():
    """公共函数"""
    return "这是公共函数"

def _private_function():
    """私有函数（以下划线开头）"""
    return "这是私有函数"

PUBLIC_CONSTANT = 100
_private_constant = 200
'''

print("__all__属性示例:")
print(example_all)
print("\n说明：")
print("- 使用 from mymodule import * 时，只会导入__all__中列出的内容")
print("- 以下划线开头的名称被视为私有，通常不导出")


## 自定义包的创建

包是包含多个模块的目录，必须包含`__init__.py`文件。


### 创建简单的包结构

创建一个包含多个模块的包。


In [None]:
# 包的目录结构示例：
package_structure = '''
mypackage/              # 包目录
    __init__.py         # 包的初始化文件（必需）
    module1.py          # 模块1
    module2.py          # 模块2
    utils.py            # 工具模块
'''

print("包的结构示例:")
print(package_structure)


In [None]:
# __init__.py 文件示例
init_py_code = '''
# mypackage/__init__.py

# 可以导入包中的模块，使其更容易访问
from .module1 import function1
from .module2 import function2

# 定义包的版本
__version__ = "1.0.0"

# 定义包的作者
__author__ = "Your Name"

# 可以定义__all__来控制from package import *
__all__ = ['function1', 'function2', '__version__']
'''

print("__init__.py 文件示例:")
print(init_py_code)


In [None]:
# 模块文件示例
module1_code = '''
# mypackage/module1.py

def function1():
    """模块1的函数"""
    return "这是模块1的函数"

def helper_function():
    """辅助函数（不导出）"""
    return "辅助函数"
'''

module2_code = '''
# mypackage/module2.py

def function2():
    """模块2的函数"""
    return "这是模块2的函数"

class MyClass:
    """模块2的类"""
    def __init__(self, value):
        self.value = value
    
    def get_value(self):
        return self.value
'''

print("模块1示例:")
print(module1_code)
print("\n模块2示例:")
print(module2_code)


### 包的导入方式

创建包后，可以通过多种方式导入包中的内容。


In [None]:
# 包的导入方式示例（假设mypackage已创建）

import_examples = '''
# 方式1：导入整个包
import mypackage
mypackage.function1()

# 方式2：从包导入模块
from mypackage import module1
module1.function1()

# 方式3：从包导入特定函数
from mypackage.module1 import function1
function1()

# 方式4：从包的__init__.py导入（如果已定义）
from mypackage import function1, function2
function1()
function2()

# 方式5：导入包中的类
from mypackage.module2 import MyClass
obj = MyClass(10)
'''

print("包的导入方式示例:")
print(import_examples)


### 创建带子包的包结构

包可以包含子包，形成层次结构。


In [None]:
# 带子包的包结构示例
subpackage_structure = '''
mypackage/                  # 主包
    __init__.py
    module1.py
    module2.py
    subpackage1/            # 子包1
        __init__.py
        module3.py
    subpackage2/            # 子包2
        __init__.py
        module4.py
        utils.py
'''

print("带子包的包结构:")
print(subpackage_structure)


In [None]:
# 子包的导入示例
subpackage_import = '''
# 导入子包中的模块
from mypackage.subpackage1 import module3
from mypackage.subpackage2.module4 import some_function

# 或者
import mypackage.subpackage1.module3
import mypackage.subpackage2.module4
'''

print("子包的导入示例:")
print(subpackage_import)


## 模块搜索路径

Python在导入模块时会按照特定顺序搜索模块的位置。


In [None]:
# 查看模块搜索路径
import sys

print("Python模块搜索路径（按顺序）:")
for i, path in enumerate(sys.path, 1):
    print(f"{i}. {path}")


### 模块搜索顺序

1. **当前脚本所在目录**
2. **PYTHONPATH环境变量指定的目录**
3. **Python标准库目录**
4. **site-packages目录**（第三方库安装位置）


In [None]:
# 添加自定义路径到模块搜索路径
import sys
import os

# 添加当前目录的某个子目录到搜索路径
custom_path = os.path.join(os.getcwd(), "mypackages")
if os.path.exists(custom_path):
    sys.path.insert(0, custom_path)
    print(f"已添加路径: {custom_path}")
else:
    print(f"路径不存在: {custom_path}")
    print("可以使用 sys.path.append() 或 sys.path.insert() 添加路径")


### 查看已导入的模块

使用`sys.modules`可以查看所有已导入的模块。


In [None]:
# 查看已导入的模块
import sys

# sys.modules是一个字典，包含所有已导入的模块
print(f"已导入的模块数量: {len(sys.modules)}")
print("\n部分已导入的模块:")
for i, module_name in enumerate(sorted(sys.modules.keys())[:15], 1):
    print(f"{i}. {module_name}")


## 实践练习

通过实际例子巩固所学知识。


### 练习1：创建和使用自定义模块

创建一个工具模块，包含常用的工具函数。


In [None]:
# 在实际项目中，创建 tools.py 文件
tools_module_code = '''
# tools.py - 工具模块

def format_currency(amount):
    """格式化货币"""
    return f"¥{amount:,.2f}"

def format_percentage(value, total):
    """计算百分比"""
    if total == 0:
        return "0.00%"
    return f"{(value/total)*100:.2f}%"

def validate_email(email):
    """简单的邮箱验证"""
    return "@" in email and "." in email.split("@")[1]

__all__ = ['format_currency', 'format_percentage', 'validate_email']
'''

print("工具模块代码示例:")
print(tools_module_code)
print("\n使用方式:")
print("from tools import format_currency, format_percentage")
print("print(format_currency(1234.56))  # 输出: ¥1,234.56")


### 练习2：创建和使用自定义包

创建一个数据处理包，包含多个相关模块。


In [None]:
# 创建数据处理包的示例结构
data_processing_package = '''
dataprocessing/           # 包名
    __init__.py
    reader.py            # 数据读取模块
    processor.py         # 数据处理模块
    writer.py            # 数据写入模块
    utils.py             # 工具模块
'''

print("数据处理包结构:")
print(data_processing_package)

print("\n__init__.py 内容示例:")
init_content = '''
# dataprocessing/__init__.py
from .reader import read_csv, read_json
from .processor import clean_data, transform_data
from .writer import write_csv, write_json

__version__ = "1.0.0"
__all__ = ['read_csv', 'read_json', 'clean_data', 'transform_data', 
           'write_csv', 'write_json']
'''
print(init_content)


### 练习3：模块导入的最佳实践

总结模块导入的最佳实践。


In [None]:
# 模块导入的最佳实践

best_practices = '''
# 1. 导入顺序（建议）：
#    - 标准库模块
#    - 第三方库模块
#    - 本地/自定义模块
#    各组之间用空行分隔

import os
import sys

import requests
import pandas as pd

from mypackage import mymodule

# 2. 使用别名简化长模块名
import numpy as np
import matplotlib.pyplot as plt

# 3. 明确导入需要的内容，避免使用 import *
from math import sqrt, pi  # 好
# from math import *       # 不推荐

# 4. 使用__all__控制导出
__all__ = ['public_function', 'PublicClass']

# 5. 在包中使用相对导入（包内部）
from . import sibling_module
from ..parent import parent_module
'''

print("模块导入最佳实践:")
print(best_practices)


### 总结

- **模块**是包含Python代码的`.py`文件
- **包**是包含多个模块的目录，需要`__init__.py`文件
- 使用`import`、`from...import`等方式导入模块
- 标准库随Python安装，第三方库需要`pip install`安装
- 自定义模块和包可以组织代码，提高代码复用性
- 遵循导入最佳实践，使代码更清晰易读
