# Python模块和包

## 课程介绍

欢迎来到Python模块和包的学习课程！在前面的课程中，我们已经学习了Python的基础语法、数据类型、控制流程、函数和类。现在，我们将学习如何通过使用模块和包来组织和复用代码。

### 学习目标
- 理解什么是模块和包
- 学习如何导入和使用模块
- 熟悉Python常用标准库
- 掌握如何安装和使用第三方库

让我们开始吧！

## 1. 什么是模块和包？

### 1.1 模块 (Module)

**模块**是一个包含Python定义和语句的文件。文件名就是模块名加上`.py`后缀。例如，一个名为`hello.py`的文件就是一个名为`hello`的模块。

模块的作用：
- 组织相关的代码
- 避免命名冲突
- 提高代码的可重用性

### 1.2 包 (Package)

**包**是一种特殊的模块，它包含一组相关的模块。在文件系统中，包是一个包含多个模块文件和一个特殊的`__init__.py`文件的目录。

包的作用：
- 进一步组织模块
- 提供命名空间，避免模块名冲突
- 方便分发和安装

## 2. 导入和使用模块

Python提供了多种方式来导入模块：

### 2.1 导入整个模块

In [None]:
# 导入整个模块
import math

# 使用模块中的函数或变量
radius = 5
area = math.pi * radius**2
print(f"圆的面积: {area:.2f}")

# 使用模块中的函数
print(f"2的平方根: {math.sqrt(2):.4f}")
print(f"向上取整9.2: {math.ceil(9.2)}")
print(f"向下取整9.2: {math.floor(9.2)}")

### 2.2 导入特定的函数或变量

In [None]:
# 只导入需要的函数或变量
from math import pi, sqrt

# 直接使用导入的函数或变量，不需要模块名前缀
radius = 5
area = pi * radius**2
print(f"圆的面积: {area:.2f}")
print(f"2的平方根: {sqrt(2):.4f}")

### 2.3 导入模块并使用别名

In [None]:
# 给模块起个简短的别名
import math as m

# 使用别名访问模块中的内容
print(f"圆周率: {m.pi:.6f}")
print(f"5的阶乘: {m.factorial(5)}")

### 2.4 导入模块中的所有内容

In [None]:
# 导入模块中的所有内容（通常不推荐，因为可能导致命名冲突）
from math import *

# 直接使用函数名
print(f"圆周率: {pi:.6f}")
print(f"自然对数的底: {e:.6f}")
print(f"45度的正弦值: {sin(radians(45)):.4f}")

### 2.5 使用from...import...as...语法

In [None]:
# 导入特定函数并起别名
from math import sqrt as square_root

# 使用别名
print(f"16的平方根: {square_root(16)}")

### 2.6 导入包中的模块

In [None]:
# 导入包中的模块
import os.path

# 使用模块中的函数
print(f"当前文件的绝对路径: {os.path.abspath('.')}")  # `.` 表示当前目录
print(f"当前文件是否存在: {os.path.exists('.')}")

### 2.7 导入注意事项

1. **导入顺序**：习惯上，导入语句应该放在文件的开头
2. **避免循环导入**：两个模块不应该相互导入对方
3. **避免使用 `from module import *`**：这可能导致命名冲突
4. **使用相对导入**：在包内的模块之间可以使用相对导入（如 `from . import module`）

## 3. 常用标准库介绍

Python自带了许多有用的标准库模块，这些模块已经安装在Python中，可以直接导入使用。让我们来看看一些常用的标准库：

### 3.1 datetime 模块 — 日期和时间处理

In [None]:
import datetime

# 获取当前日期和时间
now = datetime.datetime.now()
print(f"当前日期和时间: {now}")

# 获取当前日期
today = datetime.date.today()
print(f"今天的日期: {today}")

# 创建特定日期
new_year = datetime.date(2023, 1, 1)
print(f"2023年元旦: {new_year}")

# 日期格式化
print(f"格式化日期: {now.strftime('%Y年%m月%d日 %H:%M:%S')}")

# 日期计算
one_week_later = today + datetime.timedelta(days=7)
print(f"一周后的日期: {one_week_later}")

# 解析日期字符串
date_string = "2023-05-15"
parsed_date = datetime.datetime.strptime(date_string, "%Y-%m-%d")
print(f"解析后的日期: {parsed_date}")

### 3.2 random 模块 — 生成随机数

In [None]:
import random

# 生成0到1之间的随机浮点数
print(f"随机浮点数: {random.random()}")

# 生成指定范围内的随机整数
print(f"1到100之间的随机整数: {random.randint(1, 100)}")

# 从序列中随机选择元素
fruits = ["苹果", "香蕉", "橙子", "葡萄", "西瓜"]
print(f"随机选择的水果: {random.choice(fruits)}")

# 随机打乱序列
numbers = [1, 2, 3, 4, 5]
random.shuffle(numbers)
print(f"打乱后的序列: {numbers}")

# 从序列中随机选择多个元素（不重复）
selected_fruits = random.sample(fruits, 3)
print(f"随机选择的3个水果: {selected_fruits}")

### 3.3 math 模块 — 数学函数

In [None]:
import math

# 常数
print(f"圆周率: {math.pi}")
print(f"自然对数的底: {math.e}")

# 三角函数
angle = math.radians(45)  # 将角度转换为弧度
print(f"45度的正弦值: {math.sin(angle)}")
print(f"45度的余弦值: {math.cos(angle)}")

# 指数和对数
print(f"2的8次方: {math.pow(2, 8)}")
print(f"1000的自然对数: {math.log(1000)}")
print(f"1000的以10为底的对数: {math.log10(1000)}")

# 其他函数
print(f"5的阶乘: {math.factorial(5)}")
print(f"两点之间的欧几里得距离: {math.dist([0, 0], [3, 4])}")

### 3.4 os 模块 — 操作系统接口

In [None]:
import os

# 获取当前工作目录
print(f"当前工作目录: {os.getcwd()}")

# 列出目录内容
print(f"当前目录内容: {os.listdir('.')}")

# 检查文件或目录是否存在
print(f"'.'是否存在: {os.path.exists('.')}")

# 获取环境变量
print(f"HOME环境变量: {os.environ.get('HOME', '未设置')}")

# 路径操作
file_path = os.path.join('folder', 'subfolder', 'file.txt')
print(f"拼接后的路径: {file_path}")
print(f"基础文件名: {os.path.basename(file_path)}")
print(f"目录名: {os.path.dirname(file_path)}")

### 3.5 sys 模块 — 系统特定参数和函数

In [None]:
import sys

# Python版本信息
print(f"Python版本: {sys.version}")
print(f"Python版本信息: {sys.version_info}")

# 平台信息
print(f"操作系统平台: {sys.platform}")

# 模块搜索路径
print("模块搜索路径:")
for path in sys.path:
    print(f"  - {path}")

# 获取当前引用计数
x = "Hello"
print(f"变量x的引用计数: {sys.getrefcount(x) - 1}")  # 减1是因为getrefcount函数本身会增加引用计数

### 3.6 json 模块 — JSON数据处理

In [None]:
import json

# Python对象转JSON字符串
person = {
    "name": "张三",
    "age": 30,
    "city": "北京",
    "skills": ["Python", "Java", "JavaScript"],
    "married": False
}

json_str = json.dumps(person, ensure_ascii=False, indent=4)  # ensure_ascii=False确保中文正常显示
print("JSON字符串:")
print(json_str)

# JSON字符串转Python对象
decoded_person = json.loads(json_str)
print("\n解码后的Python对象:")
print(decoded_person)
print(f"姓名: {decoded_person['name']}")
print(f"技能: {', '.join(decoded_person['skills'])}")

### 3.7 re 模块 — 正则表达式

In [None]:
import re

# 正则表达式匹配示例
text = "我的电子邮箱是 example@email.com, 电话号码是 13812345678."

# 提取电子邮箱
email_pattern = r'[\w\.-]+@[\w\.-]+'
emails = re.findall(email_pattern, text)
print(f"提取的电子邮箱: {emails}")

# 提取电话号码
phone_pattern = r'1\d{10}'
phones = re.findall(phone_pattern, text)
print(f"提取的电话号码: {phones}")

# 替换文本
censored_text = re.sub(r'(\d{3})\d{4}(\d{4})', r'\1****\2', text)
print(f"隐藏部分电话号码后的文本: {censored_text}")

### 3.8 time 模块 — 时间访问和转换

In [None]:
import time

# 获取当前时间戳（从1970年1月1日00:00:00 UTC开始的秒数）
current_timestamp = time.time()
print(f"当前时间戳: {current_timestamp}")

# 转换为本地时间
local_time = time.localtime(current_timestamp)
print(f"本地时间: {local_time}")

# 格式化时间
formatted_time = time.strftime("%Y-%m-%d %H:%M:%S", local_time)
print(f"格式化时间: {formatted_time}")

# 休眠函数
print("休眠1秒...")
time.sleep(1)
print("继续执行")

### 3.9 urllib 模块 — URL处理

In [None]:
import urllib.request
import urllib.parse

# 构建URL
base_url = "https://www.example.com/search"
params = {
    "q": "Python教程",
    "lang": "zh-CN",
    "page": 1
}
query_string = urllib.parse.urlencode(params)
full_url = f"{base_url}?{query_string}"
print(f"完整URL: {full_url}")

# 解析URL
parsed_url = urllib.parse.urlparse(full_url)
print(f"解析后的URL: {parsed_url}")
print(f"域名: {parsed_url.netloc}")
print(f"路径: {parsed_url.path}")
print(f"查询参数: {parsed_url.query}")

# 发送请求 (注意：这里只是示例代码，并不会真正执行)
print("\n以下是发送请求的示例代码 (不会真正执行)：")
print("""try:
    response = urllib.request.urlopen('https://www.python.org')
    html = response.read().decode('utf-8')
    print(f"网页标题: {html.split('<title>')[1].split('</title>')[0]}")
except urllib.error.URLError as e:
    print(f"请求失败: {e.reason}")
""")

## 4. 第三方库的安装和使用

除了Python标准库，还有大量的第三方库可以扩展Python的功能。我们可以使用`pip`命令来安装这些库。

### 4.1 使用pip安装第三方库

pip是Python的包管理器，用于安装和管理第三方库。以下是一些常用的pip命令：

```bash
# 安装包
pip install 包名

# 安装特定版本的包
pip install 包名==版本号

# 升级包
pip install --upgrade 包名

# 卸载包
pip uninstall 包名

# 列出已安装的包
pip list

# 搜索包
pip search 关键词  # 注意：此功能在某些pip版本中可能不可用

# 查看包的详细信息
pip show 包名
```

## 5. 总结

在这节课中，我们学习了Python的模块和包，包括：

1. **模块和包的概念**：
   - 模块是包含Python定义和语句的文件
   - 包是包含多个模块的目录

2. **导入和使用模块**：
   - `import module`
   - `from module import function, variable`
   - `import module as alias`

3. **常用标准库**：
   - `datetime`：日期和时间处理
   - `random`：生成随机数
   - `math`：数学函数
   - `os`：操作系统接口
   - `sys`：系统特定参数和函数
   - `json`：JSON数据处理
   - `re`：正则表达式
   - `time`：时间访问和转换
   - `urllib`：URL处理

4. **第三方库的安装和使用**：
   - 使用`pip`命令安装第三方库
   - 常用第三方库：requests、pandas、matplotlib、NumPy、BeautifulSoup等

5. **自定义模块和包**：
   - 创建自己的模块和包来组织代码
   - 使用`__init__.py`文件初始化包

6. **实际应用**：
   - 将多个模块和包结合使用来完成实际项目
   - 数据生成、保存、分析和可视化的完整流程

通过使用模块和包，我们可以更好地组织代码，提高代码的可重用性和可维护性，同时也可以使用丰富的第三方库来扩展Python的功能。