In [None]:
import numpy as np  # 导入numpy库，主要用于科学计算

# 定义一个函数f(x)，计算表达式 x^2 + 3x + 2 的值
def f(x):
    return x**2 + 3*x + 2

# 定义一个数值导数函数 numerical_derivative
# 输入：
#   f   ：目标函数
#   x   ：求导点
#   eps ：一个非常小的数，用来计算导数的差分间隔，默认是1e-6
def numerical_derivative(f, x, eps=1e-6):
    # 利用中心差分公式近似导数：
    # f'(x) ≈ [f(x + eps) - f(x - eps)] / (2 * eps)
    return (f(x + eps) - f(x - eps)) / (2 * eps)

x = 1.0  # 设定求导点x=1.0

# 打印在x=1.0处的导数近似值
print("导数值:", numerical_derivative(f, x))


导数值: 4.999999999810711


In [2]:
# 复合函数的例子：y = f(g(x))
# 其中 f(x) = x^2，g(x) = 3x + 1
x = 2.0  # 给定自变量x的值

g = 3 * x + 1  # 计算内部函数g(x)的值，g(2) = 3*2 + 1 = 7
f = g**2       # 计算外部函数f(g)的值，f(7) = 7^2 = 49

# 链式法则求导：
# dy/dx = df/dg * dg/dx
# df/dg 是 f 对 g 的导数，f(g) = g^2，因此 df/dg = 2g
df_dg = 2 * g  # 计算 df/dg，此处为 2 * 7 = 14

# dg/dx 是 g 对 x 的导数，g(x) = 3x + 1，导数为3
dg_dx = 3      # 计算 dg/dx，值为3

# 计算 dy/dx = df/dg * dg/dx = 14 * 3 = 42
dy_dx = df_dg * dg_dx

print("dy/dx =", dy_dx)  # 输出导数值


dy/dx = 42.0


In [None]:
# 初始化参数 w，目标是通过优化让 w 接近 3
w = 5.0  # 初始参数值为 5，距离目标值 3 有一定的偏差

# 设置学习率（learning rate），控制每次参数更新的步长
lr = 0.1  # 学习率是 0.1，不能太大也不能太小

# 梯度下降的迭代过程
for i in range(80):  # 执行 100 次迭代更新
    grad = 2 * (w - 3)  # 计算损失函数 (w - 3)^2 的梯度，公式推导如下：
                        # 假设损失函数 f(w) = (w - 3)^2
                        # 则 f'(w) = 2*(w - 3)

    w -= lr * grad      # 使用梯度下降法更新参数 w
                        # w = w - 学习率 × 梯度
                        # 目的是逐步减小损失函数的值，向最小值（最优 w=3）靠近

# 输出最终优化后的参数 w，应该非常接近 3
print("优化后的 w:", w)


优化后的 w: 3.0000000353369414


In [7]:
import numpy as np  # 导入NumPy库，用于处理数组和矩阵运算

x = np.array([[1, 2]])  # 定义输入数据x，是一个形状为(1, 2)的二维数组，表示有两个特征

W = np.array([[0.1, 0.2],     # 定义权重矩阵W，形状为(2, 2)，表示有2个输入和2个输出神经元
              [0.3, 0.4]])

b = np.array([[0.5, 0.6]])    # 定义偏置项b，形状为(1, 2)，每个输出神经元对应一个偏置值

output = np.dot(x, W) + b     # 先进行矩阵乘法x·W（形状变为1x2），再加上偏置b（逐元素加法）
                              # 即 output = xW + b，表示一层神经网络的线性变换

print("输出结果:", output)     # 打印输出结果，形如 [[1.2 1.6]]


输出结果: [[1.2 1.6]]


In [8]:
print(x)
print(W)

[[1 2]]
[[0.1 0.2]
 [0.3 0.4]]


In [10]:
from sklearn.decomposition import PCA  # 从sklearn库中导入PCA类，用于主成分分析降维
from sklearn.datasets import load_iris  # 导入load_iris函数，用来加载鸢尾花数据集

X = load_iris().data  # 加载鸢尾花数据集的特征数据，X是一个形状为(150, 4)的数组，表示150个样本，每个样本4个特征

pca = PCA(n_components=2)  # 创建一个PCA对象，指定降维到2个主成分（把4维数据降到2维）

X_reduced = pca.fit_transform(X)
# 先用X训练PCA模型（fit），计算主成分方向
# 然后将原始数据X映射到这两个主成分构成的新空间中（transform）
# fit_transform是fit和transform的合并操作，输出降维后的数据，形状为(150, 2)

print("降维后的数据:", X_reduced[:5])
# 打印降维后数据的前5条样本，每条样本现在只有两个特征（两个主成分的值）


降维后的数据: [[-2.68412563  0.31939725]
 [-2.71414169 -0.17700123]
 [-2.88899057 -0.14494943]
 [-2.74534286 -0.31829898]
 [-2.72871654  0.32675451]]


In [12]:
import pandas as pd  # 导入 pandas 库，用于处理表格数据
from sklearn.datasets import load_iris  # 从 sklearn 中导入加载鸢尾花数据集的函数

iris = load_iris()  # 加载鸢尾花数据集，返回一个包含特征、标签等信息的字典结构
df = pd.DataFrame(iris.data, columns=iris.feature_names)  # 将特征数据转换成 DataFrame，并设置列名为特征名称
df['label'] = iris.target  # 在 DataFrame 中新增一列，用于存储样本的分类标签（0,1,2）
print(df.head())  # 打印前5行数据，检查表格是否正确加载


   sepal length (cm)  sepal width (cm)  petal length (cm)  petal width (cm)  \
0                5.1               3.5                1.4               0.2   
1                4.9               3.0                1.4               0.2   
2                4.7               3.2                1.3               0.2   
3                4.6               3.1                1.5               0.2   
4                5.0               3.6                1.4               0.2   

   label  
0      0  
1      0  
2      0  
3      0  
4      0  


In [14]:
from sklearn.naive_bayes import GaussianNB  # 导入 Gaussian Naive Bayes（高斯朴素贝叶斯）分类器
from sklearn.datasets import load_iris      # 导入内置的 iris（鸢尾花）数据集加载工具

# 加载鸢尾花数据集的特征（X）和标签（y）
X, y = load_iris(return_X_y=True)
# X 是一个 shape 为 (150, 4) 的二维数组，对应 150 条数据，每条数据有 4 个特征
# y 是一个 shape 为 (150,) 的一维数组，对应每条数据的分类标签（0, 1, 2 分别表示三种花）

# 创建一个 Gaussian Naive Bayes 模型对象
model = GaussianNB()

# 用数据训练（拟合）模型：即学习每一类的均值、方差等参数
model.fit(X, y)

# 用训练好的模型预测第1条样本 X[0] 的类别
print("预测:", model.predict([X[100]]))
# 注意这里必须写成二维数组 [X[0]]，因为模型要求输入是二维的（即 shape 是 (1, 4)）


预测: [2]


In [17]:
import torch  # 导入 PyTorch 库

# 定义一个可训练的参数 w，初始值为 5.0，requires_grad=True 表示需要计算梯度
w = torch.tensor(5.0, requires_grad=True)

# 使用随机梯度下降（SGD）优化器优化参数 w，学习率设为 0.1
optimizer = torch.optim.SGD([w], lr=0.1)

# 训练迭代 100 次
for i in range(100):
    loss = (w - 2)**2         # 定义损失函数，目标是让 w 趋近于 2
    loss.backward()           # 自动求导，计算损失对 w 的梯度 ∂loss/∂w
    optimizer.step()          # 根据梯度更新参数 w，即 w = w - lr * grad
    optimizer.zero_grad()     # 梯度清零，防止梯度在每次循环中累加

# 打印训练结束后的参数值，将张量转为 Python 数值输出
print("训练后的 w:", w.item())


训练后的 w: 2.000000476837158
