In [1]:
   
from dreamsboard.engine.storage.task_step_store.simple_task_step_store import SimpleTaskStepStore
from langchain_community.chat_models import ChatOpenAI
from dreamsboard.dreams.builder_task_step.base import StructuredTaskStepStoryboard
from dreamsboard.engine.utils import concat_dirs
from dreamsboard.engine.storage.task_step_store.types import DEFAULT_PERSIST_FNAME
from dreamsboard.common.try_parse_json_object import try_parse_json_object
from dreamsboard.engine.memory.mctsr.prompt import RefineResponse
from dreamsboard.dreams.task_step_md.base import TaskStepMD
from dreamsboard.common import _get_assistants_tool

import logging
import os
from dreamsboard.dreams.task_step_to_question_chain.weaviate.prepare_load import get_query_hash
logger = logging.getLogger(__name__)
logger.setLevel(logging.DEBUG)

# 控制台打印
handler = logging.StreamHandler()
handler.setLevel(logging.DEBUG)

logger.addHandler(handler)
store_load = SimpleTaskStepStore.from_persist_dir(persist_dir="./storage")
task_step_md = TaskStepMD(store_load)
md_text =   task_step_md.format_md() 
from IPython.display import Markdown, display

display(Markdown(md_text.text))

  from .autonotebook import tqdm as notebook_tqdm



# 什么是损失函数？ 


### 定义与作用 [task_id:0](87469b6b-3ea2-4383-9965-aa3e54e1ff1a)

损失函数是一个数学函数，用于量化模型预测值与实际值之间的误差。通过最小化损失函数的值，优化模型的参数，从而提高模型的预测准确性。

常见的损失函数 [task_id:0>1](d3f15475-bed3-450d-9bb0-04c6bae02778)以下是常见的损失函数及其公式： 不同的损失函数在不同的模型架构、数据规模和分布条件下有着各自的优势。在实际的模型开发和训练过程中，还需要不断地进行实验和调优。例如，可以尝试多种损失函数，对比它们在训练集和验证集上的表现，观察模型的收敛速度、准确率等指标的变化。同时，还可以结合一些优化算法，如随机梯度下降（SGD）及其变种Adagrad、Adadelta、Adam等，这些优化算法与不同的损失函数相互配合，也会对模型的最终性能产生影响。此外，随着深度学习的不断发展，新的损失函数也在不断涌现，研究人员需要持续关注这些新进展，将其应用到实际任务中，以提升模型的性能和效果。

- **- 均方误差（MSE） [task_id:0>1>1](507bb38a-af91-499a-a724-50023500f96f)**:507bb38a-af91-499a-a724-50023500f96f:「在回归任务中，均方误差（MSE）作为一种常用的损失函数，其核心作用在于量化模型预测值与实际值之间的误差，并通过这一量化过程指导模型参数的优化。以下是对其计算过程及其在梯度下降中作用的详细解释：

### 1. MSE的计算过程

**公式解析：**
\[ \text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 \]

- **$y_i$**：第$i$个实际观测值。
- **$\hat{y}_i$**：第$i$个预测值。
- **$n$**：样本总数。

**步骤：**
1. **计算每个样本的误差平方**：对于每一个样本，计算其实际值与预测值之差的平方，即 $(y_i - \hat{y}_i)^2$。
2. **求和**：将所有样本的误差平方进行累加，得到 $\sum_{i=1}^{n} (y_i - \hat{y}_i)^2$。
3. **平均化**：将累加的误差平方除以样本总数 $n$，得到均方误差（MSE）。

### 2. MSE在梯度下降中的作用

**梯度下降原理：**
梯度下降是一种优化算法，旨在通过迭代更新模型参数，使得损失函数（如MSE）最小化。

**MSE的梯度计算：**
假设模型参数为 $\theta$，预测值 $\hat{y}_i$ 是参数 $\theta$ 的函数，即 $\hat{y}_i = f(\theta)$。则MSE关于参数 $\theta$ 的梯度为：

\[ \frac{\partial \text{MSE}}{\partial \theta} = \frac{2}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i) \cdot \frac{\partial \hat{y}_i}{\partial \theta} \]

**步骤：**
1. **计算梯度**：对于每一个参数 $\theta$，计算MSE关于该参数的梯度。
2. **更新参数**：根据梯度下降公式 $\theta \leftarrow \theta - \alpha \cdot \frac{\partial \text{MSE}}{\partial \theta}$，其中 $\alpha$ 为学习率，更新模型参数。
3. **迭代优化**：重复上述步骤，直到损失函数收敛或达到预设的迭代次数。

### 3. MSE的影响

**误差量化**：
- MSE通过平方误差的方式，放大了较大误差的影响，使得模型对较大误差更为敏感。
- 这种敏感性有助于模型更好地捕捉数据中的极端值，但也可能导致对异常值的过度拟合。

**参数优化**：
- 通过梯度下降，MSE指导模型参数的调整，使得预测值逐渐接近实际值。
- 参数的优化过程本质上是寻找使得MSE最小的参数组合，从而提高模型的预测准确性。

### 4. 实际应用中的考量

**数据预处理**：
- 在使用MSE之前，通常需要对数据进行标准化或归一化处理，以避免不同量纲对误差的影响。

**模型选择**：
- MSE适用于连续变量的回归任务，但对于分类任务，可能需要使用其他损失函数，如交叉熵损失。

**正则化**：
- 为防止过拟合，常在MSE基础上加入正则化项，如L1或L2正则化。

综上所述，MSE在回归任务中通过量化预测误差，并通过梯度下降指导模型参数优化，从而提升模型的预测性能。然而，实际应用中需结合具体任务和数据特性，灵活选择和调整损失函数及其相关策略。」

- **- 均方根误差（RMSE） [task_id:0>1>2](75ce8e78-0c54-4ea0-897c-49aab79c50a4)**:在实际应用场景中，比如房价预测模型，通过收集大量房屋的特征数据（如面积、房间数等作为自变量\(x_i\) ）以及对应的真实价格（\(y_i\) ）来训练模型。模型训练完成后，会对新的房屋数据进行价格预测（\(\hat{y}_i\) ）。此时RMSE就能很好地衡量模型预测价格与真实价格之间的平均误差程度。如果RMSE值较大，说明模型预测效果不佳，需要进一步优化模型，比如调整模型结构、增加数据量或者采用更好的算法等。

- **- 交叉熵损失（Cross-Entropy Loss） [task_id:0>1>4](bc979f22-f867-4bac-917d-a0bc28cd80c5)**:交叉熵损失公式中真实标签 \(y_i\) 限定为 0 或 1，这在一定程度上限制了其应用场景。从理论分析来看，在诸多定理证明和模型推导中，如在一些关于分类问题的理论分析里，像假设标签空间\(\mathcal{V} = \{0, 1\}\) 来推导分类器的平衡误差等相关结论（参考定理1的证明部分），这种限定简化了问题的分析，但也局限了其适用范围。

在实际应用场景中，当面对多分类问题，即标签取值不止 0 和 1 时，直接使用限定 \(y_i\) 为 0 或 1 的交叉熵损失就无法满足需求。例如在图像分类任务里，如果要区分多种不同类别的图像，如猫、狗、马等多个类别，简单的 0 或 1 标签无法准确表示所有类别信息。

另外，在处理一些具有连续或多值特征的标签数据时，这种限定也会显得力不从心。比如预测某个物体的温度、速度等连续值，或者具有多个离散取值（超过两个）的属性标签，都不能简单地用 0 或 1 来表示真实标签。

不过，在一些简单的二分类场景中，这种限定是非常有效的，例如判断邮件是否为垃圾邮件、疾病检测结果为阳性或阴性等场景，交叉熵损失公式中 \(y_i\) 限定为 0 或 1 能够很好地发挥作用，帮助模型进行有效的学习和分类。 总体而言，这种限定使得交叉熵损失在应用上主要集中在简单的二分类问题，对于复杂的多分类或具有多值标签的场景，需要进行适当的扩展或改进才能适用。

- **- 二元交叉熵损失（Binary Cross-Entropy Loss） [task_id:0>1>5](9dce1956-44b4-464a-92db-7b507449f28b)**:随着机器学习和深度学习的不断发展，二元交叉熵损失在更多复杂的二元分类场景中发挥着重要作用，并且常常与其他技术如神经网络架构改进、优化算法调整等相结合，以实现更好的分类效果。例如在图像的简单前景背景分割任务中，前景和背景构成二元分类。二元交叉熵损失能有效衡量模型预测的前景概率与真实前景标签的差异，助力模型优化，提升分割精度。在医疗诊断辅助领域，判断疾病的有无也是二元分类问题，二元交叉熵损失可帮助评估诊断模型的准确性，推动模型不断优化以提供更可靠的诊断建议。

- **- 多分类交叉熵损失（Categorical Cross-Entropy Loss） [task_id:0>1>6](73047c7d-f8a4-4e5b-ab6b-f53dd8b1e8b0)**:在实际应用场景中，不同的数据集特性和任务需求决定了损失函数的选择。例如在一些简单的图像二分类任务中，交叉熵损失或者二元交叉熵损失就足以满足需求，因为模型结构相对简单，数据类别也只有两种。但在复杂的多模态数据分类任务中，如同时包含图像、文本和音频信息的情感分类任务，多分类交叉熵损失就更能发挥其优势，因为它可以处理多个不同的情感类别。随着数据量的不断增大和任务复杂度的提升，研究人员也在不断探索如何更好地结合多分类交叉熵损失与其他技术，如强化学习中的奖励机制，以进一步提升模型的性能和适应性。同时，在一些新兴领域，如量子计算辅助的分类任务中，多分类交叉熵损失也面临着新的挑战和机遇，如何在量子计算环境下优化多分类交叉熵损失的计算效率和模型效果，将是未来研究的一个重要方向。

选择损失函数的考虑因素 [task_id:0>2](d96ea839-0a50-44c2-b0c7-c0373ca4e18f)选择损失函数时需要考虑任务类型、数据特性和模型特性。 除了多模态任务，在强化学习领域，损失函数的选择也有其独特的考量。强化学习旨在让智能体通过与环境交互学习最优策略，其损失函数通常与奖励机制紧密相关。从任务类型来看，强化学习任务可分为基于回合的任务和连续任务。在基于回合的任务中，如玩游戏，智能体在一个回合结束后获得最终奖励，此时损失函数可能聚焦于最大化长期累积奖励，像Q学习中的损失函数就基于当前估计值与目标值的差异来更新策略。而在连续任务中，智能体持续接收奖励信号，损失函数需要考虑如何平衡短期和长期奖励。

损失函数在模型训练中的作用 [task_id:0>3](ace673d7-201f-4aba-a528-f5fcf0840b89)损失函数在模型训练中用于梯度下降和评估模型性能。 在模型训练里，损失函数与梯度下降更新模型参数的过程紧密相连。简单来说，损失函数衡量了模型预测结果与真实标签之间的差异程度。以常见的均方误差损失函数为例，它计算预测值和真实值之差的平方的平均值。

在梯度下降中，首先要计算损失函数关于模型参数的梯度。梯度代表了损失函数在当前参数点上升最快的方向，而我们要做的是朝着损失函数下降最快的方向去更新参数。具体操作就是用当前参数减去学习率（一个预先设定的超参数，控制每次更新的步长）与梯度的乘积，以此来更新模型参数。不断重复这个过程，直到损失函数的值不再下降或者下降到一个可接受的范围，此时模型参数就达到了一个相对较优的状态。

至于利用损失函数的值准确评估模型性能，这是个复杂但关键的问题。一般而言，损失函数的值越小，说明模型预测结果与真实标签越接近，从这个角度看，模型性能似乎越好。但这并不绝对，因为在训练过程中，模型可能会出现过拟合现象，即对训练数据拟合得很好，损失函数值很低，但在测试数据上表现很差。

所以，不能仅仅依据训练集上的损失函数值来评估模型性能。通常会将数据集划分为训练集、验证集和测试集。在训练过程中，观察训练集和验证集上的损失函数值变化。如果训练集损失函数值持续下降，而验证集损失函数值在某一时刻开始上升，这可能就是过拟合的信号。

最终评估模型性能时，会使用测试集上的损失函数值以及其他指标，比如分类任务中的准确率、召回率、F1值等，回归任务中的均方根误差等。综合这些指标，才能较为准确地评估模型性能。就像在刚刚看到的文档里，通过对比不同损失函数训练出的模型在多个数据集上的HM、ZSL等指标，来全面评估模型性能，而不是单纯依赖损失函数值。

创新性与应用价值 [task_id:0>4](37bd674f-9596-4d99-9aa3-52f337e67678)设计自定义损失函数和多任务学习的联合损失函数可以提高模型性能。 在实际应用中，针对特定任务设计有效的自定义损失函数以及在多任务学习中设计合理平衡不同任务优化的联合损失函数，确实是极具挑战性但又至关重要的工作。

就特定任务设计自定义损失函数而言，以生存预测任务为例，这一任务的目标是将失败时间（死亡）作为连续变量进行估计。在最大似然估计的框架下，对于在特定时间失败的个体，要最大化其相对于其他未失败个体的失败概率。最初的损失函数在处理删失数据时存在问题，因为删失个体在反向传播中由于损失未定义而无法提供显式梯度，这会干扰模型的正常训练。为解决这一问题，通过引入批删失比例（BCP）参数\(\alpha\)，对损失函数进行重新表述，实现了在隐式和显式梯度之间的平衡，从而有效应对了该特定任务中的数据特点。

再看多任务学习中联合损失函数的设计。在一些研究里，为使模型整合多种能力，采用联合训练结合多个任务。比如考虑每个任务同等重要，不额外分配权重，直接将各个任务的损失函数相加作为总体训练损失函数，像\(\mathcal{L}=\mathcal{L}_{Geo - MP}+\mathcal{L}_{Geo - CP}+\mathcal{L}_{U CBL}+\mathcal{L}_{T POP}\)，通过最小化这个总体损失来进行预训练。还有的工作借鉴计算机视觉中的实践，使用焦点损失（Focal loss）和多任务损失（Multi - task loss）结合的方式，在训练过程中优化组合损失\(\mathcal{L}_{focal}+\alpha\mathcal{L}_{mt}\)，其中\(\alpha\)作为超参数确保初始化时两个损失处于相同数量级，以此平衡不同任务的优化。

总之，无论是针对特定任务的自定义损失函数，还是多任务学习中的联合损失函数，关键在于深入理解任务的本质、数据的特性以及模型的行为，通过合理的数学变换和参数调整，实现对模型训练的有效引导，以达到理想的性能表现。

总结 [task_id:0>5](a8cc4bd5-0a8f-4b97-8f97-47ed8e67b5de)损失函数是机器学习和深度学习中不可或缺的一部分，合理选择和设计损失函数能够提升模型的泛化能力和适用性。 损失函数在机器学习和深度学习里确实有着举足轻重、不可或缺的地位。从理论上来说，它是衡量模型预测结果与真实标签之间差异的关键指标。就像在第一篇论文中提到的，机器学习常假设训练和测试数据独立同分布，但实际中测试数据分布往往不同，模型容易依赖仅适用于训练分布的虚假相关性，而损失函数能引导模型学习到更具一般性的特征。

在众多提升模型泛化能力的研究中，损失函数的选择和设计至关重要。比如在研究领域泛化（DG）算法时，其目标就是在损失函数中发现对所有环境都最优的不变表示，以此来避免模型学习仅适用于特定子集数据的虚假相关性。不同的损失函数有着不同的特性，像第一篇论文里对比了多种学习准则（可看作不同形式的损失函数相关方法），如DRO、CVaR、Flooding、SoftAD和tilted ERM等，它们在优化模型时有着不同的表现。

关于如何合理选择和设计损失函数来提升模型泛化能力和适用性，首先要考虑数据的特点。如果数据存在标签噪声，就像第一篇论文所探讨的，一些DG算法具有对标签噪声的鲁棒性，能使模型学习不变性而非虚假相关性，这说明在有标签噪声的数据场景下，选择具有噪声鲁棒性的损失函数相关算法（如某些DG算法）可能更合适。

其次，要依据任务类型。不同的任务，如图像分类、回归等，适合的损失函数不同。在第二篇论文中提到的DART模型，针对生存分析任务，利用半参数AFT秩回归方法结合深度神经网络设计损失函数，以实现高且稳定的预测能力，这体现了根据任务设计合适损失函数的重要性。

再者，通过实验对比不同损失函数的效果。在第一篇论文的实验中，对多种学习准则应用于非线性神经网络模型训练进行对比，通过记录平均替代损失、准确率和模型参数范数等多个指标，来分析不同损失函数相关方法的性能，从而选择在特定任务和数据上表现更优的损失函数。总之，合理选择和设计损失函数需要综合考虑数据、任务以及实验结果等多方面因素 。


 


In [4]:
print(md_text.text)


# 什么是损失函数？ 


### 定义与作用 [task_id:0](87469b6b-3ea2-4383-9965-aa3e54e1ff1a)

损失函数是一个数学函数，用于量化模型预测值与实际值之间的误差。通过最小化损失函数的值，优化模型的参数，从而提高模型的预测准确性。

常见的损失函数 [task_id:0>1](d3f15475-bed3-450d-9bb0-04c6bae02778)以下是常见的损失函数及其公式： 不同的损失函数在不同的模型架构、数据规模和分布条件下有着各自的优势。在实际的模型开发和训练过程中，还需要不断地进行实验和调优。例如，可以尝试多种损失函数，对比它们在训练集和验证集上的表现，观察模型的收敛速度、准确率等指标的变化。同时，还可以结合一些优化算法，如随机梯度下降（SGD）及其变种Adagrad、Adadelta、Adam等，这些优化算法与不同的损失函数相互配合，也会对模型的最终性能产生影响。此外，随着深度学习的不断发展，新的损失函数也在不断涌现，研究人员需要持续关注这些新进展，将其应用到实际任务中，以提升模型的性能和效果。

- **- 均方误差（MSE） [task_id:0>1>1](507bb38a-af91-499a-a724-50023500f96f)**:507bb38a-af91-499a-a724-50023500f96f:「在回归任务中，均方误差（MSE）作为一种常用的损失函数，其核心作用在于量化模型预测值与实际值之间的误差，并通过这一量化过程指导模型参数的优化。以下是对其计算过程及其在梯度下降中作用的详细解释：

### 1. MSE的计算过程

**公式解析：**
\[ \text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 \]

- **$y_i$**：第$i$个实际观测值。
- **$\hat{y}_i$**：第$i$个预测值。
- **$n$**：样本总数。

**步骤：**
1. **计算每个样本的误差平方**：对于每一个样本，计算其实际值与预测值之差的平方，即 $(y_i - \hat{y}_i)^2$。
2. **求和**：将所有样本的误差平方进行累加，得到 $\sum_{i=1}^{n} (y_i - \hat{y}_i)^2$。

In [5]:

from dreamsboard.document_loaders.structured_storyboard_loader import StructuredStoryboard
structured_storyboard = StructuredStoryboard(json_data=[step.__dict__ for step in list(store_load.task_step_all.values())])

parse_table = structured_storyboard.parse_table()
parse_table

Unnamed: 0,task_step_id,shot_number,scene_number,start_task_context,aemo_representation_context,task_step_name,task_step_description,task_step_level,task_step_question,task_step_question_context,task_step_question_answer,ref_task_step_id
0,87469b6b-3ea2-4383-9965-aa3e54e1ff1a,1,story_board0,什么是损失函数？,损失函数（Loss Function）是机器学习和深度学习中一个核心的概念，用于衡量模型预测...,定义与作用,损失函数是一个数学函数，用于量化模型预测值与实际值之间的误差。通过最小化损失函数的值，优化模...,0,在理解了损失函数的定义与作用后，以下是一个针对该任务步骤的问题：\n\n**问题：** 如何...,"[{'ref_id': '454938737738784090', 'chunk_id': ...",在多分类任务中，softmax 函数与交叉熵损失函数常常配合使用。softmax 函数可以将...,
1,d3f15475-bed3-450d-9bb0-04c6bae02778,2,story_board1,什么是损失函数？,损失函数（Loss Function）是机器学习和深度学习中一个核心的概念，用于衡量模型预测...,常见的损失函数,以下是常见的损失函数及其公式：,0>1,在符合任务总体描述的情况下，针对“常见的损失函数”这一任务步骤，提出以下问题：\n\n**问...,"[{'ref_id': '454845510281596112', 'chunk_id': ...",不同的损失函数在不同的模型架构、数据规模和分布条件下有着各自的优势。在实际的模型开发和训练过...,
2,507bb38a-af91-499a-a724-50023500f96f,3,story_board2,什么是损失函数？,损失函数（Loss Function）是机器学习和深度学习中一个核心的概念，用于衡量模型预测...,均方误差（MSE）,$\text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i ...,0>1>1,在符合任务总体描述的情况下，针对当前任务信息，提出以下问题：\n\n**问题：** 在回归任...,"[{'ref_id': '454848051279710932', 'chunk_id': ...",507bb38a-af91-499a-a724-50023500f96f:「在回归任务中，均...,
3,75ce8e78-0c54-4ea0-897c-49aab79c50a4,4,story_board3,什么是损失函数？,损失函数（Loss Function）是机器学习和深度学习中一个核心的概念，用于衡量模型预测...,均方根误差（RMSE）,$\text{RMSE} = \sqrt{\frac{1}{n} \sum_{i=1}^{n...,0>1>2,均方根误差（RMSE）的公式 $\text{RMSE} = \sqrt{\frac{1}{n...,"[{'ref_id': '454846625315640320', 'chunk_id': ...",在实际应用场景中，比如房价预测模型，通过收集大量房屋的特征数据（如面积、房间数等作为自变量\...,
4,bc979f22-f867-4bac-917d-a0bc28cd80c5,5,story_board4,什么是损失函数？,损失函数（Loss Function）是机器学习和深度学习中一个核心的概念，用于衡量模型预测...,交叉熵损失（Cross-Entropy Loss）,$\text{Cross-Entropy} = -\frac{1}{n} \sum_{i=1...,0>1>4,交叉熵损失公式中，真实标签 \(y_i\) 限定为 0 或 1，这对其应用场景有怎样的限制呢？,"[{'ref_id': '455038120104564058', 'chunk_id': ...",交叉熵损失公式中真实标签 \(y_i\) 限定为 0 或 1，这在一定程度上限制了其应用场景...,
5,9dce1956-44b4-464a-92db-7b507449f28b,6,story_board5,什么是损失函数？,损失函数（Loss Function）是机器学习和深度学习中一个核心的概念，用于衡量模型预测...,二元交叉熵损失（Binary Cross-Entropy Loss）,$\text{Binary Cross-Entropy} = -\frac{1}{n} \s...,0>1>5,,[],,
6,73047c7d-f8a4-4e5b-ab6b-f53dd8b1e8b0,7,story_board6,什么是损失函数？,损失函数（Loss Function）是机器学习和深度学习中一个核心的概念，用于衡量模型预测...,多分类交叉熵损失（Categorical Cross-Entropy Loss）,$\text{Categorical Cross-Entropy} = -\frac{1}{...,0>1>6,,[],,
7,d96ea839-0a50-44c2-b0c7-c0373ca4e18f,8,story_board7,什么是损失函数？,损失函数（Loss Function）是机器学习和深度学习中一个核心的概念，用于衡量模型预测...,选择损失函数的考虑因素,选择损失函数时需要考虑任务类型、数据特性和模型特性。,0>2,,[],,
8,ace673d7-201f-4aba-a528-f5fcf0840b89,9,story_board8,什么是损失函数？,损失函数（Loss Function）是机器学习和深度学习中一个核心的概念，用于衡量模型预测...,损失函数在模型训练中的作用,损失函数在模型训练中用于梯度下降和评估模型性能。,0>3,,[],,
9,37bd674f-9596-4d99-9aa3-52f337e67678,10,story_board9,什么是损失函数？,损失函数（Loss Function）是机器学习和深度学习中一个核心的概念，用于衡量模型预测...,创新性与应用价值,设计自定义损失函数和多任务学习的联合损失函数可以提高模型性能。,0>4,,[],,
