### 导入相关包

In [11]:
import jieba

### 评价指标计算函数

In [12]:
# 计算模型回复答案中有多少token在参考答案中出现过
def calculate_correct_tokens(ref_tokens,can_tokens):
    return [can for can in can_tokens if can in ref_tokens]

In [15]:
def calculate_metrics(references, candidates):
    precisions = []
    recalls = []
    f1_scores = []
    
# 多条标准答案列表
    stopwords = ['，','。','？','！','《','》','（','）','：','、','；','“','”']

    for reference, candidate in zip(references, candidates):
        # 使用jieba分词
        ref_tokens = [token for token in jieba.lcut(reference) if token not in stopwords]
        can_tokens = [token for token in jieba.lcut(candidate) if token not in stopwords]

        # 计算正确的token数量（交集）
        correct_tokens = calculate_correct_tokens(ref_tokens,can_tokens)
        num_correct = len(correct_tokens)

        # 计算精确率Precision
        precision = num_correct / len(can_tokens) if can_tokens else 0
        precisions.append(precision)

        # 计算召回率Recall
        recall = num_correct / len(ref_tokens) if ref_tokens else 0
        recalls.append(recall)

        # 计算F1值
        f1 = 2 * (precision * recall) / (precision + recall) if (precision + recall) > 0 else 0
        f1_scores.append(f1)

    # 计算平均Precision、Recall、F1
    avg_precision = sum(precisions) / len(precisions) if precisions else 0
    avg_recall = sum(recalls) / len(recalls) if recalls else 0
    avg_f1 = sum(f1_scores) / len(f1_scores) if f1_scores else 0

    return avg_precision, avg_recall, avg_f1



In [5]:
# 导入问题列表
import json
with open('../PowerMarketQA/电力现货市场QA.json','r',encoding='UTF-8') as json_file:
	data = json.load(json_file)
results = data['results']



In [10]:
# 多条标准答案列表
references = []
# 多条模型回答列表
candidates = []
for r in results:
    references.append(r['gt_answer'])
    candidates.append(r['response'])
print(len(references))
print(len(candidates))
references[0]

125
125


'电力市场的概念。我国关于电力市场的权威解释始见于《中国电力百科全书电力系统卷（第二版）》。电力市场的定义为：基于市场经济原则，电力市场的定义为基于市场经济原则，为实现电力商品交换的电力工业组织结构、经营管理和运行规则的总和。电力市场又是一个具体的执行系统，包括交易场所、交易管理系统、计量和结算系统、信息和通信系统等。上面从组织和实操两个维度对电力市场进行了描绘。通常电力市场包括广义和狭义两种含义。比照商品市场的一般定义，广义的电力市场泛指电力流通交换的领域。按照该含义，自电力作为商品实现交换之日起，电力市场就已经存在。当今在涉及市场规模和范围的语境下，运用的便是广义电力市场的概念。广义的电力市场有着明确的地域和容量指向，电力市场的地理边界可能差异很大，例如单一州（省）域内的电力市场，或者整个国家的电力市场，乃至跨国的电力市场。而这种地理边界受限于电网的覆盖范围，由于电网是电力传输的唯一通道，故多大范围的电网才可能有多大范围的电力市场；电力市场容量也同样存在很大的差异。狭义的电力市场是指现代竞争性的电力市场，《中国电力百科全书》定义的电力市场即为狭义的电力市场，建立电力市场旨在通过开放、竞争等市场手段实现电力能源资源的优化配置。所谓基于市场经济原则主要是指电能生产者和使用者本着公平竞争、自愿互利的原则，通过协商、竞价等方式，就电能及其相关产品进行交易，通过市场竞争确定价格和数量的市场原则。目前广泛讨论的电力市场，除特殊语境下，通常都是指狭义的电力市场。之所以称之为狭义的电力市场，主要原因有二。1）专指现代电力市场，狭义的电力市场兴起于20世纪80年代，是在电力作为商品出现的百年之后，而这百年间，广义电力市场的形态发生了曲折的变迁。电力工业初创期的电力领域是以残酷的市场竞争形态出现的，既有生产方式的竞争（交流与直流之争），也有垂直一体化模式下的电力企业之间抢占市场范围和争夺同一服务地域内的用户之争。这种竞争，一方面有力推动了电力工业的技术进步；另一方面，却也限制了规模经济效益的发挥，并因重复建设等过度竞争而造成资源浪费。因此，20世纪初，电力业态很快从无序竞争状态演变为政府管制或企业自律下的垄断市场形态，尤其是在二次世界大战之后，鉴于恢复经济的需要，大多数国家都采取国家垄断的模式。直至20世纪末，随着电网的发展和技术的进步，电力规模经济的低垂之果几乎已消耗殆尽，加之市

In [16]:


avg_precision, avg_recall, avg_f1 = calculate_metrics(references, candidates)
print(f"Average Precision: {avg_precision}")
print(f"Average Recall: {avg_recall}")
print(f"Average F1: {avg_f1}")

Average Precision: 0.8575391033022026
Average Recall: 0.48596070285559645
Average F1: 0.5596609852702404
