### Step1 导入相关包

In [1]:
import os

from langchain_community.llms import BaichuanLLM
from langchain_community.vectorstores import FAISS
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_community.embeddings import HuggingFaceBgeEmbeddings
from langchain_community.document_loaders import PyPDFDirectoryLoader
from langchain.chains import RetrievalQA
from langchain.prompts import PromptTemplate

from langchain_core.documents import Document
from langchain_core.retrievers import BaseRetriever
from langchain_core.callbacks import CallbackManagerForRetrieverRun
from typing import List
from sentence_transformers import CrossEncoder

  from .autonotebook import tqdm as notebook_tqdm


### Step2 加载数据

In [2]:
import pandas as pd

In [3]:
data = pd.read_excel('./电力现货市场101问.xlsx',header=None)
questions = data.loc[1:,0]
answers = data.loc[1:,1]

In [8]:
# 根据RAGChecker要求的输入格式构建评估测试集
check_inputs = {}
results = []

In [9]:
QA_list = []
for index , (q , a)in enumerate(zip(questions,answers)):
    qa = q + '\n' + a
    results.append({"query_id":index+1,
                    "query":q,
                    "gt_answer":a
                    })
    QA_list.append(qa)


In [20]:
print(results[100])

{'query_id': 101, 'query': '101.电力现货技术支持系统与电力交易平台定位与关系是什么？', 'gt_answer': '随着中发9号文的发布，我国电力市场改革不断深化，电力交易品种日益丰富，以中长期交易规避风险，以现货市场发现价格的“中长期+现货”联合运营模式逐渐形成。中发9号文配套文件《关于推进电力市场建设的实施意见》指出，电力市场主要由中长期市场和现货市场构成，中长期市场主要开展多年、年、季、月、周等日以上电能量交易和可中断负荷、调压等辅助服务交易。现货市场主要开展日前、日内、实施电能量交易和备用、调频等辅助服务交易。条件成熟时，探索开展容量市场、电力期货和衍生品等交易。2018年，国家电网公司《全国统一电力市场深化设计方案》在综合考虑体制架构和电网安全运行需要的基础上，提出了由交易中心负责市场注册、交易申报、交易结算、信息发布等与市场交易密切相关环节，由调控中心负责现货和辅助服务交易组织、安全校核等与电网运行密切相关环节的统一市场联合运营模式。此模式也成为了电力市场技术支撑平台在交易中心和调控中心之间功能建设的实际划分标准，交易中心的电力交易平台、调控中心的电力现货技术支持系统各功能相互协作实现“全时段、全过程、全环节”的交易流程，实现“中长期+现货”市场安全、高效、有序运营，向市场成员提供准确规范的市场交易信息和在线交易业务支持。调控中心负责现货交易与电网运行密切相关的环节，负责安全校核、现货交易组织、辅助服务交易组织等工作。电力现货技术支持系统面向调控中心业务，用于支撑日前、实时等电力现货市场的组织、出清、安全校核等核心业务，并与调控中心内部的调度系统、交易中心的电力交易平台等系统实现对接。交易中心负责与市场交易密切相关的环节，电力交易平台作为国网公司对市场主体服务的窗口，在市场注册、交易申报、交易结算、信息发布等环节为市场主体提供相关服务，并与包括电力现货技术支持系统在内的调度、营销、财务等系统实现对接。电力交易平台分为面向电力交易中心的主站端，以及面向发电侧、用电侧等市场成员的子站端。主站端的主要功能是市场成员注册审批、中长期交易组织、政府授权合约分解、合同管理、结算计算、信息发布、信息管理、信用管理等功能；子站端是发用侧市场成员用于进行市场注册、现货市场申报、中长期市场申报、中长期合约备案、查看发布信息、查看结算账单的系

In [12]:
# 将分割后的文本块封装成Document类
docs_after_split = []
for i in range(0,len(QA_list)):
    qa_doc = Document(page_content=QA_list[i], metadata={"source": "PowerMarketQA\电力现货市场101问.xlsx","order":i+1})
    docs_after_split.append(qa_doc)

docs_after_split[0]

Document(metadata={'source': 'PowerMarketQA\\电力现货市场101问.xlsx', 'order': 1}, page_content='1.什么是电力市场？电力市场与普通商品市场有哪些差异？电力市场有哪些特征？\n（1）电力市场的概念。我国关于电力市场的权威解释始见于《中国电力百科全书电力系统卷（第二版）》。电力市场的定义为：基于市场经济原则，电力市场的定义为基于市场经济原则，为实现电力商品交换的电力工业组织结构、经营管理和运行规则的总和。电力市场又是一个具体的执行系统，包括交易场所、交易管理系统、计量和结算系统、信息和通信系统等。上面从组织和实操两个维度对电力市场进行了描绘。通常电力市场包括广义和狭义两种含义。比照商品市场的一般定义，广义的电力市场泛指电力流通交换的领域。按照该含义，自电力作为商品实现交换之日起，电力市场就已经存在。当今在涉及市场规模和范围的语境下，运用的便是广义电力市场的概念。广义的电力市场有着明确的地域和容量指向，电力市场的地理边界可能差异很大，例如单一州（省）域内的电力市场，或者整个国家的电力市场，乃至跨国的电力市场。而这种地理边界受限于电网的覆盖范围，由于电网是电力传输的唯一通道，故多大范围的电网才可能有多大范围的电力市场；电力市场容量也同样存在很大的差异。狭义的电力市场是指现代竞争性的电力市场，《中国电力百科全书》定义的电力市场即为狭义的电力市场，建立电力市场旨在通过开放、竞争等市场手段实现电力能源资源的优化配置。所谓基于市场经济原则主要是指电能生产者和使用者本着公平竞争、自愿互利的原则，通过协商、竞价等方式，就电能及其相关产品进行交易，通过市场竞争确定价格和数量的市场原则。目前广泛讨论的电力市场，除特殊语境下，通常都是指狭义的电力市场。之所以称之为狭义的电力市场，主要原因有二。1）专指现代电力市场，狭义的电力市场兴起于20世纪80年代，是在电力作为商品出现的百年之后，而这百年间，广义电力市场的形态发生了曲折的变迁。电力工业初创期的电力领域是以残酷的市场竞争形态出现的，既有生产方式的竞争（交流与直流之争），也有垂直一体化模式下的电力企业之间抢占市场范围和争夺同一服务地域内的用户之争。这种竞争，一方面有力推动了电力工业的技术进步；另一方面，却也限制了规模经济效益的发挥，并因重复建设等过度竞争而造成

### Step3 创建向量数据库

In [13]:
# 从过往工作经验看，embedding对于rag效果影响比较大，一般首选还是openai embedding做这一部分，开源的效果很一般
huggingface_embeddings = HuggingFaceBgeEmbeddings(
    model_name="moka-ai/m3e-base",  # 使用m3e模型做embeddding
    model_kwargs={'device':'cpu'},
    encode_kwargs={'normalize_embeddings': True}
)

In [14]:
vectorstore = FAISS.from_documents(docs_after_split, huggingface_embeddings)

### Step4 创建QA链

In [23]:
query = """输配电价对现货市场有什么影响？"""
         # Sample question, change to other questions you are interested in.
relevant_documents = vectorstore.similarity_search(query,k=3)
for i, doc in enumerate(relevant_documents):
    print(f"检索到的第{i+1}个内容: \n {doc.page_content}", end="\n-----------------------------------------------------\n")


# 从这一步看，已经很清晰rag的原理了，即从大量文件索引找到top k相关的text块，供下一步LLM查找、总结答案

检索到的第1个内容: 
 16.什么是现货市场中的再调度法？一般用于解决什么问题？
再调度法（re-dispatch）是一种实时消除阻塞的方法，这种阻塞管理方法不直接改变日前市场中标的发电量和价格，而是一个独立、自愿参与的市场，发电机组可以在其日前发电计划的基础上，对向上或向下调整的发电量进行报价，即机组的上调、下调报价，并在实际调用后获得收益。（1）再调度法原理。系统运营商作为再调度市场的唯一买方，根据机组报价、出力约束、线路潮流分布因子等约束条件，以系统再次调节成本最低为目标，安排发电机组调整计划。具体来说，当系统发生阻塞时，在阻塞线路受端，需要对未调度发电机组按报价由低到高的顺序安排机组发电，这部分机组称为限上（constrained-on）机组，对于限上机组的多发电量按机组上调报价进行结算；在阻塞线路送端，对已经安排调度计划的发电机组按报价由高到低的顺序安排机组停发或少发电，这部分机组称为限下（constrained-off）机组，限下机组的少发电量按系统边际电价和下调报价之差进行补偿。再调度产生的阻塞成本由两部分组成：①限上机组参与再调度的上调报价和日前市场出清边际电价的差值；②限下机组回购发电量的报价与日前市场中出清边际电价的价差。阻塞成本由系统运营商直接承担，并最终通过输电费用向用户进行分摊。（2）再调度法适用性分析。再调度法适合消除偶发性、不可预测的阻塞，可用在阻塞不经常发生且造成的阻塞费用很少的电力市场中。在阻塞问题严重的电力市场中，再调度法可能会对市场短期竞价和长期投资决策带来负面影响。从短期来看，在阻塞线路送端地区，发电厂商为了确保自己在日前市场的中标量，可能会提交低于其边际成本的报价，从而在日前市场中获得更多的电量收益；而在实时平衡市场中，能以更大的价差或更多的再调度量获得补偿费用。这种报价行为会加重系统中的阻塞，造成系统再调度费用明显增加，容易产生输电阻塞导致的局部地区市场力。从长期来看，对于需要建设额外发电容量的阻塞线路受端区域，再调度机制不能给出有效的价格引导信号。在这些区域，新投建的燃气等发电机组由于边际成本较高，不能被调用，难以获得再调度费用以覆盖其成本。因此，这可能会产生相反的激励信号，引导投资建设效率低下的电厂。（3）英国电力市场再调度示例。早期的英国电力市场采用单一买方电力库Pool模式，在该模式下，NGC采用再调度的方式进行

In [24]:
from sentence_transformers import CrossEncoder

cross_encoder = CrossEncoder(
    "BAAI/bge-reranker-base", max_length=512, device="cpu"
)
reranked_docs = cross_encoder.rank(
        query,
        [doc.page_content for doc in relevant_documents],
        top_k=2,
        return_documents=True,)
reranked_docs

[{'corpus_id': 2,
  'score': 0.99910444,
  'text': '19.输配电价的主要定价方法是什么？输配电价对现货市场有什么影响？我国输配电价的形成机制和执行方式是什么？\n（1）输配电价的主要定价方法。输配电价体系设计、定价方法的选择很大程度与电网的技术和经济特性相关，并应考虑电力改革的实际需求。由于各国国情不同，电力工业改革进程千差万别，各国输配电价制定方法各有不同。输配电网具有自然垄断特性，垄断将造成市场机制失灵，必须通过政府管制制定输配电价，这是世界各国理论和实践中达成的共识。国际上，输配电费用的计算可分为会计成本法和边际成本法两类，前者根据电网过去发生的投资成本和运行成本计算输配电费用，后者根据提供输配电引起输配电网未来投资成本的微增变化计算输配电费用。1）会计成本法。分为以下几类：a）邮票法。按整个电网输送的电量或功率平均分摊整个电网的输配电成本，与输送电能距离、流入流出节点位置无关的方法。该方法首先考虑各部分特定输电设备的成本和电网运行维护费用，形成输电总成本后，再按输电功率计算输电费。这种方法算法简单、直接透明，有利于维持电力交易的同一性和流畅性，同时也降低了独立发电厂投资的风险性。但是由于没有考虑发电资源和输电成本差异，该方法使得市场化前不同价区的发电价格趋同，使市场平均购电价格上扬，不能起到引导电源投资的经济信号作用。b）兆瓦千米法。计算输配电网所有线路和设备的每千瓦每千米的成本，通过潮流计算确定某项输配电服务的实际距离，按输送电能的实际距离和功率计算费用的方法。该方法适用于链条型输电网，对于公共输电网络难于进行合理的成本分摊和定价，也没有很好的考虑交易导致的阻塞成本以及额外的输电损失成本，实际上并不能反映每个交易对输电设备的实际使用度，从而降低了该方法的公正性。c）边界潮流法。先计算电网的简化潮流图，再根据潮流分布按各电压等级功率或电量的来源比例分摊输配电成本的方法。该方法体现了发电资源和输电成本的差异，不会由此造成市场平均购电价格上扬，对相关节点参与现货市场采取何种报价策略有一定影响，进而具有有效引导电源投资的经济信号作用。由于输配电价最终分摊至各项输配电服务，形成服务价格，因此输配电价格机制与电力现货市场交易价格形成机制密切相关。不同输配电价定价方法（如邮票法、兆瓦千米法和边界潮流法）对现货市场有不同

In [15]:
# 创建检索器
retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 3})

In [26]:

""" 使用自定义的检索器,重写_get_relevant_documents方法来实现对相似性检索召回的文本块进行重排"""
class CustomRetriever(BaseRetriever):
    
    def _get_relevant_documents(
        self, query: str, *, run_manager: CallbackManagerForRetrieverRun
    ) -> List[Document]:
        cross_encoder = CrossEncoder("BAAI/bge-reranker-base", max_length=512, device="cpu")
        relevant_documents = vectorstore.similarity_search(query,k=5)
        reranked_docs = cross_encoder.rank(
        query,
        [doc.page_content for doc in relevant_documents],
        top_k=2,
        return_documents=True,)

        reranking_relevant_documents= []
        for doc in reranked_docs:
           reranking_relevant_documents.append(
               Document(page_content=doc["text"],
                        metadata=relevant_documents[doc["corpus_id"]].metadata)
                        ) 
        return reranking_relevant_documents

In [27]:
# 自定义加入重排的检索器
retriever = CustomRetriever()

In [16]:
# 创建prompt
"""prompt :请参考下面的相关文本回答问题，一段文本中可能有多个子问题，子问题以问号“？”分隔，子问题对应的答案以小括号“（）”进行分隔，
检索到与问题相关的子问题直接输出子问题对应的答案的全部内容，如果不知道答案，就回复不知道。
"""
prompt_template = """
请用下面相关文本回答问题，如果不知道答案，就回复不知道。
{context}

Question: {question}

Helpful Answer:
"""

prompt = PromptTemplate(
 template=prompt_template, input_variables=["context", "question"]
)

In [17]:
# 创建百川的LLM
llm = BaichuanLLM(model='Baichuan3-Turbo-128k')

In [18]:
qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=retriever,
    return_source_documents=True,
    chain_type_kwargs={"prompt": prompt}
)

In [25]:
for index,query in enumerate(questions[:5]):
    response = qa_chain({"query": query})
    results[index]["response"] = response['result']
    retrieved_docs = []
    for doc in response['source_documents']:
        retrieved_docs.append({"doc_id":doc.metadata['order'],
                               "text":doc.page_content
                               })
    results[index]["retrieved_context"] = retrieved_docs
    print(f"第{index+1}个问题已回复..........")

results[0]

第1个问题已回复..........
第2个问题已回复..........
第3个问题已回复..........
第4个问题已回复..........
第5个问题已回复..........


{'query_id': 1,
 'query': '1.什么是电力市场？电力市场与普通商品市场有哪些差异？电力市场有哪些特征？',
 'gt_answer': '（1）电力市场的概念。我国关于电力市场的权威解释始见于《中国电力百科全书电力系统卷（第二版）》。电力市场的定义为：基于市场经济原则，电力市场的定义为基于市场经济原则，为实现电力商品交换的电力工业组织结构、经营管理和运行规则的总和。电力市场又是一个具体的执行系统，包括交易场所、交易管理系统、计量和结算系统、信息和通信系统等。上面从组织和实操两个维度对电力市场进行了描绘。通常电力市场包括广义和狭义两种含义。比照商品市场的一般定义，广义的电力市场泛指电力流通交换的领域。按照该含义，自电力作为商品实现交换之日起，电力市场就已经存在。当今在涉及市场规模和范围的语境下，运用的便是广义电力市场的概念。广义的电力市场有着明确的地域和容量指向，电力市场的地理边界可能差异很大，例如单一州（省）域内的电力市场，或者整个国家的电力市场，乃至跨国的电力市场。而这种地理边界受限于电网的覆盖范围，由于电网是电力传输的唯一通道，故多大范围的电网才可能有多大范围的电力市场；电力市场容量也同样存在很大的差异。狭义的电力市场是指现代竞争性的电力市场，《中国电力百科全书》定义的电力市场即为狭义的电力市场，建立电力市场旨在通过开放、竞争等市场手段实现电力能源资源的优化配置。所谓基于市场经济原则主要是指电能生产者和使用者本着公平竞争、自愿互利的原则，通过协商、竞价等方式，就电能及其相关产品进行交易，通过市场竞争确定价格和数量的市场原则。目前广泛讨论的电力市场，除特殊语境下，通常都是指狭义的电力市场。之所以称之为狭义的电力市场，主要原因有二。1）专指现代电力市场，狭义的电力市场兴起于20世纪80年代，是在电力作为商品出现的百年之后，而这百年间，广义电力市场的形态发生了曲折的变迁。电力工业初创期的电力领域是以残酷的市场竞争形态出现的，既有生产方式的竞争（交流与直流之争），也有垂直一体化模式下的电力企业之间抢占市场范围和争夺同一服务地域内的用户之争。这种竞争，一方面有力推动了电力工业的技术进步；另一方面，却也限制了规模经济效益的发挥，并因重复建设等过度竞争而造成资源浪费。因此，20世纪初，电力业态很快从无序竞争状态演变为政府管制或企业自律下的垄断市场形态

### Step5 提问，运行QA链，得到RAG结果

In [23]:
# question = "电力市场与普通商品市场的差异？"
# question = "什么是狭义的电力市场？"
# question = "电力市场有哪些特征？"
question = "输配电价对现货市场有什么影响？"
result = qa_chain({"query": question})
# result["result"]
print("========= chain result ==========")
print(result['result'])

输配电价对现货市场有以下影响：

1. 影响电力现货市场设计：电价形成是电力市场的核心，涉及发电厂商、电网企业以及电力用户的利益。输配电价是电力产业价格链的中间环节，合理的输配电价机制是电力现货市场的基础和关键。它需要反映电力生产的真实成本和市场供需关系，从而为各市场成员提供明确的价格信号，正确引导市场消费和电力投资，优化社会资源的配置。

2. 影响参与现货市场的市场主体的收益：电价体系分为上网电价、输配电价和销售电价，在市场化的电力体制中，上网电价和销售电价由竞争产生，而输配电价往往由监管机构进行独立核定。但输配电价形成和分摊会影响市场主体参与现货市场的竞争方式，进而影响现货市场的市场主体的收益。

3. 影响电力现货市场运行：合理的输配电价是电力市场有效运作的必要条件，输配电价空间会受到上网电价和销售电价的制约。如果电网合理成本的回收、合理收益的获取得不到根本保证，会严重地影响电网建设资本金的筹集。合理的输配电费用定价和分摊有利于向电力交易主体提供有效的经济信号，促进电力资源优化配置，并促进电网企业更有效地管理、规划输配电资源。


In [37]:
relevant_docs = result['source_documents']
print(f'There are {len(relevant_docs)} documents retrieved which are relevant to the query.')
print("*" * 100)
for i, doc in enumerate(relevant_docs):
    # print(f"Relevant Document #{i+1}:\nSource file: {doc.metadata['source']}, Page: {doc.metadata['page']}\nContent: {doc.page_content}")
    print(f"Relevant Document #{i+1}:\nSource file: {doc.metadata['source']}\nContent: {doc.page_content}")
    print("-"*100)
    print(f'There are {len(relevant_docs)} documents retrieved which are relevant to the query.')

There are 2 documents retrieved which are relevant to the query.
****************************************************************************************************
Relevant Document #1:
Source file: PowerMarketQA\电力现货市场101问.xlsx
Content: 19.输配电价的主要定价方法是什么？输配电价对现货市场有什么影响？我国输配电价的形成机制和执行方式是什么？
（1）输配电价的主要定价方法。输配电价体系设计、定价方法的选择很大程度与电网的技术和经济特性相关，并应考虑电力改革的实际需求。由于各国国情不同，电力工业改革进程千差万别，各国输配电价制定方法各有不同。输配电网具有自然垄断特性，垄断将造成市场机制失灵，必须通过政府管制制定输配电价，这是世界各国理论和实践中达成的共识。国际上，输配电费用的计算可分为会计成本法和边际成本法两类，前者根据电网过去发生的投资成本和运行成本计算输配电费用，后者根据提供输配电引起输配电网未来投资成本的微增变化计算输配电费用。1）会计成本法。分为以下几类：a）邮票法。按整个电网输送的电量或功率平均分摊整个电网的输配电成本，与输送电能距离、流入流出节点位置无关的方法。该方法首先考虑各部分特定输电设备的成本和电网运行维护费用，形成输电总成本后，再按输电功率计算输电费。这种方法算法简单、直接透明，有利于维持电力交易的同一性和流畅性，同时也降低了独立发电厂投资的风险性。但是由于没有考虑发电资源和输电成本差异，该方法使得市场化前不同价区的发电价格趋同，使市场平均购电价格上扬，不能起到引导电源投资的经济信号作用。b）兆瓦千米法。计算输配电网所有线路和设备的每千瓦每千米的成本，通过潮流计算确定某项输配电服务的实际距离，按输送电能的实际距离和功率计算费用的方法。该方法适用于链条型输电网，对于公共输电网络难于进行合理的成本分摊和定价，也没有很好的考虑交易导致的阻塞成本以及额外的输电损失成本，实际上并不能反映每个交易对输电设备的实际使用度，从而降低了该方法的公正性。c）边界潮流法。先计算电网的简化潮流图，再根据潮流分布按各电压等级功率或电量的

### Step6 开始评估

In [193]:
#result['ground_truths'] = "电力批发市场按其市场属性，可分为电力实物市场与电力金融市场。一般而言，电力实物市场与电力金融市场可以通过按产品类型和市场主体的意图两个方面加以辨识。电力实物市场建设几乎是各国各地电力市场建设的重心，建设运营中普遍接受电力监管机构的监管；电力金融市场严格意义上要接受金融监管机构的监管（见问题 3）。电力金融市场涉及能源电力衍生出的金融产品的交易行为，具有金融衍生属性，包括市场结构与相关的制度安排、市场主体、产品与交易，同时也具备其特有的供求驱动因素。电力金融市场合同通常不涉及电力实物商品的交割，取而代之的是现金的交割。电力金融市场中，一般参照金融市场期货、期权交易的基本原理进行电力期货、电力期权等电力金融衍生产品交易，其交易的对象是电力金融衍生品。"

from ragas.metrics import faithfulness, answer_relevancy, context_relevancy
from ragas.langchain.evalchain import RagasEvaluatorChain

# make eval chains
eval_chains = {
    m.name: RagasEvaluatorChain(metric=m) 
    for m in [faithfulness, answer_relevancy, context_relevancy]
}

# evaluate
for name, eval_chain in eval_chains.items():
    score_name = f"{name}_score"
    print(f"{score_name}: {eval_chain(result)[score_name]}")


faithfulness_score: 1.0
answer_relevancy_score: 0.8901393929213829
context_relevancy_score: 0.14893617021276595
