In [1]:
from langchain_community.document_loaders import PyPDFLoader
from langchain.text_splitter import CharacterTextSplitter
from langchain_community.embeddings import OpenAIEmbeddings
from langchain.vectorstores import FAISS
from langchain.chains import RetrievalQA
from langchain.chat_models import ChatOpenAI

In [2]:
from langchain_community.embeddings import HuggingFaceEmbeddings

1. 加载文档

In [3]:
loader = PyPDFLoader("GB+38031-2025.pdf")
pages = loader.load()

In [4]:
pages

[Document(metadata={'producer': '生产者; modified using iText® 5.5.13.3 ©2000-2022 iText Group NV (AGPL-version)', 'creator': '创建者', 'creationdate': "(D:20250418142603+08'00')", 'author': '作者', 'creationdate--text': "(D:20250418142603+08'00')", 'keywords': '关键字', 'moddate': '2025-04-22T11:44:23+08:00', 'moddate--text': "(D:20250418142603+08'00')", 'subject': '科目', 'title': '标题', 'source': 'GB+38031-2025.pdf', 'total_pages': 39, 'page': 0, 'page_label': '1'}, page_content='ICS43.120\nCCST47\n中 华 人 民 共 和 国 国 家 标 准\nGB38031—2025\n代替GB38031—2020\n电动汽车用动力蓄电池安全要求\nElectricvehiclestractionbatterysafetyrequirements\n2025-03-28发布 2026-07-01实施\n国家市场监督管理总局\n国家标准化管理委员会\n发 布'),
 Document(metadata={'producer': '生产者; modified using iText® 5.5.13.3 ©2000-2022 iText Group NV (AGPL-version)', 'creator': '创建者', 'creationdate': "(D:20250418142603+08'00')", 'author': '作者', 'creationdate--text': "(D:20250418142603+08'00')", 'keywords': '关键字', 'moddate': '2025-04-22T11:44:23+08:00', 'moddate--text': "(D:2025041

2. 文本切分

In [5]:
text_splitter = CharacterTextSplitter(chunk_size=500, chunk_overlap=50)
docs = text_splitter.split_documents(pages)

In [6]:
docs

[Document(metadata={'producer': '生产者; modified using iText® 5.5.13.3 ©2000-2022 iText Group NV (AGPL-version)', 'creator': '创建者', 'creationdate': "(D:20250418142603+08'00')", 'author': '作者', 'creationdate--text': "(D:20250418142603+08'00')", 'keywords': '关键字', 'moddate': '2025-04-22T11:44:23+08:00', 'moddate--text': "(D:20250418142603+08'00')", 'subject': '科目', 'title': '标题', 'source': 'GB+38031-2025.pdf', 'total_pages': 39, 'page': 0, 'page_label': '1'}, page_content='ICS43.120\nCCST47\n中 华 人 民 共 和 国 国 家 标 准\nGB38031—2025\n代替GB38031—2020\n电动汽车用动力蓄电池安全要求\nElectricvehiclestractionbatterysafetyrequirements\n2025-03-28发布 2026-07-01实施\n国家市场监督管理总局\n国家标准化管理委员会\n发 布'),
 Document(metadata={'producer': '生产者; modified using iText® 5.5.13.3 ©2000-2022 iText Group NV (AGPL-version)', 'creator': '创建者', 'creationdate': "(D:20250418142603+08'00')", 'author': '作者', 'creationdate--text': "(D:20250418142603+08'00')", 'keywords': '关键字', 'moddate': '2025-04-22T11:44:23+08:00', 'moddate--text': "(D:2025041

In [7]:
len(docs)

36

In [8]:
docs[0]

Document(metadata={'producer': '生产者; modified using iText® 5.5.13.3 ©2000-2022 iText Group NV (AGPL-version)', 'creator': '创建者', 'creationdate': "(D:20250418142603+08'00')", 'author': '作者', 'creationdate--text': "(D:20250418142603+08'00')", 'keywords': '关键字', 'moddate': '2025-04-22T11:44:23+08:00', 'moddate--text': "(D:20250418142603+08'00')", 'subject': '科目', 'title': '标题', 'source': 'GB+38031-2025.pdf', 'total_pages': 39, 'page': 0, 'page_label': '1'}, page_content='ICS43.120\nCCST47\n中 华 人 民 共 和 国 国 家 标 准\nGB38031—2025\n代替GB38031—2020\n电动汽车用动力蓄电池安全要求\nElectricvehiclestractionbatterysafetyrequirements\n2025-03-28发布 2026-07-01实施\n国家市场监督管理总局\n国家标准化管理委员会\n发 布')

3. 构建向量数据库

In [9]:
embedding_model = HuggingFaceEmbeddings(
    model_name="BAAI/bge-small-zh",
    model_kwargs={"device": "cpu"},   # 如果你有 GPU，可改为 "cuda"
    encode_kwargs={"normalize_embeddings": True}  # 官方推荐开启
)

db = FAISS.from_documents(docs, embedding_model)

  embedding_model = HuggingFaceEmbeddings(


In [10]:
db

<langchain_community.vectorstores.faiss.FAISS at 0x245e7d60f50>

In [11]:
retriever = db.as_retriever()
results = retriever.get_relevant_documents("文档中提到的某个关键词")

for i, doc in enumerate(results):
    print(f"匹配结果 {i+1}: {doc.page_content}")

  results = retriever.get_relevant_documents("文档中提到的某个关键词")


匹配结果 1: 参 考 文 献
  [1] GB/T4780—2020 汽车车身术语
[2] GB/T20438(所有部分) 电气/电子/可编程电子安全相关系统的功能安全
[3] GB/T34590(所有部分) 道路车辆 功能安全
[4] ISO26262(allparts) Roadvehicles—Functionalsafety
[5] IEC61508(allparts) Functionalsafetyofelectrical/electronic/programmableelectronic
safety-relatedsystems
13
GB38031—2025
匹配结果 2: 标引符号说明:
In ———冷却介质进口;
Out———冷却介质出口。
图A.2 含集成电池控制单元的电池系统典型结构
  标引符号说明:
In ———冷却介质进口;
Out———冷却介质出口。
图A.3 外置集成电池控制单元的电池系统典型结构
32
GB38031—2025
匹配结果 3: 附 录 C
(规范性)
热扩散分析与验证报告
C.1 通则
电池包或系统在单个电池因内部短路引发的热失控后,应不起火、不爆炸,并在不晚于热失控发生
后的5min提供一个热事件报警信号,且在发出热事件报警信号之前,以及发出热事件报警信号之后的
5min内烟气不导致乘员舱发生危险。
C.2 制造商定义的热事件报警信号说明
C.2.1 触发警告的热事件参数(例如温度、温升速率、SOC、电压下降、电流等)和相关阈值水平(通常明
显区别于制造商规定的工作状态)。
C.2.2 警告信号说明:描述传感器以及在发生热事件时电池包或系统控制说明。
C.3 电池包或系统的安全性说明文件
C.3.1 在单个电池热失控的情况下,电池单体、电池包或系统或整车中应能实现C.1所述功能或特性。
制造商应提供C.3.2~C.3.5中的安全性说明文件。
C.3.2 风险降低分析:使用适当的标准方法记录单个电池热失控所引起的对车辆乘员的风险以及降低
风险所采用的缓解功能或特征(例如:GB/T34590、ISO26262、GB/T20438、IEC61508中的故障分析
或类似的方法)。
C.3.3 相关物理系统和组件的系统图。相关系统和组件是指有助于实现C.1所述功能或特性的系统
和组件。
C.3.4 表示相关系统和组件的

4. 初始化语言模型

In [14]:
import os

API_KEY = os.getenv('DEEPSEEK_API_KEY')
llm = ChatOpenAI(
    model='deepseek-chat',
    openai_api_key=API_KEY,
    openai_api_base='https://api.deepseek.com/v1'
)

  llm = ChatOpenAI(


5. 构建 RAG 问答链

In [15]:
rag_chain = RetrievalQA.from_chain_type(
    llm=llm,
    retriever=db.as_retriever(),
    return_source_documents=True
)

6. 提问

In [16]:
# 6. 提问
query = "请用中文回答：这份文档的核心内容有哪些？"
response = rag_chain.invoke({"query": query})
print(response["result"])

这份文档的核心内容是中国国家标准《GB38031—2025 电动汽车用动力蓄电池安全要求》，主要规定了电动汽车用动力蓄电池的安全技术要求及测试方法，具体包括以下核心内容：

1. **安全要求**  
   - **电池单体**：明确过充电、过放电、短路、加热、温度循环等测试条件下的安全性能要求（如不起火、不爆炸等）。  
   - **电池包或系统**：要求具备绝缘电阻、机械强度、热扩散防护等能力，例如热失控后需在5分钟内提供报警信号且确保乘员舱安全。

2. **试验方法**  
   - 详细规定了电池单体和电池包/系统的测试流程，包括机械冲击、振动、浸水、火烧等严苛环境模拟，以及热失控触发试验的具体步骤和判定条件。

3. **热扩散专项要求**（附录C）  
   - 重点规范电池热失控时的安全防护：  
     - 需提供热事件报警信号及烟气控制措施；  
     - 要求制造商提交风险分析、系统设计图、验证试验数据等文件；  
     - 检测机构需对试验结果进行验证并出具报告。

4. **实施时间**  
   - 标准于2025年3月28日发布，2026年7月1日正式实施，替代旧版GB38031—2020。

5. **配套文件**  
   - 附录A（电池结构示例）、附录B（绝缘电阻测试方法）等为规范性补充，提供具体技术指导。

**核心目标**：确保电动汽车动力蓄电池在极端条件下的安全性，降低热失控等风险对乘员的威胁。
