标题: 使用 # 来表示不同级别的标题，比如：

# 一级标题
## 二级标题
### 三级标题
粗体: 使用 ** 或 __ 来包围文本，例如：

**这是粗体文本** 或 __这是粗体文本__
斜体: 使用 * 或 _ 来包围文本，例如：

*这是斜体文本* 或 _这是斜体文本_
删除线: 使用 ~~ 来包围文本，例如：

~~这是带有删除线的文本~~
链接: 使用 []() 来创建一个链接，例如：

[百度](http://www.baidu.com)
图片: 使用 ![]() 来插入一个图片，例如：

![图片描述](图片链接)
无序列表: 使用 * 或 - 或 + 后接空格来创建无序列表，例如：

* 项目1
- 项目2
+ 项目3
有序列表: 使用数字和点后接空格来创建有序列表，例如：

1. 项目1
2. 项目2
3. 项目3
引用: 使用 > 来创建引用，例如：

> 这是一段引用
代码: 使用 ` ` 来插入内联代码，例如 这是一段代码。使用 ``` ``` 来插入代码块，

In [13]:
import os
# os.environ['HTTP_PROXY'] = "127.0.0.1:33210"
# os.environ['HTTPS_PROXY']="127.0.0.1:33210"
os.environ['HTTP_PROXY'] = "127.0.0.1:10809"
os.environ['HTTPS_PROXY']="127.0.0.1:10809"

## 从key文件读取key值
* 输入参数: file_path 文件路径
* 返回值: 存有key的列表

In [14]:
def read_keys_from_file(file_path):
    key_pool = []
    with open(file_path, 'r') as file:
        for line in file:
            key = line.strip()  # 去掉每一行的换行符
            key_pool.append(key)  # 将每一行存入key池中
    return key_pool

In [15]:
# 读取key
file_path = "key.txt"  # 将这个替换为你的txt文件的路径
key_pool = read_keys_from_file(file_path)

## 读取PDF文档函数
* 参数:文件路径file_path,提取前n页
* 返回值:一个列表

In [16]:
import pdfplumber

def read_pdf(file_path, n):
    inner = []
    text = ""
    with pdfplumber.open(file_path) as pdf:
            # 提取前n页
            for i, page in enumerate(pdf.pages):
                # 如果已经处理了n页，就停止
                if i == n:
                    break
                inner.append(page.extract_text())
    return inner

# 按页数进行划分
* 参数:inner->一个装有每一页pdf的列表
* 参数:group_size->每个组的大小
* 返回值:一个列表

> 分割逻辑:
> 以 inner = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] 举例
第一次循环：i = 0，子列表为 inner[0:0+4] = [1, 2, 3, 4]
第二次循环：i = 3，子列表为 inner[3:3+4] = [4, 5, 6, 7]
第三次循环：i = 6，子列表为 inner[6:6+4] = [7, 8, 9, 10]

In [17]:
def group_inner(inner, group_size):
    # 将inner按照每n页为一组进行分割
    """

    :param inner:
    :param group_size:
    :return:
    """
    grouped_inner = [inner[i:min(i + group_size, len(inner))] for i in range(0, len(inner), group_size - 1)]
    return grouped_inner


In [18]:
content = read_pdf(r'KT820说明书V2.0 201909.pdf', 30)

In [19]:
inner = group_inner(content, 5)

In [20]:
from langchain.prompts import  ChatPromptTemplate
prompts = """
    ----
    {text}
    ----
    帮我把上面内容总结成2-4个目录，不能超过4个,目录不要子目录，目录为简洁摘要，其它内容不用给我
    """

prompts2 = """
    abstract:
    ----
    {abstract}
    ----
    text:
    ----
    {text}
    ----

    跟据上面的摘要，找出下面内容中每个摘要对应的开始位置内容,如果涉及到目录部分,有一大串的...就只返回三个就行,不用返回全部.：
    返回格式:
    [{respond_struction}]

"""

prompts3 = """
    text1:
    ----
    {text1}
    ----
    text2:
    ----
    {text2}
    ----

        现在，你有两个字典格式的文本字符串，它们分别命名为 text1 和 text2。这两个字典中都有一个content字段，你需要判断这两个字段中的内容是否相似。
        如果它们的content相似，那么你需要合并这两个文本中的content字段的内容，并基于这个新的content生成一个新的abstract。返回的数据格式应该为一个字典，如下所示：
        返回格式:
        [{respond_struction}]
        如果它们的content不相似，那么直接返回原来的两个字典格式的字符串文本 text1 和 text2。

"""
promptsTemplate = ChatPromptTemplate.from_template(prompts)
promptsTemplate2 = ChatPromptTemplate.from_template(prompts2)
promptsTemplate3 = ChatPromptTemplate.from_template(prompts3)

## 指定返回值格式
> 返回值格式采用json数据,包含三部分:关键词,开始词,结束词
### langchain的json格式
1. 先定义单个模式,Schema = ResponseSchema(name="",description="")
2. 然后将多个模式组合在一起response_schemas = [abstract_schema, start_schema, end_schema]
3. 通过结构输出解析函数解析成结构对象 = StructuredOutputParser(response_schemas = response_schemas)
4. 最后将结构对象解析成json格式的内容


In [21]:
from langchain.output_parsers import ResponseSchema
from langchain.output_parsers import StructuredOutputParser
result_schema = ResponseSchema(name='result', description="这一部分是一个数组,用来记录返回的内容的,里面的每一项都是一个字典,每个字典里面有两个key,一个key名为abstract。其对应的内容是摘要部分的内容, 也就是用来记录摘要的。另一个key的名字是content,这一部分是返回和上面摘要部分相关的全部内容,有n个摘要就返回n个内容")
# abstract_schema = ResponseSchema(name="abstract",description="这是摘要部分的内容, 也就是用来记录摘要的")
# content_schema = ResponseSchema(name="content",description="返回和上面摘要部分相关的全部内容,有n个摘要就返回n个内容")

response_schemas = [result_schema]
out_parse = StructuredOutputParser(response_schemas = response_schemas)
format_instructions = out_parse.get_format_instructions()

In [22]:
from langchain.chains import LLMChain
from langchain.chat_models import ChatOpenAI


## 制作两条链来定位
* 第一条链用来摘要总结文本内容,第一条链用3.5的模型
* 第二条链用来根据摘要来定位文本内容,第二条链用3.5模型

In [23]:
# import random
# import re
# import json
# from langchain.chains import LLMChain
# from langchain.chat_models import ChatOpenAI
#
# abstract=[]
# result = []
# unprocess_list = []
# error_key = []
#
# for text in inner:
#     try:
#         os.environ["OPENAI_API_KEY"] = key_pool[random.randint(0,len(key_pool)-1)]
#         print(os.environ.get("OPENAI_API_KEY"))
#         llm = ChatOpenAI(model_name='gpt-3.5-turbo-16k', temperature=0)
#         chain = LLMChain(llm=llm, prompt=promptsTemplate)
#         chain2 = LLMChain(llm=llm, prompt=promptsTemplate2)
#         response=chain.run(text = text)
#         res = chain2.run(text=text,abstract=response,respond_struction=format_instructions)
#         print(res)
#         unprocess_list.append(out_parse.parse(res))
#     except Exception as e:
#         error_key = os.environ.get("OPENAI_API_KEY")
#         # 移除原来文本中对应的key
#         key_pool.remove(error_key)
#         with open('key.txt', 'w') as f:
#             for key in key_pool:
#                 f.write(key+'\n')
#
#         with open('error_key.txt', 'a') as f:
#             f.write(error_key + '\n')
#         print("An error occurred:", e)

In [25]:
import os
import random
import concurrent.futures
import time
unprocess_list = [None] * len(inner)
print(len(unprocess_list))

# 移除文件的对应的key
def delete_key(key,file_path='key.txt',abandon_key_path = 'abandon_key.txt'):
    with open(file_path, 'r') as f:
        lines = f.readlines()

    # 写回所有的行，除了要删除的行
    with open(file_path, 'w') as f:
        for line in lines:
            # 删除包含key的行
            if key not in line:
                f.write(line)
    # 将丢弃的key值写入abandon_key_path中
    with open(abandon_key_path,'a+') as f:
        f.write(key)

# 处理文本函数

def process_text(index, text):
    key = ""
    time.sleep(random.uniform(10,30))  # 添加随机时间
    try:
        os.environ["OPENAI_API_KEY"] = key_pool[index%(len(key_pool) - 1)]
        key = os.environ["OPENAI_API_KEY"]
        print("调用chain1的key",os.environ.get("OPENAI_API_KEY"))

        llm = ChatOpenAI(model_name='gpt-3.5-turbo-16k', temperature=0)
        chain = LLMChain(llm=llm, prompt=promptsTemplate)
        response = chain.run(text = text)
        print("目录:",response)
        time.sleep(5)
        time.sleep(random.uniform(1*index, 3*index))  #添加随机时间

        os.environ["OPENAI_API_KEY"] = key_pool[index%(len(key_pool) - 1)]
        key = os.environ["OPENAI_API_KEY"]
        llm = ChatOpenAI(model_name='gpt-3.5-turbo-16k', temperature=0)
        chain2 = LLMChain(llm=llm, prompt=promptsTemplate2)
        print("调用chain2的key",os.environ.get("OPENAI_API_KEY"))
        res = chain2.run(text=text, abstract=response, respond_struction=format_instructions)
        print(res)
        return index, out_parse.parse(res)
    except Exception as e:
        print("下标：",{index},":An error occurred:", e)
        # 删除无效key
        delete_key(key)
        return index, None

# 设置最多同时运行的进程数
max_workers = 5
# 创建一个ThreadPoolExecutor线程池
with concurrent.futures.ThreadPoolExecutor(max_workers=max_workers) as executor:
    # 用于提交任务到线程池并获取结果的Future对象
    futures = [executor.submit(process_text, index, text) for index, text in enumerate(inner)]
    for future in concurrent.futures.as_completed(futures):
        index, result = future.result()
        if result is not None:
            # 结果是按照顺序放入unprocess_list
            unprocess_list[index] = result

# 收集为unprocess_list为none的下标
none_index = []
for i, item in enumerate(unprocess_list):
    if item is None:
        none_index.append(i)
print(none_index)

8
调用chain1的key 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
调用chain1的key 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
目录: 1. 液晶显示和功能：液晶显示规格指标、显示内容丰富、U盘功能、参数导入导出、系统U盘升级等。
2. 输入输出功能：开关量输入输出、模拟量控制、刀具功能、辅助T和M功能、快捷MDI方式、补偿功能、螺纹循环等。
3. 机床控制功能：信号跳转、段平滑过渡、无限和有限循环、外部条件跳转、输出自动重复、旋转轴控制、润滑、计时、三位开关功能等。
4. 坐标系和插补功能：轴定义、机床坐标系和零点、工件坐标系和程序零点、插补功能、绝对坐标和相对坐标编程等。
调用chain1的key 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
调用chain1的key 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
目录: 1. 工件坐标系和编程方式
- 绝对坐标值编程
- 相对坐标值编程
- 混合坐标值编程
- 直径编程和半径编程

2. G功能
- 定位 G00
- 直线插补 G01
- 倒角功能
- 圆弧插补 G02,G03
目录: 目录：
1. 产品简介
2. 编程基础
3. G功能
4. MST代码
5. 刀补C功能
6. 宏程序
7. 图形功能
8. 操作方式和界面显示
9. 安全操作
调用chain1的key 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
目录: 目录：
1. 刀具补偿
2. 宏程序
3. 图形功能
4. 操作方式和界面显示
调用chain2的key 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
调用chain2的key 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
调用chain2的key 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
调用chain2的ke

Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 1.0 seconds as it raised APIConnectionError: Error communicating with OpenAI: HTTPSConnectionPool(host='api.openai.com', port=443): Max retries exceeded with url: /v1/chat/completions (Caused by ProxyError('Cannot connect to proxy.', RemoteDisconnected('Remote end closed connection without response'))).
Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 1.0 seconds as it raised APIConnectionError: Error communicating with OpenAI: HTTPSConnectionPool(host='api.openai.com', port=443): Max retries exceeded with url: /v1/chat/completions (Caused by ProxyError('Cannot connect to proxy.', RemoteDisconnected('Remote end closed connection without response'))).
Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 1.0 seconds as it raised APIConnectionError: Error communicating with Op

```json
{
	"result": [
		{
			"abstract": "1. 工件坐标系和编程方式\n- 绝对坐标值编程\n- 相对坐标值编程\n- 混合坐标值编程\n- 直径编程和半径编程",
			"content": "工件\nz\nx 刀\n具 第\n一\n程序指令： 篇\n螺纹循环加工： G92 X(U) Z（W） F/I\n编\n单刀螺纹加工： G32 Z（W） F/I 程\n(2) 切锥螺纹 篇\n工件\nz\n刀\n具\nx\n程序指令：\n螺纹循环加工： G92 X(U) Z（W）R F/I\n单刀螺纹加工： G32 X(U) Z（W）R F/I\n1.2.5 绝对坐标、相对坐标\n工件坐标系建立后，所有编程点的坐标位置都是相对于工件坐标系零点的坐标值，但定\n位到某点或进给到某点的程序编程值可以采用绝对坐标值（X，Z 字段），相对坐标值（U，W\n字段），或混合坐标值（X/Z，U/W字段，绝对和相对坐标同时使用）方式进行编程。\n1．绝对坐标值编程\n使用X、Z 轴的绝对坐标值（用X、Z表示）编程称为绝对坐标编程；\n76 45\n工件 Z\n23\n26\nB\nA\nX\n图1 - 1\n如上图，刀具从A点移动到B点，使用B点的坐标值，其指令如下：\n13"
		},
		{
			"abstract": "2. G功能\n- 定位 G00\n- 直线插补 G01\n- 倒角功能\n- 圆弧插补 G02,G03",
			"content": "X32.0 Z76.0；\n2．相对坐标值编程\n使用X、Z 轴的相对位移量（用U、W表示）编程称为相对坐标编程；\n如上图，刀具同样由A点到B 点，其指令如下：\nU-30.0 W-45.0；\n3．混合坐标值编程\n第\n该系统允许在同一程序段 X、Z 轴分别使用绝对编程坐标值和相对位移量编程，称为混\n一\n篇 合坐标编程。如上图，刀具同样由A点到B点，其指令如下：\n编 U-30.0 Z76.0；或 X32.0 W-45.0；\n程 注：当一个程序段中同时有指令地址X、U或Z、W时，系统将会提示报警。\n篇\n1.2.6 直径编程、半径编程\n车床控制系统的CNC编程时，有直径编程和半径编程两种方法，如图1－2。\n通过设定参数P001 Bit2为0或1选择直径编程或半径编程：\

Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 2.0 seconds as it raised APIConnectionError: Error communicating with OpenAI: HTTPSConnectionPool(host='api.openai.com', port=443): Max retries exceeded with url: /v1/chat/completions (Caused by ProxyError('Cannot connect to proxy.', RemoteDisconnected('Remote end closed connection without response'))).


```json
{
	"result": [
		{
			"abstract": "第二段螺纹",
			"content": "07\n第二段螺纹\n第\n第一段螺纹\n一\n快速定位 篇\n编\n程\n篇\n螺纹退刀图解\n07\n第三段螺纹\n第四段螺纹\n快速退刀\n2.10 刚性攻丝 G33\n指令格式：G33 Z(W)__ F(I)__ J__；\nZ：丝孔底绝对坐标\nW：丝孔底相对坐标\nF：公制丝攻牙距（单位 mm）\nI：英制丝攻每英寸牙数\nJ：攻到位置后，系统发出主轴停止信号，主轴降速，当降到 J 设定的速度时发出反转信\n号。不编则降速到 0 后反转。当主轴惯性较大降速较慢时，为了减少攻丝到位后跟随距离过\n长，可以编适当的J 值以使主轴较快的制动并换向。（单位 转/分）\nG33动作顺序：\n执行G33前应当首先启动主轴，G33执行时由当前位置跟随主轴进给，当到Z轴达丝孔\n底部位置时，发出主轴停止信号。若编了J，则当转速降到J 值时，发出反转信号。若未编J\n则降速到0后发出反转信号。然后Z轴跟随主轴反向退刀。当到达起刀点后，Z轴降速停止，\n同时恢复主轴原来旋转方向，G33指令段执行结束。\n可以通过调节173号参数调节G33的Z向跟随偏差。\n25"
		},
		{
			"abstract": "快速定位篇",
			"content": "07\n第二段螺纹\n第\n第一段螺纹\n一\n快速定位 篇\n编\n程\n篇\n螺纹退刀图解\n07\n第三段螺纹\n第四段螺纹\n快速退刀\n2.10 刚性攻丝 G33\n指令格式：G33 Z(W)__ F(I)__ J__；\nZ：丝孔底绝对坐标\nW：丝孔底相对坐标\nF：公制丝攻牙距（单位 mm）\nI：英制丝攻每英寸牙数\nJ：攻到位置后，系统发出主轴停止信号，主轴降速，当降到 J 设定的速度时发出反转信\n号。不编则降速到 0 后反转。当主轴惯性较大降速较慢时，为了减少攻丝到位后跟随距离过\n长，可以编适当的J 值以使主轴较快的制动并换向。（单位 转/分）\nG33动作顺序：\n执行G33前应当首先启动主轴，G33执行时由当前位置跟随主轴进给，当到Z轴达丝孔\n底部位置时，发出主轴停止信号。若编了J，则当转速降到J 值时，发出反转信号。若未编J\n则降速到0后发出反转信号。然

Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 4.0 seconds as it raised APIConnectionError: Error communicating with OpenAI: HTTPSConnectionPool(host='api.openai.com', port=443): Max retries exceeded with url: /v1/chat/completions (Caused by ProxyError('Cannot connect to proxy.', RemoteDisconnected('Remote end closed connection without response'))).
Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 4.0 seconds as it raised APIConnectionError: Error communicating with OpenAI: HTTPSConnectionPool(host='api.openai.com', port=443): Max retries exceeded with url: /v1/chat/completions (Caused by ProxyError('Cannot connect to proxy.', RemoteDisconnected('Remote end closed connection without response'))).
Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 8.0 seconds as it raised APIConnectionError: Error communicating with Op

下标： {0} :An error occurred: Error communicating with OpenAI: HTTPSConnectionPool(host='api.openai.com', port=443): Max retries exceeded with url: /v1/chat/completions (Caused by ProxyError('Cannot connect to proxy.', RemoteDisconnected('Remote end closed connection without response')))
下标： {3} :An error occurred: Error communicating with OpenAI: HTTPSConnectionPool(host='api.openai.com', port=443): Max retries exceeded with url: /v1/chat/completions (Caused by ProxyError('Cannot connect to proxy.', RemoteDisconnected('Remote end closed connection without response')))
[0, 3]


In [45]:
print(unprocess_list[7])

{'result': [{'abstract': '第二段螺纹', 'content': '07\n第二段螺纹\n第\n第一段螺纹\n一\n快速定位 篇\n编\n程\n篇\n螺纹退刀图解\n07\n第三段螺纹\n第四段螺纹\n快速退刀\n2.10 刚性攻丝 G33\n指令格式：G33 Z(W)__ F(I)__ J__；\nZ：丝孔底绝对坐标\nW：丝孔底相对坐标\nF：公制丝攻牙距（单位 mm）\nI：英制丝攻每英寸牙数\nJ：攻到位置后，系统发出主轴停止信号，主轴降速，当降到 J 设定的速度时发出反转信\n号。不编则降速到 0 后反转。当主轴惯性较大降速较慢时，为了减少攻丝到位后跟随距离过\n长，可以编适当的J 值以使主轴较快的制动并换向。（单位 转/分）\nG33动作顺序：\n执行G33前应当首先启动主轴，G33执行时由当前位置跟随主轴进给，当到Z轴达丝孔\n底部位置时，发出主轴停止信号。若编了J，则当转速降到J 值时，发出反转信号。若未编J\n则降速到0后发出反转信号。然后Z轴跟随主轴反向退刀。当到达起刀点后，Z轴降速停止，\n同时恢复主轴原来旋转方向，G33指令段执行结束。\n可以通过调节173号参数调节G33的Z向跟随偏差。\n25'}, {'abstract': '快速定位篇', 'content': '07\n第二段螺纹\n第\n第一段螺纹\n一\n快速定位 篇\n编\n程\n篇\n螺纹退刀图解\n07\n第三段螺纹\n第四段螺纹\n快速退刀\n2.10 刚性攻丝 G33\n指令格式：G33 Z(W)__ F(I)__ J__；\nZ：丝孔底绝对坐标\nW：丝孔底相对坐标\nF：公制丝攻牙距（单位 mm）\nI：英制丝攻每英寸牙数\nJ：攻到位置后，系统发出主轴停止信号，主轴降速，当降到 J 设定的速度时发出反转信\n号。不编则降速到 0 后反转。当主轴惯性较大降速较慢时，为了减少攻丝到位后跟随距离过\n长，可以编适当的J 值以使主轴较快的制动并换向。（单位 转/分）\nG33动作顺序：\n执行G33前应当首先启动主轴，G33执行时由当前位置跟随主轴进给，当到Z轴达丝孔\n底部位置时，发出主轴停止信号。若编了J，则当转速降到J 值时，发出反转信号。若未编J\n则降速到0后发出反转信号。然后Z轴跟随主轴反向退刀。当到达起刀点后，Z轴降速停止，\n同时恢

In [40]:
# 内容为none的重新生成
for i in none_index:
    index,result = process_text(3,inner[3]);
    unprocess_list[index] = result

调用chain1的key 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
目录: 1. 功能描述规格指标
2. 程序控制功能
3. 螺纹加工功能
4. 坐标系和插补功能
调用chain2的key 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
```json
{
	"result": [
		{
			"abstract": "1. 功能描述规格指标",
			"content": "功 能 描 述 规 格 指 标\n液晶显示 8英寸，TFT真彩显示\n位置，程序，刀补，\n显示\n报警，诊断，参数， 显示内容丰富，直观\n设置，U盘,图形\n程序导入导出 有\n第\nU盘功能 参数导入导出 有 一\n篇\n系统U盘升级 有\n编\n输入口 54路开关量，光电隔离输入 程\n篇\n输出口 48路开关量输出（OC输出）\n变频器模拟量控制或 S1～S4 档位控制；主轴\n主轴功能\n模拟量输出倍率可调0～150%；\nM，S，T机能\n刀位号：T01～T08，刀补号：01～24；电动刀\n刀具功能 架，排刀刀架或专用刀架；运行中修整刀补值；\n程序控制动态刀补补偿。\n辅助T功能 有，特定T代码执行特定子程序\n辅助M功能 有，特定M代码执行特定子程序\n快捷MDI方式 在位置界面下直接输入要执行的程序段\nMDI方式\n传统MDI方式 进入MDI输入界面，按字段输入\n补偿机能 补偿功能 刀具补偿、反向间隙补偿、丝杠螺距误差补偿\nG93 外圆车削循环\nG94 端面车削循环（平面，锥面）\n螺纹循环（直、锥螺纹，公、英制，单头、多\nG92\n头螺纹、任意螺纹切入角）\nG86，G87 螺纹复合循环\nG70,G71,G72,G73 复合循环\nG74 端面钻孔循环\nG75 切槽或割断循环\nG76 多重螺纹切削循环\nG33 刚性攻丝循环\nG32 单刀螺纹功能\n其他螺纹功能\nG34 变螺距螺纹功能\n倒角功能 G01 L/R 直线或圆弧倒角\n9"
		},
		{
			"abstract": "2. 程序控制功能",
			"content": "功 能 描 述 规 格 指 标\n信号跳转机能 G31 进给运行中遇信号跳转\n程序段自动速度

KeyboardInterrupt: 

### 第三条链
用来去重,去掉每一次切割部分重叠的内容

In [43]:
final_contents = []
for i in range(len(unprocess_list)-1):
    data1 = unprocess_list[i]['result']
    data2 = unprocess_list[i+1]['result']
    need_process_data = []
    need_process_data.append(data1[len(data1)-1])
    need_process_data.append(data2[0])
    os.environ["OPENAI_API_KEY"] = key_pool[random.randint(0,len(key_pool)-1)]
    llm = ChatOpenAI(model_name='gpt-3.5-turbo-16k', temperature=0, request_timeout=75000)
    chain3 = LLMChain(llm=llm, prompt=promptsTemplate3)
    response = chain3.run(text1=need_process_data[0],text2=need_process_data[1],respond_struction=format_instructions)
    # 解析返回文本
    content = out_parse.parse(response)
    final_contents.append(content)
    print(response)

```json
{
	"result": [
		{
			"abstract": "3. G功能 刀具补偿",
			"content": "第二章 G功能 .......................................................................................................................... 15\n2.1 定位G00 ............................................................................................................................. 15\n2.2 直线插补 G01 ..................................................................................................................... 16\n2.3 倒角功能 ............................................................................................................................. 16\n2.4 圆弧插补 G02,G03 ............................................................................................................. 17\n2.5 暂停或准停G04 ................................................................................................................. 20\n2.6 自动返回机械零点G28 .....................................................................................................

In [1]:
print(final_contents)

NameError: name 'final_contents' is not defined

In [71]:
# 下载到文件里
import json

with open('output.json', 'w',encoding='utf-8') as f:
    for item in final_contents:
        f.write(str(item)+ "\n")


ImportError: jq package not found, please install it with `pip install jq`