参考资料：
- [Azure OpenAI 入门教程 - LangChain 篇 ： 长文本内容总结](https://zhuanlan.zhihu.com/p/646778848)
- [RecursiveCharacterTextSplitter overlap sometimes does not work about langchain](https://githubhelp.com/hwchase17/langchain/issues/8142)

In [1]:
import dotenv
from langchain.chat_models import ChatOpenAI

dotenv.load_dotenv()
llm = ChatOpenAI()

In [2]:
from langchain.document_loaders import UnstructuredFileLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.chains.summarize import load_summarize_chain
from langchain.prompts import PromptTemplate

loader = UnstructuredFileLoader('data/long-text.txt')
document = loader.load()

# The splitter will only use overlap when the chunk size is longer than the chunk size limit.
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=500,
    chunk_overlap=50
)

split_documents = text_splitter.split_documents(document)
print(f'documents: {len(split_documents)}')

prompt_template = """写出以下内容的简明摘要：


"{text}"


简明摘要："""
prompt = PromptTemplate(template=prompt_template, input_variables=["text"])

# llm = ChatOpenAI(model="gpt-3.5-turbo-16k", temperature=0, streaming=False)
chain = load_summarize_chain(llm, chain_type='map_reduce', verbose=True, map_prompt=prompt, combine_prompt=prompt)
chain.run(split_documents)

documents: 4


[1m> Entering new MapReduceDocumentsChain chain...[0m


[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m写出以下内容的简明摘要：


"杭州副高级、正高级职称评定条件（2023年最新版）

空格教育

2023



02



27 16:45

广东

杭州职称是对专业技术人员的考核，分为四个级别：技师、助理工程师(初级职称);工程师(中级职称);高级工程师(高级职称)。

在这里不得不说明下职称的一般获得方式：职称可通过包括职称评审、国家统一考试（以考代评）、职业资格对应等方式获取；而在杭州，由于职业资格证书可以对应职称，一建可以对应中级职称（工程师）；二建就是初级职称（助理工程师）

获得一建的用处

建造师是懂管理、懂技术、懂经济、懂法律法规、综合素质高的复合型人才。建造师不仅要有理论水平，还需要行业的实践经验和强大的组织能力。建造师经注册录用后，可以以建造师的名义担任建设工程项目经理，从事其他建设活动的管理，以及法律规定的其他业务，行政法规或者国务院建设行政主管部门规定的其他业务。

建造师的职能所在是根据公司事业单位法定代表人的授权，对项目从开工准备到竣工验收实施全面的组织管理。"


简明摘要：[0m
Prompt after formatting:
[32;1m[1;3m写出以下内容的简明摘要：


"持有一建资格证书的人员可以按照《建筑业企业资质等级标准》的规定，成为特殊一级建筑业企业资质的建筑工程项目经理;二级建造师能成为具有二级建筑施工企业资质的建筑工程项目经理。

大中型工程项目的项目经理必须逐步由具有建造师专业资格的人员担任;因此，获得一级还是二级资格的建造师证书在行业内还是非常具有优势的。

杭州工程师的职称评定条件（副高级工程师）

注意我们这里只说正常申报的条件，破格申报具体条件可以咨询空格职称专业申报顾问。

1、获博士学位，从事专业技术工作2年以上

2、获硕士学位，取得工程师资格后，从事专业技术工作5年以上

3、大学本科毕业，取得工程师资格后，再从事本专业技术工作5年以上

先参加工作后取得规定学历的，取得学历前后的任职时

Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 4.0 seconds as it raised ServiceUnavailableError: The server is overloaded or not ready yet..
Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 4.0 seconds as it raised APIError: HTTP code 500 from API ().



[1m> Finished chain.[0m


[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m写出以下内容的简明摘要：


"杭州的职称评定条件分为四个级别，包括技师、助理工程师、工程师和高级工程师。在杭州，职业资格证书可以对应职称，一建对应中级职称，二建对应初级职称。获得一建的建造师可以在建设工程项目中担任项目经理，并从事其他管理和法律规定的业务。

持有一建资格证书的人员可以成为特殊一级建筑业企业资质的建筑工程项目经理，二级建造师可以成为具有二级建筑施工企业资质的建筑工程项目经理。大中型工程项目的项目经理必须由具有建造师专业资格的人员担任。获得一级或二级建造师证书对于职业发展有很大优势。杭州工程师的副高级工程师职称评定条件包括获得博士学位并从事专业技术工作2年以上，获得硕士学位并取得工程师资格后从事专业技术工作5年以上，大学本科毕业并取得工程师资格后再从事本专业技术工作5年以上。职称评审工作一般每年进行一次，长三角地区的职称互相认可无需重新确认。杭州工程师的正高级工程师职称评定条件未提及。

杭州工程师的正高级工程师职称评定条件包括取得高级工程师资格后实际聘任高级工程师职务5年以上，具有副教授等高级专业技术资格人员转评高级工程师资格后实际聘任高级工程师职务1年以上并累计5年以上任职年限，以及取得一项以上标志性业绩的实际聘任高级工程师职务。标志性业绩包括获得科技成果奖项和工程设计奖项等。

该文简要介绍了关于杭州工程师相关职称评定条件，并提到可以免费咨询专业老师解答疑问。"


简明摘要：[0m

[1m> Finished chain.[0m

[1m> Finished chain.[0m


'该文简要介绍了杭州的职称评定条件，包括四个级别的职称，以及职业资格证书与职称的对应关系。文章还提到了获得一级或二级建造师证书对职业发展的优势，以及副高级工程师职称的评定条件。同时，文章提到可以免费咨询专业老师解答疑问。'