In [None]:
!pip install langchain
!pip install openai

In [3]:
import os
os.environ["OPENAI_API_KEY"] = "you key"

#1.Chains基本概念

##1.1单输入

In [None]:
from langchain.llms import OpenAI
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain

llm = OpenAI(temperature=0.5)
prompt = PromptTemplate(
    input_variables=["pet"],
    template="我养了一只{pet}起个什么名字好呢?",
)
#将llm 和 prompt链接起来
chain = LLMChain(llm=llm, prompt=prompt)
# Run the chain only specifying the input variable.
print(chain.run("小狗"))



可以考虑一些可爱的名字，比如：小白、欢欢、乐乐、柯柯、阿贝、阿黄、阿灿、阿柏、阿琪、贝贝、柴柴、豆豆、哆啦、菲菲、哈哈、咪咪、喵喵、娜娜、娃娃、萍萍、淘淘、潼潼、悟空、哇哈、夏夏、熊熊、小熊、小黑、小橘、小花、小豆、小鸭、小羊、小鱼、


##1.2多输入

In [None]:
prompt = PromptTemplate(
    input_variables=["pet", "season"],
    template="我养了一只{pet}，它出生在{season}起个什么名字好呢?",
)
chain = LLMChain(llm=llm, prompt=prompt)
print(chain.run({
    'pet': "小狗",
    'season': "秋天"
    }))



秋天是一个充满生机的季节，所以为它取一个活泼的名字也很合适，比如：洋洋、阳阳、欢欢、米米、晴晴、豆豆、静静、咪咪、芝芝、瑞瑞、珍珍、晓晓、宝宝、多多等。


##1.3聊天模式

In [None]:
from langchain.chat_models import ChatOpenAI
from langchain.prompts.chat import (
    ChatPromptTemplate,
    HumanMessagePromptTemplate,
)
human_message_prompt = HumanMessagePromptTemplate(
        prompt=PromptTemplate(
            template="我养了一只{pet}起个什么名字好呢?",
            input_variables=["pet"],
        )
    )
chat_prompt_template = ChatPromptTemplate.from_messages([human_message_prompt])
chat = ChatOpenAI(temperature=0.9)
#将chat llm 与 prompt 链接起来
chain = LLMChain(llm=chat, prompt=chat_prompt_template)
print(chain.run("小猫"))

你可以根据小猫的特点或者你喜欢的事物来给它起名字。以下是一些建议：

1. 小花 - 如果你的小猫有花纹的毛色，这个名字很适合。
2. 小米 - 如果你的小猫的身体颜色类似小米，这个名字也很可爱。
3. 萌萌 - 这个名字适合可爱的小猫。
4. 咪咪 - 如果你喜欢经典的猫咪名字，这个是一个不错的选择。
5. 宝贝 - 如果你觉得你的小猫是你的宝贝，这个名字很适合。
6. 小伙伴 - 如果你的小猫是你的朋友和伙伴，这个名字也很贴切。

当然，最重要的是选择一个你和你的小猫都喜欢的名字。祝你和你的小猫快乐相处！


#2.Chain 基本用法


##2.1 API异步调用

In [None]:
import asyncio
import time

from langchain.llms import OpenAI
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain

#执行同步函数 多次
def generate_serially():
    llm = OpenAI(temperature=0.9)
    prompt = PromptTemplate(
    input_variables=["pet"],
    template="我养了一只{pet}起个什么名字好呢?",
    )
    chain = LLMChain(llm=llm, prompt=prompt)
    for _ in range(5):
        resp = chain.run(pet="猫")
        print(resp)

#异步函数
async def async_generate(chain):
    resp = await chain.arun(pet="狗")
    print(resp)

#执行异步函数 多次
async def generate_concurrently():
    llm = OpenAI(temperature=0.9)
    prompt = PromptTemplate(
        input_variables=["pet"],
        template="我养了一只{pet}起个什么名字好呢?",
    )
    chain = LLMChain(llm=llm, prompt=prompt)
    tasks = [async_generate(chain) for _ in range(5)]
    await asyncio.gather(*tasks)


s = time.perf_counter()
# If running this outside of Jupyter, use asyncio.run(generate_concurrently())
await generate_concurrently()
elapsed = time.perf_counter() - s
print("\033[1m" + f"Concurrent executed in {elapsed:0.2f} seconds." + "\033[0m")

s = time.perf_counter()
generate_serially()
elapsed = time.perf_counter() - s
print("\033[1m" + f"Serial executed in {elapsed:0.2f} seconds." + "\033[0m")



这取决于你。也许你可以取个你喜欢的明星或者历史人物的名字，或者一个你常用的字或者短语，或者随机挑一个你觉得很有趣的名字。


给它取一个跟它个性相符的名字吧，比如：欢欢、橘子、茶茶、墨墨、悠悠、曼曼、柚子等。


您可以取个有趣可爱的名字，例如：小黄、泰迪、花花、阿瓜、可乐、奔奔、芝麻、乐乐、悠悠等。


这取决于你自己，一般可以取一些有趣的名字，比如汪汪、小白、大黄、阿福、小明等。也可以根据狗的性格特点取名，比如活泼的狗可以叫爱斯基摩人，乖巧的狗可以叫甜甜圈，可爱的狗可以叫小可爱等。


这取决于你喜欢什么样的名字，比如古雅的古老名字，如唐、墨、米勒等;也可以给狗取英文名字，比如瑞奇、布莱克、布鲁克等;或者给狗取一个美好的梦想名字，比如飞翔、灿烂、阳光等;或者取个有趣的名字，比如小可爱、面包、棒棒糖等。
[1mConcurrent executed in 6.23 seconds.[0m


一般而言，猫的名字大多以英文单词或双语单词为主，可以去参考一些英文常见的名字，像Kitty、Sophie、Molly、Nala等；也可以参考动漫中的名字，如高达、小智、龙猫等；还可以以它的性格为参考，例如活泼、玩命、酷酷、憨厚等。希望能够帮助到你！


这取决于主人的喜好，常见的猫名有：小黑、小花、小青、小白、小黄、小香、小橘、小豆、小兔、小鱼、米奇、咪咪、波斯、莉莉、花花、柯基、泰迪、雪糕等等。


具体取名要结合实际情况，但是可以从以下几个方面着手：

1. 考虑自己和宠物的关系，选择一个非常特别的名字，让它显得更加特别；

2. 取一些有意义的名字，可以是某些形容词、象征意义或者数字；

3. 可以从经典的电影、动漫、小说的人物名中挑选，使它与众不同；



很多人喜欢以中国传统文化中的诗词名称来取名字，比如：一枝花、芙蓉仙子、凤求凰、长安可期、晓露新、玉树凌风，还有：可可、福禄、柳岩、水蓝、茉莉、雨涵等。


这取决于你的喜好，有许多常见的猫名，比如小白、阿福、小子、小花、小黑、小明、小鱼、小雪等等。也可以根据你喜欢的一种形容词，取一个有意义的名字，比如可爱的红、温柔的泰瑞、娇小的欣欣等等。
[1mSerial executed in 31.68 seconds.[0m


##2.2 debug 开关

In [None]:
from langchain.llms import OpenAI
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain

llm = OpenAI(temperature=0.5)
prompt = PromptTemplate(
    input_variables=["pet"],
    template="我养了一只{pet}起个什么名字好呢?",
)
#verbose 为tur 开启 debug开关，可以跟踪 chain的完成情况
chain = LLMChain(llm=llm, prompt=prompt,verbose=True)
# Run the chain only specifying the input variable.
print(chain.run("小狗"))





[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m我养了一只小狗起个什么名字好呢?[0m

[1m> Finished chain.[0m


这取决于你的喜好，你可以取一些比较可爱的名字，比如小黑、小白、小黄、小花、小橘等。也可以取一些有趣的名字，比如小贝、小多、小乐、小路、小豆等。


##2.3链接外部资源
[调用LangChainHub](https://github.com/hwchase17/langchain-hub)
LangChainHub是一个收集与LangChain基元（如提示，链和代理）相关的所有有用工件的地方。这个库的目标是成为分享和发现高质量提示、链和代理的中心资源，这些元素结合在一起可以形成复杂的LLM应用。LangChainHub从收集提示开始，期待LangChain社区对此进行扩充，希望很快能扩展到链和代理。

In [None]:
from langchain.chains import load_chain

chain = load_chain("lc://chains/llm-math/chain.json")

chain.run("2 的6次方是多少？")





[1m> Entering new LLMMathChain chain...[0m
2 的6次方是多少？[32;1m[1;3mAnswer: 64[0m
[1m> Finished chain.[0m


'Answer: 64'

##2.4与Memory合作

In [None]:
from langchain.chains import ConversationChain
from langchain.memory import ConversationBufferMemory
from langchain.chat_models import ChatOpenAI

chat = ChatOpenAI(temperature=0.5)
conversation = ConversationChain(
    llm=chat,
    memory=ConversationBufferMemory()
)
#chat中的第一个问题
print(conversation.run("世界由哪几个大洲组成的，说前三个?"))
#chat中的第二个问题，通过memory记忆上下文
print(conversation.run("把剩余的洲告诉我?"))


世界由七个大洲组成，按照面积从大到小排列，前三个大洲分别是亚洲、非洲和北美洲。
剩余的大洲是南美洲、南极洲、欧洲和大洋洲。


##3.5chain保存到磁盘

In [None]:
from langchain.llms import OpenAI
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain

llm = OpenAI(temperature=0.5)
prompt = PromptTemplate(
    input_variables=["pet"],
    template="我养了一只{pet}起个什么名字好呢?",
)
#将llm 和 prompt链接起来
chain = LLMChain(llm=llm, prompt=prompt)
# Run the chain only specifying the input variable.
print(chain.run("小狗"))

chain.save("llm_chain.json")





常见的有：

1. 欢欢（Happy）
2. 欣欣（Joy）
3. 小黑（Blackie）
4. 小白（Whitey）
5. 小黄（Yellow）
6. 米奇（Micky）
7. 小贝（Bean）
8. 小叮（Ting）
9. 小熊（Bear）
10. 小花（Flower）


#3.Chain 与 LLM 基础用法

##3.1 prompt template 的参数数组化

In [None]:
from langchain.llms import OpenAI
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain


llm = OpenAI(temperature=0.5)
prompt = PromptTemplate(
    input_variables=["pet"],
    template="我养了一只{pet}起个什么名字好呢?",
)
#将llm 和 prompt链接起来
chain = LLMChain(llm=llm, prompt=prompt)
#chain中饮用参数数组
input_list = [
    {"pet": "狗"},
    {"pet": "猫"},
    {"pet": "鸟"}
]
#通过apply 接受参数数组
chain.apply(input_list)

[{'text': '\n\n这取决于你的喜好，有很多可供选择的名字，比如：欧拉、阿福、雪莉、拉比、贝拉、阿比、泰迪、卡比、萨摩、查理、费奇、芭比、斯洛克等。'},
 {'text': '\n\n你可以取一个英文名字，如：Molly、Coco、Bella、Max、Tiger、Lucky、Charlie、Smokey、Sam、Oscar等。'},
 {'text': '\n\n这取决于你喜欢的鸟类，如果它是一只鹦鹉，你可以取名为“阿尔法”；如果它是一只孔雀，你可以取名为“米奇”；如果它是一只鹰，你可以取名为“雄鹰”；如果它是一只鸽子，你可以取名为“白鸽”。'}]

##3.2多参数

In [None]:
template = """我养了一只{pet}，它出生在{season}起个什么名字好呢?"""
prompt = PromptTemplate(template=template, input_variables=["pet", "season"])
chain = LLMChain(prompt=prompt, llm=OpenAI(temperature=0))
#直接通过predict 进行prompt template 的参数输入
chain.predict(pet="猫", season="冬天")


'\n\n冬冬、雪雪、雪莉、雪绒、雪珍、雪宝、雪儿、雪球、雪珠、雪晴、雪萌、雪瑶、雪梅、雪芳、雪英、雪林、雪玉、雪娜、雪洁、雪晶、雪珊、雪瑛、雪璐、雪瑜、雪珍、雪瑞、雪璇、雪玲、雪瑶、雪璃、雪珊、雪瑶、雪璐、雪瑜、雪珍、雪瑞、雪璇、雪玲、雪瑶、雪璃、雪珊、雪瑶、雪璐、'

##3.3定义输出格式

In [None]:
from langchain.output_parsers import CommaSeparatedListOutputParser

#定义输出格式
output_parser = CommaSeparatedListOutputParser()
template = """列出所有可以饲养的宠物"""
prompt = PromptTemplate(template=template, input_variables=[], output_parser=output_parser)
llm_chain = LLMChain(prompt=prompt, llm=llm)
#在chain 中需要使用predict_and_parse 定义output parser
llm_chain.predict_and_parse()



['- 狗\n- 猫\n- 鹦鹉\n- 鸽子\n- 鼠\n- 狐狸\n- 金鱼\n- 蜥蜴\n- 蛇\n- 青蛙\n- 兔子\n- 小鸡\n- 鹅\n- 鸡\n- 企鹅\n- 马\n- 羊']

##3.4 Router

In [None]:
from langchain.chains.router import MultiPromptChain
from langchain.llms import OpenAI
from langchain.chains import ConversationChain
from langchain.chains.llm import LLMChain
from langchain.prompts import PromptTemplate

#生成物理专业相关的prompt template
physics_template = """你是一位非常出色的物理家。你擅长回答物理问题。你之所以出色，是因为你能够将复杂的问题分解为各个部分，回答这些部分，然后将它们组合起来回答更广泛的问题。
这里是问题：
{input}"""

#生成数学专业相关的prompt template
math_template = """你是一位非常出色的数学家。你擅长回答数学问题。你之所以出色，是因为你能够将复杂的问题分解为各个部分，回答这些部分，然后将它们组合起来回答更广泛的问题。

这里是问题:
{input}"""

prompt_infos = [
    {
        "name": "physics",
        "description": "更适合回答物理相关问题",
        "prompt_template": physics_template,
    },
    {
        "name": "math",
        "description": "更是适合回答数学相关问题",
        "prompt_template": math_template,
    },
]

llm = OpenAI()

destination_chains = {}
for p_info in prompt_infos:
    name = p_info["name"]
    prompt_template = p_info["prompt_template"]
    prompt = PromptTemplate(template=prompt_template, input_variables=["input"])
    chain = LLMChain(llm=llm, prompt=prompt)
    #把两个template 对应的chain 放到destination_chains中
    #destination_chains 就是路由的目的chain
    destination_chains[name] = chain
#如何destination_chains 没有被选中（既不是物理问题也不是数学问题）
#就选择default_chain 作为默认的chain
default_chain = ConversationChain(llm=llm, output_key="text", verbose=True)


MULTI_PROMPT_ROUTER_TEMPLATE是用于生成问题的模板，它会将输入的问题与所有可能的目标链（即数学和物理）的描述组合起来。

在生成的问题中，LLM需要选择最适合的答案，也就是说，选择最能解答输入问题的目标链。LLM是通过评估输入问题与各个目标链描述的相似性来做出选择的。例如，如果输入的问题是关于物理的，那么与物理相关的目标链描述会与输入问题有更高的相似性，因此LLM就会选择物理链。同样，如果问题是关于数学的，那么LLM就会选择数学链。

In [None]:
from langchain.chains.router.llm_router import LLMRouterChain, RouterOutputParser
from langchain.chains.router.multi_prompt_prompt import MULTI_PROMPT_ROUTER_TEMPLATE
#生成destination string
destinations = [f"{p['name']}: {p['description']}" for p in prompt_infos]
destinations_str = "\n".join(destinations)
#准备组合destination router 与输入的内容
router_template = MULTI_PROMPT_ROUTER_TEMPLATE.format(destinations=destinations_str)
#组合destination router 与输入的内容 放入到router prompt中
router_prompt = PromptTemplate(
    template=router_template,
    input_variables=["input"],
    output_parser=RouterOutputParser(),
)
#请求 LLM 获取合适的组合
router_chain = LLMRouterChain.from_llm(llm, router_prompt)
#根据合适的组合生成chain
chain = MultiPromptChain(
    router_chain=router_chain,
    destination_chains=destination_chains,
    default_chain=default_chain,
    verbose=True,
)
#执行chain
print(chain.run("电磁感应是怎么一回事"))



[1m> Entering new MultiPromptChain chain...[0m




physics: {'input': '电磁感应是什么？'}
[1m> Finished chain.[0m


电磁感应是指物体在电磁场中受到的力，这种力可以在物体之间传播，而且可以改变物体的运动方向或速度。它是由电磁场产生的，电磁场由电流产生，而电流又是由电荷产生的。电磁感应的原理是当两个电荷产生的电磁场相互作用时，会产生一种电磁力，这种力可以改变物体的运动方向或


#4.SequentialChain

##4.1简单顺序Chain

In [None]:
from langchain.llms import OpenAI
from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate

# chain 写一个剧情概要
llm = OpenAI(temperature=.7)
template = """你是一个剧作家。给出剧目的标题，你的任务是为该标题写一个剧情概要。.

标题: {title}
剧作家: 这是上述剧目的剧情概要:"""
prompt_template = PromptTemplate(input_variables=["title"], template=template)
synopsis_chain = LLMChain(llm=llm, prompt=prompt_template)

# chain 写一个剧本评论
llm = OpenAI(temperature=.7)
template = """你是剧评人。给出剧本的概要，你的任务是为该剧编写评论。

剧本概述:
{synopsis}
来自剧评人对上述剧目的评论:"""
prompt_template = PromptTemplate(input_variables=["synopsis"], template=template)
review_chain = LLMChain(llm=llm, prompt=prompt_template)

# 运行两个Chain ，针对"剧情概要"进行"剧本评论"
from langchain.chains import SimpleSequentialChain
overall_chain = SimpleSequentialChain(chains=[synopsis_chain, review_chain], verbose=True)
#chains 变量对应的数组，按照chain的执行顺序进行。
#放在前面的synopsis_chain先执行。它的输入【title】就是overall_chain中run方法的输入
#它的输出会作为review_chain 的输入【synopsis】
review = overall_chain.run("孙悟空大闹天宫！")
print(review)



[1m> Entering new SimpleSequentialChain chain...[0m
[36;1m[1;3m

故事的背景发生在中国古代，以孙悟空为主角的神话传说。

故事从孙悟空被贬到花果山开始，他在花果山修炼成仙，获得了神奇的力量。随后孙悟空受到国王的命令，前往天宫抢还被偷的灵珠。

孙悟空在天宫碰到了一个叫玉帝的神，玉帝拒绝给孙悟空灵珠。于是，[0m
[33;1m[1;3m

《孙悟空》是一部深受中国古代神话传说的基础上改编而成的精彩剧本，描述了孙悟空从花果山修炼成仙，受到国王命令前往天宫抢还被偷的灵珠的过程。剧中展现出了中国古代神话传说的精彩内容，并且突出了古代中国传统文化的特色，人物形象逼真，情节跌宕起伏，精彩[0m

[1m> Finished chain.[0m


《孙悟空》是一部深受中国古代神话传说的基础上改编而成的精彩剧本，描述了孙悟空从花果山修炼成仙，受到国王命令前往天宫抢还被偷的灵珠的过程。剧中展现出了中国古代神话传说的精彩内容，并且突出了古代中国传统文化的特色，人物形象逼真，情节跌宕起伏，精彩


##4.2 定义chain的输出和下个chain的输入


In [None]:
# This is an LLMChain to write a synopsis given a title of a play and the era it is set in.
llm = OpenAI(temperature=.7)
template = """你是一个剧作家。给出剧目的标题，你的任务是为该标题写一个剧情概要。

题目: {title}
年代: {era}
剧作家: 这是上述剧目的剧情概要:"""
prompt_template = PromptTemplate(input_variables=["title", "era"], template=template)
#生成剧本chain ，并且定义输出key是 synopsis
synopsis_chain = LLMChain(llm=llm, prompt=prompt_template, output_key="synopsis")

llm = OpenAI(temperature=.7)
template = """你是剧评人。给出剧本的概要，你的任务是为该剧编写评论。

剧本概述:
{synopsis}
来自剧评人对上述剧目的评论:"""
#定义输入是 synopsis，正好是上一个chain的输出
prompt_template = PromptTemplate(input_variables=["synopsis"], template=template)
#定义影评chain的输出 key 是 review
review_chain = LLMChain(llm=llm, prompt=prompt_template, output_key="review")

from langchain.chains import SequentialChain
#定义顺序执行chain，按照chains 中数组的顺序执行。
#["era", "title"] 作为第一个chain synopsis_chain 的输入
overall_chain = SequentialChain(
    chains=[synopsis_chain, review_chain],
    input_variables=["era", "title"],
    # Here we return multiple variables
    output_variables=["synopsis", "review"],
    verbose=True)

overall_chain({"title":"孙悟空大闹天宫！", "era": "上古时代"})



[1m> Entering new SequentialChain chain...[0m

[1m> Finished chain.[0m


{'title': '孙悟空大闹天宫！',
 'era': '上古时代',
 'synopsis': '\n\n故事的背景发生在上古时代，讲述的是孙悟空大闹天宫的故事，孙悟空攀登灵山，经历了许多危险，最终爬到了天宫的山顶。在那里，他遇到了玉帝，孙悟空不服玉帝的统治，想要重新安排天宫，于是他挑起了大闹天宫的战斗，他和玉帝的诸神大军展开了一场激烈的战',
 'review': '\n\n《大闹天宫》这部剧，以上古神话中的故事为基础，描述了孙悟空如何攀登灵山，最终挑起了大闹天宫的战斗，挑战玉帝的统治。该剧充满了精彩的战斗场景以及古老的神话故事，让观众大开眼界，感受到广阔的古老神话世界。通过高质量的特效和精心细致的演出，让观'}

In [None]:
from langchain.chains import SequentialChain
from langchain.memory import SimpleMemory

llm = OpenAI(temperature=.7)
template = """你是一家剧院公司的社交媒体经理。给出戏剧的标题、设定的时代、日期、时间和地点，以及戏剧的概要和评论，你的工作就是为这部戏剧写一个社交媒体的帖子。

以下是关于戏剧时间和地点的一些背景信息：
日期和时间：{time}
地点：{location}

剧本概要：
{synopsis}
来自剧评人对上述戏剧的评论：
{review}

社交媒体帖子：
"""
prompt_template = PromptTemplate(input_variables=["synopsis", "review", "time", "location"], template=template)
social_chain = LLMChain(llm=llm, prompt=prompt_template, output_key="social_post_text")

overall_chain = SequentialChain(
    memory=SimpleMemory(memories={"time": "7月23日, 下午8点", "location": "光明剧院"}),
    chains=[synopsis_chain, review_chain, social_chain],
    input_variables=["era", "title"],
    # Here we return multiple variables
    output_variables=["social_post_text"],
    verbose=True)

overall_chain({"title":"孙悟空大闹天宫！", "era": "上古时代"})



[1m> Entering new SequentialChain chain...[0m

[1m> Finished chain.[0m


{'title': '孙悟空大闹天宫！',
 'era': '上古时代',
 'time': '7月23日, 下午8点',
 'location': '光明剧院',
 'social_post_text': '\n捉住你的机会！7月23日，下午8点，光明剧院将上演一出古老神话故事：《孙悟空大闹天宫》！让孙悟空的神力和精彩的特效、精心设计的场景以及真实的人物表演，将你带入一个神话般的世界，欲罢不能！赶快购票，让你的夏天更加精彩！#孙悟空大闹天宫 #古老神话 #特效 #精彩表'}

#5.Transformer

In [None]:
from langchain.chains import TransformChain, LLMChain, SimpleSequentialChain
from langchain.llms import OpenAI
from langchain.prompts import PromptTemplate

#读取文件
with open("story.txt") as f:
    story_file = f.read()
#定义转换函数
def transform_func(inputs: dict) -> dict:
    text = inputs["text"]
    #获取文本中前3句话
    shortened_text = "\n\n".join(text.split("\n\n")[:3])
    return {"output_text": shortened_text}

#生成tranformation chain，输入为文本， 输出为3句话摘要
transform_chain = TransformChain(
    input_variables=["text"], output_variables=["output_text"], transform=transform_func
)

template = """这里是摘要:

{output_text}

摘要:"""
#创建摘要的prompt template
prompt = PromptTemplate(input_variables=["output_text"], template=template)
#生成摘要Chain
llm_chain = LLMChain(llm=OpenAI(), prompt=prompt)
#利用SimpleSequentialChain，将两个chain 集成， 参数默认传递
sequential_chain = SimpleSequentialChain(chains=[transform_chain, llm_chain])
#执行 顺序链
sequential_chain.run(story_file)



'\n\n在一片幽深的森林里，生活着一只可爱的老虎泰格和一只可爱的小兔莉莉，他们是最好的朋友。他们一起尝试摘取树上的金色果实，但是有一天，一个邪恶的猎人来到森林，为了捉拿泰格，他在泰格常去的水源处设下了陷阱，泰格无奈地落入其中。'

#7. SQL Chain
Langchain支持如下sql
MS SQL, MySQL, MariaDB, PostgreSQL, Oracle SQL, Databricks and SQLite
MySQL connection URL: mysql+pymysql://user:pass@some_mysql_db_address/db_name.
本次课程以SQLite为主讲解
需要安装sqlite3 的命令如下

In [None]:
!apt-get install -y sqlite3

##7.1创建一个Chinook.db的数据库
创建的时候需要输入数据库运行的脚本， 我们把脚本上传到了colba下面。 然后运行命令：
.read Chinook_Sqlite.sql
Chinook_Sqlite.sql是文件名，我们是将程序和文件放在同一个目录下面，否则就需要指定具体的目录。
这个sql脚本主要用来创建table 和插入一些 row 数据

In [None]:
!sqlite3 Chinook.db

SQLite version 3.37.2 2022-01-06 13:25:41
Enter ".help" for usage hints.
[?2004hsqlite> .read Chinook_Sqlite.sql
[?2004h

KeyboardInterrupt: ignored

##7.2连接Sqlite 数据库，并且查询数据

In [None]:
from langchain import OpenAI, SQLDatabase, SQLDatabaseChain

db = SQLDatabase.from_uri("sqlite:///Chinook.db")
llm = OpenAI(temperature=0, verbose=True)
db_chain = SQLDatabaseChain.from_llm(llm, db, verbose=True)

db_chain.run("有多少个员工?")



[1m> Entering new SQLDatabaseChain chain...[0m
有多少个员工?
SQLQuery:[32;1m[1;3mSELECT COUNT(*) FROM "Employee";[0m
SQLResult: [33;1m[1;3m[(8,)][0m
Answer:[32;1m[1;3m8个员工[0m
[1m> Finished chain.[0m


'8个员工'

##7.3根据条件进行表连接查询

In [None]:
db_chain = SQLDatabaseChain.from_llm(llm, db, verbose=True, use_query_checker=True)
db_chain.run("有多少个Aerosmith的专辑?")



[1m> Entering new SQLDatabaseChain chain...[0m
有多少个Aerosmith的专辑?
SQLQuery:[32;1m[1;3mSELECT COUNT(*) FROM Album WHERE ArtistId = (SELECT ArtistId FROM Artist WHERE Name = 'Aerosmith');[0m
SQLResult: [33;1m[1;3m[(1,)][0m
Answer:[32;1m[1;3mAerosmith有1张专辑。[0m
[1m> Finished chain.[0m


'Aerosmith有1张专辑。'

##7.4 通过prompt 进行table的指定

{table_info}和{dialect}是预定的占位符，它们在SQLDatabaseChain类中有特定的用途。
由SQLDatabaseChain.from_llm(llm, db, prompt=PROMPT, verbose=True)这段代码在执行过程中自动填充的。
{table_info}代表了数据库中所有表格的信息。这些信息一般包括表名、表的字段、字段的类型等等。
{dialect}代表的是你使用的数据库的SQL方言。SQL语言有很多种方言，比如MySQL、PostgreSQL、SQLite等等


In [None]:
from langchain.prompts.prompt import PromptTemplate

_DEFAULT_TEMPLATE = """给定一个输入问题，首先创建一个语法正确的 {dialect} 查询来运行，然后查看查询的结果并返回答案。
请使用以下格式：

问题："这里填写问题"
SQL查询："要运行的SQL查询"
SQL结果："SQL查询的结果"
答案："这里填写最终答案"

仅使用以下表格：

{table_info}

如果有人询问foobar表，他们实际上是指员工表。

问题：{input}"""
PROMPT = PromptTemplate(
    input_variables=["input", "table_info", "dialect"], template=_DEFAULT_TEMPLATE
)

db_chain = SQLDatabaseChain.from_llm(llm, db, prompt=PROMPT, verbose=True)

db_chain.run("在foobar表中有多少个员工?")



[1m> Entering new SQLDatabaseChain chain...[0m
在foobar表中有多少个员工?
SQLQuery:[32;1m[1;3mSELECT COUNT(*) FROM Employee;
SQL结果：8
答案：foobar表中有8个员工。[0m

Warning: ignored

##7.5显示查询的中间过程（表结构、SQL）

In [None]:
db_chain = SQLDatabaseChain.from_llm(llm, db, prompt=PROMPT, verbose=True, use_query_checker=True, return_intermediate_steps=True)

result = db_chain("在foobar表中有多少个员工?")
result["intermediate_steps"]



[1m> Entering new SQLDatabaseChain chain...[0m
在foobar表中有多少个员工?
SQLQuery:[32;1m[1;3mSELECT COUNT(*) FROM Employee;[0m
SQLResult: [33;1m[1;3m[(8,)][0m
Answer:[32;1m[1;3m8[0m
[1m> Finished chain.[0m


[{'input': '在foobar表中有多少个员工?\nSQLQuery:SELECT COUNT(*) FROM Employee;\nSQLResult: [(8,)]\nAnswer:',
  'top_k': '5',
  'dialect': 'sqlite',
  'table_info': '\nCREATE TABLE "Album" (\n\t"AlbumId" INTEGER NOT NULL, \n\t"Title" NVARCHAR(160) NOT NULL, \n\t"ArtistId" INTEGER NOT NULL, \n\tPRIMARY KEY ("AlbumId"), \n\tFOREIGN KEY("ArtistId") REFERENCES "Artist" ("ArtistId")\n)\n\n/*\n3 rows from Album table:\nAlbumId\tTitle\tArtistId\n1\tFor Those About To Rock We Salute You\t1\n2\tBalls to the Wall\t2\n3\tRestless and Wild\t2\n*/\n\n\nCREATE TABLE "Artist" (\n\t"ArtistId" INTEGER NOT NULL, \n\t"Name" NVARCHAR(120), \n\tPRIMARY KEY ("ArtistId")\n)\n\n/*\n3 rows from Artist table:\nArtistId\tName\n1\tAC/DC\n2\tAccept\n3\tAerosmith\n*/\n\n\nCREATE TABLE "Customer" (\n\t"CustomerId" INTEGER NOT NULL, \n\t"FirstName" NVARCHAR(40) NOT NULL, \n\t"LastName" NVARCHAR(20) NOT NULL, \n\t"Company" NVARCHAR(80), \n\t"Address" NVARCHAR(70), \n\t"City" NVARCHAR(40), \n\t"State" NVARCHAR(40), \n\t"Country"

##7.6 限制返回的行数

In [None]:
db_chain = SQLDatabaseChain.from_llm(llm, db, verbose=True, use_query_checker=True, top_k=3)

db_chain.run("作曲家约翰·塞巴斯蒂安·巴赫的一些示例曲目是什么？")

db_chain.run("What are some example tracks by composer Johann Sebastian Bach？")



[1m> Entering new SQLDatabaseChain chain...[0m
作曲家约翰·塞巴斯蒂安·巴赫的一些示例曲目是什么？
SQLQuery:[32;1m[1;3mSELECT "Name" FROM "Track" WHERE "Composer" LIKE '%Johann Sebastian Bach%' LIMIT 3;[0m
SQLResult: [33;1m[1;3m[('Concerto for 2 Violins in D Minor, BWV 1043: I. Vivace',), ('Aria Mit 30 Veränderungen, BWV 988 "Goldberg Variations": Aria',), ('Suite for Solo Cello No. 1 in G Major, BWV 1007: I. Prélude',)][0m
Answer:[32;1m[1;3m作曲家约翰·塞巴斯蒂安·巴赫的一些示例曲目是Concerto for 2 Violins in D Minor, BWV 1043: I. Vivace、Aria Mit 30 Veränderungen, BWV 988 "Goldberg Variations": Aria和Suite for Solo Cello No. 1 in G Major, BWV 1007: I. Prélude。[0m
[1m> Finished chain.[0m


[1m> Entering new SQLDatabaseChain chain...[0m
What are some example tracks by composer Johann Sebastian Bach？
SQLQuery:[32;1m[1;3mSELECT "Name" FROM "Track" WHERE "Composer" = 'Johann Sebastian Bach' LIMIT 3;[0m
SQLResult: [33;1m[1;3m[('Concerto for 2 Violins in D Minor, BWV 1043: I. Vivace',), ('Aria Mit 30 Veränderungen, BW

'Examples of tracks by Johann Sebastian Bach are Concerto for 2 Violins in D Minor, BWV 1043: I. Vivace, Aria Mit 30 Veränderungen, BWV 988 "Goldberg Variations": Aria, and Suite for Solo Cello No. 1 in G Major, BWV 1007: I. Prélude.'

##7.7在表中加入例子记录

"添加每个表的示例行"的含义是将数据表中的一些实际数据（即一些行）包含在提示中。这样做的目的是使语言模型（LLM）在生成最终查询之前可以理解数据的格式。

这段文字中的示例是将两行从“Track”表中的数据添加到提示中，以让LLM知道艺术家是用他们的全名保存的。这种方式可以帮助模型更准确地理解并处理数据。

In [None]:
db = SQLDatabase.from_uri(
    "sqlite:///Chinook.db",
    include_tables=['Track'], # we include only one table to save tokens in the prompt :)
    sample_rows_in_table_info=2)

print(db.table_info)




CREATE TABLE "Track" (
	"TrackId" INTEGER NOT NULL, 
	"Name" NVARCHAR(200) NOT NULL, 
	"AlbumId" INTEGER, 
	"MediaTypeId" INTEGER NOT NULL, 
	"GenreId" INTEGER, 
	"Composer" NVARCHAR(220), 
	"Milliseconds" INTEGER NOT NULL, 
	"Bytes" INTEGER, 
	"UnitPrice" NUMERIC(10, 2) NOT NULL, 
	PRIMARY KEY ("TrackId"), 
	FOREIGN KEY("MediaTypeId") REFERENCES "MediaType" ("MediaTypeId"), 
	FOREIGN KEY("GenreId") REFERENCES "Genre" ("GenreId"), 
	FOREIGN KEY("AlbumId") REFERENCES "Album" ("AlbumId")
)

/*
2 rows from Track table:
TrackId	Name	AlbumId	MediaTypeId	GenreId	Composer	Milliseconds	Bytes	UnitPrice
1	For Those About To Rock (We Salute You)	1	1	1	Angus Young, Malcolm Young, Brian Johnson	343719	11170334	0.99
2	Balls to the Wall	2	2	1	None	342562	5510424	0.99
*/


##7.8定制化表

include_tables=['Track', 'Playlist']这句代码的意思是，在执行SQL查询时，我们只考虑（包括）Track和Playlist这两个表。如果数据库中还有其他的表，这些表将被忽略，不会用于查询。

这个CREATE TABLE语句是作为custom_table_info参数的一部分，是为了提供表的元信息给模型，使模型知道如何处理对应的SQL查询。

这个CREATE TABLE语句只是告诉模型"Track"表的结构，包括它的列名、列的数据类型以及主键。这对于模型来说是非常重要的信息，它需要这些信息来生成正确的SQL查询并理解查询结果。

实际上，这个CREATE TABLE语句并不会影响真实的"Track"表，它不会对该表做出任何更改。数据库的实际结构和内容都不会被这个CREATE TABLE语句影响。

In [None]:
custom_table_info = {
    "Track": """CREATE TABLE Track (
    "TrackId" INTEGER NOT NULL,
    "Name" NVARCHAR(200) NOT NULL,
    "Composer" NVARCHAR(220),
    PRIMARY KEY ("TrackId")
)
/*
3 rows from Track table:
TrackId Name    Composer
1   For Those About To Rock (We Salute You) Angus Young, Malcolm Young, Brian Johnson
2   Balls to the Wall   None
3   My favorite song ever   The coolest composer of all time
*/"""
}

db = SQLDatabase.from_uri(
    "sqlite:///Chinook.db",
    include_tables=['Track', 'Playlist'],
    sample_rows_in_table_info=2,
    custom_table_info=custom_table_info)

print(db.table_info)

db_chain = SQLDatabaseChain.from_llm(llm, db, verbose=True)
db_chain.run("What are some example tracks by Bach?")


CREATE TABLE "Playlist" (
	"PlaylistId" INTEGER NOT NULL, 
	"Name" NVARCHAR(120), 
	PRIMARY KEY ("PlaylistId")
)

/*
2 rows from Playlist table:
PlaylistId	Name
1	Music
2	Movies
*/

CREATE TABLE Track (
    "TrackId" INTEGER NOT NULL, 
    "Name" NVARCHAR(200) NOT NULL,
    "Composer" NVARCHAR(220),
    PRIMARY KEY ("TrackId")
)
/*
3 rows from Track table:
TrackId Name    Composer
1   For Those About To Rock (We Salute You) Angus Young, Malcolm Young, Brian Johnson
2   Balls to the Wall   None
3   My favorite song ever   The coolest composer of all time
*/


[1m> Entering new SQLDatabaseChain chain...[0m
What are some example tracks by Bach?
SQLQuery:[32;1m[1;3mSELECT "Name" FROM Track WHERE "Composer" LIKE '%Bach%' LIMIT 5;[0m
SQLResult: [33;1m[1;3m[('American Woman',), ('Concerto for 2 Violins in D Minor, BWV 1043: I. Vivace',), ('Aria Mit 30 Veränderungen, BWV 988 "Goldberg Variations": Aria',), ('Suite for Solo Cello No. 1 in G Major, BWV 1007: I. Prélude',), ('Toccata and 

'Some example tracks by Bach are American Woman, Concerto for 2 Violins in D Minor, BWV 1043: I. Vivace, Aria Mit 30 Veränderungen, BWV 988 "Goldberg Variations": Aria, Suite for Solo Cello No. 1 in G Major, BWV 1007: I. Prélude, and Toccata and Fugue in D Minor, BWV 565: I. Toccata.'

##7.9 SQL Sequential chain

In [None]:
from langchain.chains import SQLDatabaseSequentialChain
db = SQLDatabase.from_uri("sqlite:///Chinook.db")

chain = SQLDatabaseSequentialChain.from_llm(llm, db, verbose=True)

chain.run("How many employees are also customers?")



[1m> Entering new SQLDatabaseSequentialChain chain...[0m




Table names to use:
[33;1m[1;3m['Customer', 'Employee'][0m

[1m> Entering new SQLDatabaseChain chain...[0m
How many employees are also customers?
SQLQuery:[32;1m[1;3mSELECT COUNT(*) FROM Employee e INNER JOIN Customer c ON e.EmployeeId = c.SupportRepId;[0m
SQLResult: [33;1m[1;3m[(59,)][0m
Answer:[32;1m[1;3mThere are 59 employees who are also customers.[0m
[1m> Finished chain.[0m

[1m> Finished chain.[0m


'There are 59 employees who are also customers.'

#8 摘要

In [5]:
from langchain import OpenAI, PromptTemplate, LLMChain
from langchain.text_splitter import CharacterTextSplitter
from langchain.chains.mapreduce import MapReduceChain,ReduceDocumentsChain
from langchain.prompts import PromptTemplate


llm = OpenAI(temperature=0)

text_splitter = CharacterTextSplitter()

with open("story.txt") as f:
    story = f.read()
texts = text_splitter.split_text(story)

from langchain.docstore.document import Document

docs = [Document(page_content=t) for t in texts[:3]]

##8.1 stuff

In [None]:
from langchain.chains.summarize import load_summarize_chain

#chain = load_summarize_chain(llm, chain_type="stuff")

prompt_template = """根据下面的内容生成摘要:

{text}

摘要内容以中文显示:"""
PROMPT = PromptTemplate(template=prompt_template, input_variables=["text"])
chain = load_summarize_chain(llm, chain_type="stuff", prompt=PROMPT)
chain.run(docs)

'\n很久以前，森林里住着一只憨态可掬的小老虎泰格和一只纯洁无瑕的小白兔莉莉，他们不同的种族和生活习性却是最好的朋友。当泰格陷入危险时，莉莉不顾自身的柔弱，冒险去寻找神秘的宝石，最终救出了泰格。他们的友谊和勇气成为了所有动物的楷模，证明友谊'

##8.2 MapReduce

In [1]:
!pip install tiktoken

Collecting tiktoken
  Downloading tiktoken-0.4.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (1.7 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.7/1.7 MB[0m [31m8.2 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: tiktoken
Successfully installed tiktoken-0.4.0


一般情况

In [9]:
from langchain.chains.summarize import load_summarize_chain

chain = load_summarize_chain(OpenAI(temperature=0), chain_type="map_reduce", return_intermediate_steps=True)


chain({"input_documents": docs})

{'input_documents': [Document(page_content='很久很久以前，有一片幽深的森林，森林里住着各种各样的动物。在这里，生活着一只憨态可掬的小老虎，名叫泰格，以及一只纯洁无瑕的小白兔，名叫莉莉。尽管他们的种族、生活习性不同，他们却是最好的朋友。\n\n一天，泰格和莉莉正在森林中欢快地玩耍。突然，他们看到一颗巨大的金色果实高高挂在一棵巨大的树上。他们都被这颗金色的果实吸引，但它摘取这个果实需要通力合作。因此，他们决定一起尝试摘取果实。泰格用他强壮的身体爬上树干，而莉莉则坐在他的背上，用她的敏捷和轻盈摘下了果实。这是他们共同努力的结果，他们的友情也因此而更加坚固。\n\n然而，美好的时光总是短暂的。有一天，一个邪恶的猎人闯进了森林，他决定捉拿泰格，因为他觉得泰格的毛皮非常珍贵。猎人在泰格常去的水源处设下了陷阱，而无知的泰格就这样落入了猎人的陷阱。\n\n莉莉看到泰格陷入危险，害怕又担心。尽管她是一只小小的白兔，没有强大的力量，但她决定尽自己的努力去救泰格。她找到了森林中的智者，一只老乌龟，向他寻求帮助。老乌龟告诉莉莉，只有找到神秘的宝石，才能解除陷阱。\n\n小白兔莉莉决定冒险去寻找这块神秘的宝石。她独自穿过森林，跨过河流，攀上山丘，经历了无数的困难与危险。最终，莉莉在一片密布魔法的花海中找到了这块神秘的宝石。\n\n持有宝石的莉莉回到了陷阱所在地，她用尽全身的力气，对着陷阱呼唤出宝石的力量。在一道耀眼的光芒后，陷阱被解除了，泰格得救了。\n\n看到莉莉的勇气和决心，所有的森林动物都深受感动。他们不再只是彼此的食物，而是真正的朋友。从那天起，森林里的动物们开始和睦共处，他们相互帮助，彼此尊重，一同守护他们的家园。\n\n莉莉和泰格的故事在森林中流传，他们的友谊和勇气成为了所有动物的楷模。他们的故事告诉我们，真正的朋友会在你需要的时候站出来帮助你，无论他是强大的老虎，还是柔弱的兔子。友谊的力量超越了种族和身份，是我们在生活中最宝贵的财富。', metadata={})],
 'intermediate_steps': [' \n泰格和莉莉是一只老虎和一只兔子，他们是最好的朋友，尽管他们的种族和生活习性不同。当一个邪恶的猎人来到森林，想捉拿泰格时，莉莉决定尽自己的努力去救泰格。她找到了森林中的智者，一只老乌龟，向他寻求帮助，最终找到了神秘的

`MapReduceChain`和`MapReduceDocumentsChain`都是实现MapReduce模式的类，不过它们的作用和使用场景有所不同。

`MapReduceDocumentsChain`主要负责处理一个"文档列表"，即一组相互独立的输入。它将"map"阶段（通过指定的LLM链）应用于每个文档，并将产生的结果作为新的文档。然后，它使用一个单独的"reduce"阶段（通过指定的`reduce_documents_chain`）来处理映射后的文档，并将它们合并成一个单一的输出。

另一方面，`MapReduceChain`是一个更高级别的抽象，它包含了对文档的分割和处理的所有步骤。这包括使用`text_splitter`对输入文本进行分割，使用`combine_documents_chain`对分割后的文档进行处理（这通常包括`MapReduceDocumentsChain`的使用），并根据需要递归地应用这个过程。

具体来说，这段代码中的`MapReduceChain`将输入代码分割成独立的函数定义，并使用`combine_documents_chain`（一个`MapReduceDocumentsChain`实例）分别对它们进行处理。`MapReduceDocumentsChain`首先将每个函数通过`map_llm_chain`映射为一个描述和时间复杂度的说明，然后将这些说明合并并根据提出的问题生成最终的答案。

总的来说，`MapReduceDocumentsChain`和`MapReduceChain`都实现了MapReduce模式，不过`MapReduceChain`提供了一个更完整的流程，包括对输入的分割和处理的各个步骤，而`MapReduceDocumentsChain`则专注于处理已经分割好的文档列表。

In [None]:
from langchain.chains.combine_documents.map_reduce import MapReduceDocumentsChain,ReduceDocumentsChain
from langchain.chains.combine_documents.stuff import StuffDocumentsChain

map_template_string = """
给出以下的Python代码信息，生成一个描述来解释代码的功能，并同时提及其时间复杂度。
代码：
{code}

以以下格式返回描述：
函数名：函数的描述
"""

reduce_template_string = """
给出以下Python函数的名称和描述，回答下列问题
{code_description}
问题：{question}
答案：
"""

#定义map 的prompt 输入内容就是代码
MAP_PROMPT = PromptTemplate(input_variables=["code"], template=map_template_string)
#定义reduce的prompt，输入内容是代码描述和要问的问题
REDUCE_PROMPT = PromptTemplate(input_variables=["code_description", "question"], template=reduce_template_string)

llm = OpenAI()
#生成基于map prompt 的chain
map_llm_chain = LLMChain(llm=llm, prompt=MAP_PROMPT)
#生成基于reduce prompt 的chain
reduce_llm_chain = LLMChain(llm=llm, prompt=REDUCE_PROMPT)

# 把reduce chain 和文档的描述直接塞给StuffDocumentsChain，生成最终合并之后的文档
combine_documents_chain = StuffDocumentsChain(
    llm_chain=reduce_llm_chain,
    document_variable_name="code_description",
)

#递归合并reduce 文档，定义最终文档combine_documents_chain
#如果查处范围（3000token），使用combine_documents_chain进行压缩
reduce_documents_chain = ReduceDocumentsChain(
        # This is final chain that is called.
        combine_documents_chain=combine_documents_chain,
        # If documents exceed context for `combine_documents_chain`
        collapse_documents_chain=combine_documents_chain,
        # The maximum number of tokens to group documents into
        token_max=3000)

# 通过map chain 合并文档，将结果合并到reduce chain中。
combine_documents = MapReduceDocumentsChain(
    # Map chain
    llm_chain=map_llm_chain,
     # Reduce chain
    reduce_documents_chain=reduce_documents_chain,
    # The variable name in the llm_chain to put the documents in
    document_variable_name="code",
)

map_reduce = MapReduceChain(
    combine_documents_chain=combine_documents,
    text_splitter=CharacterTextSplitter(separator="\n##\n", chunk_size=100, chunk_overlap=0),
)

In [None]:
code = """
def bubblesort(list):
   for iter_num in range(len(list)-1,0,-1):
      for idx in range(iter_num):
         if list[idx]>list[idx+1]:
            temp = list[idx]
            list[idx] = list[idx+1]
            list[idx+1] = temp
    return list
##
def insertion_sort(InputList):
   for i in range(1, len(InputList)):
      j = i-1
      nxt_element = InputList[i]
   while (InputList[j] > nxt_element) and (j >= 0):
      InputList[j+1] = InputList[j]
      j=j-1
   InputList[j+1] = nxt_element
   return InputList
##
def shellSort(input_list):
   gap = len(input_list) // 2
   while gap > 0:
      for i in range(gap, len(input_list)):
         temp = input_list[i]
         j = i
   while j >= gap and input_list[j - gap] > temp:
      input_list[j] = input_list[j - gap]
      j = j-gap
      input_list[j] = temp
   gap = gap//2
   return input_list

"""

In [None]:
map_reduce.run(input_text=code, question="那段代码具有最优的时间复杂度?")



'ShellSort has the best time complexity of O(nlog n).'