In [1]:
import os
import grandalf

from rich import print as print
from operator import attrgetter, itemgetter

from langchain_openai import ChatOpenAI
from langchain_core.runnables import ConfigurableField
from langchain_core.pydantic_v1 import BaseModel, Field
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_core.prompts import ChatPromptTemplate, PromptTemplate
from langchain.output_parsers.openai_tools import JsonOutputToolsParser
from langchain_core.output_parsers import StrOutputParser, JsonOutputParser
from langchain_core.runnables import RunnableBranch, RunnableLambda, RunnableParallel, RunnablePassthrough, RunnableSequence

In [2]:
os.environ['OPENAI_API_KEY'] = "sk-None-vowLahS2p4mOq6FP56VCT3BlbkFJTY1umKuhsfu61iHTNVDc"
os.environ["GOOGLE_API_KEY"] = "AIzaSyCGtKgSU_XxaFGFbPCEt3H4uTmP3tOrAFg"

# 第 3 章 建立對話機器人

## 3-1 認識LCEL（LangChain Expression Language）

### 1. 簡單使用 LCEL
可以使用`|`把prompt，LLM，parser串起來成一個chain，再使用`invoke`直接得到想要的輸出

In [3]:
prompt = ChatPromptTemplate.from_template('{city} 位於那一個國家？')
chat_model = ChatOpenAI()
str_parser = StrOutputParser()
chain = prompt | chat_model | str_parser

In [4]:
print(chain.invoke({"city":"台北"}))

台北是台灣的首都，位於中華民國（台灣）的北部。


### 2. 手工串接個別物件
如果沒有`|`的話，我們就得自己寫Python把這些東西串起來了，多不方便啊！此外，想加入新的東西也會很麻煩

In [5]:
content = str_parser.invoke(chat_model.invoke(prompt.invoke({'city': '台北'})))
print(content)

台北位於中華民國（台灣）的北部。


In [6]:
class make_chain:
    def __init__(self, runnable_list):
        self.__runnable_list = runnable_list
    def invoke(self, arg):
        for runnable in self.__runnable_list:
            arg = runnable.invoke(arg)
        return arg

find_country_chain = make_chain([prompt, chat_model, str_parser])
find_country_chain.invoke({'city': '京都'})

'日本。'

### 3. 使用 RunnableSequence 類別簡化多層函式的呼叫
`RunnableSequence`的功能跟LCEL是一樣的，只是不如LCEL精簡

In [7]:
find_country_chain = RunnableSequence(prompt, chat_model, str_parser)
find_country_chain.invoke({'city': 'New York'})

'美國'

### 4. 使用 RunnableParallel 以相同參數執行並整合多個 Runnable 物件
將相同參數傳入多個不同的chain時（可以想像成Chain的並聯），可以使用`RunnableParallel`物件。例如以下定義一個`find_lang_chain`的chain，我們想pass一樣的參數進去`find_lang_chain`和剛剛定義的`find_country_chain`，可以這麼做

In [8]:
lang_template = ChatPromptTemplate.from_template('在{city}講哪一種語言？')
find_lang_chain = lang_template | chat_model | str_parser
find_lang_chain.invoke({'city': '開羅'})

'在開羅，主要使用的語言是阿拉伯語。此外，也有一部分人口使用英語作為第二語言。'

建立`RunnableParallel`物件時，甚至可以隨意的塞入沒定義過得變數作為輸出的key。例如之前的程式根本沒定義`country`跟`lang`兩變數，但`RunnableParallel`物件會讓這個並聯的chain的回傳成為「以這兩個變數名稱為key的字典」

In [9]:
find_country_and_lang_chain = RunnableParallel(country=find_country_chain, lang=find_lang_chain)
find_country_and_lang_chain.invoke({'city': '開羅'})

{'country': '開羅位於埃及。',
 'lang': '在開羅，通常講阿拉伯語。開羅是埃及的首都，阿拉伯語是埃及的官方語言之一。此外，也有部分人口講英語或法語等其他語言。'}

也可以用字典建立`RunnableParallel`物件，比較不會造成誤會

In [10]:
find_country_and_lang_chain = RunnableParallel({'country': find_country_chain, 'lang': find_lang_chain})
find_country_and_lang_chain.invoke({'city': '香港'})

{'country': '香港位於中國的南部，是中國的特別行政區。',
 'lang': '香港主要使用廣東話作為主要語言，此外普通話、英語和其他方言也有使用。'}

當字典（value必須是callable的物件！）跟一個`Runnable`物件以`|`接起來時，該字典會自動變成`RunnableParallel`物件。可以想像成兩個callable的物件並聯後再與第三個物件做串聯。例如以下的`summary_template`，他的功能是把前兩個並聯的chain的output接在一起

In [11]:
summary_template = ChatPromptTemplate.from_template('{country}{lang}')
summary_chain = {'country': find_country_chain, 'lang': find_lang_chain} | summary_template # 先並聯再串聯
pprint(summary_chain.invoke({'city': '釜山'}))

## 3-2 LCEL 實用功能

### 1. 串接可呼叫物件
`|`也可以拿來串聯函式等可呼叫的物件。比如說，以下的`attrgetter`是一個可以取得物件屬性的函式，而`itemgetter`則是可以獲取串列中指定位置元素的函式。

In [13]:
get_messages = attrgetter('messages')
get_first_item = itemgetter(0)

比如說，以下的Chain，會先由`summary_chain`獲得`ChatPromptValue`的回傳值，接著`get_messages`會取出該`ChatPromptValue`物件中的`messages`屬性（為一串列），`get_first_item`取出message的第一個元素，最後由`str_parser`解析器輸出成字串

In [14]:
summary = (summary_chain | get_messages | get_first_item | str_parser)
summary.invoke({'city': '台中'})

'台中位於台灣。在台中，主要講中文（普通話或台語）。另外，也有部分人口講英文或其他語言。'

### 2. 使用 RunnablePassthrough 搭配 RunnableParallel 簡化傳入參數
`RunnablePassthrough`可以用來把字串直接傳入chain中，單獨使用時就是一個identical mapping

In [15]:
r = RunnablePassthrough()
r.invoke("台北")

'台北'

用以下的技巧省去`invoke`時需要傳送字典的不方便

In [16]:
summary = {'city': RunnablePassthrough()} | summary
summary.invoke('台中')

'台中位於台灣。台中是位於台灣的城市，居民主要使用的語言是中文，也就是普通話或台語。另外，也有少數人使用英文或其他外語。'

### 3. RunnableBinding物件
`RunnableBinding`物件可以用來指定額外的參數。例如`Runnable`物件底下的`bind`方法，其中的stop參數可以使模型一講到其中的關鍵字就停止輸出

In [17]:
chain = {"city": RunnablePassthrough()} | prompt.bind() | chat_model.bind(stop=["台灣","臺灣"]) | str_parser
print(chain.invoke("台北"))

台北是位於中華民國（


又比方說我們可以用`Pydantic`定義工具給LLM使用。定義出的工具，藉由模型的`bind_tools`方法來使用。比如我們定義一個網路搜尋工具（只是範例，它沒有作用）

In [24]:
class Search(BaseModel):
    """網路搜尋工具"""
    search_input: str = Field(description="應該要搜尋的關鍵字")

當使用`bind_tools`之後，`Pydantic`物件轉為OpenAI function calling

In [25]:
model = chat_model.bind_tools([Search])
pprint(model.kwargs["tools"])

以下這個chain，會將`invoke`的參數當成`prompt`中的`city`，拿去給`model`使用，而`model`會將剛剛該參數傳給定義出的`Search`物件

In [26]:
chain = ({"city": RunnablePassthrough()} | prompt | model)

In [27]:
pprint(chain.invoke("台北").tool_calls)

當想要知道chain裡面的工具的資訊時，可以使用`JsonOutputToolsParser`，這對使用OpenAI function calling非常有幫助

In [30]:
tools_parser = JsonOutputToolsParser()

In [31]:
chain = {"city": RunnablePassthrough()} | prompt | model | tools_parser
pprint(chain.invoke("台北"))

### 4. 分支與合併
現在我們展示LCEL真正強大的地方。我們可以把一個大問題拆解成一連串的chain，但是把中間的思考過程隱藏起來。比如想要問「珍珠奶茶起源於哪裡」，可以拆解成兩個問題：「誰發明了珍珠奶茶？」以及「該人是哪國人？」

In [32]:
person_template = ChatPromptTemplate.from_template("是誰發明{invention}？")
country_template = ChatPromptTemplate.from_template("{person}來自哪個國家？")

person_chain = ({"invention": RunnablePassthrough()}
              | person_template
              | chat_model
              | str_parser)

person_summary_chain = ({"person": person_chain} # invoke的參數會先被丟進`person_chain`
                        | country_template
                        | chat_model
                        | str_parser)

person_summary_chain.invoke("珍珠奶茶")

'臺灣'

### 5. 多個提示模板
甚至還可以把每個chain視為一個節點，組成一張單向圖，完成邏輯較為複雜的任務

比方說一個JK要根據自己當天的心情決定穿搭，他的決策方式如下：
1. 由自己的心情決定衣服
2. 由衣服決定下半身的搭配
3. 由衣服決定配戴的飾品
4. 綜合1~3作為一整套穿搭

則這個過程可以用4個prompt概括：

In [33]:
json_parser = JsonOutputParser()
format_instructions = json_parser.get_format_instructions()

In [65]:
# 制定提示模板
prompt1 = ChatPromptTemplate.from_template("假設你是日本女高中生，且你今天的心情十分{emotion}，請為自己挑選一件衣服。請僅提供該衣服的名稱：") 
prompt2 = ChatPromptTemplate.from_template("{cloth}這種衣服通常會搭配哪種裙子？請僅提供該裙子的名稱：{format_instructions}")
prompt2 = prompt2.partial(format_instructions=format_instructions)
prompt3 = ChatPromptTemplate.from_template("哪種飾品配合{cloth}最搭配？請僅提供飾品名稱：")
prompt4 = ChatPromptTemplate.from_template("請結合{cloth}，{skirt}和{accessory}，這樣的穿搭適合和朋友到哪些地方逛街")

把決策的過程使用3條chain串起來

In [66]:
emotion_to_cloth = {"emotion": RunnablePassthrough()} | prompt1 | chat_model | str_parser
cloth_to_skirt = prompt2 | chat_model | json_parser
cloth_to_accessory = prompt3 | chat_model | str_parser

In [71]:
def extract_cloth(input_dict):
    return {"cloth": input_dict, "input": input_dict}

In [72]:
question_generator = (emotion_to_cloth
    | extract_cloth
    | {
        "skirt": cloth_to_skirt | itemgetter("裙子"),  # RunnableParallel
        "accessory": cloth_to_accessory,
        "cloth": RunnablePassthrough()  # Ensure cloth is preserved
    }
    | prompt4
)

In [73]:
prompt = question_generator.invoke("長期素食導致變成不爽世")
print(
    f"最終產生的問題：{prompt.messages[0].content}\n\n"
    f"AI 回答結果：{chat_model.invoke(prompt).content}"
)

最終產生的問題：請結合{'cloth': '黑色長袖寬鬆T恤', 'input': '黑色長袖寬鬆T恤'}，牛仔裙和1. 銀色長項鍊
2. 黑色寬腰帶
3. 銀色手鐲
4. 棕色編織手提包，這樣的穿搭適合和朋友到哪些地方逛街

AI 回答結果：這樣的穿搭適合和朋友到購物中心、咖啡廳或者小型市集逛街。配上牛仔裙和黑色長袖寬鬆T恤，再搭配銀色長項鍊、黑色寬腰帶、銀色手鐲以及棕色編織手提包，整體看起來時尚又舒適，適合在休閒的環境中與朋友一起享受購物樂趣。這樣的穿搭不僅適合在白天逛街，也可以輕鬆轉換成晚上的約會穿搭。


甚至還可以把這個決策圖給畫出來

In [76]:
question_generator.get_graph().print_ascii()

                             +------------------------+                           
                             | Parallel<emotion>Input |                           
                             +------------------------+                           
                                          *                                       
                                          *                                       
                                          *                                       
                                  +-------------+                                 
                                  | Passthrough |                                 
                                  +-------------+                                 
                                          *                                       
                                          *                                       
                                          *                                       
    

但是要注意的是，很多個chain這樣串在一起時往往很難debug，而不斷的invoke又會浪費錢。建議真的有問題可以丟給ChatGPT請他幫你生可以跑的code

## 3-3 LCEL 函式應用與分支合併

### 1. `RunnableLambda`物件
可以用`RunnableLambda`物件用來定義自己的`Runnable`物件，使其可以應用`invoke`方法並可以用`|`併入chain中。注意`RunnableLambda`物件包裝的函數只能有單一參數

In [78]:
def commodity(food):
    # 定義每個商店的商品和價格
    items = {"熱狗": 50, "漢堡": 70, "披薩": 100}
    item = items.get(food)
    print(f"{food}價格：{item}")
    return {"price": item}

In [80]:
food=RunnableLambda(commodity)
food.invoke("披薩")

披薩價格：100


{'price': 100}

In [82]:
prompt = ChatPromptTemplate.from_template("我選擇的商品要多少錢？數量{number}價錢{price}")
chain = (
    {
        'price':itemgetter("food") | RunnableLambda(commodity), # 並聯
        'number':itemgetter("number")
    }
    | prompt
    | chat_model
    | str_parser
)
print(chain.invoke({"food":"漢堡", "number":"101"}))

漢堡價格：70
101個商品的價格為70元。


看起來用的模型滿笨的

### 2. 依照輸入的分類執行不同任務
如果我們希望依據輸入的不同來進行不同的任務，我們可以怎麼做呢？比方說，
1. 當使用者用命令的語氣說話時，希望模型都以「是的，主人」開頭
2. 當使用者詢問知識形問題時，希望模型都以「根據我的知識」開頭。
#### (1) 土法煉鋼
我們可以先定義出一個分類器來分辨命令或查詢

In [83]:
classifier = (PromptTemplate.from_template(
                """
                    根據使用者問題作回答, 將問題分為要求命令或是查詢答案。\n
                    <問題>\n{question}\n</問題>\n
                    分類:
                """)
              | chat_model 
              | str_parser)

In [84]:
print(classifier.invoke({"question": "這是最後的警告，今後不要再和我扯上關係了"}))
print(classifier.invoke({"question": "為什麼要演奏春日影！？"}))

要求命令
查詢答案


接著根據兩種情況分別定義不同的chain

In [85]:
order_chain = (
    PromptTemplate.from_template(
        "你不會思考只根據命令做回應, 每次回答開頭都以 '是的, 主人' "
        "回覆命令\n"
        "問題: {question}\n"
        "回覆:"
    )
    | chat_model
)
ask_chain = (
    PromptTemplate.from_template(
        "你只能回答知識性相關問題, 任何要求命令不會照做也不會回答,"
        "每次回答開頭都以 '根據我的知識' 回覆命令\n"
        "問題: {question}"
        "回覆:"
    )
    | chat_model
)

並定義一個default的情形

In [86]:
defult_chain = (
    PromptTemplate.from_template(
        "請回答問題:\n"
        "問題: {question}\n"
        "回覆:"
    )
    | chat_model
)

將這些chain組合起來，並直接使用`if-else`判斷要使用哪一個chain來回答問題

In [87]:
def route(info):
    if "查詢答案" in info["topic"]:
        return ask_chain
    elif "要求命令" in info["topic"]:
        return order_chain
    else:
        return defult_chain

In [91]:
full_chain = ({"topic":classifier, "question": lambda x: x["question"]}
             | RunnableLambda(route)
             | str_parser)

In [92]:
full_chain.get_graph().print_ascii()

       +-------------------------------+    
       | Parallel<topic,question>Input |    
       +-------------------------------+    
                **            **            
              **                **          
            **                    **        
+----------------+                  **      
| PromptTemplate |                   *      
+----------------+                   *      
          *                          *      
          *                          *      
          *                          *      
  +------------+                     *      
  | ChatOpenAI |                     *      
  +------------+                     *      
          *                          *      
          *                          *      
          *                          *      
+-----------------+             +--------+  
| StrOutputParser |             | Lambda |  
+-----------------+             +--------+  
                **            **            
          

使用例：

In [93]:
print(full_chain.invoke({"question": "去幫我買東西"}))
print(full_chain.invoke({"question": "北極圈是在緯度多少以上？"}))

是的, 主人，我會去幫您買東西。
根據我的知識，北極圈是在緯度66.5度以上。


#### (2) RunnableBranch
如果需要LLM進行分類的時候可以建立`RunnableBranch`物件，達成跟剛剛的`route`一樣的事情。

In [95]:
branch = RunnableBranch(
    (lambda x: "查詢答案" in x["topic"], ask_chain),
    (lambda x: "要求命令" in x["topic"], order_chain),
    defult_chain,
)

In [96]:
full_chain = ({"topic": classifier, 
               "question": lambda x: x["question"]} # 並聯
              | branch
              | str_parser)

In [97]:
print(full_chain.invoke({"question": "以GPT4為題寫一首七言絕句"}))
print(full_chain.invoke({"question": "GPT2有多少參數？"}))

是的, 主人，GPT4智慧無雙，
機器之腦，超越人類，
推演未來，預測天象，
創新無窮，無所不能。
根據我的知識，GPT2有1.5億個參數。


### 3. 更換模型或提示
Google的gemini也支援langchain

In [99]:
gemini = ChatGoogleGenerativeAI(model="gemini-pro")
print(gemini.invoke("台灣101有多高？").content)

508公尺


#### (1) `ConfigurableField`物件

可以建立`ConfigurableField`物件，使得chain可以使用各種想要的語言模型。其中`id`將會用來切換模型使用，其餘的`name`以及`description`則是說明。以下列例子來說，可以使用字典`{'llm': "gpt4"}`來切換模型給GPT-4 turbo，或是以`{'llm': gemini'}`來切換到Gemini-pro，而預設的`llm`（`default_key`）是GPT-3.5 turbo。

In [118]:
llm = chat_model.configurable_alternatives(
    ConfigurableField(id="llm", name="LLM", description="多種語言模型"), # 預設模型 gpt-3.5-turbo
    default_key = "openai",
    gpt4 = ChatOpenAI(model="gpt-4-turbo"), # 新增模型 gpt-4-turbo   
    gemini = ChatGoogleGenerativeAI(model="gemini-pro", temperature=0.7) # 新增模型 gemini-pro
)

In [103]:
prompt = PromptTemplate.from_template("請回答問題{topic}")
chain = prompt | llm | str_parser

GPT4

In [104]:
print(chain.with_config(configurable={"llm": "gpt4"}).invoke({"topic": "為什麼要演奏春日影？"}))

《春日影》是一首具有中國傳統文化特色的樂曲，常見於古箏或其他中國傳統樂器的演奏。演奏這類樂曲有幾個原因：

1. **文化傳承**：演奏如《春日影》這樣的傳統樂曲有助於保留和傳遞中國豐富的文化遺產。這些樂曲往往蘊含深厚的歷史和文化意義，是文化身份和傳統的重要表達。

2. **藝術表達**：通過演奏傳統樂曲，演奏者可以展示其技藝，同時也能表達個人對於音樂和美的理解和感受。《春日影》等樂曲常常具有獨特的旋律和節奏，提供了一個展現個人藝術風格的平台。

3. **教育和學習**：對學習中國傳統音樂的學生來說，演奏這類樂曲是學習和掌握相關樂器技巧的重要部分。它們不僅有助於提高演奏技能，也能加深對音樂理論和歷史的理解。

4. **情感和心理作用**：音樂有助於調節情緒和緩解壓力。《春日影》這樣的樂曲通常具有柔和和諧的旋律，能夠帶給聽眾平靜和舒緩的感受，有益於心理健康。

5. **社交和娛樂**：在節日慶典或其他社交聚會中演奏《春日影》等樂曲，可以增添氣氛，促進人們之間的交流和聯繫，並提供娛樂享受。

總之，演奏《春日影》不僅是對傳統音樂的一種欣賞和練習，也是對中國文化深厚底蘊的一種展示和傳播。


In [105]:
print(chain.with_config(configurable={"llm": "gemini"}).invoke({"topic": "為什麼要演奏春日影？"}))

演奏《春日影》的原因可能包括：

* **展現日本傳統音樂：**《春日影》是日本傳統音樂的代表作，演奏它可以推廣和欣賞日本文化。

* **表達季節性情感：**這首曲子與春天聯繫在一起，它的旋律和節奏傳達了春天的歡樂和更新感。

* **技術挑戰：**這首曲子技術要求很高，需要精湛的演奏技巧，演奏它可以展現演奏者的能力。

* **文化交流：**在國際場合演奏《春日影》可以作為日本與其他文化之間交流的橋樑。

* **個人表達：**演奏這首曲子可以讓音樂家表達自己的音樂性、情感和對日本傳統的欣賞。

* **教育目的：**演奏《春日影》可以幫助學生了解日本音樂和文化。

* **儀式或慶祝活動：**這首曲子可用於儀式或慶祝活動，例如茶道或花道。

* **娛樂價值：**《春日影》是一首優美動聽的曲子，演奏它可以為聽眾帶來愉悅。


LLM們又在鬼扯了。

#### (2) `PromptTemplate`物件
`PromptTemplate`也可以塞入`ConfigurableField`物件

In [119]:
prompt = PromptTemplate.from_template("告訴我一個{topic}相關知識").configurable_alternatives(
    ConfigurableField(id="prompt", name="提示模板", description="多種提示"),
    default_key="knowledge", # 預設模板
    discuss=PromptTemplate.from_template("根據顏色{color}列出可能的水果"), # 新增提示模板
    chat=ChatPromptTemplate.from_messages([("system","你是一個動物專家"),
                                           ("human","相關特徵有{topic}, 請猜出是十二生肖的哪一個動物")]) # 新增對話提示模板
)

跟剛剛的`llm`串成一個chain。要怎麼使用呢？只要調用chain的`with_config`方法，將以字典指定`configurable`，就能同時指定`prompt`和`llm`的參數。接著`invoke`時只要塞入與`prompt`對應的參數即可

In [120]:
chain = prompt | llm | str_parser

In [110]:
print(chain.with_config(configurable={"prompt": "discuss", "llm": "openai"}).invoke({"color": "紅色"}))

蘋果、草莓、櫻桃、紅莓、紅提、火龍果


注意Gemini現在尚不支援`ChatPromptTemplate`輸入！！

In [121]:
print(chain.with_config(configurable={"llm": "gemini"}).invoke({"topic": "貓貓蟲咖波"}))

**貓貓蟲咖波**

**基本資料：**

* 學名：Strigops habroptilus
* 別名：貓頭鷹鸚鵡、紐西蘭夜鸚鵡
* 分類：鸚鵡科（Psittacidae）
* 體型：約 50-56 公分
* 壽命：約 10-12 年

**外觀：**

* 渾身覆蓋著黃綠色羽毛，腹部為黃色，臉部有明顯的貓頭鷹狀白色面盤
* 喙短而彎曲，呈綠色
* 眼睛大而圓，虹膜為黃色
* 腿短而強壯，腳趾上有鋒利的爪子

**棲息地：**

* 紐西蘭南島的峽灣地區和西海岸
* 棲息於低海拔的森林和灌木叢中

**習性：**

* 夜行性動物，白天通常躲藏在樹洞或岩縫中
* 以地面上的植物、水果和昆蟲為食
* 具有獨特的舞姿，會在求偶或求雨時拍打翅膀並發出低沉的咕嚕聲
* 非常害羞和神秘，很少被人類觀察到

**保護現狀：**

* 極度瀕危物種，目前僅存約 250 隻個體
* 面臨棲息地喪失、外來物種入侵和捕食等威脅
* 紐西蘭政府正在積極進行保護工作，包括圈養繁殖和棲息地管理

**趣聞：**

* 貓貓蟲咖波是紐西蘭的國鳥
* 牠們的叫聲聽起來像貓咪的呼嚕聲
* 牠們是世界上唯一不會飛的鸚鵡物種
* 牠們的壽命比其他鸚鵡要短，可能是由於夜行習性和地面棲息地的緣故
