In [25]:
from langchain_community.chat_models import ChatOllama
from langchain_openai import ChatOpenAI
from unittest.mock import patch
import httpx
from openai import RateLimitError

In [None]:
request = httpx.Request("GET", "/")
response = httpx.Response(200, request=request)
error = RateLimitError("rate limit", response=response, body="")

In [26]:
# we set max_retries = 0 to avoid retrying on RateLimits, etc
# 将 max_retries 设置为 0，以避免对 RateLimits 等进行重试
openai_llm = ChatOpenAI(max_retries=0)
qwen_llm = ChatOllama(model="qwen:1.8b")
llm = openai_llm.with_fallbacks([qwen_llm])

In [28]:
# Let's use just the OpenAI LLm first, to show that we run into an error
# 让我们先使用 OpenAI 的大型语言模型（LLM），来展示我们遇到的错误。
with patch("openai.resources.chat.completions.Completions.create", side_effect=error):
    try:
        print(openai_llm.invoke("你是谁？"))
    except RateLimitError:
        print("遇到错误")

遇到错误


In [18]:
# Now let's try with fallbacks to qwen_llm
# 现在让我们尝试使用 qwen_llm 作为备选方案
with patch("openai.resources.chat.completions.Completions.create", side_effect=error):
    try:
        print(llm.invoke("你是谁？"))
    except RateLimitError:
        print("遇到错误")

content='我是来自阿里云的大规模语言模型，我叫通义千问。我可以回答各种问题，包括但不限于科技、文化、生活等方面的问题，帮助用户快速获取信息和解决问题。如果您有任何问题想要了解，请随时告诉我，我会尽力提供最准确的答案和帮助您解决问题。\n' response_metadata={'model': 'qwen:1.8b', 'created_at': '2024-04-03T22:14:41.7210445Z', 'message': {'role': 'assistant', 'content': ''}, 'done': True, 'total_duration': 10855166400, 'load_duration': 10236569100, 'prompt_eval_count': 11, 'prompt_eval_duration': 101424000, 'eval_count': 62, 'eval_duration': 515002000} id='run-bf2a0a88-ca17-46c2-bf48-23d0c31e1476-0'


我们可以像使用普通大型语言模型（LLM）一样使用我们的“具有备选方案的大型语言模型（LLM with Fallbacks）”。

In [21]:
from langchain_core.prompts import ChatPromptTemplate

prompt = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            "你真是一个贴心的助手，总会在回复中附上赞美之词。",
        ),
        ("human", "为什么你喜欢{city}"),
    ]
)
chain = prompt | llm
with patch("openai.resources.chat.completions.Completions.create", side_effect=error):
    try:
        print(chain.invoke({"city": "利川"}))
    except RateLimitError:
        print("Hit error")

content='我喜欢利川的原因有很多。\n\n首先，利川位于中国湖北省东北部，地处武陵山区腹地。这种地理位置为利川带来了丰富的自然景观和人文资源。如长江、清江、仙女山等，这些自然景观和人文资源无疑成为了我喜爱利川的重要原因之一。\n\n其次，利川有着深厚的历史文化底蕴，是中华民族精神的象征。如利川的楚王城、利川的金瓜峰、利川的神农架等，这些历史文化遗产无疑为我的喜爱利川提供了重要的历史文化背景。\n\n综上所述，喜欢利川的原因有很多，包括其丰富的自然景观和人文资源，以及其深厚的历史文化底蕴等等。总之，作为一名来自利川的助手，我对利川有着深深的热爱和向往，我将尽我所能帮助利川的人们，让他们在利川享受到更多的幸福和快乐。\n\n' response_metadata={'model': 'qwen:1.8b', 'created_at': '2024-04-03T22:24:39.843922Z', 'message': {'role': 'assistant', 'content': ''}, 'done': True, 'total_duration': 1598917600, 'load_duration': 3479600, 'prompt_eval_count': 7, 'prompt_eval_duration': 151244000, 'eval_count': 183, 'eval_duration': 1441056000} id='run-b5377b4c-8148-4b67-9c7b-8d2f8715ab3c-0'
