In [78]:
from fastapi import FastAPI, Depends
from fastapi.responses import StreamingResponse
from langchain.chat_models import ChatOpenAI
from dotenv import dotenv_values
from langchain.prompts import PromptTemplate
from langchain.chains import RetrievalQA
from threading import Thread
import asyncio
import uvicorn
import os, yaml
import datetime
from utils import load_vectorstore
from dependencies import get_token_header
from langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler

# load env token
# with open("token.yaml", "r") as token_yaml:
#     try:
#         token = yaml.safe_load(token_yaml)
#     except yaml.YAMLError as exc:
#         print(exc)
# api_key = token["openai_token"]
config = dotenv_values("../.env")
os.environ["OPENAI_API_KEY"] = "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"

chosen_model = "gpt-3.5-turbo" 

In [42]:
import sys

# Creating the custom callback handler class
# class CallbackHandler(StreamingStdOutCallbackHandler):
#     def __init__(self) -> None:
#         self.content: str = ""
#         self.final_answer: bool = False

#     def on_llm_new_token(self, token: str, **kwargs) -> None:
#         self.content += token
#         if "query" in self.content:
#             # now we're in the final answer section, but don't print yet
#             self.final_answer = True
#             self.content = ""
#         if self.final_answer:
#             if '"result": "' in self.content:
#                 if token not in ["}"]:
#                     sys.stdout.write(token)  # equal to `print(token, end="")`
#                     sys.stdout.flush()


In [91]:
context = """請用金融專家的角色，幫我根據以下新聞時事的文本回覆最底下的問題。若根據提供的文本，無法找到相關資訊請提供警示，不要嘗試生成內容。
這些文本將包含在三次回程中 (```)。

sentences :
```美國排名靠後的原因之一是凶殺率，報告指出：「美國的凶殺率整體增幅為第四大，目前每10萬人中有六人以上被殺害，比大多數西歐國家高出六倍以上。」```

question :美國發生哪些事情？
請用繁體中文回覆"""

from utils import num_tokens_from_string
num_tokens_from_string(context, chosen_model)

231

In [79]:
vectorstore = load_vectorstore()
print(f"vectore store count: {vectorstore._collection.count()}")

2024/02/25-17:15 | Load vectorstore success!
vectore store count: 2356


In [80]:
# Creating an object of custom handler
llm = ChatOpenAI(
    temperature=0.0,
    model_name=chosen_model,
    streaming=True,
    callbacks=[StreamingStdOutCallbackHandler()],
)

prompt = """請用金融專家的角色，幫我根據以下新聞時事的文本回覆最底下的問題。若根據提供的文本，無法找到相關資訊請提供警示，不要嘗試生成內容。
這些文本將包含在三次回程中 (```)。

sentences :
```{context}```

question :{question}
請用繁體中文回覆
"""

PROMPT = PromptTemplate(template=prompt, input_variables=["context", "question"])

In [105]:

qa_chain = RetrievalQA.from_chain_type(
    llm=llm,  
    retriever=vectorstore.as_retriever(search_kwargs={"k": 5}, search_type="mmr"),
    return_source_documents=True,
    chain_type_kwargs={"prompt": PROMPT, "verbose": True},
    
)



In [106]:
sim = vectorstore.similarity_search_with_score("美國發生哪些事情？", k=3)
sim

[(Document(page_content='美國排名靠後的原因之一是凶殺率，報告指出：「美國的凶殺率整體增幅為第四大，目前每10萬人中有六人以上被殺害，比大多數西歐國家高出六倍以上。」', metadata={'id': '5596def4-b1a4-45f1-ae37-359fb5813d57', 'title': '最安全國家排行 美131名遠落後加國11名 冰島居冠', 'date': '2023/11/23', 'category': '全球', 'source': 'udn'}),
  0.32088956236839294)]

In [107]:
len(sim)

1

In [108]:
res = qa_chain("美國發生哪些事情？")



[1m> Entering new  chain...[0m


[1m> Entering new  chain...[0m
Prompt after formatting:
[32;1m[1;3m請用金融專家的角色，幫我根據以下新聞時事的文本回覆最底下的問題。若根據提供的文本，無法找到相關資訊請提供警示，不要嘗試生成內容。
這些文本將包含在三次回程中 (```)。

sentences :
```美國排名靠後的原因之一是凶殺率，報告指出：「美國的凶殺率整體增幅為第四大，目前每10萬人中有六人以上被殺害，比大多數西歐國家高出六倍以上。」

一年一度的感恩節又來臨，回首2023年，至少有十件美國及國際事件發展值得感恩，若不是這些發展，全球局勢可能更糟糕。  一、經濟衰退尚未襲擊美國   彭博資訊專欄作家歐瑟士說，值得感恩的第一件事，是美國經濟尚未變得死氣沈沈，年初投資人擔心聯準會（Fed）一連串猛烈升息可能把經濟推入衰退深淵，但這夢魘至今尚未成真。原因不一而足，從消費者仗著疫情期間的儲蓄支出不輟、Fed決策者謹慎行事、到雇主避免裁員，都有助延緩景氣下沉。   一些經濟學家和許多華爾街人士認為，美國應可避免衰退，但認為景氣沉淪恐怕已經展開的也大有人在。華爾街著名大空頭、法興全球策略師Albert Edwards就警告，卡車貨運等物流業今年聘僱人數陡降，以及服務業臨時雇員人數也明顯滑落，是指向2024年經濟衰退的兩個領先指標。   無論如何，至少目前為止衰退還沒影，是值得感恩的驚喜。  二、央行升息停止，降息的比升息的多   全球央行因應嚴重程度不一的通膨，貨幣政策趨於分歧，但現在央行貨幣政策再度趨於一致，而這一回的利率走向是往下走。德意志銀行分析世界各地81個央行的利率行動發現，今年10月降息的央行數目超越升息的央行，是2021年來首見。   德銀策略師萊德寫道：「降息動能慢慢增強，但大主題是全球央行（利率）行動大幅降低。現在的問題是，今後會是『更高、更久』，還是會見到一波大規模的全球寬鬆循環？我的看法是，除非美國遭遇衰退，否則難以見到短期出現一波大幅寬鬆循環。」   彭博經濟學家指出，通膨緩和而衰退風險升高，美、歐、英央行的升息循環可能已結束。當然也有例外，例如土耳其和阿根廷央行仍在費力壓制極高的物價上漲壓力。但整體而言，全球正進入新階段：通膨已大致

In [111]:
res["source_documents"]

[Document(page_content='美國排名靠後的原因之一是凶殺率，報告指出：「美國的凶殺率整體增幅為第四大，目前每10萬人中有六人以上被殺害，比大多數西歐國家高出六倍以上。」', metadata={'id': '5596def4-b1a4-45f1-ae37-359fb5813d57', 'title': '最安全國家排行 美131名遠落後加國11名 冰島居冠', 'date': '2023/11/23', 'category': '全球', 'source': 'udn'}),
 Document(page_content='一年一度的感恩節又來臨，回首2023年，至少有十件美國及國際事件發展值得感恩，若不是這些發展，全球局勢可能更糟糕。  一、經濟衰退尚未襲擊美國   彭博資訊專欄作家歐瑟士說，值得感恩的第一件事，是美國經濟尚未變得死氣沈沈，年初投資人擔心聯準會（Fed）一連串猛烈升息可能把經濟推入衰退深淵，但這夢魘至今尚未成真。原因不一而足，從消費者仗著疫情期間的儲蓄支出不輟、Fed決策者謹慎行事、到雇主避免裁員，都有助延緩景氣下沉。   一些經濟學家和許多華爾街人士認為，美國應可避免衰退，但認為景氣沉淪恐怕已經展開的也大有人在。華爾街著名大空頭、法興全球策略師Albert Edwards就警告，卡車貨運等物流業今年聘僱人數陡降，以及服務業臨時雇員人數也明顯滑落，是指向2024年經濟衰退的兩個領先指標。   無論如何，至少目前為止衰退還沒影，是值得感恩的驚喜。  二、央行升息停止，降息的比升息的多   全球央行因應嚴重程度不一的通膨，貨幣政策趨於分歧，但現在央行貨幣政策再度趨於一致，而這一回的利率走向是往下走。德意志銀行分析世界各地81個央行的利率行動發現，今年10月降息的央行數目超越升息的央行，是2021年來首見。   德銀策略師萊德寫道：「降息動能慢慢增強，但大主題是全球央行（利率）行動大幅降低。現在的問題是，今後會是『更高、更久』，還是會見到一波大規模的全球寬鬆循環？我的看法是，除非美國遭遇衰退，否則難以見到短期出現一波大幅寬鬆循環。」   彭博經濟學家指出，通膨緩和而衰退風險升高，美、歐、英央行的升息循環可能已結束。當然也有例外，例如土耳其和阿根廷央行仍在費力壓制極高的物價上漲壓力。但整體而言，全球正進入新階段：通膨已大致受控，未來一年

In [112]:
import requests

def get_stream(query: str):
    s = requests.Session()
    with s.get(
        "http://localhost:8000/chat",
        stream=True,
        json={"text": query}
    ) as r:
        for line in r.iter_content(decode_unicode=True):
            print(line, end="") 


In [113]:
get_stream("美國發生哪些事？")

美國發生了以下幾件事情：
1. 美國的凶殺率增幅為第四大，目前每10萬人中有六人以上被殺害。
2. 美國經濟尚未襲擊，景氣仍相對穩定。
3. 全球央行降息的比升息的多，利率走向是往下走。
4. 美國感恩節期間，全國陸空交通進入壅塞高峰期。
5. 田納西州發生家暴相關死亡槍擊事件，造成4名女性死亡及1名女性重傷。
6. 美國與加拿大間的彩虹橋發生車輛爆炸事件，可能涉及恐怖主義攻擊。

: 