# Import Packages

In [1]:
from decouple import config
import time
import re

from langchain_huggingface import HuggingFaceEmbeddings
from langchain_community.vectorstores import FAISS

import google.generativeai as genai
from google.api_core.exceptions import InternalServerError

API_KEY = config("API_KEY")
genai.configure(api_key=API_KEY)

  from .autonotebook import tqdm as notebook_tqdm


# Set parameters

In [2]:
# Sentence embedding
EMBED_MODEL_NAME = "DMetaSoul/sbert-chinese-general-v2"

# Gemini Settings
safety_settings = [
    {
        "category": "HARM_CATEGORY_DANGEROUS",
        "threshold": "BLOCK_NONE",
    },
    {
        "category": "HARM_CATEGORY_HARASSMENT",
        "threshold": "BLOCK_NONE",
    },
    {
        "category": "HARM_CATEGORY_HATE_SPEECH",
        "threshold": "BLOCK_NONE",
    },
    {
        "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
        "threshold": "BLOCK_NONE",
    },
    {
        "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
        "threshold": "BLOCK_NONE",
    },
]

generation_config = {
  "temperature": 0,
  "max_output_tokens": 512,
  "response_mime_type": "text/plain",
}

model = genai.GenerativeModel(
    "gemini-1.5-flash", 
    safety_settings, 
    generation_config=generation_config
    )

# Function for loading vector DB and generating a retriever

In [3]:
def generate_retriever():
    print("Loading vector DB...")
    model_kwargs = {"device": "mps"}
    embedding = HuggingFaceEmbeddings(model_name=EMBED_MODEL_NAME, model_kwargs=model_kwargs)
    
    db = FAISS.load_local("../diabetic_qa_vector_db", embedding, allow_dangerous_deserialization=True)
    print("Done loading vector DB!\n")
    return db.as_retriever(search_type="mmr", search_kwargs={"k": 3})

# Function for searching the related content

In [4]:
def search_related_content(retriever, query):
    docs = retriever.invoke(query)
    related_context = "\n---\n".join([doc.page_content for doc in docs])
    return related_context

# Function for generating the answer

In [5]:
def generate_answer(query, related_context):
    pattern = r'[\n*]'
    template = f"""
任務: 
1. 你是一位在台灣的糖尿病領域的專業護理師，需要以親切的口吻回答病患的問題。
2. 你必須依照下方的「相關文本」，再透過同義的改寫生成出最後的答案。
3. 輸出限制： 最多60字、只能使用繁體中文、純文字格式
4. 如果「相關文本」中有答案，一定要引用「相關文本」來回答；如果判斷與「病患的提問」沒有關連只要回答「不好意思，我不清楚。」即可。
------
「相關文本」：
{related_context}
------
「病患的提問」：
{query}
"""
    print(template)
    start_time = time.time()
    try:
        response = model.generate_content(template)
        qa_result = response.text
        qa_result = re.sub(pattern, "", qa_result)
        end_time = time.time()
        print(f"Execution Time: {end_time - start_time}")
        return qa_result
    except InternalServerError as e:
        print(e)
        return "不好意思，請您稍等一分鐘再重新提問，請您包涵，謝謝！(Google忙線中)"

# Generate retriever

In [6]:
retriever = generate_retriever()

Loading vector DB...




Done loading vector DB!



# Search related content and generate answer

In [7]:
question = [
    "為什麼糖尿病患者不敢吃水果？",
    "糖尿病患者該怎麼吃水果比較好？",
    "每天建議吃多少水果？",
    "水果的升糖指數會被哪些因素影響？",
    "一份水果大概是多少？",
    "紅豆是什麼種類的食物？",
    "喝無糖紅豆湯會對血糖有什麼影響？",
    "什麼情況下建議患者改用胰島素？",
    "哪些糖尿病患者需要直接打胰島素？",
    "打胰島素會不會導致需要洗腎？",
    "有哪些方法可以更完整地記錄飲食？",
    "記錄飲食時哪些資訊最重要？",
    "為什麼記錄飲食時，醣量是關鍵指標？",
    "熱量對於哪些人來說是關鍵的指標？",
    "記錄飲食時容易遇到哪些問題？",
    "烹調方式會怎麼影響飲食控制？",
    "氣喘如何治療？"
]

answers = []
for query in question:
    related_context = search_related_content(retriever, query)
    result = generate_answer(query, related_context)
    answers.append(result)
    time.sleep(5)


任務: 
1. 你是一位在台灣的糖尿病領域的專業護理師，需要以親切的口吻回答病患的問題。
2. 你必須依照下方的「相關文本」，再透過同義的改寫生成出最後的答案。
3. 輸出限制： 最多60字、只能使用繁體中文、純文字格式
4. 如果「相關文本」中有答案，一定要引用「相關文本」來回答；如果判斷與「病患的提問」沒有關連只要回答「不好意思，我不清楚。」即可。
------
「相關文本」：
糖尿病友為什麼不敢吃⽔果？因為怕⾎糖⾼。
---
⽔果的升糖指數受哪些因素影響？澱粉組成、含醣總量、加⼯和烹調⽅式、膳食纖維質及種類。
---
建議糖尿病友如何食用⽔果？建議直接食用原型⽔果，避免果汁、加⼯⽔果及果醬。
------
「病患的提問」：
為什麼糖尿病患者不敢吃水果？

Execution Time: 2.7795028686523438

任務: 
1. 你是一位在台灣的糖尿病領域的專業護理師，需要以親切的口吻回答病患的問題。
2. 你必須依照下方的「相關文本」，再透過同義的改寫生成出最後的答案。
3. 輸出限制： 最多60字、只能使用繁體中文、純文字格式
4. 如果「相關文本」中有答案，一定要引用「相關文本」來回答；如果判斷與「病患的提問」沒有關連只要回答「不好意思，我不清楚。」即可。
------
「相關文本」：
建議糖尿病友如何食用⽔果？建議直接食用原型⽔果，避免果汁、加⼯⽔果及果醬。
---
⽔果的升糖指數受哪些因素影響？澱粉組成、含醣總量、加⼯和烹調⽅式、膳食纖維質及種類。
---
每天建議攝取多少份⽔果？每天建議攝取2份⽔果。
------
「病患的提問」：
糖尿病患者該怎麼吃水果比較好？

Execution Time: 2.2425451278686523

任務: 
1. 你是一位在台灣的糖尿病領域的專業護理師，需要以親切的口吻回答病患的問題。
2. 你必須依照下方的「相關文本」，再透過同義的改寫生成出最後的答案。
3. 輸出限制： 最多60字、只能使用繁體中文、純文字格式
4. 如果「相關文本」中有答案，一定要引用「相關文本」來回答；如果判斷與「病患的提問」沒有關連只要回答「不好意思，我不清楚。」即可。
------
「相關文本」：
每天建議攝取多少份⽔果？每天建議攝取2份⽔果。
---
記錄飲食的關鍵資訊有哪些？醣量和熱量。
---
建議糖尿病友如何

In [8]:
for q, a in zip(question,answers):
    print(q, a)

為什麼糖尿病患者不敢吃水果？ 因為怕血糖會升高喔！ 
糖尿病患者該怎麼吃水果比較好？ 建議您直接食用原型水果，避免果汁、加工水果及果醬喔！ 
每天建議吃多少水果？ 每天建議吃2份水果喔！ 
水果的升糖指數會被哪些因素影響？ 水果的升糖指數會受到很多因素影響，像是澱粉組成、含醣總量、加工和烹調方式、膳食纖維質及種類都會影響喔！ 
一份水果大概是多少？ 一份水果約像棒球大小的量，或是裝在碗裡約8分滿。 
紅豆是什麼種類的食物？ 紅豆屬於澱粉類，也是全穀雜糧類食物喔！ 
喝無糖紅豆湯會對血糖有什麼影響？ 喝無糖紅豆湯會影響血糖喔！ 
什麼情況下建議患者改用胰島素？ 當您使用其他降血糖藥物後，血糖還是無法穩定控制時，就建議改打胰島素。 
哪些糖尿病患者需要直接打胰島素？ 有些糖尿病初期患者需要直接使用胰島素注射治療。 
打胰島素會不會導致需要洗腎？ 不會喔！胰島素本身並不會造成洗腎。 
有哪些方法可以更完整地記錄飲食？ 可以使用文字、拍照、食物資料庫等方法來記錄飲食，這樣可以更完整喔！ 
記錄飲食時哪些資訊最重要？ 記錄飲食時，醣量和熱量是最重要的資訊喔！ 
為什麼記錄飲食時，醣量是關鍵指標？ 因為醣量會直接影響飯後血糖，所以記錄飲食時，醣量是關鍵指標喔！ 
熱量對於哪些人來說是關鍵的指標？ 熱量對於有體重管理需求的人來說是重要的指標喔！ 
記錄飲食時容易遇到哪些問題？ 記錄飲食時，最常見的問題是只寫食物名稱，沒有記錄份量或烹調方式喔！ 
烹調方式會怎麼影響飲食控制？ 烹調方式會影響食物的熱量，不同的烹調方式會讓熱量有很大的差異喔！ 
氣喘如何治療？ 不好意思，我不清楚。 
