# Testing extract_relevance_info_from_docs_with_conversation Function

This notebook demonstrates how to use and test the `extract_relevance_info_from_docs_with_conversation` function from the ByzerLLM library.

In [1]:
from openai import OpenAI
import json

# 如果使用 HTTPS，请将 URL 改为 https://
client = OpenAI(api_key="your_api_key_here", base_url="http://127.0.0.1:8000/v1")

# messages = json.loads(open("/tmp/rag.json").read())

response = client.chat.completions.create(
    messages=
        [
  {
    "role": "system",
    "content": "这是历史聊天总结作为前情提要：质量系统在药品生产中至关重要，涉及质量管理、控制、风险管理、文件记录、培训、设>施设备、供应商物料管理及产品放行召回等多个方面。它确保药品从研发到销售的全过程符合质量标准和法规要求，保护消费者并提升企业信>誉。"
  },
  {
    "role": "user",
    "content": "给我详细介绍下质量系统"
    }],
    model="deepseek_chat",
)
print(response.choices[0].message.content)

质量系统在药品生产中是一个全面的管理体系，旨在确保药品从研发到销售的全过程符合质量标准和法规要求，保护消费者并提升企业信誉。以下是质量系统的详细介绍：

### 1. 质量管理
质量管理是确保产品质量符合预期用途、维持质量体系的一系列有组织的活动。它包括制定质量目标、强化全程管理、确保药品的安全性、有效性和质量可控性。企业高管和相关人员各负其责，确保软件和硬件都符合GMP要求。

### 2. 质量保证（QA）
质量保证系统包括：
- **产品年度回顾**：每年对所有生产的药品进行产品质量回顾分析，确认工艺稳定可靠，以及原辅料、成品现行质量标准的适用性。
- **审计**：包括GMP自检、对供应商的审计和药政部门的按规定检查的资料及整改报告。
- **投诉处理**：包括产品质量投诉、药品不良反应报告和疑似虚假药品的投诉。
- **偏差管理**：对不符合指定的要求的情况进行调查、分析和处理。
- **变更控制**：管理变化的正式体系，包括生产工艺变更、设备变更、生产区域和配套支持系统变更等。
- **产品放行**：确保每批放行药品的生产、检验均符合要求。
- **返工/再加工管理**：对不合格产品进行返工或再加工的管理。
- **SOP管理**：确保所有操作规程（SOP）得到正确执行。
- **人员和培训**：确保从事影响产品质量工作的人员达到必要的能力。

### 3. 质量控制（QC）
质量控制涉及：
- **资源**：包括设施、设备、仪器和人员。
- **SOP**：制定各物料产品的取样、检查、检验、稳定性考察和环境监测（必要时）的SOP。
- **专人依法取样**：确保取样的正确性和合规性。
- **检验方法验证/确认**：确保检验方法的准确性和可靠性。
- **记录**：包括取样、检验、检查和偏差调查的记录。
- **质量标准**：作为检验检查的依据，并确保有记录。
- **留样备检**：确保物料和终产品的留样，以便必要时进行复检。

### 4. 质量风险管理
质量风险管理涉及：
- **风险评估**：采用前瞻性或回顾性的方式评估风险。
- **风险控制**：根据风险等级采取相应措施。
- **风险沟通**：确保所有相关人员了解风险和控制措施。
- **风险审核**：定期审核风险管理的效果。

### 5. 文件记录
文件记录涉及：
- **SOP**：设

In [5]:
from openai import OpenAI
import json

# 如果使用 HTTPS，请将 URL 改为 https://
client = OpenAI(api_key="your_api_key_here", base_url="http://127.0.0.1:8000/v1")

# messages = json.loads(open("/tmp/rag.json").read())

response = client.chat.completions.create(
    messages=
        [ 
  {
    "role": "user",
    "content": "董事会审议通过的利润分配预案为：以2,968,907,902股为基数 这个数字准确么？"
    }],
    model="deepseek_chat",
)
print(response.choices[0].message.content)

根据文档中的信息，董事会审议通过的利润分配预案为：向全体股东分配股利2,968,907,902.00元，同时以资本公积向全体股东每10股转增7股。这个数字指的是分配的股利总额，而不是股本基数。因此，董事会审议通过的利润分配预案中的数字2,968,907,902.00元是准确的，但它是分配的股利总额，而不是股本基数。


## Prepare Test Data

Let's create some sample documents and a conversation history to test our function.

In [2]:
# Sample documents
documents = [
    "The capital of France is Paris. It is known for its beautiful architecture and cuisine.",
    "Python is a popular programming language used in data science and web development.",
    "The Great Wall of China is one of the most famous landmarks in the world."
]

# Sample conversation history
conversations = [
    {"role": "user", "content": "Tell me about France."},
    {"role": "assistant", "content": "France is a country in Western Europe known for its rich history and culture."},
    {"role": "user", "content": "What's the capital of France?"}
]

## Define and Test the Function

In [5]:
@byzerllm.prompt()
def extract_relevance_info_from_docs_with_conversation(conversations, documents) -> str:
    """
    使用以下文档和对话历史来提取相关信息。

    文档：
    {% for doc in documents %}
    {{ doc }}
    {% endfor %}

    对话历史：
    {% for msg in conversations %}
    <{{ msg.role }}>: {{ msg.content }}
    {% endfor %}

    请根据提供的文档内容、用户对话历史以及最后一个问题，提取并总结文档中与问题相关的重要信息。
    如果文档中没有相关信息，请回复"该文档中没有与问题相关的信息"。
    提取的信息尽量保持和原文中的一样，并且只输出这些信息。
    """

# Test the function
result = extract_relevance_info_from_docs_with_conversation.with_llm(llm).run(conversations=conversations, documents=documents)
print(result)

The capital of France is Paris.


## Analyze the Results

Let's analyze the output of our function to see if it correctly extracted the relevant information from the documents based on the conversation history.

In [None]:
print("Extracted relevant information:")
print(result)

print("\nDoes the extracted information answer the user's last question?")
print("User's last question:", conversations[-1]['content'])
print("Relevant information found:", "Yes" if "Paris" in result else "No")

## Test with Different Scenarios

Let's test our function with different scenarios to ensure it works correctly in various situations.

In [None]:
# Scenario 1: Question about a topic not in the documents
conversations_scenario1 = [
    {"role": "user", "content": "What's the capital of Germany?"},
]

result_scenario1 = extract_relevance_info_from_docs_with_conversation.with_llm(llm).run(conversations=conversations_scenario1, documents=documents)
print("Scenario 1 Result:")
print(result_scenario1)

# Scenario 2: Question about a topic in the documents, but not related to France
conversations_scenario2 = [
    {"role": "user", "content": "Tell me about Python programming."},
]

result_scenario2 = extract_relevance_info_from_docs_with_conversation.with_llm(llm).run(conversations=conversations_scenario2, documents=documents)
print("\nScenario 2 Result:")
print(result_scenario2)

## Conclusion

In this notebook, we've tested the `extract_relevance_info_from_docs_with_conversation` function with various scenarios. The function should effectively extract relevant information from the provided documents based on the conversation history and the user's last question. 

By analyzing the results, we can see how well the function performs in different situations, such as when the relevant information is present in the documents or when it's not available.