# 0. wde.agents 支持多种客户端

首先将 wde 目录加入 python path

In [1]:
import os
import sys
from pathlib import Path
pwd = Path(os.getcwd())
sys.path.append(str(pwd.parent.parent.parent))
os.chdir(str(pwd.parent.parent.parent))

导入 LLMAgent

In [2]:
from wde.agents import LLMAgent

演示使用 Qwen/Qwen2-7B-Instruct 模型

In [3]:
model = "Qwen/Qwen2-7B-Instruct"

演示的提示词为 "给我介绍一下大型语言模型。"

In [4]:
prompt = "给我介绍一下大型语言模型。"

In [5]:
for llm_config in [
    {"type": "zeroclient", "model": model},
    {"type": "openai", "model": model, "base_url": 'http://localhost:8080/v1/'},
    {"type": "ollama", "model": model},
]:
    print("-" * 80)
    print(llm_config)
    agent = LLMAgent(
        name="chatbot",
        llm_config=llm_config,
    )

    print("stream=False")
    reply = agent.generate_reply(
        messages=[{"content": prompt, "role": "user"}],
        stream=False,
        options={"max_tokens": 1000}
    )

    print(reply)

    print("stream=True")
    for part in agent.generate_reply(
        messages=[{"content": prompt, "role": "user"}],
        stream=True,
        options={"max_tokens": 1000}
    ):
        print(part, end="", flush=True)
    print()

--------------------------------------------------------------------------------
{'type': 'zeroclient', 'model': 'Qwen/Qwen2-7B-Instruct'}
stream=False
大型语言模型是人工智能领域中的一种神经网络模型，主要用于生成和理解人类语言。它们通过学习大量的文本数据（如书籍、文章、新闻、社交媒体文本等）来捕捉语言的复杂结构和语义，从而能够生成新的、连贯的文本，回答问题，甚至进行对话。

关键特征和组成部分通常包括：

1. **Transformer架构**：这是大型语言模型中广泛使用的一种架构，相比以前的RNN（递归神经网络）架构，Transformer能够并行处理输入文本中的所有元素，显著提高了训练和应用的效率。

2. **自回归生成**：许多大型语言模型采用了自回归机制，这意味着模型在预测词时依赖于之前所有已经生成的词的输出，使得生成的文本具备逻辑性和连贯性。

3. **预训练-微调**：大型模型通常首先通过在大量无标注文本上进行预训练，学习到通用的语言表征和模式。然后，根据特定任务（如文本生成、问答、翻译等）进行微调，以优化这些通用表示在特定任务上的性能。

4. **大规模参数量**：这类模型往往包含数亿到数百亿个参数，需要大量的计算资源进行训练。这不仅是对硬件资源的要求，也是训练时间上的巨大挑战。

5. **多语种支持**：随着全球化和多语言交流的需求，大型语言模型也能支持多种语言的处理，提高了其适用性和广泛性。

大型语言模型在多个领域有广泛应用，例如：

- **文本生成**：包括文章写作、故事创作、代码生成、自动化文档等。
- **机器翻译**：实现不同语言之间的自动翻译。
- **问答系统**：能够理解问题并从大量文本中提取信息以提供准确的回答。
- **对话系统**：在聊天机器人、智能助手中应用，提供自然流畅的对话体验。

大型语言模型是人工智能研究的重要成果，正逐渐改变着信息处理、内容生成和人机交互的方式。
stream=True
大型语言模型是人工智能研究领域内的一种基于深度学习的神经网络模型，被设计为能够生成类似于人类语言的文本。这些模型通过学习和理解大量文本数据中的语义、语法和关联关系来工作，

INFO 11-25 16:40:36 _client.py:1038 HTTP Request: POST http://localhost:8080/v1/chat/completions "HTTP/1.1 200 OK"
INFO 11-25 16:40:36 _client.py:1038 HTTP Request: POST http://localhost:8080/v1/chat/completions "HTTP/1.1 200 OK"


大型语言模型，又称为预训练语言模型，是一种基于深度学习的自然语言处理技术。这类模型通过大量文本数据进行预训练，学习到语言的普遍结构和规律，并在特定任务上进行微调，以解决特定的自然语言处理任务，如文本生成、问答、翻译、文本分类等。它们的规模通常非常大，包含数亿到数百亿的参数，这使得它们能够捕捉到非常复杂的语言模式。

### 基本原理

大型语言模型基于Transformer架构，这是一种能够高效处理序列数据的模型结构。Transformer模型通过自注意力机制来捕捉输入序列之间的依赖关系，而不是像传统的递归神经网络（RNN）那样顺序处理每个输入。这种机制使得模型能够并行处理大量数据，显著提高了训练和推理的速度。

### 应用场景

1. **文本生成**：根据给定的提示或输入，模型能够生成连续的文本，如文章、故事、代码、新闻等。
2. **对话系统**：在聊天机器人、客服系统中，大型语言模型能够理解用户的输入并生成合适的响应。
3. **机器翻译**：将一种语言的文本自动翻译成另一种语言。
4. **文本摘要**：自动从长文本中提取关键信息并生成摘要。
5. **问答系统**：回答基于文本的数据查询，如知识库检索、文档搜索等。

### 代表性模型

- **GPT**（Generative Pre-trained Transformer）系列：从GPT-1到GPT-3，每一版本参数量逐渐增加，性能显著提升。
- **BERT**（Bidirectional Encoder Representations from Transformers）：通过双向上下文信息进行学习，提高了模型在多种NLP任务上的性能。
- **T5**（Text to Text Transfer Transformer）：一个统一的模型，可以用于多种NLP任务，包括文本生成、问答、机器翻译等。

### 面临的挑战与争议

虽然大型语言模型在很多任务上取得了显著的进展，但也面临着一些挑战和争议，包括：

- **数据偏见**：模型可能吸收训练数据中的偏见，影响其输出的公正性。
- **安全与隐私**：模型可能被滥用，用于生成有害内容或泄露敏感信息。
- **透明度与解释性**：大型模型的决策过程通常难以解释，这在某些关键应用（如医疗诊断）中是一个问题。

随着技术的发展，研究者也在努力解决这

INFO 11-25 16:40:52 _client.py:1038 HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"
INFO 11-25 16:40:52 _client.py:1038 HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"


大型语言模型，或称大模型，是深度学习领域发展的最新成果之一，主要指具有大量参数（通常数亿到数百亿或更多）的深度神经网络模型，专门用于处理语言任务，如文本生成、问答系统、语义理解、聊天机器人等等。这类模型通过在大量文本数据上学习分布式表示（通过自监督学习或预训练），能够生成流畅、合理甚至创造性的文本回复，并且具有在多种不同任务上进行微调以获得高效性能的能力，简化了专为特定任务训练模型的步骤。

### 大型语言模型的关键特性与应用

1. **参数量**：大型模型通常具有数亿到数百亿个参数，这使得它们能够捕捉到语言的复杂结构和细微差异。

2. **自监督学习与大规模数据**：大模型通过在大量未标记文本数据上进行自我监督学习进行预训练，然后针对特定任务进行微调。这种方式允许模型学习到广泛的语言模式和语法结构。

3. **多模态能力**：除了语言文本之外，一些大型语言模型如通义千问、LaMDA等还具有处理图形、图片、语音等多模态数据的能力，这是由其模块化或集成式结构实现的。

4. **高效响应与生成质量**：大型模型能够快速生成高质量的文本回复，甚至具备创作故事、解释专业概念或回应复杂问题的能力。

### 典型应用领域

- **自然语言处理（NLP）**：实时对话系统、自动文本摘要、情感分析、机器翻译等。
- **内容生成**：自动编写文章、创作诗歌、故事生成等。
- **教育辅助**：个性化学习资源生成、自动出题等。
- **个性化服务**：客服机器人、智能助理等提高客户体验。
- **科学研究**：辅助生成假设、解释数据、执行文本总结等。

大型语言模型正不断推动人工智能与人类交流方式的创新，它们的出现不仅在学术研究中引发了关注，在工业界也为众多产品和服务带来了革命性变化。随着技术的进一步发展，这些模型将来可能会在更多领域展现出强大的能力，改变人们工作和生活的方式。
stream=True
大型语言模型，也常被称为大语言模型、超大规模语言模型或超大规模AI模型，是一种基于深度学习技术的自然语言处理算法。这类模型从大量的文本数据中学习，包括但不限于书籍、网站内容、社交媒体文本、新闻文章等各类语言信息。由于其规模庞大，通常需要处理和存储数以百万计，甚至数十亿计的参数，故称为“大型”或“超大规模”的模型。

在技术实现上，大型语言模型通常采用递归神经网络（RNN）

## 总结
wde.agents 支持 ollama 和 openai客户端、支持 zeroclient 内部通讯协议。非常灵活。