## 大语言模型分类

大语言模型（LLM）如ChatGPT是基于Transformer架构的生成式预训练语言模型。它可以生成自然语言文本，并通过学习大量文本数据来提高自身的语言理解能力和表达能力。

1. **大语言模型（LLMs）通过提示模板分类的原理**：
    - LLMs，例如ChatGPT，基于Transformer架构和无监督预训练技术。它们通过在大规模语料库中训练，学习语言的规律和特征，从而具备自然语言理解、文本生成、对话生成等功能。
    - 提示模板分类是一种方法，用户提供一个文本提示，模型根据这个提示生成回答。模型的回答是基于上文的，因此它可以根据不同的上文生成不同的输出。

2. **ChatGPT解决了之前方法的哪些问题**：
    - ChatGPT改变了游戏规则，将大型语言模型的强大功能带入了主流。它能够执行多个复杂任务，具有长篇上下文多轮对话的能力，并生成连贯、亲和和自然的语言。
    - 与传统的分层智能系统不同，ChatGPT是一个通用模型，不需要专业的研究人员和工程师构建和训练多个不同的任务层。

3. **ChatGPT是在哪一年提出的**：
    - ChatGPT于**2022年11月30日**由OpenAI发布⁸。

4. **ChatGPT的不足**：
    - **事实错误**：ChatGPT有时会生成错误的信息，甚至虚构的内容。这可能导致用户误导。
    - **无法实时更新**：ChatGPT的知识停留在2021年，无法连接搜索引擎获取最新信息。
    - **缺乏可控性**：用户只能通过有限长度的文本提示与ChatGPT进行通信，无法完全控制输出。

提示词示例：以下这条陈述的罪名是什么？从[抢劫, 走私、贩卖、运输、制造毒品, 危险驾驶, 盗窃]中选择一个,仅显示答案。2010年12月21日10时许，被告人王某趁武强县金音建筑工地工友张某不在宿舍之际，盗窃张某枕头下现金3500元。

![%E5%BE%AE%E4%BF%A1%E5%9B%BE%E7%89%87_20240415220233.png](attachment:%E5%BE%AE%E4%BF%A1%E5%9B%BE%E7%89%87_20240415220233.png)

提示词示例：以下这条咨询属于医院哪个科室？从[小儿内科, 妇科，皮肤科，呼吸内科，内分泌科，耳鼻喉科]中选择一个,仅显示答案。你好！我有脚气十几年了，手也脱皮，是不是真菌感染，可以吃伊曲康唑吗？

![%E5%BE%AE%E4%BF%A1%E5%9B%BE%E7%89%87_20240415220233.png](attachment:%E5%BE%AE%E4%BF%A1%E5%9B%BE%E7%89%87_20240415220233.png)

如果你想在程序中调用ChatGPT，你可以按照以下步骤进行操作：

1. **获取API密钥**：
    - 首先，你需要在OpenAI官网注册账号并获取API密钥。
    - 登录后，点击右上角的用户名，选择“View API keys”，然后创建一个新的API密钥。
    - 注意：API密钥生成后，请妥善保存，因为在官网上只能查看一次。

2. **选择编程语言**：
    - 根据你的需求和应用场景，选择合适的编程语言，如Python、JavaScript、Java等。

3. **安装必要的库或模块**：
    - 根据所选编程语言，安装必要的库或模块，以便在代码中发起HTTP请求。

4. **编写代码**：
    - 根据官方文档配置API请求参数，如输入文本、生成文本长度等。
    - 在代码中加入你的API密钥，以进行身份验证。

5. **发起API请求**：
    - 运行编写好的代码，发起API请求。
    - 成功调用后，ChatGPT将返回相应的结果，如生成的文本或情感分析结果等。

6. **处理API响应**：
    - 对API返回的结果进行处理，将其集成到你的应用、网站或服务中。

以下是使用Python调用ChatGPT API接口的简单示例：

```python
import openai

# 设置你的API密钥
openai.api_key = "YOUR_API_KEY"

# 定义输入文本
input_text = "How are you today?"

# 调用ChatGPT API
response = openai.ChatCompletion.create(
    model="gpt-3.5-turbo",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": input_text}
    ]
)

# 提取生成的回复
generated_text = response.choices[0].message["content"]
print("Generated response:", generated_text)
```

请将上述代码中的`YOUR_API_KEY`替换为你自己的API密钥。这样，你就可以在程序中调用ChatGPT并获取回复了。


https://github.com/chatanywhere/GPT_API_free
可以申请免费Chatgpt的api_key试用

In [2]:
from openai import OpenAI

client = OpenAI(
    # defaults to os.environ.get("OPENAI_API_KEY")
    api_key="*", #替换成自己的API_KEY
    base_url="https://api.chatanywhere.tech/v1"
    # base_url="https://api.chatanywhere.cn/v1"
)

In [2]:
s = """
以下这条陈述的罪名是什么？从[抢劫, 走私、贩卖、运输、制造毒品, 危险驾驶, 盗窃]中选择一个,仅显示答案。
2010年12月21日10时许，被告人王某趁武强县金音建筑工地工友张某不在宿舍之际，盗窃张某枕头下现金3500元。
"""
response = client.chat.completions.create(
    messages=[
        {
            "role": "user",
            "content": s,
        }
    ],
    model="gpt-3.5-turbo",
)

print(response)

ChatCompletion(id='chatcmpl-9A875YIGGNYHzYUsCf5EpQGDcrq1W', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='盗窃。', role='assistant', function_call=None, tool_calls=None))], created=1712201495, model='gpt-3.5-turbo-0125', object='chat.completion', system_fingerprint='fp_b28b39ffa8', usage=CompletionUsage(completion_tokens=5, prompt_tokens=140, total_tokens=145))


In [17]:
print(response.choices[0].message.content)

盗窃。


In [30]:
s = """
以下这条咨询输入医院哪个科室？从[小儿内科, 妇科，皮肤科，呼吸内科，内分泌科，耳鼻喉科]中选择一个,仅显示答案。
你好！我有脚气十几年了，手也脱皮，是不是真菌感染，可以吃伊曲康唑吗？
"""
response = client.chat.completions.create(
    messages=[
        {
            "role": "user",
            "content": s,
        }
    ],
    model="gpt-3.5-turbo",
)

print(response.choices[0].message.content)

皮肤科


In [32]:
s = """
以下这条短信的类型是什么？从[正常短信, 垃圾短信]中选择一个,仅显示答案。
商业秘密的秘密性那是维系其商业价值和垄断地位的前提条件之一。
"""
response = client.chat.completions.create(
    messages=[
        {
            "role": "user",
            "content": s,
        },
    ],
    model="gpt-3.5-turbo",
)

In [33]:
print(response.choices[0].message.content)

正常短信


In [26]:
import pandas as pd

In [27]:
#1、加载数据
train_df = pd.read_csv(r'dadata.csv', encoding='utf-8', header=None, names=['label','review'])
print(train_df.shape)

sentences = list(train_df['review'][1:])
labels =train_df['label'][1:].values
labels = [int(i) for i in labels]
print(sentences[0:5])
print(labels[0:5])

(1243, 2)
['商业秘密的秘密性那是维系其商业价值和垄断地位的前提条件之一', '南口阿玛施新春第一批限量春装到店啦\ue310   \ue310   \ue310   春暖花开淑女裙、冰蓝色公主衫\ue006   气质粉小西装、冰丝女王长半裙、\ue319   皇', '带给我们大常州一场壮观的视觉盛宴', '有原因不明的泌尿系统结石等', '23年从盐城拉回来的麻麻的嫁妆']
[0, 1, 0, 0, 0]


In [34]:
pre_label = []
for s in sentences[:100]:
    text = "以下这条短信的类型是什么？从[正常短信, 垃圾短信]中选择一个,仅显示答案。" + s
    response = client.chat.completions.create(
        messages=[
            {
                "role": "user",
                "content": text,
            },
        ],
        model="gpt-3.5-turbo",
    )
    pre_label.append(response.choices[0].message.content)

In [35]:
print(pre_label)

['正常短信', '正常短信', '正常短信', '正常短信', '垃圾短信', '正常短信', '正常短信', '正常短信', '垃圾短信', '正常短信', '正常短信', '垃圾短信', '正常短信', '正常短信', '正常短信。', '正常短信', '正常短信', '正常短信', '正常短信', '[正常短信]', '垃圾短信', '垃圾短信', '正常短信', '正常短信', '正常短信', '垃圾短信', '正常短信', '垃圾短信', '垃圾短信', '正常短信', '垃圾短信', '垃圾短信', '正常短信', '垃圾短信', '垃圾短信', '正常短信', '正常短信', '垃圾短信', '正常短信。', '正常短信', '垃圾短信', '正常短信', '垃圾短信', '正常短信', '正常短信', '正常短信', '正常短信', '正常短信', '垃圾短信', '正常短信', '正常短信', '正常短信', '垃圾短信', '正常短信', '垃圾短信', '城管版', '正常短信', '正常短信。', '垃圾短信', '垃圾短信', '正常短信', '正常短信', '垃圾短信', '正常短信', '正常短信', '垃圾短信', '垃圾短信', '正常短信', '正常短信', '垃圾短信', '正常短信', '垃圾短信', '正常短信', '正常短信', '正常短信', '垃圾短信', '垃圾短信', '垃圾短信', '正常短信', '正常短信', '正常短信', '正常短信', '正常短信', '正常短信', '正常短信', '正常短信', '正常短信', '垃圾短信', '垃圾短信', '垃圾短信', '正常短信', '正常短信', '垃圾短信', '垃圾短信', '正常短信', '垃圾短信', '正常短信', '正常短信', '垃圾短信', '正常短信']


In [37]:
pred_list = []
for item in pre_label:
    if item == "正常短信":
        pred_list.append(0)
    else:
        pred_list.append(1)

In [40]:
from sklearn import metrics
classify_report = metrics.classification_report(pred_list, labels[:100], digits = 4) #分类报告 support测试集样本数
print(classify_report) 
confusion_matrix = metrics.confusion_matrix(pred_list, labels[:100]) #混淆矩阵
print(confusion_matrix) 

              precision    recall  f1-score   support

           0     0.5977    0.8667    0.7075        60
           1     0.3846    0.1250    0.1887        40

    accuracy                         0.5700       100
   macro avg     0.4912    0.4958    0.4481       100
weighted avg     0.5125    0.5700    0.5000       100

[[52  8]
 [35  5]]


## 为什么有些任务直接使用ChatGPT通过提示词分类效果不理想？

直接使用ChatGPT通过提示词分类可能存在一些弊端：

1. **语境理解不足**：
    - ChatGPT是一个基于大规模预训练的语言模型，它在理解上下文和任务细节方面可能存在局限。
    - 对于某些复杂的分类任务，ChatGPT可能无法准确理解关键信息，导致分类效果不佳。

2. **泛化能力差**：
    - ChatGPT的预训练数据集通常涵盖了广泛的主题和领域，但它可能没有针对特定任务进行专门的训练。
    - 直接使用ChatGPT进行分类可能导致模型在特定领域或任务上的泛化能力不足。

3. **标注数据不足**：
    - 分类任务通常需要大量的标注数据来训练模型，以便学习有效的特征和模式。
    - 如果直接使用ChatGPT，它没有经过专门的标注数据训练，可能无法捕捉到任务特定的信息。

4. **模型偏见**：
    - ChatGPT的预训练数据中可能存在偏见，这会影响其分类结果。
    - 直接使用ChatGPT进行分类可能会继承这些偏见，导致不公平或不准确的分类。

综上所述，直接使用ChatGPT进行分类可能会受到语境理解、泛化能力、标注数据和模型偏见等因素的影响，因此在实际应用中，我们通常需要针对具体任务进行专门的模型训练和调优。