# 测试调用模型

### 1. 测试文本生成大模型（中文小型语料库，包含新闻、评论）

In [2]:
# 1. 导包
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
import torch

# 2. 加载模型和分词器
# 设置设备为 cuda:7
device = torch.device("cuda:7" if torch.cuda.is_available() else "cpu")

model_dir = "/raid/gfc/llm/models/models--uer--gpt2-chinese-cluecorpussmall/snapshots/c2c0249d8a2731f269414cc3b22dff021f8e07a3"
model = AutoModelForCausalLM.from_pretrained(model_dir).to(device)
tokenizer = AutoTokenizer.from_pretrained(model_dir)

# 3. 使用加载的模型和分词器创建生成文本的pipeline
generator = pipeline("text-generation", model=model, tokenizer=tokenizer, device=7)

# 4. 生成文本
output = generator(
    "你好",
    max_length=100,
    num_return_sequences=1,
    temperature=0.7,
    top_p=0.9,
    top_k=50,
    truncation=True,
    clean_up_tokenization_spaces=False,
)
print(output)


  from .autonotebook import tqdm as notebook_tqdm


[{'generated_text': '你好 ！ 小 王 说 ： 我 们 要 把 你 的 孩 子 打 下 来 ， 把 孩 子 的 情 况 告 诉 我 们 。 我 们 要 把 孩 子 打 下 来 ， 把 孩 子 的 情 况 告 诉 我 们 ， 让 他 们 知 道 ， 如 果 他 们 的 情 况 是 这 样 的 ， 他 们 就 会 很 快 的 好 起 来 。 孩 子 会 很 快 乐 的 成 长 。 我 们 要 做'}]


### 2. 歌词

In [9]:
from transformers import BertTokenizer, GPT2LMHeadModel, TextGenerationPipeline
import torch

device = torch.device("cuda:7" if torch.cuda.is_available() else "cpu")
# 指定模型下载目录
cache_dir = "/raid/gfc/llm/models"

tokenizer = BertTokenizer.from_pretrained("uer/gpt2-chinese-lyric", cache_dir=cache_dir)
model = GPT2LMHeadModel.from_pretrained("uer/gpt2-chinese-lyric", cache_dir=cache_dir).to(device)
# 在创建pipeline时直接指定device参数
text_generator = TextGenerationPipeline(model, tokenizer, device=7)
# do_sample=True 每次都不一样 do_sample=False 每次都一样
text_generator("最美的不是下雨天，是曾与你躲过雨的屋檐", max_length=100, do_sample=True)


Truncation was not explicitly activated but `max_length` is provided a specific value, please use `truncation=True` to explicitly truncate examples to max length. Defaulting to 'longest_first' truncation strategy. If you encode pairs of sequences (GLUE-style) with the tokenizer you can select this strategy more precisely by providing a specific strategy to `truncation`.


[{'generated_text': '最美的不是下雨天，是曾与你躲过雨的屋檐 ， 我 们 的 爱 情 ， 就 像 那 ， 一 张 张 泛 黄 的 照 片 ， 我 们 的 爱 情 ， 就 像 那 ， 一 本 本 泛 黄 的 书 ， 我 们 的 爱 情 ， 就 像 那 ， 一 本 本 泛 黄 的 书 ， 我 们 的 爱 情 ， 就 像 那 ， 一 本 本 泛 黄 的 书 ， 我 们 的 爱 情 ， 就'}]

### 3. 古诗文

In [5]:
from transformers import BertTokenizer, GPT2LMHeadModel, TextGenerationPipeline
import torch

device = torch.device("cuda:7" if torch.cuda.is_available() else "cpu")
# 指定模型下载目录
cache_dir = "/raid/gfc/llm/models"

tokenizer = BertTokenizer.from_pretrained("uer/gpt2-chinese-ancient", cache_dir=cache_dir)
model = GPT2LMHeadModel.from_pretrained("uer/gpt2-chinese-ancient", cache_dir=cache_dir).to(device)
# 在创建pipeline时直接指定device参数
text_generator = TextGenerationPipeline(model, tokenizer, device=7)
text_generator("当是时", max_length=100, do_sample=True)

Truncation was not explicitly activated but `max_length` is provided a specific value, please use `truncation=True` to explicitly truncate examples to max length. Defaulting to 'longest_first' truncation strategy. If you encode pairs of sequences (GLUE-style) with the tokenizer you can select this strategy more precisely by providing a specific strategy to `truncation`.


[{'generated_text': '当是时 ， 吾 不 复 食 卿 肉 。 ” 时 上 遂 即 以 是 年 八 十 三 而 卒 ， 时 年 八 十 一 。 元 寿 元 年 也 。 张 安 世 在 位 后 五 十 年 而 魏 将 黄 门 郎 史 高 为 卫 司 马 军 长 史 ， 与 司 马 懿 俱 入 阁 ， 共 秉 朝 政 ， 时 号 三 公 。 司 马 氏 之 女 名 安 ， 与 安 相 继 为 上 官 氏 妻'}]

### 4. 对联

In [10]:
from transformers import BertTokenizer, GPT2LMHeadModel, TextGenerationPipeline
import torch

device = torch.device("cuda:7" if torch.cuda.is_available() else "cpu")
# 指定模型下载目录
cache_dir = "/raid/gfc/llm/models"

tokenizer = BertTokenizer.from_pretrained("uer/gpt2-chinese-couplet", cache_dir=cache_dir)
model = GPT2LMHeadModel.from_pretrained("uer/gpt2-chinese-couplet", cache_dir=cache_dir).to(device)
# 在创建pipeline时直接指定device参数
text_generator = TextGenerationPipeline(model, tokenizer, device=7)
text_generator("[CLS]天气晚来秋", max_length=25, do_sample=True)


Truncation was not explicitly activated but `max_length` is provided a specific value, please use `truncation=True` to explicitly truncate examples to max length. Defaulting to 'longest_first' truncation strategy. If you encode pairs of sequences (GLUE-style) with the tokenizer you can select this strategy more precisely by providing a specific strategy to `truncation`.


[{'generated_text': '[CLS]天气晚来秋 ， 红 枫 怒 放 一 山 火 - 霜 威 先 闪 电 ， 黄 叶 轻 扬'}]