BiLLa-7B-LLM生成文本问题 #16

chk4991 · 2023-05-23T06:43:06Z

用BiLLA-7b-LLM，根据issues# 8，采用commit id=887dd5e259104ed6fe7816cd0c0997ab68bbb94e版本的pytorch_model-33-of-33.bin替换原来的权重，并且没有用embedding_convery.py。

测试代码如下
from transformers import LlamaForCausalLM, LlamaTokenizer
CKPT = 'BiLLa-7B-LLM'
DEVICE = 'cuda:0'
tokenizer = LlamaTokenizer.from_pretrained(CKPT, add_special_tokens=True)
model = LlamaForCausalLM.from_pretrained(CKPT).to(DEVICE)

prompts = ["我看见一群人走在大", "今天是个阳光明媚的", "这件事情的发展出乎意"]

for prompt in prompts:

input_ids = tokenizer(prompt, return_tensors='pt').input_ids.to(DEVICE)

output_ids = model.generate(input_ids, max_new_tokens=100)[0]

out_text = tokenizer.decode(output_ids)

print(out_text)

生成结果如下：
<s> 我看见一群人走在大马路可以指：</s>
<s> 今天是个阳光明媚的日子，可以指：</s>
<s> 这件事情的发展出乎意料 </s>

请问这个结果是正常的吗

The text was updated successfully, but these errors were encountered:

lucasjinreal · 2023-05-23T06:53:30Z

不太正常

Neutralzz · 2023-05-25T02:38:19Z

确实看起来有点奇怪。我得到周日才能抽出时间来再验证一下。

lucasjinreal · 2023-05-26T12:29:23Z

不过我也发现这个LLM，非sft，已转换embedding，生成结果不太对

总是会输出：

可以指：

或者输入Hi， Hello，返回空，或者返回world的情形。

楼主麻烦check一下是不是传错了模型。。。。

Neutralzz · 2023-05-27T17:42:10Z

上传的模型应该是对的，但观察输出结果时，看到的现象跟你们一致。

我这边对比了原始的模型文件和上传的模型文件，确认两边参数是一致的。同时计算了两个模型的perplexity，跟README里结果也是一致的（甚至更低一点）。

目前推测这种现象跟模型训练方式有关：

训练语言建模时是Conditional Generation，见代码
任务数据中多数是强依赖于prompt信息的数据，只有WebQA和翻译是prompt相对短的数据。

所以，大概率可以通过提升prompt长度（至100~200字）来避免该现象的出现。

luohao123 · 2023-05-28T02:46:29Z

我这边训的好几个LORA基本上都是崩溃的，根本无法正常输出，训练数据就sft常用的coig alpaca_zn等数据，都是较长的输出。
基本可以确定这个与训练模型，比较难训练出一个可用的lora了。

Neutralzz mentioned this issue May 27, 2023

突然发现预训练模型似乎存在一些问题(sft之前阶段的模型） #25

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

BiLLa-7B-LLM生成文本问题 #16

BiLLa-7B-LLM生成文本问题 #16

chk4991 commented May 23, 2023 •

edited

lucasjinreal commented May 23, 2023

Neutralzz commented May 25, 2023

lucasjinreal commented May 26, 2023

Neutralzz commented May 27, 2023

luohao123 commented May 28, 2023

BiLLa-7B-LLM生成文本问题 #16

BiLLa-7B-LLM生成文本问题 #16

Comments

chk4991 commented May 23, 2023 • edited

lucasjinreal commented May 23, 2023

Neutralzz commented May 25, 2023

lucasjinreal commented May 26, 2023

Neutralzz commented May 27, 2023

luohao123 commented May 28, 2023

chk4991 commented May 23, 2023 •

edited