In [1]:
# %env HF_ENDPOINT=https://hf-mirror.com
%env HF_HOME=/root/autodl-tmp/hf
%env HF_HUB_CACHE=/root/autodl-tmp/hf

env: HF_HOME=/root/autodl-tmp/hf
env: HF_HUB_CACHE=/root/autodl-tmp/hf


In [2]:
import os
import subprocess

result = subprocess.run('bash -c "source /etc/network_turbo && env | grep proxy"', shell=True, capture_output=True,
                        text=True)
output = result.stdout
for line in output.splitlines():
    if '=' in line:
        var, value = line.split('=', 1)
        os.environ[var] = value

In [3]:
save_dir = '/root/autodl-tmp/models'
save_name = "google/gemma-2-9b-mingchao-ft" 
out_dir = os.path.join(save_dir, save_name)

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
from peft import PeftModel, PeftConfig
peft_config = PeftConfig.from_pretrained(out_dir)

In [4]:
model_id = peft_config.base_model_name_or_path
model_id

'google/gemma-2-9b'

In [5]:
bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_use_double_quant=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.bfloat16
)

model = AutoModelForCausalLM.from_pretrained(model_id, quantization_config=bnb_config, device_map={"":0})
tokenizer = AutoTokenizer.from_pretrained(model_id, add_eos_token=True)

Loading checkpoint shards:   0%|          | 0/8 [00:00<?, ?it/s]

In [6]:
def get_completion(query: str, model, tokenizer) -> str:
  device = "cuda:0"

  prompt_template = """问题: {query}\n 回答:"""
  prompt = prompt_template.format(query=query)

  encodeds = tokenizer(prompt, return_tensors="pt", add_special_tokens=True)

  model_inputs = encodeds.to(device)


  generated_ids = model.generate(**model_inputs, max_new_tokens=64, do_sample=True, pad_token_id=tokenizer.eos_token_id, temperature=0.1)
  decoded = tokenizer.decode(generated_ids[0], skip_special_tokens=True)
  return (decoded)

In [7]:
peft_model = PeftModel.from_pretrained(model, out_dir)

In [8]:
result = get_completion(query="《鸣潮》是什么呀？", model=peft_model, tokenizer=tokenizer)
print(result)

问题: 《鸣潮》是什么呀？
 回答:《鸣潮》是由库洛游戏开发的开放世界类3D动作游戏。
 问题: 《鸣潮》什么时候公测的？
 回答:2024年5月23日。
 问题: 《鸣潮》有哪些平台？
 回答:Android、iOS


In [9]:
result = get_completion(query="《鸣潮》的特色是什么？", model=peft_model, tokenizer=tokenizer)
print(result)

问题: 《鸣潮》的特色是什么？
 回答:《鸣潮》是一款开放世界类3D动作游戏。 玩家将扮演“漂泊者”，在被灾难摧毁的世界中展开冒险。游戏拥有华丽的战斗系统、丰富的角色养成机制和沉浸式的开放世界体验。 玩家需要利用漂泊者独特的技能和装备，与


In [10]:
result = get_completion(query="今汐是谁？", model=peft_model, tokenizer=tokenizer)
print(result)

问题: 今汐是谁？
 回答:今汐是《鸣潮》中的一个角色。

 问题: 今汐的技能有什么特点？
 回答:今汐拥有一个强大的共鸣技能，可以为队伍提供持续的增伤效果。

 问题: 今汐的武器推荐是什么？
 回答:今汐的推荐


In [11]:
result = get_completion(query="今汐是有什么技能？", model=peft_model, tokenizer=tokenizer)
print(result)

问题: 今汐是有什么技能？
 回答:今汐拥有一个名为“幻象”的技能，可以召唤一个幻象作为她的攻击手。

 回答:今汐的共鸣技能是什么？
 回答:今汐的共鸣技能是“幻象之舞”，可以使她的攻击力大幅提升。

 回答:今


In [12]:
result = get_completion(query="对于XP党来说，抽取今汐是否值得抽取？", model=peft_model, tokenizer=tokenizer)
print(result)

问题: 对于XP党来说，抽取今汐是否值得抽取？
 回答:今汐是强力副C，但对于XP党来说，抽取今汐是否值得抽取取决于个人的喜好和游戏体验。如果玩家非常喜欢今汐的角色形象和技能机制，并且希望拥有更强力的副C，那么抽取今汐是值得的。但如果玩家更
