In [1]:
# %env HF_ENDPOINT=https://hf-mirror.com
%env HF_HOME=/root/autodl-tmp/hf
%env HF_HUB_CACHE=/root/autodl-tmp/hf

env: HF_HOME=/root/autodl-tmp/hf
env: HF_HUB_CACHE=/root/autodl-tmp/hf


In [2]:
import os
import subprocess

result = subprocess.run('bash -c "source /etc/network_turbo && env | grep proxy"', shell=True, capture_output=True,
                        text=True)
output = result.stdout
for line in output.splitlines():
    if '=' in line:
        var, value = line.split('=', 1)
        os.environ[var] = value

In [3]:
save_dir = '/root/autodl-tmp/models'
save_name = "google/gemma-2-9b-mingchao-ft" 
out_dir = os.path.join(save_dir, save_name)

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
from peft import PeftModel, PeftConfig
peft_config = PeftConfig.from_pretrained(out_dir)

In [4]:
model_id = peft_config.base_model_name_or_path
model_id

'google/gemma-2-9b'

In [5]:
bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_use_double_quant=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.bfloat16
)

model = AutoModelForCausalLM.from_pretrained(model_id, quantization_config=bnb_config, device_map={"":0})
tokenizer = AutoTokenizer.from_pretrained(model_id, add_eos_token=True)

Loading checkpoint shards:   0%|          | 0/8 [00:00<?, ?it/s]

In [6]:
def get_completion(query: str, model, tokenizer) -> str:
  device = "cuda:0"

  prompt_template = """
  ### 问题: {query}\n###回答:
  """
  prompt = prompt_template.format(query=query)

  encodeds = tokenizer(prompt, return_tensors="pt", add_special_tokens=True)

  model_inputs = encodeds.to(device)


  generated_ids = model.generate(**model_inputs, max_new_tokens=128, do_sample=True, pad_token_id=tokenizer.eos_token_id)
  decoded = tokenizer.decode(generated_ids[0], skip_special_tokens=True)
  return (decoded)

In [7]:
result = get_completion(query="《鸣潮》是什么呀？", model=model, tokenizer=tokenizer)
print(result)


  ### 问题: 《鸣潮》是什么呀？
###回答:
  名词, n. 1 潮声; 2 噪声; 3 喧闹声;
  adj. 喧闹的; 4 (指海洋中的潮汐)起落平稳的;
  vt. 骚扰; 吵闹; 骚扰;(使)吵嚷;(使)喧闹
 *



In [8]:
result = get_completion(query="《鸣潮》的特色是什么？", model=model, tokenizer=tokenizer)
print(result)


  ### 问题: 《鸣潮》的特色是什么？
###回答:
  :
  - `双曲网格（双曲网格，即对称度数大于2的网格，或者对称度数小于等于2但至少有一条对称轴的网格）`,
  - `环路(Cycle)`,
  - `多环路(MultiCycle)`,
  - `连体(Connectivity)`,
- 鸣潮中的连体属性(Connectivity)是双相流(Two-phase flow)的有效描述方案，其中两个相交相交两个相交两个相交两个相交两个相交两个相交两个相


In [9]:
result = get_completion(query="今汐是谁？", model=model, tokenizer=tokenizer)
print(result)


  ### 问题: 今汐是谁？
###回答:
  :  :red_heart:/red_heart:/red_heart: **:red_heart:/red_heart:/red_heart:** :red_heart:/red_heart:/red_heart: :red<br>
  > *今天是06月!06日*
  <img src='https://cdn.jsdelivr.net/gh/zcx123456a/zcx123456/static/img/1.png'>
  ##  :blue_heart:/red_heart: **:red_heart:/red_heart:/


In [10]:
result = get_completion(query="今汐是有什么技能？", model=model, tokenizer=tokenizer)
print(result)


  ### 问题: 今汐是有什么技能？
###回答:
  _0034:
    - 一旦进入暗黑之门, 就可以自由的行走整个世界。
`
# 2.7.4246591-4
```java
    class Test
      private String qName;
    - public Test(String questionId) {
      super();
      this.qName = questionId;
    }
 ```
```sh
$ cd
$ git update-index --ignore-submodules --refresh
$ git update-index --ignore-submodules --refresh
$ git update-index --ignore-


In [11]:
result = get_completion(query="对于XP党来说，抽取今汐是否值得抽取？", model=model, tokenizer=tokenizer)
print(result)


  ### 问题: 对于XP党来说，抽取今汐是否值得抽取？
###回答:
  为一个新英雄，不看立绘，仅看定位上来说，这是一个主战的双打坦克型辅助，定位上和老牌坦克辅助小公枪差距不是很大。
  在对练环境中，因为大家有充足的资源去培养自己的主力，现在对练环境其实是一个大规模5打4的对抗，也就是你这边除了6个主力，有一个辅助的位置是给敌方补位的，换句话说，哪怕是我这边满级的六位主力，如果对方的六位主力都是满级的情况下，那我的这六位主力，如果一个不配合好了就会输
