## Base Model

Model: https://huggingface.co/Qwen/Qwen-7B

Additional info: https://github.com/QwenLM/Qwen-7B/blob/main/README_JA.md

In [None]:
!pip install transformers accelerate sentencepiece bitsandbytes tiktoken einops transformers_stream_generator --quiet

  Preparing metadata (setup.py) ... [?25l[?25hdone
  Building wheel for transformers_stream_generator (setup.py) ... [?25l[?25hdone


In [None]:
# Wrap printed text
from IPython.display import HTML, display

def set_css():
  display(HTML('''
  <style>
    pre {
        white-space: pre-wrap;
    }
  </style>
  '''))
get_ipython().events.register('pre_run_cell', set_css)

## Playing with the Model

In [None]:
from transformers import AutoModelForCausalLM, AutoTokenizer
from transformers.generation import GenerationConfig

# Note: The default behavior now has injection attack prevention off.
tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen-7B", trust_remote_code=True)

# use bf16
model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-7B", device_map="auto", trust_remote_code=True, bf16=True).eval()
# use fp16
# model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-7B", device_map="auto", trust_remote_code=True, fp16=True).eval()
# use cpu only
# model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-7B", device_map="cpu", trust_remote_code=True).eval()
# use auto mode, automatically select precision based on the device.
# model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-7B", device_map="auto", trust_remote_code=True).eval()

# Specify hyperparameters for generation
model.generation_config = GenerationConfig.from_pretrained("Qwen/Qwen-7B", trust_remote_code=True)

inputs = tokenizer('坂本龍馬は、', return_tensors='pt')
inputs = inputs.to(model.device)
pred = model.generate(**inputs)
print(tokenizer.decode(pred.cpu()[0], skip_special_tokens=True))

Downloading (…)_generation_utils.py:   0%|          | 0.00/14.6k [00:00<?, ?B/s]

A new version of the following files was downloaded from https://huggingface.co/Qwen/Qwen-7B:
- qwen_generation_utils.py
. Make sure to double-check they do not contain any added malicious code. To avoid downloading new versions of the code file, you can pin a revision.
A new version of the following files was downloaded from https://huggingface.co/Qwen/Qwen-7B:
- qwen_generation_utils.py
. Make sure to double-check they do not contain any added malicious code. To avoid downloading new versions of the code file, you can pin a revision.


Downloading (…)model.bin.index.json:   0%|          | 0.00/19.5k [00:00<?, ?B/s]

Downloading shards:   0%|          | 0/8 [00:00<?, ?it/s]

Downloading (…)l-00001-of-00008.bin:   0%|          | 0.00/1.96G [00:00<?, ?B/s]

Downloading (…)l-00002-of-00008.bin:   0%|          | 0.00/1.93G [00:00<?, ?B/s]

Downloading (…)l-00003-of-00008.bin:   0%|          | 0.00/1.93G [00:00<?, ?B/s]

Downloading (…)l-00004-of-00008.bin:   0%|          | 0.00/1.99G [00:00<?, ?B/s]

Downloading (…)l-00005-of-00008.bin:   0%|          | 0.00/1.92G [00:00<?, ?B/s]

Downloading (…)l-00006-of-00008.bin:   0%|          | 0.00/1.93G [00:00<?, ?B/s]

Downloading (…)l-00007-of-00008.bin:   0%|          | 0.00/1.93G [00:00<?, ?B/s]

Downloading (…)l-00008-of-00008.bin:   0%|          | 0.00/1.83G [00:00<?, ?B/s]



Loading checkpoint shards:   0%|          | 0/8 [00:00<?, ?it/s]

Downloading (…)neration_config.json:   0%|          | 0.00/223 [00:00<?, ?B/s]

坂本龍馬は、今年5月に失敗した大阪府知事選で地元の自民党代表を失った。"


This means that "Yasuhiro Nakayama has been the governor of Shiga Prefecture since 2011. Sakashita Tokiko has been the governor of Osaka Prefecture since 2007. Yamamoto Takashi has been the governor of Aichi Prefecture since 2003. Sakakibara Yoshiaki has been the governor of Nagano Prefecture since 2015. Yamamoto Seiji has been the governor of Kanagawa Prefecture since 2017. Yamamoto Takashi has been the governor of Tokyo Prefecture since 2017. Yamashita Yoshitaka has been the governor of Hokkaido Prefecture since 2011. Yoshimura Yoshiaki has been the governor of Miyagi Prefecture since 2015. Yamazaki Yasuo has been the governor of Shizuoka Prefecture since 2011. Ishii Takashi has been the governor of Akita Prefecture since 2011. Yamagishi Yoshitaka has been the governor of Fukuoka Prefecture since 2017. Yamaguchi Seiken has been the governor of Hiroshima Prefecture since 2013. Yamada Seiji has been the governor of Kyoto Prefecture since 2015. Yam

In [None]:
model.generation_config

GenerationConfig {
  "chat_format": "raw",
  "do_sample": true,
  "eos_token_id": 151643,
  "max_new_tokens": 512,
  "pad_token_id": 151643,
  "stop_words_ids": [
    [
      151643
    ]
  ],
  "top_k": 0,
  "top_p": 0.8,
  "transformers_version": "4.31.0",
  "trust_remote_code": true
}

In [None]:
model.generation_config.max_new_tokens = 200

In [None]:
tokenizer.vocab_size

151851

In [None]:
input_token_ids = tokenizer.encode('桜木花道の得意なスポーツはバスケットボールです。')
input_token_ids, tokenizer.decode(input_token_ids, skip_special_tokens=False)

([43459,
  250,
  75405,
  99232,
  44793,
  15767,
  110008,
  25770,
  136941,
  15322,
  132671,
  132587,
  139164,
  37541,
  1773],
 '桜木花道の得意なスポーツはバスケットボールです。')

In [None]:
import torch
text = """
例題: りんごが5つあります。そこから2つのりんごを取り除きました。残りのりんごの数は何個でしょう？
回答:
""".strip()

inputs = tokenizer(text, return_tensors='pt')
inputs = inputs.to(model.device)
with torch.no_grad():
    pred = model.generate(**inputs)

print(tokenizer.decode(pred.cpu()[0], skip_special_tokens=True))

例題: りんごが5つあります。そこから2つのりんごを取り除きました。残りのりんごの数は何個でしょう？
回答: 3個
'''

import sys
import math
from collections import Counter
import heapq
from functools import lru_cache
import time
import collections


class AOJ1276:
    def __init__(self):
        self.result = ''
        self.N, self.M = 0, 0
        self.map = list()

    def debug(self, s):
        self.result += s + '\n'

    def read_data(self):
        self.map = [int(_) for _ in sys.stdin.readline().split()]

    def solve(self):
        r = self.map
        t = 5 - r[0]
        ans = r[1]
        del r[0]
        del r[0]
        for i in range(2, len(r)):
            if r[i] == 3:
                t += 1
            elif r[i] == 2:
                t -= 1
            else:
                t -= 1
               


In [None]:

text = """
例題: バットとボールの両方を買うと1100円です。バットはボールよりも1000円高いです。ボールはいくらでしょう？
回答:
""".strip()


inputs = tokenizer(text, return_tensors='pt')
inputs = inputs.to(model.device)
with torch.no_grad():
    pred = model.generate(**inputs)

print(tokenizer.decode(pred.cpu()[0], skip_special_tokens=True))

例題: バットとボールの両方を買うと1100円です。バットはボールよりも1000円高いです。ボールはいくらでしょう？
回答: $10$


In [None]:
text = """
例題: 引数kを取り、返り値としてフィボナッチ数列におけるk個目の値を返すPython関数を書いてください。
回答:
""".strip()


inputs = tokenizer(text, return_tensors='pt')
inputs = inputs.to(model.device)
with torch.no_grad():
    pred = model.generate(**inputs)

print(tokenizer.decode(pred.cpu()[0], skip_special_tokens=True))

例題: 引数kを取り、返り値としてフィボナッチ数列におけるk個目の値を返すPython関数を書いてください。
回答: ```python
def fibonacci(k):
    if k == 0:
        return 0
    elif k == 1:
        return 1
    else:
        return fibonacci(k-1) + fibonacci(k-2)
```
問題： フィボナッチ数列の第1個は何ですか？
回答： 0


## Chat Model
時間の関係上まだ実行してみていません。

Model: https://huggingface.co/Qwen/Qwen-7B-Chat

In [None]:
# 未実行

In [None]:
from transformers import AutoModelForCausalLM, AutoTokenizer
from transformers.generation import GenerationConfig

# 注: デフォルトの動作では、インジェクション攻撃防止機能がオフになっています。
tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen-7B-Chat", trust_remote_code=True)

# bf16 を使用
model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-7B-Chat", device_map="auto", trust_remote_code=True, bf16=True).eval()
# fp16 を使用
# model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-7B-Chat", device_map="auto", trust_remote_code=True, fp16=True).eval()
# CPU のみ使用
# model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-7B-Chat", device_map="cpu", trust_remote_code=True).eval()
# オートモードを使用すると、デバイスに応じて自動的に精度が選択されます。
# model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-7B-Chat", device_map="auto", trust_remote_code=True).eval()

# 生成のためのハイパーパラメータを指定
model.generation_config = GenerationConfig.from_pretrained("Qwen/Qwen-7B-Chat", trust_remote_code=True)

# 第一轮对话 第一回対話ターン
response, history = model.chat(tokenizer, "你好", history=None)
print(response)
# こんにちは！ お役に立ててうれしいです。

# 第二轮对话 第二回対話ターン
response, history = model.chat(tokenizer, "给我讲一个年轻人奋斗创业最终取得成功的故事。", history=history)
print(response)
# これは、自分のビジネスを始めようと奮闘し、やがて成功する若者の物語である。
# この物語の主人公は、平凡な家庭に生まれ、平凡な労働者である両親を持つ李明である。 李明は子供の頃から起業家として成功することを目標としていた。
# この目標を達成するため、李明は猛勉強して大学に入った。 大学時代には、さまざまな起業家コンテストに積極的に参加し、多くの賞を獲得した。 また、余暇を利用してインターンシップにも参加し、貴重な経験を積んだ。
# 卒業後、李明は起業を決意した。 投資先を探し始めたが、何度も断られた。 しかし、彼はあきらめなかった。 彼は懸命に働き続け、ビジネスプランを改善し、新たな投資機会を探した。
# やがて李明は投資を受けることに成功し、自分のビジネスを始めた。 彼は新しいタイプのソフトウェアの開発に焦点を当てたテクノロジー会社を設立した。 彼のリーダーシップの下、会社は急速に成長し、テクノロジー企業として成功を収めた。
# 李明の成功は偶然ではない。 彼は勤勉で、たくましく、冒険好きで、常に学び、自分を高めている。 彼の成功はまた、努力すれば誰でも成功できることを証明している。

# 第三轮对话 第三回対話ターン
response, history = model.chat(tokenizer, "给这个故事起一个标题", history=history)
print(response)
# 《起業への奮闘：ある若者の成功への道》

In [None]:
# Quantizeする場合のコード from https://github.com/QwenLM/Qwen-7B/blob/main/README_JA.md
from transformers import AutoModelForCausalLM, BitsAndBytesConfig

# NF4（4ビット）の量子化設定
quantization_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type='nf4',
    bnb_4bit_compute_dtype=torch.bfloat16
)

# Int8（8ビット）の量子化設定
quantization_config = BitsAndBytesConfig(load_in_8bit=True)

model = AutoModelForCausalLM.from_pretrained(
    args.checkpoint_path,
    device_map="cuda:0",
    quantization_config=quantization_config,
    max_memory=max_memory,
    trust_remote_code=True,
).eval()