<a href="https://colab.research.google.com/github/yukiharada1228/neural_network/blob/main/StableLM%E3%82%92%E8%A9%A6%E3%81%97%E3%81%AB%E4%BD%BF%E3%81%A3%E3%81%A6%E3%81%BF%E3%81%9F.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
# GPUの確認
!nvidia-smi

Thu Aug 10 15:59:19 2023       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 525.105.17   Driver Version: 525.105.17   CUDA Version: 12.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|   0  Tesla T4            Off  | 00000000:00:04.0 Off |                    0 |
| N/A   34C    P8     9W /  70W |      0MiB / 15360MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Proces

In [2]:
# 必要なライブラリをインストール
!pip install -q sentencepiece einops transformers huggingface_hub accelerate bitsandbytes

[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.3/1.3 MB[0m [31m6.3 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m42.2/42.2 kB[0m [31m1.5 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m7.4/7.4 MB[0m [31m17.1 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m268.8/268.8 kB[0m [31m16.1 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m244.2/244.2 kB[0m [31m16.1 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m92.6/92.6 MB[0m [31m9.2 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m7.8/7.8 MB[0m [31m65.3 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.3/1.3 MB[0m [31m75.6 MB/s[0m eta [36m0:00:00[0m
[?25h

In [3]:
# StableLMを使用するため許可されたアカウントでhuggingfaceにログイン
from huggingface_hub import notebook_login
notebook_login()

VBox(children=(HTML(value='<center> <img\nsrc=https://huggingface.co/front/assets/huggingface_logo-noborder.sv…

In [4]:
import torch
from transformers import LlamaTokenizer, AutoModelForCausalLM

# チャットボットを作成
class StableChatBot:
    def __init__(self, max_length=128, k=40):
        tokenizer_id = "novelai/nerdstash-tokenizer-v1"
        model_id = "stabilityai/japanese-stablelm-instruct-alpha-7b"
        self.tokenizer = LlamaTokenizer.from_pretrained(tokenizer_id, additional_special_tokens=['▁▁'])
        self.model = AutoModelForCausalLM.from_pretrained(
            model_id,
            trust_remote_code=True,
            low_cpu_mem_usage=True,
            device_map="auto",
            variant="int8",
            load_in_8bit=True
        )
        self.max_length = max_length
        self.k = k

    def chat(self):
        self.model.eval()
        while "[exit]" not in (user_message := self._input()):

            prompt = self.make_prompt(user_message)

            token_ids = self.tokenizer.encode(prompt, add_special_tokens=False, return_tensors="pt")

            output = ""
            for word in self.gradually_generate(token_ids):
                print(word, end='', flush=True)
                output += word
            print()

    def _input(self):
        s = input("> ").replace("\r", "").replace("\n", "")
        return s

    def make_prompt(self, user_message, sep="\n\n### "):
        sys_msg = "以下は、タスクを説明する指示と、文脈のある入力の組み合わせです。要求を適切に満たす応答を書きなさい。"
        p = sys_msg
        p += sep + "指示"
        p += '\n' + user_message
        p += sep + "応答"
        return p

    def gradually_generate(self, token_ids):
        token_ids = token_ids.to(self.model.device)
        for _ in range(self.max_length):
            with torch.no_grad():
                outputs = self.model(token_ids)

            logits = outputs.logits
            indices_to_remove = logits < torch.topk(logits, self.k)[0][..., -1, None]
            logits[indices_to_remove] = float('-inf')
            probs = torch.nn.functional.softmax(logits[..., -1, :], dim=-1)
            next_token_id = torch.multinomial(probs, num_samples=1)
            token_ids = torch.cat((token_ids, next_token_id), dim=-1)

            output_str = self.tokenizer.decode(next_token_id[0])

            yield output_str

            if "<|endoftext|>" in output_str:
                break

In [5]:
# チャットボットを作成
bot = StableChatBot()

Downloading tokenizer.model:   0%|          | 0.00/1.03M [00:00<?, ?B/s]

Downloading (…)cial_tokens_map.json:   0%|          | 0.00/1.77k [00:00<?, ?B/s]

Downloading (…)okenizer_config.json:   0%|          | 0.00/1.97k [00:00<?, ?B/s]

You are using the legacy behaviour of the <class 'transformers.models.llama.tokenization_llama.LlamaTokenizer'>. This means that tokens that come after special tokens will not be properly handled. We recommend you to read the related pull request available at https://github.com/huggingface/transformers/pull/24565


Downloading (…)lve/main/config.json:   0%|          | 0.00/984 [00:00<?, ?B/s]

Downloading (…)se_stablelm_alpha.py:   0%|          | 0.00/5.69k [00:00<?, ?B/s]

A new version of the following files was downloaded from https://huggingface.co/stabilityai/japanese-stablelm-instruct-alpha-7b:
- configuration_japanese_stablelm_alpha.py
. Make sure to double-check they do not contain any added malicious code. To avoid downloading new versions of the code file, you can pin a revision.


Downloading (…)se_stablelm_alpha.py:   0%|          | 0.00/29.3k [00:00<?, ?B/s]

A new version of the following files was downloaded from https://huggingface.co/stabilityai/japanese-stablelm-instruct-alpha-7b:
- modeling_japanese_stablelm_alpha.py
. Make sure to double-check they do not contain any added malicious code. To avoid downloading new versions of the code file, you can pin a revision.


Downloading pytorch_model.int8.bin:   0%|          | 0.00/7.56G [00:00<?, ?B/s]

Downloading (…)neration_config.json:   0%|          | 0.00/111 [00:00<?, ?B/s]

In [6]:
# チャットを開始
bot.chat()

> 画像処理とは何ですか

画像処理とは、視覚データを分析し、コンピュータの支援により視覚能力を提供するための技術です。コンピュータの画像処理システムは、カメラからコンピュータに画像を取り込み、それを視覚的な情報に変換します。これは、画像の種類によって異なります。画像処理は、以下を提供します：
画像のサイズを縮小または拡大する
色を調整し、調整する
画像の質を向上させ、クリーンアップやノイズリダクションによって画像品質を向上させる<|endoftext|>
> パターン認識について教えてください

パターン認識とは、データを何らかの特性を備えたオブジェクトとして分類する技術的方法です。
例:
パターン認識の例には、音声認識、画像認識、自動運転などの技術が含まれます。
<|endoftext|>
> [exit]
