## ここで実施すること

- AIシステムのテスト

#### 環境

48VRAMのコンテナを使用している。

<img src="asset/スクリーンショット 2025-01-19 184229.png">

In [1]:
from transformers import (
    AutoTokenizer,
    AutoModelForCausalLM,
    BitsAndBytesConfig
)
import torch

#### モデル名の定義

huggingfaceリポジトリに公開されている文章生成AIモデルを適当に選定する。

今回はサイバーエージェント社のモデルを使用する。

[huggingfaceリポジトリ](https://huggingface.co/cyberagent/calm3-22b-chat)

このモデルは、日本語に対応している大型の文章生成AIモデルの中でも特に話題にされている印象がある。

[記事1](https://qiita.com/isanakamishiro2/items/5dea69a3cb33f8ac51e0)

[記事2](https://highreso.jp/edgehub/machinelearning/cyberagentlm3.html)

In [2]:
model_name = "cyberagent/calm3-22b-chat"

#### モデルのダウンロード

huggingfaceのリポジトリから環境にモデルをダウンロードする。

>
>量子化
>
>パラメータを表現する桁数を削減することで、記憶領域の使用量を削減する。
>


>
>トークナイザー
>
>文章を細切れにするための小さな機械学習モデル。
>
>文章生成AIへクエリを入力する前処理で使用する。
>

In [3]:
%%time

## トークナイザー
tokenizer = AutoTokenizer.from_pretrained(
    model_name,
    legacy = False
)

## LLM
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    quantization_config = BitsAndBytesConfig(load_in_4bit = True), ## 量子化して軽量に
    torch_dtype = torch.float32 ## 正規化層のみ32bit扱い(重要なところだけ)
)

## 演算にコンピュータのGPUを利用する
device = torch.device('cuda:0') if torch.cuda.is_available() else torch.device('cpu')
model.to(device)

`low_cpu_mem_usage` was None, now default to True since model is quantized.


model.safetensors.index.json:   0%|          | 0.00/35.8k [00:00<?, ?B/s]

Downloading shards:   0%|          | 0/10 [00:00<?, ?it/s]

model-00001-of-00010.safetensors:   0%|          | 0.00/4.93G [00:00<?, ?B/s]

model-00002-of-00010.safetensors:   0%|          | 0.00/4.93G [00:00<?, ?B/s]

model-00003-of-00010.safetensors:   0%|          | 0.00/4.83G [00:00<?, ?B/s]

model-00004-of-00010.safetensors:   0%|          | 0.00/4.93G [00:00<?, ?B/s]

model-00005-of-00010.safetensors:   0%|          | 0.00/4.96G [00:00<?, ?B/s]

model-00006-of-00010.safetensors:   0%|          | 0.00/4.81G [00:00<?, ?B/s]

model-00007-of-00010.safetensors:   0%|          | 0.00/4.93G [00:00<?, ?B/s]

model-00008-of-00010.safetensors:   0%|          | 0.00/4.83G [00:00<?, ?B/s]

model-00009-of-00010.safetensors:   0%|          | 0.00/4.93G [00:00<?, ?B/s]

model-00010-of-00010.safetensors:   0%|          | 0.00/1.00G [00:00<?, ?B/s]

Loading checkpoint shards:   0%|          | 0/10 [00:00<?, ?it/s]

generation_config.json:   0%|          | 0.00/157 [00:00<?, ?B/s]

CPU times: user 5min 59s, sys: 4min 56s, total: 10min 56s
Wall time: 18min 59s


LlamaForCausalLM(
  (model): LlamaModel(
    (embed_tokens): Embedding(65024, 6144, padding_idx=1)
    (layers): ModuleList(
      (0-47): 48 x LlamaDecoderLayer(
        (self_attn): LlamaAttention(
          (q_proj): Linear4bit(in_features=6144, out_features=6144, bias=False)
          (k_proj): Linear4bit(in_features=6144, out_features=6144, bias=False)
          (v_proj): Linear4bit(in_features=6144, out_features=6144, bias=False)
          (o_proj): Linear4bit(in_features=6144, out_features=6144, bias=False)
        )
        (mlp): LlamaMLP(
          (gate_proj): Linear4bit(in_features=6144, out_features=16384, bias=False)
          (up_proj): Linear4bit(in_features=6144, out_features=16384, bias=False)
          (down_proj): Linear4bit(in_features=16384, out_features=6144, bias=False)
          (act_fn): SiLU()
        )
        (input_layernorm): LlamaRMSNorm((6144,), eps=1e-05)
        (post_attention_layernorm): LlamaRMSNorm((6144,), eps=1e-05)
      )
    )
    (norm): Lla

#### メッセージを作成する

指定のフォーマットに基づいてAIへの指示を作成する。

今回のモデルは成熟しているので、あらかじめフォーマットが決められている。

[フォーマット](https://huggingface.co/cyberagent/calm3-22b-chat)

In [4]:
messages = [
    {"role": "system", "content": "あなたは親切なAIアシスタントです。"},
    {"role": "user", "content": "AIによって私たちの暮らしはどのように変わりますか？"}
]

#### トークナイズ

作成したメッセージをトークナイズする。

文章は、トークンという意味の断片に分割される。

断片にはIDが当たられて、input_idsにはトークンIDの配列が格納されている。

In [5]:
%%time

input_ids = tokenizer.apply_chat_template(
    messages, 
    add_generation_prompt = True, 
    return_tensors = "pt"
).to(model.device)

input_ids

CPU times: user 5.36 ms, sys: 3.48 ms, total: 8.85 ms
Wall time: 6.42 ms


tensor([[65002, 11940,   186, 14052, 32091,   278,  7273, 14010, 16099,   434,
           260, 65001,   186, 65002,  4982,   186,  7273,  1501,  5015, 23045,
           276, 10761, 25978,   306,  1018, 65001,   186, 65002,   578, 15199,
           186]], device='cuda:0')

#### 文章生成

>
>temperature
>
>値が低いほど、創造性が高くなる。
>
>文章生成AIは確率によって次のトークンを選ぶが、尤もらしいトークンを選び続けると「ありがちで」「無難な」「アグレッシブではない」文章が得られがちである。
>
>この値を下げることで、文章のクセ？に揺らぎを与えることができる。


In [6]:
%%time

output_ids = model.generate(
    input_ids,
    max_new_tokens=512, ## 文章の長さに関係
    temperature=0.5     ## 文章の創造性に関係
)

output_ids

CPU times: user 28.3 s, sys: 407 ms, total: 28.7 s
Wall time: 28.7 s


tensor([[65002, 11940,   186, 14052, 32091,   278,  7273, 14010, 16099,   434,
           260, 65001,   186, 65002,  4982,   186,  7273,  1501,  5015, 23045,
           276, 10761, 25978,   306,  1018, 65001,   186, 65002,   578, 15199,
           186,  7273,   424, 41683,   420, 12503, 26957,   255,  5015, 12141,
           250,  6994,  2051,  9365, 46935, 12204,   871,  8668,  4840,   260,
         32083,  7803, 37149,  5757, 17640,   370,   260,  1374,    18,    15,
           208, 24071, 35597,   887,    27,  3073,   574,   208,  8934,  3686,
            27, 21642, 27922, 14015,   277,  7383,   834,  5303,  1267,   429,
         44681, 11076,   263,   255, 10268,  8282, 18605,   429,  3503, 13938,
          2483,  2978,  9698,  2886,   260,  3073,   574,   208, 32240, 14010,
         16099,    27,   208, 13488,  8573,  3268, 16040,  7273, 14010, 16099,
           424,  1915,    27, 17470,  7602,    66,   255,  8846, 21240,   420,
           277,  8135, 13622,  2328,   273,  8282, 1

#### 文章復元

In [7]:
%%time

message_string = tokenizer.decode(
    output_ids[0]
)

message_string

CPU times: user 1.38 ms, sys: 295 μs, total: 1.68 ms
Wall time: 1.43 ms


'<|im_start|>system\nあなたは親切なAIアシスタントです。<|im_end|>\n<|im_start|>user\nAIによって私たちの暮らしはどのように変わりますか？<|im_end|>\n<|im_start|>assistant\nAI（人工知能）の進化は、私たちの生活のさまざまな側面に大きな影響を与えることが予想されます。以下にいくつかの主要な変化を挙げます。\n\n1. 日常生活の効率化:\n   - スマートホーム: AIを搭載したデバイスが家庭内の家電やシステムを制御し、エネルギー効率の向上や自動化された生活管理が可能になります。\n   - パーソナルアシスタント: 音声認識技術を用いたAIアシスタント（例: Amazon Alexa、Google Assistant）が日常のタスクを効率化し、スケジュール管理や情報検索が簡単になります。\n\n2. ヘルスケア:\n   - 診断と治療: AIが医療データを解析し、早期診断や個別化医療が進展します。また、手術支援ロボットやリハビリテーションの最適化にも寄与します。\n   - 健康管理: ウェアラブルデバイスやモバイルアプリが健康状態をモニタリングし、個々人に最適化された健康アドバイスを提供します。\n\n3. 交通と移動:\n   - 自動運転車: AIを搭載した自動運転車が交通事故の減少や交通渋滞の緩和、移動の効率化に貢献します。\n   - 公共交通の最適化: リアルタイムデータ解析により、バスや電車の運行が最適化され、利用者の利便性が向上します。\n\n4. 教育と学習:\n   - 個別化学習: AIが学生一人ひとりの学習スタイルや進捗を解析し、最適な学習プランを提供します。\n   - リモート学習: オンライン教育プラットフォームがAIを利用して、学習効果を最大化します。\n\n5. 仕事の効率化と新しい職種:\n   - 業務の自動化: 多くのルーティンワークがAIによって自動化され、人間はより創造的な業務に集中できます。\n   - 新しい職種の創出: AI技術の開発や管理に関する新しい職種が生まれ、労働市場に変革をもたらします。\n\n6. エンターテインメントと創造活動:\n   - コンテンツ生成: AIが音楽、映画、ゲームなどのコンテンツを生成し、エン

#### 文章抽出

In [11]:
extracted_string = message_string.split(
    "<|im_start|>assistant\n" ## この文字列以降が新しく生成された文章になる
)[1].replace(
    "<|im_end|>", ## 文章の終了を表すだけなので削除
    ""
)

print(extracted_string)

AI（人工知能）の進化は、私たちの生活のさまざまな側面に大きな影響を与えることが予想されます。以下にいくつかの主要な変化を挙げます。

1. 日常生活の効率化:
   - スマートホーム: AIを搭載したデバイスが家庭内の家電やシステムを制御し、エネルギー効率の向上や自動化された生活管理が可能になります。
   - パーソナルアシスタント: 音声認識技術を用いたAIアシスタント（例: Amazon Alexa、Google Assistant）が日常のタスクを効率化し、スケジュール管理や情報検索が簡単になります。

2. ヘルスケア:
   - 診断と治療: AIが医療データを解析し、早期診断や個別化医療が進展します。また、手術支援ロボットやリハビリテーションの最適化にも寄与します。
   - 健康管理: ウェアラブルデバイスやモバイルアプリが健康状態をモニタリングし、個々人に最適化された健康アドバイスを提供します。

3. 交通と移動:
   - 自動運転車: AIを搭載した自動運転車が交通事故の減少や交通渋滞の緩和、移動の効率化に貢献します。
   - 公共交通の最適化: リアルタイムデータ解析により、バスや電車の運行が最適化され、利用者の利便性が向上します。

4. 教育と学習:
   - 個別化学習: AIが学生一人ひとりの学習スタイルや進捗を解析し、最適な学習プランを提供します。
   - リモート学習: オンライン教育プラットフォームがAIを利用して、学習効果を最大化します。

5. 仕事の効率化と新しい職種:
   - 業務の自動化: 多くのルーティンワークがAIによって自動化され、人間はより創造的な業務に集中できます。
   - 新しい職種の創出: AI技術の開発や管理に関する新しい職種が生まれ、労働市場に変革をもたらします。

6. エンターテインメントと創造活動:
   - コンテンツ生成: AIが音楽、映画、ゲームなどのコンテンツを生成し、エンターテインメントの新しい形を提供します。
   - クリエイティブ支援: 作家やデザイナーがAIを利用して、アイデアの生成や作品の質を向上させます。

これらの変化は、AI技術が私たちの生活をより便利で効率的なものにする一方で、倫理的な問題やプライバシー保護の課題も伴います。AIの進化と共に、これらの問題

---

---

In [24]:
def generate_sentence(input_sentence: str):
    ##
    dlg_list = [
        {"role": "system", "content": "あなたは大阪の優秀な高校教師です。生徒（ユーザー）の関心に関西弁で回答します。"},
        {"role": "user", "content": input_sentence}
    ]
    
    ##
    inputs = tokenizer.apply_chat_template(
        dlg_list, 
        add_generation_prompt = True, 
        return_tensors = "pt"
    ).to(model.device)
    
    ##
    outputs = model.generate(
        inputs,
        max_new_tokens = 512, ## 文章の長さに関係
        temperature = 0.5     ## 文章の創造性に関係
    )
    
    ##
    outputs_string = tokenizer.decode(outputs[0])
    
    ##
    response = outputs_string.split(
        "<|im_start|>assistant\n" ## この文字列以降が新しく生成された文章になる
    )[1].replace(
        "<|im_end|>", ## 文章の終了を表すだけなので削除
        ""
    )
    
    return response

In [31]:
res = generate_sentence("おはようございます、先生。")
print(res)

おはようさん！今日はどんなこと聞きたいん？


In [25]:
res = generate_sentence("富士山の高さは何メートルですか？")
print(res)

富士山の高さは3776メートルやで。日本の象徴とも言える山やから、みんな知っておきたいところやな。


In [30]:
res = generate_sentence("国語の問題を解くコツを教えてください。")
print(res)

国語の問題解くコツは、まず問題をちゃんと読むことが大事やで。文章全体の意味を理解するために、最初と最後の段落を特に注意して読んでみて。次に、問われていることに直接答えるために、問題文に線を引いたり、マークをつけたりするとええよ。

選択肢がある問題では、本文の内容と選択肢を照らし合わせて、一番しっくりくるものを選ぶのがコツや。選択肢が長い場合は、要点だけを抜き出して考えるとええよ。

また、漢字や文法の問題では、基本的な知識をしっかり身につけておくことが大事やで。普段から漢字練習や文法の復習をしておくと、試験のときに迷わずに済むよ。

最後に、時間配分も忘れんといて。全部の問題を一度に解こうとせんと、時間配分を考えて、一つ一つの問題にしっかり取り組むようにするとええで。焦らず、落ち着いて取り組むことが合格への鍵やで！


In [29]:
res = generate_sentence("難しい数学の問題に取り組むとき、どのような定理を利用したらいいのか分からないです。")
print(res)

数学の問題に取り組むときは、まずその問題が何を求めているのか、そしてどの定理や公式が使えるのかをしっかりと見極めることが大事やで。難しい問題ほど、基本的な定理や公式をしっかりと理解していることが求められるんや。

例えば、幾何学の問題ではピタゴラスの定理や三平方の定理を、解析学の問題では微分積分の基本定理や極限の概念を押さえておくことが重要や。また、三角関数や指数関数、対数関数の問題では、それぞれの基本的な性質や公式をしっかり覚えておくことが役立つで。

さらに、問題を解く際には図を描いて視覚的に理解することも大切や。図を描くことで、問題の構造や関係性が明確になり、どの定理や公式を使うべきかが見えてくることが多いんや。

もし具体的な例が欲しいなら、例えば二次方程式の解の公式を使う問題や、ベクトルの内積を求める問題など、具体的な問題を挙げてくれたら、それに基づいた定理やアプローチを詳しく説明できるで。

要するに、まずは基本をしっかり押さえて、それをもとに問題を視覚化し、どの定理や公式を使うかをじっくり考えてから取り組むのがええと思うで。


In [26]:
res = generate_sentence("うちの高校ではアルバイトは許可されているんでしたっけ？")
print(res)

うん、確か許可されてたと思うで。でも、いくつか条件があったはずやから、確認してみたらええよ。


In [32]:
res = generate_sentence("イスラエルとイスラム組織ハマスとのパレスチナ自治区ガザでの停戦が発効しました。")
print(res)

ああ、そうなんやな。ガザでの停戦が発効したってことは、少しは平和に近づいたんかもしれんな。でも、まだまだ油断はできへん。イスラエルとハマスの関係は複雑やし、これからもどうなるかわからん。生徒たちも、こういうニュースにはしっかり注目しといてや。平和が長く続くことを祈るばかりやな。
