<a href="https://colab.research.google.com/github/YasuharuSuzuki/24_programing1/blob/main/" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Section 13-2 AIと会話してみよう

- 最近では、人工知能（AI）の発展に伴い、ChatGPTなどに代表される大規模言語モデル（LLM: Large Language Model）を日常で使用する機会が増えました。
- これらのAIは、膨大な量のテキストデータから学習し、人間のような対話や文章生成が可能です。
- Pythonは、オープンソースソフトウェアの世界で発展し、主に機械学習の分野を得意とするプログラミング言語です。多くのAI関連ライブラリやフレームワークがPythonで開発されています。
- ここでは、Googleが開発したGemmaというオープンソースの言語モデルを使って会話してみましょう

---

## 参考サイト
### [参考サイト1 【npaka】Google Colab で Gemma 2 JPN を試す](https://note.com/npaka/n/n806bf46a2842)
- Gemmaの実行方法がシンプルに記載されたnoteです。
- Google Colab で動かす方法と、ソースコードが紹介されています
- ソースコードを実行すると自動的に Hugging Face というサイトから大規模言語モデルをダウンロード、実行します

### [参考サイト2 【Zenn】Hugging Faceにサインアップ & アクセストークンを取得する](https://zenn.dev/protoout/articles/73-hugging-face-setup)
- 参考サイト1の通りに実行するにはHugging Faceへの登録とアクセストークンが必要です
- こちらのサイトを参考にHugging Faceのアクセストークンを取得しましょう

### [参考サイト3 【Hugging Face】gemma-2-2b-jpn-it](https://huggingface.co/google/gemma-2-2b-jpn-it)
- 大規模言語モデルのページです。上記ページにアクセスして、以下のテキストが表示されればダウンロード可能です
```
[ Gated model ] You have been granted access to this model
```

### [参考サイト4 【Google Colab】GPUの使い方](https://sci-by-py.com/hpc/google-colab/)
- 大規模言語モデルの使用にはGPUが必要です。
- Google ColabでGPUを利用するには、こちらのサイトを参考にランタイムタイプをGPUへ変更しましょう
- [ランタイム]メニューから、[ランタイムのタイプを変更]→[T4 GPU]を選ぶと使用できます



---

## Gemmaについて

<img src="https://storage.googleapis.com/gweb-developer-goog-blog-assets/images/Gemma-banner.original.png">

[参考サイト5 【Gemma 徹底解説】 Gemma モデルファミリーのアーキテクチャの概要](https://developers.googleblog.com/ja/gemma-explained-overview-gemma-model-family-architectures/)
- とても詳しくGemmaについて解説されていますが、きちんと理解するには機械学習モデルの開発に関連した知識が必要です
- 興味ある方だけ全部読んでみてください

### Gemmaの特徴(かんたんに特徴を説明)
- ChatGPT等の大規模言語モデルと違ってAPIを叩く必要がなく、Google Colab上でモデルをダウンロードして実行できる
- 無料で使える
- Gemma1、Gemma2と複数バージョンある（今回は2024/10に発表されたばかりの最新のGemma2-2B-JPNを使用します）
- サイズの違うGemma2-9B、Gemma2-27Bなどもあるが、モデル名に ``` ??B ``` と付いているところが大規模言語モデルのパラメータ数を表しており、2B、9B、27Bはそれぞれ20億、90億、270億パラメータとなります。なお、Bはbillion(10億)の略です。
- 9Bはスペックの高いGPUが必要なため、有料のGoogle Colabか、高額のGPU（10万円ほどする）が必要となります。さらに27Bは100万円以上のGPUが必要です。
- 性能は以下の通りパラメータが多くなるほど高くなります ([参考](https://ai.google.dev/gemma?hl=ja))

<img src="https://pbs.twimg.com/media/GdI7n_MbMAA5jAa?format=jpg&name=large">

具体例としてサンプルプログラムを見てみましょう
- 実行には Hugging Face のアクセストークンと、ランタイムタイプのGPUへの切り替えが必要です。参考サイトの情報を元にセットアップを行ってください

## サンプルプログラム3　Gemma2 2B JPN を試す

### パッケージのインストール
- 参考サイト1の通りに実行します
- まずはパッケージのインストールから

In [1]:
# パッケージのインストール
!pip install transformers accelerate



### パイプラインの準備
- 次に大規模言語モデルを実行するパイプラインというものを作ります
- Hugging Face のアクセストークンを取得し、Google Colabのシークレットキーとして指定してください（指定しないと失敗します）
  - Hugging Face のアクセストークンはしばらく経つと有効期限が切れます。その際には Hugging Face に再度アクセスし、モデルのページを開いて許可を取得してください
- ランタイムをGPUにしていないと、こちらの実行時に失敗します

In [2]:
import torch
from transformers import pipeline

# パイプラインの準備
pipe = pipeline(
    "text-generation",
    model="google/gemma-2-2b-jpn-it",
    model_kwargs={"torch_dtype": torch.bfloat16},
    device="cuda",
)

config.json:   0%|          | 0.00/805 [00:00<?, ?B/s]

model.safetensors.index.json:   0%|          | 0.00/24.2k [00:00<?, ?B/s]

Downloading shards:   0%|          | 0/2 [00:00<?, ?it/s]

model-00001-of-00002.safetensors:   0%|          | 0.00/4.99G [00:00<?, ?B/s]

model-00002-of-00002.safetensors:   0%|          | 0.00/241M [00:00<?, ?B/s]

Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]

generation_config.json:   0%|          | 0.00/168 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/46.9k [00:00<?, ?B/s]

tokenizer.model:   0%|          | 0.00/4.24M [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/17.5M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/555 [00:00<?, ?B/s]

### 推論を実行
- 大規模言語モデルを実行します
- メッセージには適当な文字列を設定し、先程作成したパイプラインを通して大規模言語モデルで推論します

In [3]:
# メッセージの準備
messages = [
    {"role": "user", "content": "まどか☆マギカでは誰が一番かわいい?"},
]

# 推論の実行
outputs = pipe(messages, return_full_text=False, max_new_tokens=256)
assistant_response = outputs[0]["generated_text"].strip()
print(assistant_response)

それは個人の好みなので、誰が一番かわいいかは人によって違います！ 

「まどか☆マギカ」のキャラクターたちはそれぞれ魅力的で、多くのファンに愛されています。 

**人気キャラクターとして挙げられるのは:**

* **まどか:**  主人公であり、物語の軸となるキャラクター。明るく元気で、ファンからは「まどかちゃん」と呼ばれています。
* **ユウキ:**  まどかの友人であり、彼女を支える存在。クールで、時には少し複雑な性格ですが、深い愛情を持っていることがわかります。
* **アヤ:**  まどかの友人であり、明るく元気な性格。
* **ミホ:**  まどかの友人であり、少し変わった性格。

どのキャラクターが一番かわいいかは、あなたの好みによって異なります。 

**あなたにとって一番かわいいキャラクターは誰ですか？**


---

### サンプルプログラムの動作について
#### "まどか" は正しい
- 主人公のまどかに関しては正しい情報を出力しているように見えます
- ただし、名前はあっていますが、あまり詳しい説明はされていません

#### その他は正しくない
- ユウキ、アヤ、ミホ、というキャラは少なくともアニメにはいません（ゲームやマギレコでは知らないけど。。。）
- ほむら、さやか、マミ、杏子がいないのは不自然です
- AIはこのように間違うことがあります
- さらに Gemma 2B は言語モデルの中ではパラメータ数が小さいため、性能が低く、このように間違った結果を推論してしまう可能性があります
- 言語モデルを使用する時には、間違った情報に注意して使用しましょう

---

### 練習プログラム3　質問応答 (2点)
- input()で 質問文を受け取り、推論結果を出力するプログラムを書いてみましょう  

In [4]:
# メッセージの準備
question = input()
messages = [
    {"role": "user", "content": question},
]

# 推論の実行
outputs = pipe(messages, return_full_text=False, max_new_tokens=256)
assistant_response = outputs[0]["generated_text"].strip()
print(assistant_response)

Pythonの特徴と主な用途について教えて下さい
## Pythonの特徴と主な用途

Pythonは、**初心者でも学習しやすい**、**柔軟性と汎用性の高い**プログラミング言語です。 

**特徴:**

* **読みやすさ:**  Pythonのコードは、他の言語と比べて読みやすいため、学習が容易です。
* **汎用性:**  Web開発、データ分析、機械学習、ゲーム開発など、幅広い分野で利用できます。
* **豊富なライブラリ:**  Pythonには、様々な機能を提供する豊富なライブラリがあり、開発効率を向上させます。
* **オープンソース:**  無料で利用でき、コミュニティによるサポートが充実しています。
* **実行速度:**  Pythonは、実行速度が速く、複雑な処理も効率的に実行できます。
* **動的型:**  変数の型を宣言する必要がなく、柔軟なコード設計が可能です。
* **オブジェクト指向:**  オブジェクト指向プログラミングの概念を導入しており、コードの再利用性と可読性を高めます。

**主な用途:**

* **Web開発:**  フレームワーク（Django, Flask）を用いて、Webサイトやアプリを開発できます。
* **データ分析:**  Pandas


---
---
---

## サンプルプログラム4　文章生成

大規模言語モデル(LLM)を使用すると、以下のような機能を簡単に利用することができます

- 質問応答：プログラミングの概念やエラーについて質問すると、分かりやすく説明してくれます。
- 文章生成：与えられたテーマについて、レポートや説明文などを作成できます。
- 文章校正：書いた文章の誤字脱字をチェックし、より適切な表現を提案します。
- 要約：長い文章を読みやすい長さに要約し、重要なポイントを抽出します。
- 翻訳：日本語と英語など、異なる言語間の翻訳を行うことができます。
- アイデア出し：課題解決やプロジェクトのアイデアについて、様々な提案をしてくれます。

これらを活用することで、さまざまな問題の解決や学習をより効率的に進めることができます。

In [5]:
# メッセージの準備
topic = "Pythonのリスト内包表記について、1000文字程度で詳しく説明する文章を生成してください"
#topic = input()  # このように入力すると、好きな文字列を入力することが出来ます
messages = [
    {"role": "user", "content": topic},
]

# 推論の実行
outputs = pipe(messages, return_full_text=False, max_new_tokens=256)
assistant_response = outputs[0]["generated_text"].strip()
print(assistant_response)

## Pythonのリスト内包表記：効率と簡潔さの魔法

Pythonのリスト内包表記は、リストの操作を簡潔かつ効率的に行うための強力な機能です。従来のリストの要素のアクセスや操作に比べて、コードの読みやすさと記述量を大幅に削減できます。

**内包表記の仕組み**

リスト内包表記は、リスト内の要素を直接操作するための簡略化された構文です。 

```python
my_list = [1, 2, 3, 4, 5]
# 内包表記で要素を操作
result = [x * 2 for x in my_list]  # すべての要素を2倍にする
```

**内包表記のメリット**

1. **コードの簡潔化:**  複雑なループや条件分岐を省略できます。
2. **読みやすさ:**  コードが分かりやすく、直感的に理解できます。
3. **効率性:**  処理速度が向上し、実行時間を短縮できます。
4. **可読性:**  コードの構造が明確になり、他の開発者にも理解しやすいです。

**内包表記の種類**


---

### 練習プログラム4　翻訳 (2点)
- input()で日本文を受け取り、英語に翻訳するプログラムを書いてみましょう  

In [6]:
# メッセージの準備
japanese = input()
prompt = """あなたは英文和訳の文章の専門家です。以下の ### で区切られた日本語の文章を英訳してください

###
{}
###
""".format(japanese)
messages = [
    {"role": "user", "content": prompt},
]

# 推論の実行
outputs = pipe(messages, return_full_text=False, max_new_tokens=256)
assistant_response = outputs[0]["generated_text"].strip()
print(assistant_response)

コメントで言及したフレーズ、「目がぁ目がぁ～！」 「40秒で支度しな！」 - は、有名な日本のアニメ会社スタジオジブリの傑作「天空の城ラピュタ」の有名なセリフです。 日本では毎年夏にスタジオジブリの名作映画が放送されており、今年も『天空の城ラピュタ』が上映されました。これらのセリフは多くの日本人に馴染みがあり、大衆文化の一部となっています。 私と妻はこれらの表現をコミュニケーションに利用していますが、アニメの内容なので、家族や親しい友人以外にそのような表現を使うのは恥ずかしいと感じています。
The phrases "目がぁ目がぁ～!" and "40秒で支度しな！" mentioned in the comments are famous lines from Studio Ghibli's acclaimed masterpiece, "Spirited Away." In Japan, Studio Ghibli's famous films are broadcast annually during the summer, and this year, "Spirited Away" was screened. These phrases are well-known to many Japanese people and have become part of popular culture. My wife and I use these expressions in our communication, but as they are from an anime, we feel it's somewhat awkward to use them with family or close friends.
