---
>「不用意にもらす言葉こそ、ほんとうらしいものをふくんでいるのだ。 」
>
> 太宰治
---

# はじめに

ここでは、LangChainを主として、ChatGPTなどのLLMモデルを便利に使うための仕組みについて学ぶ

なお、ChatGPTを対象とする場合、ChatGPTには、GPTsという独自のChatGPTをNoCodeで作成するツールが準備されている
- 従って、以下で説明する内容の多くは、この機能を用いて実現できる
- ただし、仕様がすぐに変更されるなど、混乱している状況にあるため、各自で触って試してみるとよい
- GPTsの開発状況により状況が大きく変わる可能性がある点に注意する事

# LangChain
LangChainは日々更新されている
- これは、この授業テキスト全般に言えることであるが、特に後半は更新が頻繁に行われている
- アップデートにより実行できない場合もあるが、その場合は速やかに申し出ること

その前に、OpenAPIのChat APIについて学ぶ

なお、このノートブックは、GPUを使わないCPUランタイムを利用している

***注意***

ChatGPTのAPI利用について、無償料金枠が2024年時点でなくなっている

利用において、次のような文章を含むエラーが出力された場合は、しばらく待って再度実行する必要がある

```
WARNING:RateLimitError: Rate limit reached for default-gpt-3.5-turbo on requests per min. Limit: 3 / min. Please try again in 20s.
```

もし、まとめて実行する場合、途中で実行を待ってスロットを使いつくさないようにする必要があるため、次の設定を行うとよい
- ***制約がかかった場合は、openai_wait = Trueにすること***
- 利用にはまずAPIキーを発行してください

In [20]:
import os
import time
#openai_wait = True
openai_wait = False

In [21]:
!pip install --upgrade nltk
import nltk

Collecting nltk
  Downloading nltk-3.9.2-py3-none-any.whl.metadata (3.2 kB)
Downloading nltk-3.9.2-py3-none-any.whl (1.5 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.5/1.5 MB[0m [31m18.7 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: nltk
  Attempting uninstall: nltk
    Found existing installation: nltk 3.9.1
    Uninstalling nltk-3.9.1:
      Successfully uninstalled nltk-3.9.1
Successfully installed nltk-3.9.2


  return datetime.utcnow().replace(tzinfo=utc)


# Chat APIを利用する


## API Keyの発行

openai.comにアクセスし、DASHBOARDメニューにあるAPI keysでAPI keyを発行する
- セキュリティのため、プロジェクトごとに異なるキーを利用すること
- ここでは、dataai-keyという鍵をつくるとよい
- 発行された鍵をコピーしておくこと

## API Keyを使えるようにする

発行したKeyを次のコードにペーストして利用する

次のセルにある、```%env OPENAI_API_KEY=``` に続けて、APIキーを記録して実行すること

In [22]:
%env OPENAI_API_KEY=ここにキーを登録
%env OPENAI_API_KEY=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
print(os.environ['OPENAI_API_KEY'])

env: OPENAI_API_KEY=ここにキーを登録
env: OPENAI_API_KEY=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
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


APIはOpenAI Chat APIに統一されている

モデルは、コストの安いgpt-3.5-turboを利用する
- ここでは性能よりも使い方を学ぶためコスト重視とする
- model="gpt-4"などとすることで、GPT-4を利用することができるが、利用料が高くなるので注意すること

## APIを使う

まず、ChatGPTに挨拶して、APIが使えているかどうかを確認する

"Hello. Am I using the API correctly?"と聞いて回答を実際に得る

必要なライブラリは、単純に次の2つ
- インターネットを利用して、シンプルにRESTでリクエストを投げてレスポンスを得るためのrequests
- JSONフォーマットを扱うためのjson

In [23]:
import requests
import os
import json

In [None]:
url = "https://api.openai.com/v1/chat/completions"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer " + os.environ["OPENAI_API_KEY"]
}
data = {
    "model": "gpt-3.5-turbo",
    "messages": [
        {"role": "user", "content": "Hello. Am I using the API correctly?"}
    ],
    "temperature": 0,
}

response = requests.post(url=url, headers=headers, json=data)
print(json.dumps(response.json(), indent=2))

{
  "id": "chatcmpl-CwUIbT7ZvHBYjYkV7pjJOSevForPD",
  "object": "chat.completion",
  "created": 1768055529,
  "model": "gpt-3.5-turbo-0125",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "Hello! I'm an AI assistant and I'm here to help you with any questions you may have about using APIs. Can you provide more information about the specific API you are using and what you are trying to achieve? This will help me better assist you with your query.",
        "refusal": null,
        "annotations": []
      },
      "logprobs": null,
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 16,
    "completion_tokens": 55,
    "total_tokens": 71,
    "prompt_tokens_details": {
      "cached_tokens": 0,
      "audio_tokens": 0
    },
    "completion_tokens_details": {
      "reasoning_tokens": 0,
      "audio_tokens": 0,
      "accepted_prediction_tokens": 0,
      "rejected_prediction_tokens": 0
    }
  },
  "servi

返事は"content"にあるように、

"Hello! I'm an AI assistant and I'm here to help you with any questions you may have about using APIs. Can you provide more details about the API you are using and what specific issues you are facing?"

などとなるが、意味としては、

「こんにちは！私はAIアシスタントです。APIの利用に関するご質問なら何でもお手伝いします。お使いのAPIについて、また直面している具体的な問題を詳しく教えていただけますか？」

となる

なお、パラメータについて、
- temperatureは0に近いほど、同じ回答を出力するようになる
- max_tokensは返答として最大何文字返すかを指定する
  - ChatGPTのAPIは、利用文字数(トークン数)により課金されるため、コスト低減を考えるのであれば重要である
- nは同一質問に対する返答数を指定する  
  この場合temparatureを大きめの値にしなければ、同じ回答が並ぶことになる

これで、ひとまず使えるようになったであろう

## Chat Completions APIのパラメータ

OpenAI の `/v1/chat/completions` エンドポイントで指定できる主なフィールドと意味を整理する

## 必須パラメータ

| パラメータ | 型 | 説明 |
|-----------|----|------|
| **model** | string | 使用するモデル名 (`gpt-3.5-turbo` など)。必須。 |
| **messages** | array | 対話履歴。各要素は `{role, content}` を持つ。必須。 |

---

## 任意パラメータ一覧

| パラメータ | 型 | 説明 | デフォルト |
|-----------|----|------|-------------|
| **temperature** | number (0〜2) | 出力のランダム性。0 に近いほど決定的。 | **1** |
| **top_p** | number (0〜1) | nucleus sampling。temperature との併用推奨なし。 | **1** |
| **n** | integer | 同じプロンプトに対して返す候補の数。 | **1** |
| **stream** | boolean | 応答をストリーミングで受け取る。 | **false** |
| **stop** | string / array | 応答を強制停止させる文字列。複数可。 | 省略 |
| **max_tokens** | integer | 生成する最大トークン数上限。 | **デフォルト値は非公開** |
| **presence_penalty** | number (-2〜2) | 未登場語を促進。テーマを広げる。 | **0** |
| **frequency_penalty** | number (-2〜2) | 同語句の繰り返しを抑える。 | **0** |
| **logit_bias** | dict | 特定トークンの確率を調整（高度用途）。 | 省略 |
| **user** | string | 利用者識別用。安全性/分析目的。 | 省略 |

なお以下の点に注意すること
- max_tokensの明確なデフォルト固定値は公開されていない
- 未指定時はモデルごとのコンテキスト上限に基づき自動調整される
  - gpt-3.5-turbo のコンテキスト長が 4096 トークンの場合  
  プロンプトが 1000 トークン → 生成可能は約 3000 トークン前後
- 課金対象は入力トークン（プロンプト + 過去の messages）と出力トークン（生成部分）の合計
  - 過去の messages が増えるほど高くなる
  - max_tokens を低く設定すると節約になる
  - n を増やすと **n倍近くコスト増**

全項目入りリクエストの例を挙げておく

```
python
import os
import requests
import json
url = "https://api.openai.com/v1/chat/completions"
headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {os.environ['OPENAI_API_KEY']}"
}
data = {
    "model": "gpt-3.5-turbo",
    "messages": [
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Explain gravity in 2 sentences."}
    ],
    "temperature": 0.2,
    "top_p": 1,
    "n": 1,
    "max_tokens": 100,
    "stream": False,
    "stop": None,
    "presence_penalty": 0,
    "frequency_penalty": 0,
    "logit_bias": {},
    "user": "example-user-id"
}
response = requests.post(url, headers=headers, data=json.dumps(data))
print(response.json())
```

### エラートラブル(1)

次のように表示される場合は、APIを利用するための無償枠や課金分を既に使い切ったか、時間が過ぎたためExpireしたことを意味する
- 課金するか、別アカウントを利用する
- 新しいアカウントに対して、5ドル分の無料お試し枠が設定される

```
{
  "error": {
    "message": "You exceeded your current quota, please check your plan and billing details.",
    "type": "insufficient_quota",
    "param": null,
    "code": "insufficient_quota"
  }
}
```

### エラートラブル(2)

頻繁にアクセスすると、エラーが発生する

これは、単位時間あたりのアクセス数が制限されているためである
- しばらく待ってリトライすること

### roleについて

"role"は、次の3つがある
- userはChatGPTのユーザで、皆さんのこと
- assistantがChatGPTによる回答を指し、ChatGPTのこと
- systemはassistantのふるまいを制御するために利用

但し、gpt-3.5-turboでは、systemは利用しない


## API利用において重要なこと

### ブラウザ版との違い

API利用と、ブラウザ利用における最も大きな違いは、API利用では過去の会話のやり取りを一切考慮しないという点である

したがって、APIを利用する場合で過去の会話を参照したい場合は、過去の会話そのものを全てmessageに記載する必要がある


### 料金の確認

https://openai.com/pricing にアクセスすると、

| Model	| Input	| Output |
|:---|:---|:---|
| GPT-3.5-Turbo 4K context | \$0.0015 / 1K tokens | \$0.002 / 1K tokens |

と記載されている

現在いくらつかったかは、

https://platform.openai.com/account/usage

にアクセスして確認するとよい


### トークン数

課金対象にもなっているトークン数について、トークンは基本的に単語のことであり、トークン数は入力した単語の数を意味する
- ChatGPTを含む多くのLMにおいて、膨大な単語を効率よく学習するため、一つの単語を複数のトークンに分割して処理している
  - 例えば、"humburger"は、"hum", "bur", "ger"の3つに分解される
- 日本語と英語ではトークン数のカウント方法が異なる
  - 日本語は内部で英語に変換されて処理されているため日本語は似た内容の文章において課金上不利となる
  - 日本語は1トークンはおよそ4文字、英語ではおよそ0.75語に相当するなど不利な状況があり、一般に直接英語を利用した方がお得といわれている所以
  - 実際2倍程度の開きがあったが、近年緩和されつつある

このトークン数は、各モデルの入力や出力サイズの制限にも利用される

直接文字数を計数したい場合は、https://platform.openai.com/tokenizer にアクセスして、文章を入力するとよい



# GPT APIを用いたアプリケーション実装

***ここでは、料理名を入力することで、材料と手順、調理時間、お勧めのサイドメニューなどを表示するというアプリを作成することを念頭に説明する***

## 全体の構成

### APIまでの通信手順

以下の手順を踏む
- スマートフォンやPC、Webのアプリを利用して、レシピ名をサーバプログラムに送信する
- サーバプログラムは、プロンプトエンジニアリングを行い、APIキーを付与してOpenAIのAPIを叩く

レシピ生成アプリが直接OpenAI APIを叩くような構成は、APIキーが漏えいするため普通は行わない

<img src="http://class.west.sd.keio.ac.jp/dataai/text/chatapi1.jpg" width=700>

# LangChain

## LangChainとは？

LLMを使ったアプリケーション開発フレームワーク
- PythonとJavaScript/TypeScriptの2つがある
- フリーで利用できる

詳細は公式のドキュメントを参照すること
- 過去のバージョンのマニュアルを見る場合は、githubにあるlangchainに行き、docsのreleasesから目的のバージョンを選択するとよい

## LangChainを使うメリット

1. **抽象化**: HTTP通信やJSONの処理を意識せずに済む
1. **モデル切り替え**: OpenAI → Azure → Anthropic など容易に変更可能
1. **機能拡張**: プロンプトテンプレート、チェーン、メモリ、RAGなどを活用可能
1. **エコシステム**: 多数のツール・ローダー・ベクトルストアとの連携可能

## Module

LangChainにはmoduleと呼ばれる構成要素がある

| モジュール | 役割 | 2025年の状況 |
|-----------|------|-------------|
| **Models** | LLMやチャットモデルへのアクセス | `langchain_openai` 等からインポート |
| **Prompts** | プロンプトテンプレートの管理 | `langchain_core.prompts` からインポート |
| **Chains** | 複数の処理を連結 | **LCEL記法を推奨**（LLMChain等は非推奨）|
| **Indexes** | ドキュメントの読み込みとベクトル化 | `langchain_community` 等からインポート |
| **Memory** | 会話履歴の管理 | メッセージリスト直接管理を推奨 |
| **Agents** | ツールを使った自律的な処理 | **LangGraph** を推奨 |

### Models module

LongChainで利用する機械学習モデルである

- Chat Models: Open AIのChatAPIのためのモジュール
- Text Embedding Models: テキストをベクトル化するモデル



先に示した簡単な対話プログラムを再構成する
- 先ほどよりもシンプルに記述できることがわかるであろう
- 内部でjsonに変換され通信が行なわれている

openaiをインストールする

ライブラリの開発速度が速く、バージョン競合が簡単に発生するため注意すること
- できれば、自分で解決する能力を身に着けるとよい
- (2023/12) openai、cohere、tiktokenは同時に導入しないと警告が表示される
- (2023/12) tensorflow-probabilityと一部ライブラリがコンフリクトするため、uninstallする
- (2025/01) Colabにプリインストールされているopentelemetryとchromadbの依存関係が競合するため、先にopentelemetry関連のバージョンを固定

次のようにインストールすることで対処する

In [24]:
!pip uninstall -y --quiet tensorflow-probability tensorflow-metadata tensorflow-datasets
!pip install --quiet "opentelemetry-api==1.37.0" "opentelemetry-sdk==1.37.0" \
    "opentelemetry-exporter-otlp-proto-common==1.37.0" "opentelemetry-proto==1.37.0" \
    "opentelemetry-exporter-otlp-proto-http==1.37.0" 2>/dev/null

[0m

なお、LangChainは複数のパッケージに分割されている

| パッケージ | 用途 | 主なクラス |
|-----------|------|----------|
| `langchain` | コア機能 | - |
| `langchain-core` | 基本クラス・インターフェース | PromptTemplate, StrOutputParser |
| `langchain-community` | コミュニティ貢献のローダー・ツール | DirectoryLoader, ChatMessageHistory |
| `langchain-openai` | OpenAI統合 | ChatOpenAI, OpenAIEmbeddings |
| `langchain-chroma` | Chromaベクトルストア統合 | Chroma |
| `langchain-text-splitters` | テキスト分割機能 | RecursiveCharacterTextSplitter |


In [25]:
# 基本パッケージのインストール
!pip install --quiet openai cohere tiktoken

In [26]:
# chromadbと関連パッケージのインストール
!pip install --quiet chromadb kaleido python-multipart

[31mERROR: pip's dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts.
opentelemetry-exporter-gcp-logging 1.11.0a0 requires opentelemetry-sdk<1.39.0,>=1.35.0, but you have opentelemetry-sdk 1.39.1 which is incompatible.
google-adk 1.21.0 requires opentelemetry-api<=1.37.0,>=1.37.0, but you have opentelemetry-api 1.39.1 which is incompatible.
google-adk 1.21.0 requires opentelemetry-sdk<=1.37.0,>=1.37.0, but you have opentelemetry-sdk 1.39.1 which is incompatible.
google-adk 1.21.0 requires tenacity<10.0.0,>=9.0.0, but you have tenacity 8.5.0 which is incompatible.
opentelemetry-exporter-otlp-proto-http 1.37.0 requires opentelemetry-exporter-otlp-proto-common==1.37.0, but you have opentelemetry-exporter-otlp-proto-common 1.39.1 which is incompatible.
opentelemetry-exporter-otlp-proto-http 1.37.0 requires opentelemetry-proto==1.37.0, but you have opentelemetry-proto 1.39.1 which i

LangChain関連パッケージのインストール（新しいLCEL対応版）

In [27]:
!pip install --quiet langchain langchain-core langchain-community langchain-openai langchain-chroma langchain-text-splitters

[31mERROR: pip's dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts.
embedchain 0.1.128 requires chromadb<0.6.0,>=0.5.10, but you have chromadb 1.4.0 which is incompatible.[0m[31m
[0m

## LangChain の書き方

LangChain 0.1.x 以降、APIの書き方が大きく変わった

### `invoke()` メソッドを使う

```python
# 旧: predict() や run() は非推奨（deprecatedの警告が出る）
result = llm.predict("質問")  # ← 使わない
result = llm.run("質問")      # ← 使わない
# 新: invoke() を使う
result = llm.invoke("質問")   # ← これを使う
```

### 戻り値は `AIMessage` オブジェクト

```python
result = llm.invoke("質問")
print(result)          # → AIMessage(content='回答テキスト', ...)
print(result.content)  # → '回答テキスト' （これで文字列を取得）
```
`result` をそのまま文字列として使うとエラーになる

### インポート先が `langchain_openai` に変更

```python
# 旧: langchain.chat_models からのインポート（非推奨）
from langchain.chat_models import ChatOpenAI
# 新: langchain_openai パッケージからインポート
from langchain_openai import ChatOpenAI
```

次のように実行する

```python
from langchain_openai import ChatOpenAI
llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)
result = llm.invoke("自己紹介してください。")
print(result.content)  # ← .content で回答テキストを取得
```

- `ChatOpenAI()`: OpenAIのチャットモデルを初期化
  - `model_name`: 使用するモデル（"gpt-3.5-turbo", "gpt-4" など）
  - `temperature`: 0に近いほど決定的な回答、1に近いほど多様な回答
- `invoke()`: モデルを呼び出して応答を得る
- `result.content`: AIMessageオブジェクトから回答テキストを取得

In [28]:
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)
result = llm.invoke("自己紹介してください。")
print(result.content)

はじめまして、私はAIアシスタントです。自然言語処理技術を用いて、様々な質問に回答したり、会話を行ったりすることができます。お手伝いが必要なことがあれば、遠慮なくお知らせください。どうぞよろしくお願いいたします。


  return datetime.utcnow().replace(tzinfo=utc)


## Prompts module

まず、Promptsも含めた、主なテンプレートの種類について概説する

テンプレートは、モデルへの入力を組み立てるmoduleであり、次の要素がある

| クラス | 用途 |
|--------|------|
| `PromptTemplate` | 単純な文字列テンプレート |
| `ChatPromptTemplate` | チャット形式（system/human/ai）|
| `MessagesPlaceholder` | 会話履歴を挿入する場所を指定 |

ここでは、Prompt Templatesについて説明する
- ChatGPTへのプロンプトについてテンプレートつまり例文を作成することができる

Prompts のインポート先は次のように刷新されている

```python
# 基本的なプロンプト
from langchain_core.prompts import PromptTemplate
# チャット用プロンプト
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
# 出力パーサー
from langchain_core.output_parsers import StrOutputParser, PydanticOutputParser
```



次のコードでは、`{command}` が `ls` に置き換わる
- Promptの長さを考慮して埋め込む
- 出力する形式を指定して埋め込む

などが可能であり、単純なPythonコードによる埋め込みよりも高度な処理が可能である

1. **変数は `{変数名}` で指定**
   - template内の `{command}` が置換対象
   
2. **`input_variables` はリスト形式**
   - 単一変数でも `["command"]` とリストで書く
   - 複数変数なら `["var1", "var2"]`

3. **`format()` で値を埋め込む**
   - キーワード引数で `変数名=値` を指定
   - 戻り値は埋め込み後の文字列

In [None]:
from langchain_core.prompts import PromptTemplate

template = """
次のコマンドの概要を説明してください。
コマンド: {command}
"""
prompt = PromptTemplate(
    input_variables=["command"],
    template=template,
)
result = prompt.format(command="ls")
print(result)


次のコマンドの概要を説明してください。
コマンド: ls



## Chains module

Models, Templates, Chainsなどのmoduleを連結する

LangChain 0.1.17以降、従来の `LLMChain` は**非推奨（deprecated）**となっており、**LCEL記法** を使用する。

### LCEL記法

**パイプ演算子 `|`** を使ってコンポーネントを連結する
- データが左から右へ流れるイメージ

```python
chain = prompt | chat | StrOutputParser()
```

### パイプラインの流れ

```
{"command": "ls"}
      ↓
   prompt        → PromptTemplateが変数を埋め込んだ文字列を生成
      ↓
    chat         → ChatOpenAIがAPIを呼び出してAIMessageを返す
      ↓
StrOutputParser  → AIMessageから.contentを抽出して文字列を返す
      ↓
  "結果の文字列"
```

### StrOutputParser の役割

```python
from langchain_core.output_parsers import StrOutputParser

# StrOutputParser がない場合
chain = prompt | chat
result = chain.invoke({"command": "ls"})
print(type(result))  # → <class 'AIMessage'>
print(result.content)  # ← .content が必要

# StrOutputParser がある場合
chain = prompt | chat | StrOutputParser()
result = chain.invoke({"command": "ls"})
print(type(result))  # → <class 'str'>  ← 直接文字列が得られる
```

なお、LangChainの挙動の詳細を確認するため、
`langchain.verbose = True`
としている
- いろいろと意味のない文章や宣伝も表示されるが、不要な場合は、Falseとするとよい

In [None]:
from langchain_openai import ChatOpenAI
from langchain_core.prompts import PromptTemplate
from langchain_core.output_parsers import StrOutputParser
#  詳細な実行ログを出力させるために利用、普通はコメントアウトしておく
from langchain_core.tracers.stdout import ConsoleCallbackHandler

# Model を用意
chat = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)

# Prompt を用意
template = """
次のコマンドの概要を説明してください。

コマンド: {command}
"""
prompt = PromptTemplate(
    input_variables=["command"],
    template=template,
)

# LCEL Chain を作成（パイプ演算子で接続）
chain = prompt | chat | StrOutputParser()

# 実行
# config={'callbacks': [...]} を指定して、この実行のログをコンソールに出力させる
print("=== 詳細ログ ===")
result = chain.invoke({"command": "ls"}, config={'callbacks': [ConsoleCallbackHandler()]})
print("\n=== 結果 ===")
#result = chain.invoke({"command": "ls"})
print(result)

=== 詳細ログ ===
[32;1m[1;3m[chain/start][0m [1m[chain:RunnableSequence] Entering Chain run with input:
[0m{
  "command": "ls"
}
[32;1m[1;3m[chain/start][0m [1m[chain:RunnableSequence > prompt:PromptTemplate] Entering Prompt run with input:
[0m{
  "command": "ls"
}
[36;1m[1;3m[chain/end][0m [1m[chain:RunnableSequence > prompt:PromptTemplate] [1ms] Exiting Prompt run with output:
[0m[outputs]
[32;1m[1;3m[llm/start][0m [1m[chain:RunnableSequence > llm:ChatOpenAI] Entering LLM run with input:
[0m{
  "prompts": [
    "Human: \n次のコマンドの概要を説明してください。\n\nコマンド: ls"
  ]
}
[36;1m[1;3m[llm/end][0m [1m[chain:RunnableSequence > llm:ChatOpenAI] [1.67s] Exiting LLM run with output:
[0m{
  "generations": [
    [
      {
        "text": "「ls」コマンドは、リスト（List）の略で、指定されたディレクトリ内のファイルやディレクトリの一覧を表示するためのコマンドです。デフォルトではカレントディレクトリの内容を表示しますが、任意のディレクトリを指定することもできます。ファイルやディレクトリの名前や属性、更新日時などが表示され、現在のディレクトリ内で何が存在しているかを確認するのに便利です。",
        "generation_info": {
          "finish_reason": "stop",
      

`chain.invoke()` を用いて、構築したchainが順に実行される
- 最初に文字の埋め込み(prompt)が行われる
- 次にchat modelにより実際に通信が行われる

invoke() の使い方
- 引数は必ず辞書形式

```python
# 間違い: 文字列をそのまま渡す
result = chain.invoke("ls")
# 正しい: 辞書で渡す（キーはinput_variablesで指定した変数名）
result = chain.invoke({"command": "ls"})
```
**エラー例**: `KeyError: 'command'` → 辞書のキー名が間違っている

- 複数の変数がある場合

```python
prompt = PromptTemplate(
    input_variables=["name", "age"],
    template="{name}さんは{age}歳です"
)
chain = prompt | chat | StrOutputParser()
# 全ての変数を辞書で渡す
result = chain.invoke({"name": "田中", "age": "30"})
```

### LCEL による複数ステップの連結

LCEL記法では、`RunnableLambda` を使って中間変換を行い、チェーンを連結する。

```python
from langchain_core.runnables import RunnableLambda, RunnablePassthrough
# 1つ目のチェーン
chain1 = prompt1 | chat | StrOutputParser()
# 2つ目のチェーン  
chain2 = prompt2 | chat | StrOutputParser()
# 連結（RunnableLambdaで出力を次の入力形式に変換）
full_chain = chain1 | RunnableLambda(lambda x: {"input": x}) | chain2
```
RunnablePassthrough と RunnableLambda

| クラス | 役割 |
|--------|------|
| `RunnablePassthrough()` | 入力をそのまま次に渡す |
| `RunnableLambda(func)` | 関数を適用して変換する |

In [None]:
#スロット待ち
if openai_wait:
  time.sleep(60)

### Chainの例

例えば
- 簡単な算数の問題を問い合わせ、それに対して回答を得る場合、詳細な手順を聞くようにすると解答の精度が向上する
- しかしながら、欲しいのは最終的な答えであって、途中経過は不要であるとする
- すると、まず、詳細な手順を含む答えを得てから、その答えを要約して最後の答えだけ得るようにするとよい

つまり、ChatGPTを2回利用して最終的に欲しい回答を獲得することを考える
- なお、この例では1回でも十分である

以下のコードのデータの流れは次の通り

```
"リンゴの問題文"
      ↓ RunnablePassthrough
{"question": "リンゴの問題文"}
      ↓ cot_chain
"ステップ1...ステップ2...答えは10個"
      ↓ RunnableLambda
{"input": "ステップ1...ステップ2...答えは10個"}
      ↓ summarize_chain
"10個"
```

In [None]:
from langchain_openai import ChatOpenAI
from langchain_core.prompts import PromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough, RunnableLambda

# Model を用意
chat = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)

# 1 つ目の Prompt を用意
cot_template = """
以下の質問に回答してください。

### 質問 ###
{question}
### 質問終了 ###

ステップバイステップで考えましょう。
"""
cot_prompt = PromptTemplate(
    input_variables=["question"],
    template=cot_template,
)

# 2 つ目の Prompt を用意
summarize_template = """
入力を結論だけ抜き出して記述してください。

### 入力 ###
{input}
### 入力終了 ###
"""
summarize_prompt = PromptTemplate(
    input_variables=["input"],
    template=summarize_template,
)

# 1つ目のチェーン: ステップバイステップで考える
cot_chain = cot_prompt | chat | StrOutputParser()
# 2つ目のチェーン: 結論だけ抜き出す
summarize_chain = summarize_prompt | chat | StrOutputParser()

# 全体のチェーン: cot_chain の出力を summarize_chain の input に渡す
full_chain = (
    {"question": RunnablePassthrough()} # 入力をquestionキーに
    | cot_chain                         # → 詳細な回答
    | RunnableLambda(lambda x: {"input": x}) # 出力をinputキーに変換
    | summarize_chain                   # → 結論のみ
)

# 実行
result = full_chain.invoke("私は市場に行って10個のリンゴを買いました。隣人に2つ、修理工に2つ渡しました。それから5つのリンゴを買って1つ食べました。残りは何個ですか？")
print(result)

最終的には10個のリンゴが残ります。


なお、独自のpromptsやchains moduleを作成することも可能である

詳細は、LangChainのマニュアル https://python.langchain.com/docs/get_started/introduction を参照されたい

LCEL でカスタム処理を組み込むには、RunnableLambda を使う

```python
from langchain_core.runnables import RunnableLambda

# カスタム処理を関数として定義
def my_processor(input_data):
    # 何らかの処理
    return {"processed": input_data.upper()}

# RunnableLambda でラップしてチェーンに組み込み
chain = (
    RunnableLambda(my_processor)
    | prompt
    | chat
    | StrOutputParser()
)
```
よく使う Runnable クラスは次の通り

| クラス | 役割 |
|--------|------|
| `RunnableLambda(func)` | 任意の関数をラップ |
| `RunnablePassthrough()` | 入力をそのまま通過 |
| `RunnableParallel({...})` | 複数の処理を並列実行 |

## Output Parsers

出力形式を指定するプロンプトの作成とPythonオブジェクトとのマッピングを提供する

<img src="http://class.west.sd.keio.ac.jp/dataai/text/chatapi2.jpg" width=700>

#### PydanticOutputParser の使い方

- 手順

1. **Pydanticモデルを定義**: 期待する出力構造を定義
2. **Parserを作成**: `PydanticOutputParser(pydantic_object=モデル)`
3. **フォーマット指示を取得**: `parser.get_format_instructions()`
4. **プロンプトに埋め込み**: `partial_variables` で指示を埋め込む
5. **チェーンを実行**: `chain.invoke()`
6. **出力をパース**: `parser.parse(output.content)`

In [None]:
from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import PydanticOutputParser
from langchain_core.prompts import PromptTemplate
from pydantic import BaseModel, Field
from typing import List

chat = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)

class Recipe(BaseModel):
    ingredients: List[str] = Field(description="ingredients of the dish")
    steps: List[str] = Field(description="steps to make the dish")
    time: List[str] = Field(description="time to make the dish")
    sides: List[str] = Field(description="side menu of the dish")

template = """料理のレシピを教えてください。

{format_instructions}

料理名: {dish}
"""
# Parserの生成
parser = PydanticOutputParser(pydantic_object=Recipe)

# フォーマット指示をプロンプトに埋め込む
prompt = PromptTemplate(
    template=template,
    input_variables=["dish"],
    partial_variables={"format_instructions": parser.get_format_instructions()}
)

# LCEL Chain を作成
chain = prompt | chat

# 実行
output = chain.invoke({"dish": "カレー"})
print("=== output ===")
print(output.content)

=== output ===
```json
{
    "ingredients": [
        "カレールー",
        "肉（牛肉、豚肉、鶏肉など）",
        "じゃがいも",
        "にんじん",
        "玉ねぎ",
        "油",
        "水"
    ],
    "steps": [
        "1. じゃがいも、にんじん、玉ねぎを適当な大きさに切る。",
        "2. 鍋に油を熱し、肉を炒める。",
        "3. 野菜を加えて炒める。",
        "4. 水を加えて煮込む。",
        "5. カレールーを加えて溶かし、とろみがつくまで煮込む。",
        "6. 器に盛り付けて完成。"
    ],
    "time": [
        "準備時間: 15分",
        "調理時間: 45分"
    ],
    "sides": [
        "ご飯",
        "フライドポテト",
        "サラダ"
    ]
}
```


最後に、recipe型にマッピングするために、parser.parse()を利用する

```python
recipe = parser.parse(output.content)
```

- 処理の流れ

1. `output` は `AIMessage` オブジェクト
2. `output.content` でJSON形式の文字列を取得
3. `parser.parse()` で文字列を `Recipe` オブジェクトに変換

- 変換後のアクセス方法

```python
print(recipe.ingredients)  # ['玉ねぎ', '人参', ...]
print(recipe.steps)        # ['野菜を切る', '炒める', ...]
print(recipe.time)         # ['30分']
print(recipe.sides)        # ['サラダ', 'らっきょう']
```

- **`OutputParserException`**: LLMの出力がJSON形式でない場合に発生
  - 対策: プロンプトを改善するか、`temperature=0` で安定させる

In [None]:
recipe = parser.parse(output.content)
print("=== recipe object ===")
print(recipe)

=== recipe object ===
ingredients=['カレールー', '肉（牛肉、豚肉、鶏肉など）', 'じゃがいも', 'にんじん', '玉ねぎ', '油', '水'] steps=['1. じゃがいも、にんじん、玉ねぎを適当な大きさに切る。', '2. 鍋に油を熱し、肉を炒める。', '3. 野菜を加えて炒める。', '4. 水を加えて煮込む。', '5. カレールーを加えて溶かし、とろみがつくまで煮込む。', '6. 器に盛り付けて完成。'] time=['準備時間: 15分', '調理時間: 45分'] sides=['ご飯', 'フライドポテト', 'サラダ']


In [None]:
recipe.ingredients

['カレールー', '肉（牛肉、豚肉、鶏肉など）', 'じゃがいも', 'にんじん', '玉ねぎ', '油', '水']

In [None]:
print(recipe.ingredients)

['カレールー', '肉（牛肉、豚肉、鶏肉など）', 'じゃがいも', 'にんじん', '玉ねぎ', '油', '水']


In [None]:
print(recipe.steps)

['1. じゃがいも、にんじん、玉ねぎを適当な大きさに切る。', '2. 鍋に油を熱し、肉を炒める。', '3. 野菜を加えて炒める。', '4. 水を加えて煮込む。', '5. カレールーを加えて溶かし、とろみがつくまで煮込む。', '6. 器に盛り付けて完成。']


In [None]:
print(recipe.time)

['準備時間: 15分', '調理時間: 45分']


In [None]:
print(recipe.sides)

['ご飯', 'フライドポテト', 'サラダ']


## Indexes

ChatGPTは学習に用いたデータセットの範疇でのみ答えを出すため、新しい知識や概念については、正しく解答することが難しい

例えば、次のような質問に対しては、お手上げになっている

<img src="http://class.west.sd.keio.ac.jp/dataai/text/langchain1.jpg" width=500>

ここで、質問に対する回答を得るうえで必要となる情報を渡してから処理させると、おおよそ正しい回答を得ることができるようになる

<img src="http://class.west.sd.keio.ac.jp/dataai/text/langchain2.jpg" width=500>


コンテキストとして、情報を加えることで正しい回答を与えることができており、これは強力な方法であるが、実際に用いる場合は注意が必要である

- ChatGPTには、入力文字数に制限があるため、長い文章を入力する必要がある場合はともかく、様々な情報を大量に与えておいて、そこから適切な回答を得るという利用は困難である
- 文字数、つまり入力トークン数も課金に関係するため、高コストとなる

まず、全ての情報を与えておいて、何かしら回答を得るということは非現実的であるが、自動化という点では有効な手段である



### Vector Store

そこで、Vector Storeを活用する
- 文章をベクトル化してVector Storeに保存、入力と近しいベクトルの文章をVector Storeから検索してcontextに含める手法
- 全文章ではなく、「大事と思われる部分文章群についてのみ」情報を与える
  - これには、embeddingと呼ばれる内部ベクトル表現への変換を行い、そのベクトルの近接性を用いて、どの文章が重要かを判断している
  - 単語をベクトル化するトークンではない点に注意すること

<img src="http://class.west.sd.keio.ac.jp/dataai/text/langchain3.jpg" width=700>

Vector Store のパッケージは次の通り

| Vector Store | パッケージ | 特徴 |
|-------------|-----------|------|
| Chroma | `langchain-chroma` | ローカル実行、開発向け |
| FAISS | `langchain-community` | 高速、Meta製 |
| Pinecone | `langchain-pinecone` | クラウド、本番向け |

- 基本的な使い方

```python
from langchain_openai import OpenAIEmbeddings
from langchain_chroma import Chroma
# 1. Embeddingsモデルを作成
embeddings = OpenAIEmbeddings()
# 2. Vector Storeを作成
vectorstore = Chroma.from_documents(documents, embeddings)
# 3. Retrieverとして使用
retriever = vectorstore.as_retriever()
docs = retriever.invoke("検索クエリ")
```

実際にindexを扱う

ここでは、LangChainのドキュメントを参考にして、質問できるようにする
- 最新のドキュメントはgitで公開されているため、LangChainのgitをcloneする

In [None]:
# LangChainのドキュメントをダウンロード
# （リポジトリが大きいため、shallow cloneを使用）
!git clone --depth 1 --filter=blob:none --sparse https://github.com/langchain-ai/langchain.git
%cd langchain
!git sparse-checkout set docs
%cd ..
print("LangChainドキュメントのダウンロード完了")

fatal: destination path 'langchain' already exists and is not an empty directory.
/content/langchain
/content
LangChainドキュメントのダウンロード完了


langchainのディレクトリに入る

In [None]:
# カレントディレクトリの確認
!ls -la langchain/libs/cli/langchain_cli/integration_template/docs/ | head -20

total 96
drwxr-xr-x 2 root root 4096 Jan 10 13:55 .
drwxr-xr-x 3 root root 4096 Jan 10 13:55 ..
-rw-r--r-- 1 root root 9164 Jan 10 13:55 chat.ipynb
-rw-r--r-- 1 root root 6223 Jan 10 13:55 document_loaders.ipynb
-rw-r--r-- 1 root root 7342 Jan 10 13:55 llms.ipynb
-rw-r--r-- 1 root root  970 Jan 10 13:55 provider.ipynb
-rw-r--r-- 1 root root 6778 Jan 10 13:55 retrievers.ipynb
-rw-r--r-- 1 root root 6343 Jan 10 13:55 stores.ipynb
-rw-r--r-- 1 root root 7280 Jan 10 13:55 text_embedding.ipynb
-rw-r--r-- 1 root root 5529 Jan 10 13:55 toolkits.ipynb
-rw-r--r-- 1 root root 8355 Jan 10 13:55 tools.ipynb
-rw-r--r-- 1 root root 8532 Jan 10 13:55 vectorstores.ipynb


以降の動作確認で必要となるライブラリを導入する

In [None]:
# 追加で必要なパッケージ（chromadb, langchainは既にインストール済み）
!pip install --quiet unstructured tabulate pdf2image pytesseract

まず、ディレクトリの中の全体を読むための便利な`DirectoryLoader`を用いて、ある場所にあるファイルをサブディレクトリもまとめて取得する
- ここでは拡張子がmdであるファイルに限定している

- そこから次々に文章を取得して、ベクトル化してChromaに格納していく
  - この時、embeddingと呼ばれる内部ベクトル表現への変換も同時に行っている

パッケージのインポート先は次の通り

```python
# Document Loaders
from langchain_community.document_loaders import DirectoryLoader, TextLoader
# Embeddings
from langchain_openai import OpenAIEmbeddings
# Vector Store
from langchain_chroma import Chroma
# Text Splitter
from langchain_text_splitters import RecursiveCharacterTextSplitter
```
コードの流れは次の通り

1. **ドキュメント読み込み**: `DirectoryLoader` でファイルを読み込む
2. **テキスト分割**: `RecursiveCharacterTextSplitter` でチャンクに分割
3. **ベクトル化**: `OpenAIEmbeddings` でテキストをベクトルに変換
4. **格納**: `Chroma.from_documents()` でベクトルストアに保存

In [None]:
!pip install --quiet nltk click joblib regex tqdm

In [None]:
from langchain_community.document_loaders import DirectoryLoader, TextLoader
from langchain_openai import OpenAIEmbeddings
from langchain_chroma import Chroma
from langchain_text_splitters import RecursiveCharacterTextSplitter
import os
import shutil

nltk.download('punkt')
nltk.download('punkt_tab')
nltk.download('averaged_perceptron_tagger_eng')

# 正しいドキュメントパスを設定（git sparse-checkoutで取得したのはルートのdocs）
docs_path = "/content/langchain/libs/cli/langchain_cli/integration_template/docs/"

# ドキュメントがロードできたかどうかのフラグ
loaded = False
documents = []

print(f"Checking path: {docs_path}")
if os.path.exists(docs_path):
    # .ipynb を試す
    print("Trying to load .ipynb files...")
    try:
        loader = DirectoryLoader(docs_path, glob="*.ipynb", loader_cls=TextLoader, show_progress=True)
        documents = loader.load()
        if len(documents) > 0:
            loaded = True
    except Exception as e:
        print(f"Warning: Failed to load .ipynb files: {e}")

# ロードできなかった場合はサンプルを作成して使用
if not loaded:
    print("\nドキュメントが見つからないため、サンプルデータを作成して使用します。")
    sample_dir = "./sample_docs"
    if os.path.exists(sample_dir):
        shutil.rmtree(sample_dir)
    os.makedirs(sample_dir, exist_ok=True)

    sample_texts = [
        ("langchain_overview.md", '''# LangChain Overview
LangChain is a framework for developing applications powered by language models.
It provides tools for prompt management, chains, and agents.
Key features include: memory management, document loaders, and vector stores.
'''),
        ("index_module.md", '''# Index Module
The Index module in LangChain helps manage and query document collections.
It supports various vector stores like Chroma, FAISS, and Pinecone.
Documents are split into chunks and embedded for efficient retrieval.
'''),
        ("chains.md", '''# Chains in LangChain
Chains allow you to combine multiple components into a single pipeline.
LCEL (LangChain Expression Language) uses the pipe operator for chaining.
Example: prompt | llm | output_parser
'''),
    ]

    for filename, content in sample_texts:
        with open(f"{sample_dir}/{filename}", "w") as f:
            f.write(content)

    docs_path = sample_dir
    loader = DirectoryLoader(docs_path, glob="**/*.md", loader_cls=TextLoader, show_progress=True)
    documents = loader.load()

print(f"\n最終的なドキュメントパス: {docs_path}")
print(f"Loaded {len(documents)} documents")

if len(documents) > 0:
    # テキストを分割
    text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
    texts = text_splitter.split_documents(documents)

    # Embeddingを作成してChromaに保存
    embeddings = OpenAIEmbeddings()
    vectorstore = Chroma.from_documents(texts, embeddings)

    print(f"Split into {len(texts)} chunks and created vectorstore")
else:
    print("エラー: 有効なドキュメントがありませんでした。")

[nltk_data] Downloading package punkt to /root/nltk_data...
[nltk_data]   Package punkt is already up-to-date!
[nltk_data] Downloading package punkt_tab to /root/nltk_data...
[nltk_data]   Package punkt_tab is already up-to-date!
[nltk_data] Downloading package averaged_perceptron_tagger_eng to
[nltk_data]     /root/nltk_data...
[nltk_data]   Package averaged_perceptron_tagger_eng is already up-to-
[nltk_data]       date!


Checking path: /content/langchain/libs/cli/langchain_cli/integration_template/docs/
Trying to load .ipynb files...


100%|██████████| 10/10 [00:00<00:00, 3596.25it/s]



最終的なドキュメントパス: /content/langchain/libs/cli/langchain_cli/integration_template/docs/
Loaded 10 documents
Split into 85 chunks and created vectorstore


では、そのvector storeを利用して、質問する

なお、現時点でChatGPTに"LangChain"について問い合わせると、データセットに含まれていないという回答になる

### LCEL記法によるRAG（検索拡張生成）チェーンの構築

- RAGとは？

**R**etrieval **A**ugmented **G**eneration（検索拡張生成）のことで、ユーザーの質問に関連するドキュメントを検索し、それをコンテキストとしてLLMに渡す手法

- データの流れ

```
"LangChainのIndex moduleについて教えて"
      ↓
┌──────────────────────────────────────┐
│  context: retriever | format_docs  │  ← 類似ドキュメントを検索→文字列化  |
│  question: RunnablePassthrough()   │  ← 質問をそのまま渡す                |
└──────────────────────────────────────┘
      ↓ 両方が辞書として prompt に渡される
{"context": "検索されたドキュメント...", "question": "質問文"}
      ↓ prompt
"コンテキスト: ...\n質問: ...\n回答:"
      ↓ chat → StrOutputParser
"回答テキスト"
```

辞書 `{}` の中で複数の処理を並列に実行でき、`retriever | format_docs`として検索結果（Documentのリスト）を文字列に変換する

In [None]:
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough

chat = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)

# RAG用のプロンプトテンプレート
template = """以下のコンテキストに基づいて質問に答えてください。

コンテキスト:
{context}

質問: {question}

回答:"""

prompt = ChatPromptTemplate.from_template(template)

# Retrieverを作成
retriever = vectorstore.as_retriever()

# ドキュメントを文字列に変換する関数
def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)

# LCEL RAG Chain
rag_chain = (
    {"context": retriever | format_docs, "question": RunnablePassthrough()}
    | prompt
    | chat
    | StrOutputParser()
)

result = rag_chain.invoke("LangChainにおけるIndex moduleについて概要を1文で説明してください。", config={'callbacks': [ConsoleCallbackHandler()]})
#result = rag_chain.invoke("LangChainにおけるIndex moduleについて概要を1文で説明してください。")
print(result)

[32;1m[1;3m[chain/start][0m [1m[chain:RunnableSequence] Entering Chain run with input:
[0m{
  "input": "LangChainにおけるIndex moduleについて概要を1文で説明してください。"
}
[32;1m[1;3m[chain/start][0m [1m[chain:RunnableSequence > chain:RunnableParallel<context,question>] Entering Chain run with input:
[0m{
  "input": "LangChainにおけるIndex moduleについて概要を1文で説明してください。"
}
[32;1m[1;3m[chain/start][0m [1m[chain:RunnableSequence > chain:RunnableParallel<context,question> > chain:RunnableSequence] Entering Chain run with input:
[0m{
  "input": "LangChainにおけるIndex moduleについて概要を1文で説明してください。"
}
[32;1m[1;3m[chain/start][0m [1m[chain:RunnableSequence > chain:RunnableParallel<context,question> > chain:RunnablePassthrough] Entering Chain run with input:
[0m{
  "input": "LangChainにおけるIndex moduleについて概要を1文で説明してください。"
}
[36;1m[1;3m[chain/end][0m [1m[chain:RunnableSequence > chain:RunnableParallel<context,question> > chain:RunnablePassthrough] [1ms] Exiting Chain run with output:
[0m{
  "output": "LangC

`langchain.verbose = True`のため、無意味な動作確認メッセージも表示されているが、要約文が出力されていることがわかる
- なお、若干回答は的を得ていない


DocumentLoadersは、webサイト、GoogleDrive、Slackなどを読み込む機能が存在しているため、様々な情報をVctor Storeに格納することができる

このように、ある特定分野のデータを一連の要素としてエンコードし、それぞれが内部で 1 つの「ベクトル」として表現している
- これには、単語であればWord2Vecなどが利用できるが、ここでは文章であることから、BERTをFine-TuningしたSentenceTransformerの利用が検討される
- このベクトル数値は、多次元ベクトル空間で要素を相互に関連づけてマッピングしている

ベクトル要素がセマンティックであり、ある一つの意味を表していると考えるならば、そのベクトルの近接性が文脈関係の指標となりえる
- このベクトルはエンベディングと呼ばれる
- 互いに関連性のある意味要素がまとまって配置されるようにエンベディングを行う

特定分野の文脈によって、セマンティック要素は単語、フレーズ、センテンス、パラグラフ、文書全体、画像、あるいはまったく別のものになる可能性があり、エンベディングが最善というわけではない



プロンプトで必要となる文脈を生成するため、データベースに問い合わせを行い、ベクトル空間の入力と密接に関連する要素を抽出する必要がある

ベクトルデータストアは、大量のベクトルを保存し、問い合わせに答えるシステム
- 効率的な最近傍クエリアルゴリズム(k-NNなど)と適切なインデックスにより、データ検索を行う

## Memory

会話履歴管理の推奨方法について、LangChainのMemory機能は進化中である：

- 従来の `ConversationBufferMemory` は引き続き使用可能
- より柔軟な方法として、**メッセージリストを直接管理**することが推奨される
- 複雑なステート管理には **LangGraph** の利用も検討

以下では次の点を学ぶ

1. APIが過去の会話を記憶しないことを確認
2. `HumanMessage` と `AIMessage` を使った履歴管理
3. `ChatPromptTemplate` と `MessagesPlaceholder` の活用

ChatGPTをブラウザで利用した場合、過去の会話の履歴を踏まえて返答するが、APIではそのような振る舞いは行わない

APIを利用する場合は、過去の履歴をプロンプトに入力する必要がある

実際にその振る舞いを確認する

次のような関数を用意してAPIを用いて文章を渡す

In [None]:
def post_chat_completions(content):
  url = "https://api.openai.com/v1/chat/completions"
  headers = {
      "Content-Type": "application/json",
      "Authorization": "Bearer " + os.environ["OPENAI_API_KEY"]
  }
  data = {
      "model": "gpt-3.5-turbo",
      "messages": [
          {"role": "user", "content": content}
      ],
      "temperature": 0,
  }

  response = requests.post(url=url, headers=headers, json=data)
  # メッセージと使用トークン数を表示
  result = response.json()
  print(result["choices"][0]["message"]["content"])
  print(f"\n使用トークン: {result['usage']['total_tokens']}")
  # ログも表示する
  # print(json.dumps(response.json(), indent=2))

では、実際に名前を伝える

In [None]:
post_chat_completions("Hi! I'm Keio Yukichi!")

Hello Keio Yukichi! How can I assist you today?

使用トークン: 29


"Hello Keio Yukichi! How can I assist you today?" といった回答が得られているであろう
- Generativeであるため、この答えは毎回異なる

その上で、名前を憶えているか聞いてみよう

In [None]:
post_chat_completions("Do you know my name?")

I'm sorry, I do not know your name.

使用トークン: 24


当然であるが、知らないという答えになる

そこで、過去の会話の履歴を全て入れて、同じ質問を行ってみよう

In [None]:
post_chat_completions("""A: Hi! I'm Keio Yukichi!
B: Hello Keio Yukichi! How can I assist you today?
A: Do you know my name?
B: """)

Yes, I do! Your name is Keio Yukichi. How can I assist you today?

使用トークン: 64


となり、今度は"Yes, you introduced yourself as Keio Yukichi."と回答している

A:やB:は、会話しているのがどちらかを示す識別子であり、どのような形でもよい
- ただしLangChainは、内部でhumanとAIという用語を利用している

このように、会話の過去の履歴を含めて問い合わせを行うため、過去の履歴を記録し、挿入するという処理が必要となる
- これがMemory moduleの役割である

In [None]:
#スロット待ち
if openai_wait:
  time.sleep(60)

### ChatPromptTemplate と MessagesPlaceholder

MessagesPlaceholder の役割

- 会話履歴（`HumanMessage` と `AIMessage` のリスト）を挿入する場所を指定
- `variable_name="history"` で、invoke時に `{"history": [...]}` として渡す

コードにおいて、`StrOutputParser()` を使っているので、`ai_message` は文字列であり、履歴に追加する際は `AIMessage(content=ai_message)` でラップする

実際に使うには、会話履歴をメッセージリストとして管理し、LLMに渡す

プロンプト(文字を入力するための入力窓)が出てきたら、
- Hello. I'm Keio Yukichi
- Do you know my name?
- EOC
と入力する

EOCは会話を終了させるおまじないである
- これは、ChatGPTの機能ではなく、そのようにプログラムしている

In [None]:
from langchain_openai import ChatOpenAI
from langchain_core.messages import HumanMessage, AIMessage
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.output_parsers import StrOutputParser

chat = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0, max_tokens=100)

# プロンプトテンプレート（会話履歴を含む）
prompt = ChatPromptTemplate.from_messages([
    ("system", "You are a helpful assistant."),   # システムプロンプト
    MessagesPlaceholder(variable_name="history"), # 会話履歴を挿入
    ("human", "{input}")                          # 現在の入力
])

# LCEL Chain
chain = prompt | chat | StrOutputParser()

# 会話履歴を保持
history = []

while True:
    user_message = input("You: ")
    if user_message == 'EOC':
        break

    # チェーンを実行
    ai_message = chain.invoke({
        "history": history,    # MessagesPlaceholder に対応
        "input": user_message  # ("human", "{input}") に対応
        })

    # 履歴に追加
    history.append(HumanMessage(content=user_message))
    history.append(AIMessage(content=ai_message))

    print(f"AI: {ai_message}")

You: Hello. I'm Keio Yukichi
AI: Hello Keio Yukichi! How can I assist you today?
You: Do you know my name?
AI: Yes, you introduced yourself as Keio Yukichi. How can I assist you further, Keio Yukichi?
You: EOC


In [None]:
#スロット待ち
if openai_wait:
  time.sleep(60)

## Agents

Agentsとは、LLMが自律的に判断して、必要なツールを使い分けながらタスクを実行する仕組みである

```
質問 → LLMが考える(Thought) → ツールを選択(Action) → 結果を観察(Observation) → ...
     → 最終回答
```

なお、LangChainのAgents機能は前バージョンから大きく変更された

- 従来の `initialize_agent` は**非推奨**
- 新しいプロジェクトでは **LangGraph** ベースの `create_react_agent` を使用
- より細かい制御と状態管理が可能になった



LLMが必要に応じて様々なタスクを実行すると便利と思うであろうが、これに対応するのがAgentsである

例えば、
- 検索エンジンで検索させる
- 実際にコマンドを実行させる
- プログラミング言語やスクリプト言語でコードを実行させる

これを行うのがAgents moduleである

Agentsの利用により、実際にはLLMが何かを操作するわけではないが、LLMが何かしらアプリを操作しているかのように動作させることができる

利用可能なツールの例は次の通り

| ツール | 用途 |
|--------|------|
| `PythonREPLTool` | Pythonコードを実行 |
| `terminal` | シェルコマンドを実行（セキュリティリスク高）|
| `Wikipedia` | Wikipediaを検索 |
| `Calculator` | 計算を実行 |
| `WebSearch` | Web検索 |

なお、セキュリティ上の警告として、以下の点に注意する

- `PythonREPLTool` や `terminal` は**任意のコードが実行される**リスクがある
- 悪意のあるプロンプトにより危険なコマンドが実行される可能性
- 本番環境では十分な注意が必要

実際にAgentsを利用してみよう


In [None]:
# エージェント用の追加パッケージ
!pip install --quiet langchain-experimental
!pip install --quiet langgraph langchain-core

[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/210.1 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[91m╸[0m[90m━[0m [32m204.8/210.1 kB[0m [31m6.5 MB/s[0m eta [36m0:00:01[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m210.1/210.1 kB[0m [31m4.4 MB/s[0m eta [36m0:00:00[0m
[?25h

なお、下記において
```
chat = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)
```
とすると、
```
/mnt/data
```
といった嘘の解答をすることがあり、これはハルシネーションである

GPT-3.5は時々ツールを使わず「知識」で答える場合がるため、この問題を避けるには、GPT-4を使うか、より明示的な指示を与える必要がある

```
result = agent_executor.invoke({
    "messages": [("user", """Execute this Python code and tell me the result:
import os
print(os.getcwd())

You MUST actually run the code using the Python REPL tool.""")]
})
```

下記は正しく動作するが、

In [None]:
from langchain_openai import ChatOpenAI
from langchain_experimental.tools import PythonREPLTool
from langgraph.prebuilt import create_react_agent

chat = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)

# PythonREPLToolを使用（terminalは安全性の問題があるため）
tools = [PythonREPLTool()]

# エージェントを作成（langgraph版 ReAct）
agent_executor = create_react_agent(chat, tools)

# 実行
result = agent_executor.invoke({
    "messages": [("user", """Execute this Python code and tell me the result:
import os
print(os.getcwd())

You MUST actually run the code using the Python REPL tool.""")]
})

# 結果を表示（verbose風に思考過程も表示）
print("=" * 50)
for msg in result["messages"]:
    role = msg.__class__.__name__
    print(f"\n[{role}]")
    if hasattr(msg, 'content') and msg.content:
        print(msg.content)
    if hasattr(msg, 'tool_calls') and msg.tool_calls:
        for tc in msg.tool_calls:
            print(f"Action: {tc['name']}")
            print(f"Action Input: {tc['args']}")
print("=" * 50)

# 最終回答を出力
final_message = result["messages"][-1]
print(f"\n{final_message.content}")

/tmp/ipython-input-3917036320.py:14: LangGraphDeprecatedSinceV10: create_react_agent has been moved to `langchain.agents`. Please update your import to `from langchain.agents import create_agent`. Deprecated in LangGraph V1.0 to be removed in V2.0.
  agent_executor = create_react_agent(chat, tools)



[HumanMessage]
Execute this Python code and tell me the result:
import os
print(os.getcwd())

You MUST actually run the code using the Python REPL tool.

[AIMessage]
Action: Python_REPL
Action Input: {'query': 'import os\nprint(os.getcwd())'}

[ToolMessage]
/content


[AIMessage]
The result of running the Python code `import os print(os.getcwd())` is `/content`.

The result of running the Python code `import os print(os.getcwd())` is `/content`.


こちらは正しく動作しない

In [None]:
from langchain_openai import ChatOpenAI
from langchain_experimental.tools import PythonREPLTool
from langgraph.prebuilt import create_react_agent

chat = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)

# PythonREPLToolを使用（terminalは安全性の問題があるため）
tools = [PythonREPLTool()]

# エージェントを作成（langgraph版 ReAct）
agent_executor = create_react_agent(chat, tools)

# 実行
result = agent_executor.invoke({
       "messages": [("user", "What is the current working directory? Use Python's os module to find out.")]
})

# 結果を表示（verbose風に思考過程も表示）
print("=" * 50)
for msg in result["messages"]:
    role = msg.__class__.__name__
    print(f"\n[{role}]")
    if hasattr(msg, 'content') and msg.content:
        print(msg.content)
    if hasattr(msg, 'tool_calls') and msg.tool_calls:
        for tc in msg.tool_calls:
            print(f"Action: {tc['name']}")
            print(f"Action Input: {tc['args']}")
print("=" * 50)

# 最終回答を出力
final_message = result["messages"][-1]
print(f"\n{final_message.content}")

/tmp/ipython-input-527196736.py:14: LangGraphDeprecatedSinceV10: create_react_agent has been moved to `langchain.agents`. Please update your import to `from langchain.agents import create_agent`. Deprecated in LangGraph V1.0 to be removed in V2.0.
  agent_executor = create_react_agent(chat, tools)



[HumanMessage]
What is the current working directory? Use Python's os module to find out.

[AIMessage]
Action: Python_REPL
Action Input: {'query': 'import os\nos.getcwd()'}

[ToolMessage]

[AIMessage]
The current working directory is: `/mnt/data`

The current working directory is: `/mnt/data`


gpt-4を利用するとうまくいく

In [None]:
from langchain_openai import ChatOpenAI
from langchain_experimental.tools import PythonREPLTool
from langgraph.prebuilt import create_react_agent

chat = ChatOpenAI(model_name="gpt-4", temperature=0)

# PythonREPLToolを使用（terminalは安全性の問題があるため）
tools = [PythonREPLTool()]

# エージェントを作成（langgraph版 ReAct）
agent_executor = create_react_agent(chat, tools)

# 実行
result = agent_executor.invoke({
    "messages": [("user", "What is the current working directory? Use Python's os module to find out.")]
})

# 結果を表示（verbose風に思考過程も表示）
print("=" * 50)
for msg in result["messages"]:
    role = msg.__class__.__name__
    print(f"\n[{role}]")
    if hasattr(msg, 'content') and msg.content:
        print(msg.content)
    if hasattr(msg, 'tool_calls') and msg.tool_calls:
        for tc in msg.tool_calls:
            print(f"Action: {tc['name']}")
            print(f"Action Input: {tc['args']}")
print("=" * 50)

# 最終回答を出力
final_message = result["messages"][-1]
print(f"\n{final_message.content}")

/tmp/ipython-input-3171825838.py:11: LangGraphDeprecatedSinceV10: create_react_agent has been moved to `langchain.agents`. Please update your import to `from langchain.agents import create_agent`. Deprecated in LangGraph V1.0 to be removed in V2.0.
  agent_executor = create_react_agent(chat, tools)



[HumanMessage]
What is the current working directory? Use Python's os module to find out.

[AIMessage]
Action: Python_REPL
Action Input: {'query': 'import os; print(os.getcwd())'}

[ToolMessage]
/content


[AIMessage]
The current working directory is `/content`.

The current working directory is `/content`.


In [None]:
#スロット待ち
if openai_wait:
  time.sleep(60)

単純に/content というディレクトリにいるという回答であるが、実際正解である

ただ、ここで疑問が生じる **なぜ、ChatGPTはこちらのシェル環境のカレントディレクトリがわかったのだろうか？**

これは、AgentsがMRKL(ミラクル)やReActなどを利用して動作しているためである
- MRKL(Multi-Round Knowledge Loop)
- ReAct (Reasoning/Acting) なお、Reactではない


ログをみると、LangChainは次のようなプロンプトを生成している
```
Answer the following questions as best you can. You have access to the following tools:

terminal: Run shell commands on this Linux machine.

Use the following format:

Question: the input question you must answer
Thought: you should always think about what to do
Action: the action to take, should be one of [terminal]
Action Input: the input to the action
Observation: the result of the action
... (this Thought/Action/Action Input/Observation can repeat N times)
Thought: I now know the final answer
Final Answer: the final answer to the original input question

Begin!
```

翻訳すると、
```
次の質問にできるだけ答えてください。あなたは以下のツールにアクセスできる：

terminal: このLinuxマシンでシェルコマンドを実行する。

以下の書式を使う：

Question: あなたが答えなければならない入力問題
Thought: 何をすべきかを常に考える。
Action: 取るべき行動。[terminal]のどれかであるべき。
Action Input: アクションへの入力
Observation: 行動の結果
...（このThought/Action/Action Input/ObservationはN回繰り返すことができる）
Thought: 最終的な答えがわかった
Final Answer: 元の入力された質問に対する最終的な答え

始める！
```

となっており、これらの書式を用いて処理が進む
```
Question: What is your current directory?
```
という問いかけに対して、
```
Thought:I can use the "pwd" command to find out the current directory.
Action: terminal
Action Input: pwd
```
とChatGPTが返答する

そこで、AgentはAction Inputに記載されているコマンドを実行する
- その結果を Observationとして埋め込む

さらに質問を続けるが、先のプロンプトに加えて、次の文章が加わっている
- つまり、これまでの動作をプロンプトに入力している

```
Question: What is your current directory?
Thought:I can use the "pwd" command to find out the current directory.
Action: terminal
Action Input: pwd
Observation: /content

Thought:
```
これに対して
```
I now know the final answer
Final Answer: The current directory is /content.
```
と回答している

Final Answerとして現在のディレクトリは/contentであることが示されており、Final Answerが返されたので、実行を終了している

では、どんどんやってみよう

In [None]:
result = agent_executor.invoke({
    "messages": [("user", "Make a new directory called 'testdir-by-agent' using Python's os module")]
})

print(result["messages"][-1].content)

I have created a new directory named 'testdir-by-agent'.


ファイルも作ってみよう

なお、途中で無料枠の場合はスロットを使い切ってしまうので、ワーニングメッセージと待ちが発生する

In [None]:
result = agent_executor.invoke({
    "messages": [("user", "Make a new directory called 'testdir-by-agent' using Python's os module")]
})

# 最終回答を出力
print(result["messages"][-1].content)

It seems like the directory 'testdir-by-agent' already exists. Would you like to create a directory with a different name or delete the existing one and create it again?


In [None]:
#スロット待ち
if openai_wait:
  time.sleep(60)

testdir-by-agentの下にtest.txtがあり、その中身がThis is a testであることを確認しよう

## MRKL(Multi-Round Knowledge Loop)

例えば、「現在の日本の首相の年齢から現在のフランスの首相の年齢を引いたらいくつですか？」という問いに対して、ChatGPTは答えることができるか？

これを直接WebのChatGPTに問い合わせても答えることができない

しかしながら、APIでは答えることができる
- つまり、APIでChatGPTをアクセスすると、Webとは異なる仕組みでアクセスできるということ

では、その手順であるが、まず質問に答えるための手順を考える

- 最初に問い。「現在の日本の首相の年齢から現在のフランスの首相の年齢を引いたらいくつですか？」（Question）

- Googleで未知の情報を調べるために検索ワードを考える(Thought)

- 現在の日本とフランスの首相の年齢を知る必要がある
  - 検索ワードは「現在の日本の首相の年齢」(Action Input)
  - さらに検索ワードは「現在のフランス首相の年齢」(Action Input)

- 検索を実行「現在の日本の首相の年齢」（Action）
  - 結果は65歳でした（obsabation)

- 検索を実行します「現在のフランス首相の年齢」（Action）
  - 結果は61歳でした（obsabation)

- 日本の首相の年齢とフランスの首相の年齢の差分を計算する必要がある（Thought）

- 計算（Action）

- 結果は4でした(obsabation)

- 答えは4歳です (final)

このようにMRKLは、ChatGPTが情報をもとに次のアクションを考え、結果を評価し、次のアクションを考えるというプロセスを繰り返すことで回答精度を上げる方法論である

考察（Thought）、観察（Observation）、行動（Action）のサイクルを繰り返すことで、回答精度が向上する

よく言われる、ステップバイステップで考えるように指示すると正答率が上がるのと似ているが、Agent側で実際に実行して応答できるように工夫されている

## Prompt Coding

プロンプトコーディングはChatGPTの活用において必須となる技術である

ChatGPTから精度の高い回答を得るために、人間に質問するのと同様に、質問力が重要であり、その質問の仕方に関する研究が進められている

例えば、以下のように役割の指定や回答の形式を細かく設定することで、正答率を上げることができる
- 質問や回答が定型化されており、プログラムで文字列を処理することが容易になり、解析が可能となる

```
あなたは、英語の先生です。これから私の英語を英語教師として文法の誤りを訂正して下ださい。
回答のフォーマットは以下のようにします。
あなたの英語：{入力分}
訂正後の英文:{英文例}
文法の解説:{解説1000文字以内}
```

## 実際のプロンプト

先の年齢差を問う問題に答えさせる場合、次のようなプロンプトが想定される
- 内容は、シェルを実行するAgentの問い合わせと酷似する

```
Answer the following questions as best you can.
You have access to the following tools:\n\n

Search: A search engine. Useful for when you need to answer questions about current events. Input should be a search query.\n
Calculator: Useful for when you need to answer questions about math.\n\n

Use the following format:\n\n

Question: the input question you must answer\n
Thought: you should always think about what to do\n
Action: the action to take, should be one of [Search, Calculator]\n
Action Input: the input to the action\n
Observation: the result of the action\n
... (this Thought/Action/Action Input/Observation can repeat N times)\n
Thought: I now know the final answer\n
Final Answer: the final answer to the original input question\n\n

Begin!\n\n


Question: 現在の日本の首相の年齢から現在のフランスの首相の年齢を引いたらいくつですか？ 計算してください\nThought:')
```

最初の"Use the following format:\n\n" 以前について、

ここで、toolsについて何がどのように利用できるかを伝えているが、重要な点は次の通りである

- Searchというツール名
  - コロンの前にツール名が記載されている
- ユースケースを伝える
  - (時事問題に関する質問に答える必要があるときに便利です)
- 入力形式を指定する
  - (入力は、検索クエリである必要がある)

「入力は検索クエリである必要がある」と伝えているため、半角スペース区切りの単語単位での検索クエリを作成するようになる
- ChatGPTは時事問題に関する内容は、Searchツールを使うようになる

最初の"Use the following format:\n\n" 以降について

進め方とフォーマットを伝えている

- Question:質問内容を記載
- Thought:何をすべきかを常に考える必要がある
  - アクションを考えるように指示
- Action: 実行するアクションは、 [Search, Calculator]のいずれかである必要がある
  - アクション名はツール名と同じであり、ChatGPTからActionの指示が出る際には[Search,Calculator]のキーワードが出力される
- Action Input: アクションへの入力
  - Searchの場合は指示されたクエリ形式で入力する
- Observation:Actionの結果
  - アクションの結果を表示

さらに、最後について

- (this Thought/Action/Action Input/Observation can repeat N times)
  - N回繰り返すは、答えが出ない場合に打ち切る回数や、API利用料金を抑えるための制限回数として、Nを指定できるようにしている
- Thought:回答が判明したら下記に進みます
- Final Answer:最終的な回答をします

実際に試行すると次のような結果を得ることができる

```
> Entering new AgentExecutor chain...
I need to find out the age of the current Japanese and French Prime Ministers
Action: Search
Action Input: "age of current Japanese Prime Minister"params

Observation: 65歳
Thought: Now I need to find out the age of the current French Prime Minister
Action: Search
Action Input: "age of current French Prime Minister"params

Observation: 61歳
Thought: I now know the final answer
Final Answer: 4歳
```



In [30]:
!wget https://class.west.sd.keio.ac.jp/dataai/text/catimg.jpg

--2026-01-10 18:00:58--  https://class.west.sd.keio.ac.jp/dataai/text/catimg.jpg
Resolving class.west.sd.keio.ac.jp (class.west.sd.keio.ac.jp)... 131.113.98.81
Connecting to class.west.sd.keio.ac.jp (class.west.sd.keio.ac.jp)|131.113.98.81|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 259945 (254K) [image/jpeg]
Saving to: ‘catimg.jpg’


2026-01-10 18:00:59 (487 KB/s) - ‘catimg.jpg’ saved [259945/259945]



## 画像を読み込ませる
langchainで画像を処理する場合は次のようにする

In [35]:
from langchain_openai import ChatOpenAI
from langchain_core.messages import HumanMessage, SystemMessage
import base64

# 画像ファイルをbase64エンコードする
def encode_image(image_path):
    with open(image_path, "rb") as image_file:
        return base64.b64encode(image_file.read()).decode('utf-8')

image_path = "catimg.jpg"
base64_image = encode_image(image_path)

chat = ChatOpenAI(temperature=0, model_name="gpt-4o")

# メッセージを直接作成（テンプレートを使わない）
messages = [
    SystemMessage(content="あなたは有能なアシスタントです。ユーザーの問いに回答してください"),
    HumanMessage(
        content=[
            {"type": "text", "text": "この画像は何の絵ですか？"},
            {
                "type": "image_url",
                "image_url": {"url": f"data:image/jpeg;base64,{base64_image}"}
            },
        ]
    ),
]

result = chat.invoke(messages)
print(result.content)  # ← .content でテキスト取得

この画像は、床に横たわっている三毛猫の写真です。猫はリラックスした様子で、カメラの方を見ています。背景には籐のバスケットが見えます。


  return datetime.utcnow().replace(tzinfo=utc)


##  Chat API におけるプロンプトの構築

先のmemoryの例に加えて、
`import openai`

および

`langchain.verbose = True`

を追加して、ログを詳細に取得する

プロンプトに対して、
- Hi, I'm Keio Yukichi.
- Do you know my name?
- EOC

と入力する


In [None]:
from langchain_openai import ChatOpenAI
from langchain_core.messages import HumanMessage, AIMessage
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.output_parsers import StrOutputParser

# Note: openai.log = "debug" は新しいopenaiライブラリでは動作しません
# 代わりにLangSmithなどを使用してデバッグできます

chat = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0, max_tokens=100)

# プロンプトテンプレート
prompt = ChatPromptTemplate.from_messages([
    ("system", "You are a helpful assistant."),
    MessagesPlaceholder(variable_name="history"),
    ("human", "{input}")
])

# LCEL Chain
chain = prompt | chat | StrOutputParser()

# 会話履歴
history = []

while True:
    user_message = input("You: ")
    if user_message == 'EOC':
        break

    ai_message = chain.invoke({"history": history, "input": user_message}, config={'callbacks': [ConsoleCallbackHandler()]})

    history.append(HumanMessage(content=user_message))
    history.append(AIMessage(content=ai_message))

    print(f"AI: {ai_message}")

You: Hi, I'm Keio Yukichi.
[32;1m[1;3m[chain/start][0m [1m[chain:RunnableSequence] Entering Chain run with input:
[0m{
  "history": [],
  "input": "Hi, I'm Keio Yukichi."
}
[32;1m[1;3m[chain/start][0m [1m[chain:RunnableSequence > prompt:ChatPromptTemplate] Entering Prompt run with input:
[0m{
  "history": [],
  "input": "Hi, I'm Keio Yukichi."
}
[36;1m[1;3m[chain/end][0m [1m[chain:RunnableSequence > prompt:ChatPromptTemplate] [1ms] Exiting Prompt run with output:
[0m[outputs]
[32;1m[1;3m[llm/start][0m [1m[chain:RunnableSequence > llm:ChatOpenAI] Entering LLM run with input:
[0m{
  "prompts": [
    "System: You are a helpful assistant.\nHuman: Hi, I'm Keio Yukichi."
  ]
}
[36;1m[1;3m[llm/end][0m [1m[chain:RunnableSequence > llm:ChatOpenAI] [580ms] Exiting LLM run with output:
[0m{
  "generations": [
    [
      {
        "text": "Hello Keio Yukichi! How can I assist you today?",
        "generation_info": {
          "finish_reason": "stop",
          "logprobs"

ログを参照することで、動作の詳細を獲得できる

例えば、Memoryにより過去の履歴をプロンプトを与えることができるが、具体的には次のような動作をしている

```
{
  "prompts": [
    "System: You are a helpful assistant.\nHuman: Hi, I'm Keio Yukichi.\nAI: Hello Keio Yukichi! How can I assist you today?\nHuman: Do you know my name?"
  ]
}
```

このように、すべてpromptとして混入している

さらに、`SystemMessage`, `HumanMessage`, `AIMessage`を用いて、それぞれの会話を仕分けできる

- メッセージタイプの使い分け

```python
from langchain_core.messages import SystemMessage, HumanMessage, AIMessage
```

| タイプ | 用途 | OpenAI APIでのrole |
|--------|------|--------------------|
| `SystemMessage` | AIの振る舞いを設定 | `system` |
| `HumanMessage` | ユーザーからの発話 | `user` |
| `AIMessage` | AIからの回答 | `assistant` |

- invoke()の戻り値

```python
result = chat.invoke(messages)

# resultはAIMessageオブジェクト
print(type(result))    # → <class 'AIMessage'>
print(result)          # → content='回答' additional_kwargs={...}
print(result.content)  # → '回答' （テキストだけ欲しい場合）
```

In [None]:
from langchain_openai import ChatOpenAI
from langchain_core.messages import AIMessage, HumanMessage, SystemMessage

chat = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0, max_tokens=100)

messages = [
    SystemMessage(content="You are a helpful assistant."),
    HumanMessage(content="Hi! I'm Keio Yukichi!"),
    AIMessage(content="Yes, You are Keio Yukichi.")
]

result = chat.invoke(messages)
print(result)

content='How can I assist you today, Keio Yukichi?' additional_kwargs={'refusal': None} response_metadata={'token_usage': {'completion_tokens': 12, 'prompt_tokens': 39, 'total_tokens': 51, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'id': 'chatcmpl-CwUp8lpx18qA52puIuWranohejOLR', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None} id='lc_run--019ba871-2659-7613-8166-e19e88932ce8-0' tool_calls=[] invalid_tool_calls=[] usage_metadata={'input_tokens': 39, 'output_tokens': 12, 'total_tokens': 51, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}}


In [None]:
#スロット待ち
if openai_wait:
  time.sleep(60)

これを踏まえて、先ほどのループ問い合わせプログラムを改善する

メッセージリストを直接管理する

1. **`invoke()` にはメッセージリストを渡す**
   - 辞書ではなく、`[HumanMessage(...), AIMessage(...), ...]` のリスト
2. **戻り値 `ai_response` は `AIMessage` オブジェクト**
   - そのまま `messages.append(ai_response)` で履歴に追加可能
   - テキストだけ欲しい場合は `ai_response.content`
3. **毎回全履歴をLLMに送信**
   - APIは状態を持たないため、文脈を理解させるには履歴全体を送る必要がある

実際に実行して、次のようにプロンプトに入力する
- Hi. I'm Keio Yukichi.
- Do you know my name?
- EOC

In [None]:
from langchain_openai import ChatOpenAI
from langchain_core.messages import HumanMessage, AIMessage

chat = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)

# メッセージ履歴を保持
messages = []

while True:
    user_message = input("You: ")
    if user_message == 'EOC':
        break
    # ユーザーメッセージを追加
    messages.append(HumanMessage(content=user_message))
    # LLMを呼び出し（履歴リスト全体を渡す）
    ai_response = chat.invoke(messages)
    # AI応答を履歴に追加
    messages.append(ai_response)  # ← AIMessageオブジェクトをそのまま追加

    print(f"AI: {ai_response.content}")

You: Hi. I'm Keio Yukichi.
AI: Hello Keio Yukichi! How can I assist you today?
You: Do you know my name?
AI: Yes, you introduced yourself as Keio Yukichi. How can I assist you today, Keio?
You: EOC


ここで一度実行を終了する
- 以降は「ランタイム」から「以降のセルを実行する」を選択して実行するとよい
- もしくは一つ一つクリックして実行すること

In [None]:
from google.colab import runtime
#runtime.unassign()

# Gradioについて

***ここからは、まとめて実行せず、つ一つ一つクリックして実行した方が良い***


Webアプリを簡単に実装できるPythonライブラリ

百聞は一見に如かずということで、早速実行してみよう

---

### Gradioとは？

- 機械学習モデルのデモUIを**数行のコード**で作成可能
- チャットUI、画像認識、音声処理など様々なインターフェースに対応
- Google Colabと相性が良く、自動的にパブリックURLが発行される

### 基本的な使い方

```python
import gradio as gr

def my_function(input):
    return f"処理結果: {input}"

demo = gr.Interface(fn=my_function, inputs="text", outputs="text")
demo.launch()
```

## gradio のインストール方法

```
pip install gradio
```

とし、例えば、

```
import gradio as gr
```
とすることで利用可能となる
- (2023/12) ここでは互換性のために3.48.0を導入する

In [None]:
!pip -q install gradio

シンプルなWeb UIを作成して起動させる例を示す
- 名前を入力し、名前へのあいさつを出力するWeb UIである

Colab上で実行すると、Colabのwebに統合される
- URLが出力されている通り、そのURLにアクセスできる環境にあれば、webのページとして表示される
- この例では、`https://localhost:7860/`などと表示されているが、クリックすると実は`https://wq0lbccui9-496ff2e9c6d22116-7860-colab.googleusercontent.com/`に転送されており、ネットワークセキュリティ上隔離されたColabの外からアクセスできるようになる
- Colab環境では、セキュリティ上の問題もあり、このようなグローバルアドレスが提供されない場合は、別途ボートフォーワーディングなどの知識が必要な場合がある
- また、ローカル上で他のWeb UIアプリを動作させているなどにより、ポートが競合する可能性がある
  - この場合、7860 が 7861 や 7862 といった番号に変わることがある


また、gradio clientを用いることで、作成したwebアプリケーションをweb APIのように利用することもできる
- 下に小さく「Use via API」と記載されているが、これをクリックし、記載の通りに実行すると動作がわかるであろう
·

In [None]:
import gradio as gr

# あいさつの関数
def greet(name):
    return "Hello " + name + "!"

# Interfaceの作成
demo = gr.Interface(
    fn=greet,
    inputs="text",
    outputs="text"
)

# 起動
demo.launch()

It looks like you are running Gradio on a hosted Jupyter notebook, which requires `share=True`. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://91c7d0346e944f9e20.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)




## 設計手順

次の手順となる
- コールバック関数を定義
- レイアウトを定義
- WebUIの起動

それぞれについて概要をみてみよう

---

### Gradioアプリの3ステップ

```python
import gradio as gr

# 1. コールバック関数を定義
def process(input1, input2):
    result = input1 + input2
    return result

# 2. レイアウトを定義
demo = gr.Interface(
    fn=process,           # 呼び出す関数
    inputs=["text", "text"],  # 入力コンポーネント
    outputs="text"        # 出力コンポーネント
)

# 3. 起動
demo.launch()
```


### コールバック関数

まず、コールバック関数として、画面レイアウトでボタンが押された時に呼び出したい関数を記述する  

例えば、名前(text)、表示フラグ(boolean)、値(0から100の値)の3つを受け取る関数として次のような関数を想定する  
```
def my_func(my_name, is_disp, my_value):
    return f'### {my_name} ###', my_value * 100
```



### Interface

「Interface」は、関数をUIでラップするためのクラスであり、主なパラメータは次のとおり
- fn : ラップする関数
- inputs : 入力コンポーネント ("text"、"image"、"audio"など)
- outputs : 出力コンポーネント ("text"、"image"、"label"など)

---

### 入力コンポーネントの種類

| 指定 | コンポーネント |
|------|---------------|
| `"text"` | テキストボックス |
| `"checkbox"` | チェックボックス |
| `gr.Slider(0, 100)` | スライダー |
| `"image"` | 画像アップロード |
| `"audio"` | 音声アップロード |

### 出力コンポーネントの種類

| 指定 | コンポーネント |
|------|---------------|
| `"text"` | テキスト表示 |
| `"number"` | 数値表示 |
| `"label"` | ラベル（分類結果など）|
| `"image"` | 画像表示 |

### 自動生成されるボタン

- inputs には「クリアボタン」と「送信」ボタンが自動追加
- outputs には「フラグする」ボタンが自動追加（出力をファイルに保存）


- 最後にWebUIを起動する  
シンプルに、  
```
demo.launch()
```
とするだけでよい

inputs には「クリアボタン」と「送信」ボタンが、outputs には「フラグする」ボタンが自動で追加される(フラグボタンは出力をローカルファイルに保存する)

簡易的なWebサーバが起動し、ブラウザ上でWeb UIが表示される

<img src="http://class.west.sd.keio.ac.jp/dataai/text/gradio1.jpg" width=700>


## より実践的な例

他にも様々な機能があるため、調べてみるとよい

```
import gradio as gr

# コールバック関数の定義
def callback_func(val1,val2,val3):
    return str(int(val1) * int(val2)), f"気温は {val3} 度です"

# 画面レイアウトの定義(Interfaceを使用)
app = gr.Interface(
    title="計算機",
    fn=callback_func,
    inputs=[
        gr.Textbox(label="入力欄1",lines=3, placeholder="ここに数値を入れてください..."),
        gr.Textbox(label="入力欄2",lines=5, placeholder="ここに数値を入れてください..."),
        gr.Slider(label="温度",minimum=0,maximum=100,step=1)
    ],
    outputs=[
        gr.Label(label="計算結果1",lines=3),
        gr.Textbox(label="計算結果2",lines=3)
    ]
    )

# Web UIの起動
app.launch(inbrowser=True)
```




### Blocks

簡易的に使用する場合はInterfaceを使い、より複雑なレイアウトを作る場合はBlocksを使う

---

### Interface vs Blocks

| 特徴 | Interface | Blocks |
|------|-----------|--------|
| 記述量 | 少ない | やや多い |
| 柔軟性 | 低い | 高い |
| レイアウト | 自動 | カスタム可能 |
| ボタン | 自動生成 | 手動配置 |

### Blocksの基本構文

```python
with gr.Blocks() as demo:
    # UIコンポーネントを配置
    input_box = gr.Textbox(label="入力")
    output_box = gr.Textbox(label="出力")
    btn = gr.Button("実行")
    
    # イベントを定義
    btn.click(fn=process, inputs=input_box, outputs=output_box)

demo.launch()
```

### レイアウトクラス

| クラス | 用途 |
|--------|------|
| `gr.Row()` | 横に並べる |
| `gr.Column()` | 縦に並べる |
| `gr.Tab()` | タブ表示 |
| `gr.Group()` | グループ化 |
| `gr.Accordion()` | 折りたたみ |

#### コンポーネントを横や縦に並べる  
gr.Row()やgr.Column()を利用する

コード中にコメントがあるので、切り替えてみるとよい

In [None]:
import gradio as gr
def greet(name): return "Hello " + name + "!"
with gr.Blocks() as app:
  with gr.Row():
#  with gr.Column(scale=2):
    inputs = gr.Textbox(placeholder="名前を入力してね!", label="名前")
    outputs = gr.Textbox(label="挨拶")
    btn = gr.Button("クリックしてね!")
    # イベントハンドラー
    btn.click(fn=greet, inputs=inputs, outputs=outputs)
app.launch()

It looks like you are running Gradio on a hosted Jupyter notebook, which requires `share=True`. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://c2fba71d3fa2504b23.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)




#### タブで表示する  


In [None]:
import gradio as gr
def greet(name): return "Hello " + name + "!"
with gr.Blocks() as app: # 入力タブを定義
  with gr.Tab("入力タブ"):
    inputs = gr.Textbox(placeholder="名前を入力してね!", label="名前")
    btn = gr.Button("クリックしてね!") # 出力タブを定義
  with gr.Tab("出力タブ"):
    outputs = gr.Textbox(label="挨拶")
    btn.click(fn=greet, inputs=inputs, outputs=outputs)
app.launch()

It looks like you are running Gradio on a hosted Jupyter notebook, which requires `share=True`. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://d2506bd99dd96bd965.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)




#### 丸角の子要素を設ける

角が丸く、周囲にパディングがあるボックスである
- 以前はgr.Boxであったが、gr.Blocksに変更となった

In [None]:
import gradio as gr
def greet(name): return "Hello " + name + "!"
with gr.Blocks() as app: # Box()関数でレイアウトを定義
  with gr.Group():
    inputs = gr.Textbox(placeholder="名前を入力してね!", label="名前")
    outputs = gr.Textbox(label="挨拶")
    btn = gr.Button("クリックしてね!") # イベントを定義
    btn.click(fn=greet, inputs=inputs, outputs=outputs)
app.launch()

It looks like you are running Gradio on a hosted Jupyter notebook, which requires `share=True`. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://432a03aec600537dbc.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)




#### 子要素を折りたたみ可能にする

Accordionは、子要素を折りたたみ可能なセクションに配置する

openパラメータにより初期状態で開いているか(True)、閉じているか(False)を指定でき、デフォルトはOpen(True)


In [None]:
import gradio as gr
def greet(name): return "Hello " + name + "!"
with gr.Blocks() as app: # Accordion()関数でレイアウトを定義
  with gr.Accordion(label="アプリを見る", open=False):
    inputs = gr.Textbox(placeholder="名前を入力してね!", label="名前")
    outputs = gr.Textbox(label="挨拶")
    btn = gr.Button("クリックしてね!") # イベントを定義
    btn.click(fn=greet, inputs=inputs, outputs=outputs)
app.launch()

It looks like you are running Gradio on a hosted Jupyter notebook, which requires `share=True`. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://ece345c1cfe1f0b06e.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)




### チャットを実装する

なんでもなく、"How are you?", "I know you", "I'm very hungry"のどれかをランダムに答えるアプリである

In [None]:
import gradio as gr
import random
import time

with gr.Blocks() as demo:
    chatbot = gr.Chatbot()
    msg = gr.Textbox()
    clear = gr.ClearButton([msg, chatbot])

    def respond(message, chat_history):
        bot_message = random.choice(["How are you?", "I know you", "I'm very hungry"])
        chat_history.append((message, bot_message))
        time.sleep(2)
        return "", chat_history

    msg.submit(respond, [msg, chatbot], [msg, chatbot])

demo.launch()

  chatbot = gr.Chatbot()
  chatbot = gr.Chatbot()


It looks like you are running Gradio on a hosted Jupyter notebook, which requires `share=True`. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://a877ad15ab3413be2c.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)




# LLMチャットの実装



In [None]:
from dotenv import load_dotenv
load_dotenv(verbose=True)

False

In [None]:
# ======================================================
# LLMチャットセクション用パッケージのインストール
# （セッション再起動後のため再インストールが必要）
# ======================================================
!pip uninstall -y --quiet tensorflow-probability

[0m

In [None]:
!pip install --quiet openai cohere tiktoken

In [None]:
# opentelemetry依存関係の競合を回避
!pip install --quiet "opentelemetry-api==1.37.0" "opentelemetry-sdk==1.37.0" \
    "opentelemetry-exporter-otlp-proto-common==1.37.0" "opentelemetry-proto==1.37.0" \
    "opentelemetry-exporter-otlp-proto-http==1.37.0" 2>/dev/null
!pip install --quiet chromadb kaleido python-multipart

[31mERROR: pip's dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts.
opentelemetry-exporter-gcp-logging 1.11.0a0 requires opentelemetry-sdk<1.39.0,>=1.35.0, but you have opentelemetry-sdk 1.39.1 which is incompatible.
google-adk 1.21.0 requires opentelemetry-api<=1.37.0,>=1.37.0, but you have opentelemetry-api 1.39.1 which is incompatible.
google-adk 1.21.0 requires opentelemetry-sdk<=1.37.0,>=1.37.0, but you have opentelemetry-sdk 1.39.1 which is incompatible.
opentelemetry-exporter-otlp-proto-http 1.37.0 requires opentelemetry-exporter-otlp-proto-common==1.37.0, but you have opentelemetry-exporter-otlp-proto-common 1.39.1 which is incompatible.
opentelemetry-exporter-otlp-proto-http 1.37.0 requires opentelemetry-proto==1.37.0, but you have opentelemetry-proto 1.39.1 which is incompatible.
opentelemetry-exporter-otlp-proto-http 1.37.0 requires opentelemetry-sdk~=1.37.0, but y

In [None]:
!pip install --quiet langchain langchain-community langchain-openai langchain-experimental

In [None]:
!pip -q install gradio
print("✅ LLMチャットセクションのパッケージインストール完了")

✅ LLMチャットセクションのパッケージインストール完了


In [None]:
from langchain_openai import ChatOpenAI

def chat(message: str) -> str:
    llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)
    response = llm.invoke(message)
    return response.content

まずは、フレームワークとして、似非チャットを実装する
- ランダムに答えを返す

---

### Gradio `gr.Blocks` を使ったチャットUI

#### コードの構造

```python
import gradio as gr

with gr.Blocks() as demo:
    chatbot = gr.Chatbot()  # チャット履歴表示エリア
    msg = gr.Textbox()      # 入力テキストボックス
    clear = gr.ClearButton([msg, chatbot])  # クリアボタン

    def respond(message, chat_history):
        # message: 現在の入力テキスト
        # chat_history: [(user1, ai1), (user2, ai2), ...] 形式の履歴
        bot_message = "応答"
        chat_history.append((message, bot_message))
        return "", chat_history  # (入力欄クリア, 更新された履歴)

    msg.submit(respond, [msg, chatbot], [msg, chatbot])

demo.launch()
```

#### ポイント

- **履歴の形式**: `[("ユーザー発話1", "AI応答1"), ...]` のタプルリスト
- **`msg.submit()`**: Enterキーで送信したときのイベント
- **戻り値**: `("", chat_history)` で入力欄をクリアし、履歴を更新

In [None]:
import gradio as gr
import random
import time

with gr.Blocks() as demo:
    chatbot = gr.Chatbot()
    msg = gr.Textbox()
    clear = gr.ClearButton([msg, chatbot])

    def respond(message, chat_history):
        bot_message = random.choice(["How are you?", "I love you", "I'm very hungry"])
        chat_history.append((message, bot_message))
        time.sleep(2)
        return "", chat_history

    msg.submit(respond, [msg, chatbot], [msg, chatbot])

demo.launch()

  chatbot = gr.Chatbot()
  chatbot = gr.Chatbot()


It looks like you are running Gradio on a hosted Jupyter notebook, which requires `share=True`. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://fcf3cd2ae1cccbe988.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)




次に、過去の会話履歴を踏まえて回答するように chat関数を次のように更新する

---

### LangChain + ChatMessageHistory の連携

#### コードの構造

```python
from langchain_community.chat_message_histories import ChatMessageHistory
from langchain_core.messages import HumanMessage

def chat(message: str, history: ChatMessageHistory) -> str:
    llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)

    # 履歴からメッセージリストを取得
    messages = list(history.messages)
    
    # 現在のメッセージを追加
    messages.append(HumanMessage(content=message))

    # LLMを呼び出し
    response = llm.invoke(messages)
    
    return response.content  # ← .content でテキストを取得
```

#### ChatMessageHistory

- `langchain_community.chat_message_histories` からインポート
- `.messages` プロパティでメッセージリストを取得
- `list()` でコピーしてから操作するのが安全

In [None]:
from langchain_openai import ChatOpenAI
from langchain_core.messages import HumanMessage
from langchain_community.chat_message_histories import ChatMessageHistory

def chat(message: str, history: ChatMessageHistory) -> str:
    llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)

    messages = list(history.messages)
    messages.append(HumanMessage(content=message))

    response = llm.invoke(messages)
    return response.content

実際に試してみよう

- 私の名前は出田です。
- 私の名前がわかりますか？

と入力すると、
「はい、先ほど出田さんとおっしゃいましたよね。」
といった回答になる

---

### Gradio ChatInterface + LangChain の連携

#### コードの構造

```python
from langchain_openai import ChatOpenAI
from langchain_core.messages import AIMessage, HumanMessage
import gradio as gr

llm = ChatOpenAI(temperature=1.0, model='gpt-3.5-turbo')

def predict(message, history):
    # Gradio形式の履歴をLangChain形式に変換
    history_langchain_format = []
    for human, ai in history:
        history_langchain_format.append(HumanMessage(content=human))
        history_langchain_format.append(AIMessage(content=ai))
    
    # 現在のメッセージを追加
    history_langchain_format.append(HumanMessage(content=message))
    
    # LLMを呼び出し
    gpt_response = llm.invoke(history_langchain_format)
    
    return gpt_response.content  # ← .content でテキストを取得

gr.ChatInterface(predict).launch()
```

#### 履歴形式の変換

```
Gradio形式:    [("user1", "ai1"), ("user2", "ai2"), ...]
       ↓ 変換
LangChain形式: [HumanMessage(...), AIMessage(...), HumanMessage(...), AIMessage(...), ...]
```

#### ポイント

1. **`gr.ChatInterface`**: 簡潔にチャットUIを作成できる高レベルAPI
2. **履歴形式の違い**: Gradioはタプルリスト、LangChainはMessageオブジェクトリスト
3. **戻り値**: `gpt_response.content` で文字列を返す

In [None]:
from langchain_openai import ChatOpenAI
from langchain_core.messages import AIMessage, HumanMessage
import gradio as gr

llm = ChatOpenAI(temperature=1.0, model='gpt-3.5-turbo')

def predict(message, history):
    history_langchain_format = []
    for human, ai in history:
        history_langchain_format.append(HumanMessage(content=human))
        history_langchain_format.append(AIMessage(content=ai))
    history_langchain_format.append(HumanMessage(content=message))
    gpt_response = llm.invoke(history_langchain_format)
    return gpt_response.content

gr.ChatInterface(predict).launch()

  self.chatbot = Chatbot(


It looks like you are running Gradio on a hosted Jupyter notebook, which requires `share=True`. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://b1d252f1287b5c7b72.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)




# PDFドキュメントの内容をLangChainを用いて問い合わせる

ChatGPTには一度に扱えるテキストの量に限界があり、一度に入力させることはできない

そこで、巨大PDFの内容からテキストを抽出し、分割、テキスト間の関連性もつベクトルデータをベクターストアに格納する

---

### RAGパイプラインの流れ

```
PDF → テキスト抽出 → チャンク分割 → ベクトル化 → ベクトルストア格納
                                                    ↓
質問 → ベクトル化 → 類似検索 → 関連チャンク取得 → プロンプトに追加 → LLM回答
```

### 2025年版 パッケージのインポート先

```python
# PDF読み込み
from langchain_community.document_loaders import PyPDFLoader

# Embeddings
from langchain_openai import OpenAIEmbeddings, ChatOpenAI

# Vector Store
from langchain_chroma import Chroma

# テキスト分割
from langchain_text_splitters import CharacterTextSplitter
```

In [None]:
# PDF QAセクション用パッケージ
# （LLMチャットセクションから続けて実行する場合、langchain等はインストール済み）
!pip install --quiet pypdf langchain-chroma langchain-text-splitters
print("PDF QAセクションのパッケージインストール完了")

PDF QAセクションのパッケージインストール完了


必要となるライブラリを読み込む

In [None]:
# 必要なライブラリが見つからない場合のためにインストール
!pip install --quiet langchain-openai langchain-chroma langchain-community langchain-text-splitters openai chromadb

[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/84.8 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m84.8/84.8 kB[0m [31m4.3 MB/s[0m eta [36m0:00:00[0m
[?25h[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/2.5 MB[0m [31m?[0m eta [36m-:--:--[0m[2K   [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[91m╸[0m [32m2.5/2.5 MB[0m [31m82.2 MB/s[0m eta [36m0:00:01[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m2.5/2.5 MB[0m [31m48.6 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.0/1.0 MB[0m [31m53.9 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m490.2/490.2 kB[0m [31m32.1 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m64.7/64.7 kB[0m [31m5.2 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[

In [None]:
import os
import platform

import openai
import chromadb

from langchain_openai import OpenAIEmbeddings, ChatOpenAI
from langchain_chroma import Chroma
from langchain_text_splitters import CharacterTextSplitter
from langchain_community.document_loaders import PyPDFLoader



API-KEYを読み込む
- エラーになる場合は、このテキストの最初にあるAPIキー設定箇所を再実行すること

In [None]:
from dotenv import load_dotenv
load_dotenv(verbose=True)

False

テスト用PDFとして、デジタル・ガバメント実行計画を利用する

In [None]:
if not os.path.exists('wp.pdf'):
  !wget https://cio.go.jp/sites/default/files/uploads/documents/2020_dg_all.pdf -O wp.pdf

--2026-01-10 15:19:20--  https://cio.go.jp/sites/default/files/uploads/documents/2020_dg_all.pdf
Resolving cio.go.jp (cio.go.jp)... 18.65.229.14, 18.65.229.116, 18.65.229.59, ...
Connecting to cio.go.jp (cio.go.jp)|18.65.229.14|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 3609651 (3.4M) [application/pdf]
Saving to: ‘wp.pdf’


2026-01-10 15:19:21 (5.11 MB/s) - ‘wp.pdf’ saved [3609651/3609651]



PDFローダでテキスト化して読み込み、読分割する

In [None]:
loader = PyPDFLoader("wp.pdf")
pages = loader.load_and_split()

5ページ目の文章を確認してみよう

In [None]:
pages[5].page_content

'5 \n \n１ はじめに  \n1.1 本計画の趣旨  \n \n「デジタルの活用により、一人ひとりのニーズに合ったサービスを選ぶことが\nでき、多様な幸せが実現できる社会～誰一人取り残さない、人に優しいデジタ\nル化～」 \nデジタル庁（仮称）(以下単に「デジタル庁」という。）の設置を見据えた\n「デジタル社会の実現に向けた改革の基本方針」（令和２年 12 月 25 日閣議決\n定。以下「デジタル改革基本方針」という。）において、デジタル社会の目指\nすビジョンが示された。 \n あわせて、社会全体のデジタル化を進めるために、まずは国・地方の「行\n政」が、自らが担う行政サービスにおいて、デジタル技術やデータを活用し\nて、利用者目線に立って新たな価値を創出するデジタル・トランスフォーメー\nションを実現し、「あらゆる手続が役所に行かずにできる」、「必要な給付が\n迅速に行われる」といった手続面はもちろん、規制や補助金等においてもデー\nタを駆使してニーズに即したプッシュ型のサービスを実現するなど、利用者目\n線の改革を進めていくことが必要であり、これにより、あらゆる世代、あらゆ\nる産業を対象とする行政サービスを通じて、社会全体にデジタル化によるメリ\nットを、誰一人取り残さない形で広くいきわたらせていくこと、また、行政が\n保有する様々なデータを、国民・企業が活用できるような形で連携できるデー\nタ連携基盤を提供し、民間において様々なデジタル・ビジネスを創出するな\nど、社会全体のデジタル化のための基盤を構築していくことが明記された。 \n \n社会全体のデジタル化を進める上で、デジタル・ガバメント推進の取組は重\n要な役割を担う。 \nデジタル・ガバメント推進に係る近年の取組としては、2019 年（令和元年）\nに改正後の情報通信技術を活用した行政の推進等に関する法律（平成 14 年法\n律第 151 号。以下「デジタル手続法」という。）が施行され、行政のあらゆる\nサービスを最初から最後までデジタルで完結させるために不可欠なデジタル３\n原則（①デジタルファースト：個々の手続・サービスが一貫してデジタルで完\n結する、②ワンスオンリー：一度提出した情報は、二度提出することを不要と\nする及び③コネクテッド・ワンストップ：民間サービスを含め、複数の手続・

ChatGPTを準備する

In [None]:
# OpenAI API キーは環境変数 OPENAI_API_KEY から自動的に読み取られます
llm = ChatOpenAI(temperature=0, model_name="gpt-3.5-turbo")

PDF文章をembeddingしてベクターストアに登録する

このベクターストアを LLM に与えることで、テキスト間の関連性について表現したベクトルデータを外部から与え、LLMで利用できるようになる

---

### コードの解説

```python
# Embeddingsモデルの作成
embeddings = OpenAIEmbeddings()

# ベクトルストアの作成
vectorstore = Chroma.from_documents(
    pages,                          # ドキュメントのリスト
    embedding=embeddings,           # 埋め込みモデル
    persist_directory="./chroma_db" # 保存先ディレクトリ
)
```

#### Chroma.from_documents() の動作

1. 各ドキュメントの `page_content` をベクトル化
2. ベクトルとメタデータをChromaDBに格納
3. `persist_directory` を指定すると自動的に永続化（再起動後も利用可能）

#### 【重要】新しいChromaの変更点

- `persist_directory` を指定すると**自動的に永続化**される
- 明示的な `vectorstore.persist()` の呼び出しは不要

In [None]:
embeddings = OpenAIEmbeddings()
# 新しいバージョンのChromaでは persist_directory を指定すると自動的に永続化されます
vectorstore = Chroma.from_documents(pages, embedding=embeddings, persist_directory="./chroma_db")
print(f"Created vectorstore with {vectorstore._collection.count()} documents")

Created vectorstore with 335 documents


PDF ドキュメントへ自然言語で問い合わせる

ここでは、回答文の作成に関連した元テキスト群についても示すように指定する

コードのポイントは次の通り
1. **`retriever.invoke(question)`**: 質問に類似したドキュメントを検索
2. **`format_docs(docs)`**: Documentリストを文字列に変換
3. **`rag_chain.invoke({...})`**: プロンプトの変数を辞書で渡す
4. **戻り値に `source_documents`** を含めることで、回答の根拠を確認可能

In [None]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough

# RAG用のプロンプトテンプレート
qa_template = """以下のコンテキストに基づいて質問に答えてください。コンテキストに答えがない場合は、「わかりません」と答えてください。

コンテキスト:
{context}

会話履歴:
{chat_history}

質問: {question}

回答:"""

qa_prompt = ChatPromptTemplate.from_template(qa_template)

# Retrieverを作成
retriever = vectorstore.as_retriever()

# ドキュメントを文字列に変換
def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)

# 会話履歴をフォーマット
def format_chat_history(chat_history):
    if not chat_history:
        return "なし"
    formatted = []
    for q, a in chat_history:
        formatted.append(f"Q: {q}\nA: {a}")
    return "\n".join(formatted)

# LCEL RAG Chain
rag_chain = qa_prompt | llm | StrOutputParser()

# 会話履歴対応のRAG関数
def pdf_qa_invoke(question: str, chat_history: list):
    # 関連ドキュメントを取得
    docs = retriever.invoke(question)
    context = format_docs(docs)
    history_text = format_chat_history(chat_history)

    # RAGチェーンを実行
    answer = rag_chain.invoke({
        "context": context,
        "chat_history": history_text,
        "question": question
    })

    return {
        "answer": answer,
        "source_documents": docs
    }

print("PDF QA system ready!")

PDF QA system ready!


デジタルインフラの整備の予算について問い合わせてみよう

In [None]:
query = "デジタルインフラの整備についてどのような予算がありますか？"
chat_history = []

result = pdf_qa_invoke(query, chat_history)

print(result["answer"])

デジタルインフラの整備に関連する予算は、2021年度（令和３年度）には87システムの整備・運用等に必要な予算計2,986億円が内閣官房及びデジタル庁に一括計上されています。


上記の回答に関連した元のテキスト群について確認する

In [None]:
print("Source documents:")
for i, doc in enumerate(result['source_documents']):
    print(f"\n--- Document {i+1} ---")
    print(doc.page_content[:200] + "...")

Source documents:

--- Document 1 ---
36 
 
ための手順等が明確化されたところであり、内閣官房は各府省への周知徹底を
引き続き実施する。 
 また、プロジェクトの規模や政策的重要性等の観点から重点的なプロジェク
ト管理を行う必要があると認められるプロジェクト（以下「政府重点プロジェ
クト」という。）については、プロジェクトに係る予算の執行府省の担当者、
総務省の担当者や財務省の担当者等も参加するプロジェクトチームを内閣官房
に編成...

--- Document 2 ---
18 
 
 この中で、デザインシステム、ベース・レジストリ等今までにないデジタ
ル・ガバメントの考え方が具体化してきている。2030 年（令和 12 年）も見据
えて今後も、本グランドデザインを参考にしつつ、デジタル・ガバメントの取
組を推進する。 
 
（参考）デジタル・ガバメント実現のためのグランドデザイン（概要） 
  
（出所：令和２年３月31 日CIO 連絡会議資料） 
 
4.2 デ...

--- Document 3 ---
37 
 
のうち、デジタルインフラの整備及び運用に係る予算については、原則とし
て、内閣官房が、IT 基本法第 26 条第 1 項に定める高度情報通信ネットワーク
社会の形成に関する施策の実施の推進のための事務の一環として一括して要
求・計上し、各府省に配分することとしている。 
 情報システム関係予算については、2020 年度（令和２年度）において一括要
求・一括計上の開始年として、デジタルイ...

--- Document 4 ---
8 
 
る。ただし、本計画ではデジタル庁の設置以前の組織、制度等を前提とした記
述も含まれているところであり、デジタル庁が発足した暁には、改めて本計画
の見直しや、他の基本計画との関係の整理等を検討する。 
 
なお、本計画はデジタル手続法第４条に基づく情報通信技術を利用して行わ
れる手続等に係る国の行政機関等の情報システムの整備に関する計画として位
置付けることとする。 
 
1.2 計画期間...


デジタルインフラの整備により何が影響を受けるか問い合わせる

In [None]:
chat_history = [(query, result["answer"])]
query2 = "デジタルインフラの整備により何が影響を受けるか？"

result2 = pdf_qa_invoke(query2, chat_history)

print(result2["answer"])

デジタルインフラの整備により、政府全体として共用化・標準化が進み、投資効率の向上や政府横断的な観点からの効果が期待されます。また、デジタルデバイド対策において、年齢や障害の有無、性別、国籍、経済的な理由にかかわらず、全ての国民にデジタル化の恩恵が広く行き渡る環境の整備にも影響を与えることが期待されます。


ChatGPT による回答の正確性については保証されていないが、難解な資料を素早く理解するにはかなり有効であるといえよう

# RAG (Retrieval Augmented Generative)

(A Cheat Sheet and Some Recipes For Building Advanced RAGで紹介されている内容)


## RAG の基本

RAGは、ユーザーの質問に対して、外部データベースから関連するドキュメントを取得し、そのドキュメントと元々のユーザーの質問をセットにしてLLMに渡され、LLMは、この内容をもとに回答を生成する手法

既に述べたLangChainのDictionaryがこれに相当する
- 目的はハルシネーションを抑え、最新の情報や、極めて専門的もしくは独自の情報を用いて回答を作成したいときなど

RAGにより以下が可能となる
- ハルシネーションやノイズを削減させる
- 情報不十分のとき回答しないようにする
- 複数の情報を参照して回答する
- 情報ソースの誤りを指摘できる

RAG品質は、次の指標で計測する
- コンテキストの関連性
- 回答の関連性
- 忠実度合



## RAGの応用

複雑な質問や高度なデータソースに対応するため、次の2つの重要な要件を満たすために高度な技術や戦略について述べる

- Retrieval（検索）: ユーザーの質問に最も関連性の高いドキュメントを見つけること
- Generation（生成）: 検索されたドキュメントを効果的に利用し、回答を生成すること

これを実現する技術的手法は以下の通りである

### 検索の要件に対する技術

- Chunk-size Optimization（チャンクサイズの最適化）:  
検索対象のドキュメントを適切なサイズに分割することで、情報の関連性を高める手法  
検索対象が多すぎる場合、効率が低下するため、適切なサイズのチャンクに分割することが重要

- Sliding Window Chunking（スライディングウィンドウチャンク分割）:  
情報の見落としを防ぐために、ドキュメントをオーバーラップしながらスライドさせて分割する手法  
重要な情報がチャンクの境界に分割されるのを防ぐ

- Structured Knowledge Integration（構造化ナレッジの統合）:   
構造化データ（例：データベースやスプレッドシート）を検索システムに統合し、より精度の高い検索結果を提供する手法

- Metadata Attachments（メタデータの付与）:   
メタデータ（例：著者、出版日、トピックなど）を利用して、検索精度を向上させる手法  
文脈に沿った関連性の高いドキュメントを絞り込むことができる

- Knowledge Graphs（ナレッジグラフ）:   
ナレッジグラフを活用し、ドキュメント間の関連性を明確にする手法  
情報同士の関係性を視覚化することで、検索の精度が向上する

- Mixed Retrieval（混合検索）:   
複数の検索アルゴリズムを組み合わせ、情報源から最も有用なドキュメントを取得する手法  
異なるアプローチを組み合わせることで、異なる角度から関連性が高められる

- Question Embedding Transformation（質問の埋め込み変換）:  
 質問を埋め込み表現に変換し、情報と質問の一致を効果的に計算する手法  
質問の文脈を理解し、より関連性の高い検索結果が取得できる

### 生成の要件に対する技術

- Information Compression（情報の圧縮）:   
生成モデルが扱いやすい形に情報を圧縮する手法  
例えば、ノイズを減らしたり、重要な情報を抽出してから生成を行う

- Generator Fine-Tuning（生成モデルの微調整）: 検索されたドキュメントに基づいて、生成モデルを特定のタスクに適応させるための微調整を行う手法  
生成された回答の精度が向上する

- Result Re-Ranking（結果の再ランキング）: 一度生成された結果を再度評価し、最も関連性が高いものを再ランキングする手法  
ユーザーに提供する最終結果の品質が向上する

- Adapter Methods（アダプターメソッド）: 生成モデルに外部情報を柔軟に取り入れるための手法  
新しい情報を簡単に生成モデルに適応させることができる

### 同時に2つの要件を満たす技術
- Monolithic Fine-Tuning（単一モデルの微調整）:   
検索と生成の両方を同時に最適化するために、単一の大規模モデルを微調整する手法  
情報検索と生成のプロセスが統合され、シームレスな処理が可能になる

- Retrieval-Foundational Model（検索基盤モデル）:   
検索モデルそのものを基礎モデルに統合し、検索結果と生成がより密接に結びついた形で動作するように設計する手法

- Generator-Enhanced Retrieval（生成強化型検索）:   
生成モデルを利用して、検索結果のリランキングやフィルタリングを行う手法  
生成モデルが得た情報をさらに効果的に検索に活用できる

- Iterative Retrieval-Generation（反復検索生成）:   
検索と生成のプロセスを繰り返し行い、精度の高い回答を得る手法  
例えば、一度検索された結果を元に、再度質問を修正しながらプロセスを繰り返す

### RouterRetriever

RAGで複数の埋め込みモデルを利用し、文書検索精度を向上させる手法

(KAISTとアレン人工知能研究所により提案)

通常のRAGは、埋め込みモデル（エンべディングモデル）を1つだけ利用して、ベクトル検索する
- ユーザーの質問とソースとなる大量の文書を、ただ一つの同じ埋め込みモデルでベクトル化して、検索している
- この埋め込みモデルとして、OpenAIが公開している「text-embedding」といった汎用的モデルの利用が一般的

汎用的な埋め込みモデルではなく、そのドメインに特化したモデルを利用することで検索精度が高くなる

RouterRetrieverは、ユーザーの質問のジャンルに応じて、複数の埋め込みモデルを使い分ける手法

#### 従来手法における問題点

従来はユーザーの質問に専門的な内容が入っている場合、文書検索が適切に行えなかった

これは、RAGの文書検索がもつ以下のジレンマが関係している

- RAGである分野の検索に強くするには、その分野に特化した埋め込みモデルにするのが一番よい
- 一方でその分野に特化すると、それ以外の質問には、弱くなる

現状は、これに対し、全ての分野に平均的に強い「バランス型」の埋め込みモデルを1つだけ使うという方針であった
- どのような問いあわせでも平均的な性能が獲得できる

性能を上げるには、ハイブリッド学習のように、複数の埋め込みモデルを動的に使い分ける
- ユーザーからの質問に対して、「どの埋め込みモデルを使うの最適か」を判断し、そのモデルで検索を行う


#### 事前にやっておくこと

- 専門家モデル（例えば、医学特化の埋め込みモデルなど）を複数作成しておく
- `Contriever`という汎用的な埋め込みモデルをLoRA（Low-Rank Adaptation）して複数作成しておく
  - ユーザーの質問には複数のモデルを使い分けますが、ドキュメントの埋め込みには、通常通り1つの埋め込みモデル（Contriever）のみを利用
- 「どの埋め込みモデルを使うの最適か」を、動的に判断するための仕組みを構築
- ユーザーが質問を入力してきた際に、ユーザーの質問を汎用的なモデル（Contriever）でベクトル化
  - このベクトルと、事前に用意した「各専門家モデルが得意なタイプの質問のベクトル」を比較

#### 埋め込みモデルの選択

で最もスコアが高かったモデルを利用して、もう一度ユーザーの質問をベクトル化

このベクトルを利用して、検索対象である、大量の文書を検索（ここは通常のRAGと同じ）


BEIRベンチマークにおいて、MSMARCOで訓練された単一モデルに比べて+2.1、マルチタスク訓練モデルに比べて+3.2のnDCG@10スコア向上を達成
ゲート（専門家モデル）の数を増やすにつれて、一貫して性能が向上
ドメインに特化した専門家モデルがないデータセットに対しても汎用性を持つことが確認されている

# その他トピック

ここ3ヵ月で次の通り、追いかけるのも大変
- 1年たち、既に古すぎる情報となった

## DALL-E3
画像生成AIの中でも高精度・高品質画像を作成可能なAI

## SDXL Turbo
リアルタイムでプロンプトに反応して画像生成
https://clipdrop.co/ja/stable-diffusion-turbo

## Adobe Firefly
ようやくAdobeも動きだし、著作権・商用利用問題クリアの画像生成AIを公開

## Notion AIやCursorなどのLLM統合
- Notionは様々な機能を持つメモ帳
  - AI拡張は有料
- Cursorはプログラミング用統合環境
  - VSCodeオワコンといわれている

## Claude
- ChatGPT並み(かそれ以上)の精度を持つLLM

## Google Gemini
- Googleとの連携がとりやすく、使い勝手の良いLLM
- Colabとも連携

## Runway Gen-2
画像から高精細かつ高品質な動画を生成
- 動かしたいものを指定したり、プロンプトで指示することができる


# 課題1(LangChain)

PDFファイル解析アプリケーションの例を、LangChainを用いたチャットボット形式に修正しなさい

# 課題2(LangChainによるチューニング)

履歴付きチャットボットを改造し、常に回答が子供の対応であるようにプロンプトエンジニアリングを行いなさい

単純に、入力問い合わせに対して、「考え方や言葉遣いを6歳の子供のようにして答えなさい」といった言葉を付け加えなさい

# 課題3(GPTs)

ChatGPTのGPTsを試しなさい

この課題を解くには、ChatGPT4を利用する必要があるため、課金が伴う点に注意しなさい

例えば、

- 政府発行の文章や、博物館などの解説ページなどの情報を参照し、専門的な内容に回答するチャットを作成する
  - 会社の内部文章などが面白いが、普通に規定でできないであろう
  - 仮想的にそのような「公開されていない情報」(自分の日記など)について試すとよい
- 日本語で必ず回答するようにする
- 発言の最後に、専門用語についての解説を付与するようにする

など

また、GPTsにおけるAPI操作機能を用いて、気温や湿度などを住所から入手し、適切な服装などを指示するGPTを作成しなさい

https://weather.tsukumijima.net/ などを利用するとよい

さらに、HotPepper APIを用いて、お店を検索するGPTを作成しなさい
- これについて、HotPepper側の制限によりアクセスが拒否されている場合がある
- この場合は、Proxyを立てること