# LangChain Multi-Provider Sample
このノートブックでは、プロジェクトのAPIを使ってOllamaとGeminiの両方に問い合わせる方法を示します。
`config/models.yaml`でモデル設定を管理し、`create_client_from_model_name`で呼び出します。

In [2]:
# 必要なヘルパーをインポートし、利用可能なモデル設定を表示
from src.config import create_client_from_model_name, list_model_names
from langchain_core.messages import SystemMessage, HumanMessage
model_names = list_model_names()
print('登録済みモデル:', model_names)

登録済みモデル: ['ollama_gemma3-27b', 'gemini_25flash']


## Ollamaの例
`models.yaml`で定義したOllama設定を利用して問い合わせます。

In [4]:
# Ollama設定（例: ollama_default）で会話を送信
ollama_client = create_client_from_model_name('ollama_gemma3-27b')
ollama_messages = [
    SystemMessage(content='あなたは誠実な日本語アシスタントです'),
    HumanMessage(content='LangChainを使った実験を簡単に説明してください'),
]
ollama_reply = ollama_client.invoke(ollama_messages)
ollama_reply.content

'LangChainを使った実験を簡単に説明しますね。\n\nLangChainは、大規模言語モデル（LLM）を様々なデータソースやツールと連携させて、より高度なアプリケーションを構築するためのフレームワークです。実験と聞くと難しそうに聞こえるかもしれませんが、LangChainを使うと、LLMの可能性を試すための様々な試みを比較的簡単に実現できます。\n\n**LangChainを使った実験の例と、その目的、簡単な流れをいくつか紹介します。**\n\n1. **質問応答システム:**\n   * **目的:** 特定のドキュメント（PDF、Webサイトなど）の内容に基づいて質問に答えるシステムを構築する。\n   * **流れ:**\n      1. ドキュメントを読み込み、テキストに変換する。\n      2. 変換したテキストをLangChainの「Document Loader」で読み込む。\n      3. 読み込んだドキュメントを「Text Splitter」で分割し、LLMが処理しやすいようにする。\n      4. 分割したテキストを「Vectorstore」に保存する（ベクトルデータベース）。\n      5. ユーザーからの質問を受け取り、質問をベクトル化する。\n      6. ベクトル化された質問とVectorstore内のテキストを比較し、関連性の高い情報を検索する。\n      7. 検索された情報と質問をLLMに渡し、回答を生成する。\n\n2. **要約:**\n   * **目的:** 長いテキストを要約する。\n   * **流れ:**\n      1. 要約したいテキストをLangChainに読み込ませる。\n      2. LangChainの「Summarization Chain」を使ってテキストを要約する。\n      3. 生成された要約を確認する。\n\n3. **チャットボット:**\n   * **目的:** ユーザーとの対話を通じて、タスクを実行したり、情報を提供したりするチャットボットを構築する。\n   * **流れ:**\n      1. ユーザーからの入力を受け取る。\n      2. 入力をLLMに渡し、応答を生成する。\n      3. 生成された応答をユーザーに返す。\n

## Geminiの例
Google Geminiの設定を使って同様に問い合わせます。

In [None]:
# Gemini設定（例: gemini_flash）で問い合わせ
gemini_client = create_client_from_model_name('gemini_flash')
gemini_messages = [
    SystemMessage(content='You are a concise technical assistant'),
    HumanMessage(content='Summarize how this project uses LangChain.'),
]
gemini_reply = gemini_client.invoke(gemini_messages)
gemini_reply.content

## ストリーム受信の例
応答をトークンごとに受け取りたい場合は`stream`を利用してください。

In [5]:
# Ollama設定でストリーミング
for chunk in create_client_from_model_name('ollama_gemma3-27b').stream(ollama_messages):
    print(chunk, end='')
print()

LangChainを使った実験を簡単に説明しますね。

LangChainは、大規模言語モデル（LLM）を様々なデータソースやツールと連携させて、より複雑なタスクを実行するためのフレームワークです。実験は、このLangChainを使って、LLMの可能性を探ったり、特定のタスクに対する最適な構成を見つけたりすることを指します。

**実験の基本的な流れ:**

1. **目的の設定:** 何を試したいのか、どんな問題を解決したいのかを明確にします。例えば、「特定のドキュメントの内容を要約する」「質問応答システムを作る」「チャットボットを作る」など。
2. **コンポーネントの選択:** LangChainには様々なコンポーネント（モデル、プロンプト、チェーン、インデックスなど）があります。目的に合わせて適切なコンポーネントを選びます。
3. **チェーンの構築:** 選んだコンポーネントを組み合わせて、処理の流れ（チェーン）を定義します。例えば、「ドキュメントを読み込み -> 関連する情報を検索 -> LLMに質問 -> 回答を生成」のような流れです。
4. **実行と評価:** チェーンを実行し、結果を評価します。結果が期待通りでなければ、コンポーネントの変更やチェーンの調整を行います。
5. **繰り返し:** 上記のステップを繰り返し、より良い結果が得られるように改善していきます。

**実験の例:**

* **ドキュメント要約:**
    * **目的:** 長いドキュメントを簡潔に要約する。
    * **コンポーネント:** ドキュメントローダー、テキスト分割器、LLM、要約チェーン
    * **実験:** 様々なLLMやプロンプトを試して、最も自然で正確な要約を生成できる組み合わせを見つける。
* **質問応答:**
    * **目的:** 特定のドキュメントに関する質問に答える。
    * **コンポーネント:** ドキュメントローダー、テキスト分割器、ベクトルデータベース、LLM、質問応答チェーン
    * **実験:** ベクトルデータベースの種類やLLMのパラメータを調整して、質問に対する回答の精度を向上させる。
* **チャットボット:**
    * **目的:** ユーザーとの対話を通じて、特定のタスクを実行する。
   