<a href="https://colab.research.google.com/github/takaaki-yayoi/langchain_tutorial/blob/main/langchain_tutorial_notebook.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 🦜🔗 LangChain 入門ガイド

## 📚 このノートブックについて

このノートブックでは、LangChainの基本概念から実践的な使い方まで、段階的に学習していきます。

### 学習内容
1. **環境構築** - 必要なライブラリのインストール
2. **基本概念** - LLM、プロンプトテンプレート、チェーン
3. **実践演習** - 簡単なアプリケーションの構築
4. **応用例** - RAG（Retrieval-Augmented Generation）の実装

---

## 📦 Step 1: 環境セットアップ

まずは必要なライブラリをインストールしましょう。Google Colabでは、以下のコマンドを実行するだけで準備完了です。

In [1]:
# 基本的なLangChainパッケージのインストール
!pip install -q langchain langchain-community langchain-openai

# 追加の便利なパッケージ
!pip install -q chromadb tiktoken python-dotenv

print("✅ インストール完了！")

[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/2.5 MB[0m [31m?[0m eta [36m-:--:--[0m[2K   [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[91m╸[0m [32m2.5/2.5 MB[0m [31m88.7 MB/s[0m eta [36m0:00:01[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m2.5/2.5 MB[0m [31m42.9 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m74.5/74.5 kB[0m [31m4.3 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m50.9/50.9 kB[0m [31m1.5 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m67.3/67.3 kB[0m [31m5.0 MB/s[0m eta [36m0:00:00[0m
[?25h  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25hdone
  Preparing metadata (pyproject.toml) ... [?25l[?25hdone
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m19.8/19.8 MB[0m [31m64.7 MB/s[0m eta [36m0:00:0

### 🔑 API キーの設定

LangChainでLLMを使用するには、APIキーが必要です。ここではOpenAIを例に設定方法を説明します。

**重要**: APIキーは絶対に公開しないでください！

In [3]:
import os
from getpass import getpass

# Google Colabのシークレット機能を使うか、直接入力
# 方法1: 直接入力（セキュアな入力）
#os.environ["openai_api_key"] = getpass("OpenAI APIキーを入力してください: ")

# 方法2: Google Colabのシークレット機能を使う場合
from google.colab import userdata
os.environ["OPENAI_API_KEY"] = userdata.get('openai_api_key')

print("✅ APIキーが設定されました")

✅ APIキーが設定されました


---

## 🎯 Step 2: LangChainの基本概念

### 2.1 LLM（Large Language Model）の基本

LangChainの中心となるのはLLMです。まずは最もシンプルな使い方から始めましょう。

In [4]:
from langchain_openai import ChatOpenAI

# LLMの初期化
llm = ChatOpenAI(
    model="gpt-3.5-turbo",
    temperature=0.7,  # 創造性のレベル（0-1）
)

# シンプルな使用例
response = llm.invoke("LangChainとは何ですか？日本語で簡潔に説明してください。")
print("🤖 AIの回答:")
print(response.content)

🤖 AIの回答:
LangChainは、言語翻訳技術を活用して、異なる言語間でのコミュニケーションを支援するプラットフォームやサービスのことを指します。


### 2.2 プロンプトテンプレート

プロンプトテンプレートを使うと、動的にプロンプトを生成できます。これは実際のアプリケーション開発で非常に重要です。

In [5]:
from langchain.prompts import ChatPromptTemplate

# テンプレートの作成
template = ChatPromptTemplate.from_messages([
    ("system", "あなたは{role}の専門家です。"),
    ("human", "{topic}について、初心者にもわかるように説明してください。")
])

# テンプレートの使用
prompt = template.format_messages(
    role="プログラミング教育",
    topic="オブジェクト指向プログラミング"
)

response = llm.invoke(prompt)
print("🎓 カスタマイズされた回答:")
print(response.content)

🎓 カスタマイズされた回答:
オブジェクト指向プログラミング（Object-Oriented Programming、OOP）は、プログラミングの考え方の一つで、プログラムをオブジェクトと呼ばれる要素に分割して設計する方法です。

オブジェクトは、それぞれ特定の役割や機能を持っており、他のオブジェクトと協力して処理を行います。例えば、自動車というオブジェクトがある場合、そのオブジェクトには「走る」という機能や「色」という特性があると考えることができます。

オブジェクト指向プログラミングでは、このようなオブジェクト同士の相互作用を通じてプログラムを構築します。具体的には、クラスという設計図を使ってオブジェクトを作成し、それらのオブジェクト同士がメッセージをやり取りして処理を行います。

オブジェクト指向プログラミングの利点として、コードの再利用性や保守性が高くなること、システムの柔軟性や拡張性が向上すること、コードの理解がしやすくなることなどが挙げられます。

初心者がオブジェクト指向プログラミングを学ぶ際には、まず基本的な概念や用語を理解し、実際にプログラムを書きながらオブジェクト指向の考え方を体験することが大切です。


### 2.3 チェーン（Chain）- LangChainの核心

チェーンは複数のコンポーネントを連結して、より複雑な処理を実現します。

In [6]:
from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate

# ステップ1: 要約用のチェーン
summarize_template = PromptTemplate(
    input_variables=["text"],
    template="以下のテキストを3行で要約してください:\n\n{text}"
)

summarize_chain = LLMChain(
    llm=llm,
    prompt=summarize_template,
    output_key="summary"
)

# ステップ2: 翻訳用のチェーン
translate_template = PromptTemplate(
    input_variables=["summary"],
    template="以下の日本語を英語に翻訳してください:\n\n{summary}"
)

translate_chain = LLMChain(
    llm=llm,
    prompt=translate_template,
    output_key="translation"
)

# チェーンの連結
from langchain.chains import SequentialChain

overall_chain = SequentialChain(
    chains=[summarize_chain, translate_chain],
    input_variables=["text"],
    output_variables=["summary", "translation"],
    verbose=True  # 処理過程を表示
)

# 実行例
sample_text = """
LangChainは、大規模言語モデル（LLM）を活用したアプリケーション開発を
簡素化するためのフレームワークです。プロンプトの管理、チェーンの構築、
エージェントの作成、メモリの実装など、LLMアプリケーションに必要な
様々な機能を提供しています。開発者は、これらの機能を組み合わせることで、
複雑なAIアプリケーションを効率的に構築できます。
"""

result = overall_chain({"text": sample_text})
print("\n📝 要約結果:")
print(result["summary"])
print("\n🌐 英語翻訳:")
print(result["translation"])

  summarize_chain = LLMChain(
  result = overall_chain({"text": sample_text})




[1m> Entering new SequentialChain chain...[0m

[1m> Finished chain.[0m

📝 要約結果:
LangChainはLLMを利用したアプリケーション開発を簡素化するフレームワーク。
プロンプト管理やエージェント作成など、様々な機能を提供。
開発者はこれらを組み合わせて複雑なAIアプリケーションを効率的に構築できる。

🌐 英語翻訳:
LangChain is a framework that simplifies application development using LLM. It provides various functions such as prompt management and agent creation. Developers can efficiently build complex AI applications by combining these functions.


---

## 🚀 Step 3: 実践的な応用例

### 3.1 簡単なQ&Aシステムの構築

In [7]:
from langchain.memory import ConversationBufferMemory
from langchain.chains import ConversationChain

# メモリ付きの会話チェーンを作成
memory = ConversationBufferMemory()
conversation = ConversationChain(
    llm=llm,
    memory=memory,
    verbose=True
)

print("💬 会話型AIアシスタント")
print("='exit'と入力すると終了します）\n")

# 会話のデモ
questions = [
    "私の名前は太郎です。プログラミングを勉強しています。",
    "私の名前を覚えていますか？",
    "私は何を勉強していると言いましたか？"
]

for question in questions:
    print(f"\n👤 You: {question}")
    response = conversation.predict(input=question)
    print(f"🤖 AI: {response}")

  memory = ConversationBufferMemory()
  conversation = ConversationChain(


💬 会話型AIアシスタント
='exit'と入力すると終了します）


👤 You: 私の名前は太郎です。プログラミングを勉強しています。


[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:

Human: 私の名前は太郎です。プログラミングを勉強しています。
AI:[0m

[1m> Finished chain.[0m
🤖 AI: こんにちは、太郎さん！プログラミングを勉強しているんですね。どんな言語を勉強していますか？私はPythonやJavaScriptなどの言語に詳しいですよ。何か質問があればお気軽にどうぞ！

👤 You: 私の名前を覚えていますか？


[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:
Human: 私の名前は太郎です。プログラミングを勉強しています。
AI: こんにちは、太郎さん！プ

### 3.2 ドキュメント分析（簡易RAG）

RAG（Retrieval-Augmented Generation）は、外部知識を活用してより正確な回答を生成する技術です。

In [8]:
from langchain.text_splitter import CharacterTextSplitter
from langchain_community.vectorstores import Chroma
from langchain_openai import OpenAIEmbeddings

# サンプルドキュメント
documents = [
    """LangChainは2022年10月にHarrison Chaseによって作成されました。
    オープンソースプロジェクトとして、GitHubで公開されています。""",

    """LangChainの主な機能には、プロンプトテンプレート、チェーン、
    エージェント、メモリ管理などがあります。""",

    """LangChainは、Python版とJavaScript/TypeScript版が提供されており、
    様々なLLMプロバイダー（OpenAI、Anthropic、Googleなど）に対応しています。"""
]

# テキストを小さなチャンクに分割
text_splitter = CharacterTextSplitter(chunk_size=100, chunk_overlap=20)
texts = text_splitter.create_documents(documents)

# ベクトルストアの作成
embeddings = OpenAIEmbeddings()
vectorstore = Chroma.from_documents(texts, embeddings)

# 質問応答チェーンの作成
from langchain.chains import RetrievalQA

qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=vectorstore.as_retriever(),
    return_source_documents=True
)

# 質問してみる
question = "LangChainを作った人は誰ですか？"
result = qa_chain({"query": question})

print(f"❓ 質問: {question}")
print(f"\n💡 回答: {result['result']}")
print(f"\n📚 参照したドキュメント:")
for doc in result['source_documents']:
    print(f"  - {doc.page_content[:50]}...")

❓ 質問: LangChainを作った人は誰ですか？

💡 回答: LangChainはHarrison Chaseによって作成されました。

📚 参照したドキュメント:
  - LangChainは2022年10月にHarrison Chaseによって作成されました。
    ...
  - LangChainは、Python版とJavaScript/TypeScript版が提供されており、...
  - LangChainの主な機能には、プロンプトテンプレート、チェーン、
    エージェント、メモリ管...


---

## 🎨 Step 4: カスタムツールとエージェント

エージェントは、与えられたタスクを達成するために、利用可能なツールを自律的に選択して使用します。

In [9]:
from langchain.tools import tool
from langchain.agents import create_react_agent, AgentExecutor
from langchain import hub

# カスタムツールの作成
@tool
def calculate(expression: str) -> str:
    """数式を計算します。例: '2 + 2', '10 * 5'"""
    try:
        result = eval(expression)
        return f"計算結果: {result}"
    except:
        return "計算エラー: 有効な数式を入力してください"

@tool
def get_word_count(text: str) -> str:
    """テキストの単語数を数えます"""
    words = text.split()
    return f"単語数: {len(words)}語"

# ツールのリスト
tools = [calculate, get_word_count]

# プロンプトテンプレートの取得（ReActプロンプト）
prompt = hub.pull("hwchase17/react")

# エージェントの作成
agent = create_react_agent(
    llm=llm,
    tools=tools,
    prompt=prompt
)

# エージェントエグゼキューターの作成
agent_executor = AgentExecutor(
    agent=agent,
    tools=tools,
    verbose=True,
    handle_parsing_errors=True
)

# エージェントの実行
questions = [
    "15 * 23を計算してください",
    "'Hello world this is a test'の単語数を教えてください"
]

for q in questions:
    print(f"\n🤔 質問: {q}")
    result = agent_executor.invoke({"input": q})
    print(f"✅ 結果: {result['output']}")




🤔 質問: 15 * 23を計算してください


[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m数式を計算する必要があります
Action: calculate
Action Input: '15 * 23'[0m[36;1m[1;3m計算結果: 15 * 23[0m[32;1m[1;3m計算結果が出力されました
Final Answer: 345[0m

[1m> Finished chain.[0m
✅ 結果: 345

🤔 質問: 'Hello world this is a test'の単語数を教えてください


[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mテキストの単語数を数える必要があります。
Action: Action Input: get_word_count('Hello world this is a test')[0m is not a valid tool, try one of [calculate, get_word_count].[32;1m[1;3mI made a mistake, I should use get_word_count() instead of calculate().
Action: Action Input: get_word_count('Hello world this is a test')[0m is not a valid tool, try one of [calculate, get_word_count].[32;1m[1;3mI need to provide the correct input format for get_word_count().
Action: Action Input: get_word_count('Hello world this is a test')[0m is not a valid tool, try one of [calculate, get_word_count].[32;1m[1;3mI made a mistake in the format of the inp

---

## 📊 Step 5: 出力パーサー

構造化された出力を得るために、出力パーサーを使用します。

In [10]:
from langchain.output_parsers import PydanticOutputParser
from pydantic import BaseModel, Field
from typing import List

# 出力形式の定義
class BookRecommendation(BaseModel):
    title: str = Field(description="本のタイトル")
    author: str = Field(description="著者名")
    reason: str = Field(description="推薦理由")
    difficulty: int = Field(description="難易度（1-5）")

class BookList(BaseModel):
    books: List[BookRecommendation] = Field(description="推薦書籍のリスト")

# パーサーの作成
parser = PydanticOutputParser(pydantic_object=BookList)

# プロンプトテンプレート
template = PromptTemplate(
    template="""プログラミング初心者向けの本を3冊推薦してください。

{format_instructions}

日本語で回答してください。""",
    input_variables=[],
    partial_variables={"format_instructions": parser.get_format_instructions()}
)

# チェーンの作成と実行
chain = LLMChain(llm=llm, prompt=template)
output = chain.run({})

# パース
try:
    result = parser.parse(output)
    print("📚 プログラミング初心者向けおすすめ本\n")
    for i, book in enumerate(result.books, 1):
        print(f"{i}. 『{book.title}』")
        print(f"   著者: {book.author}")
        print(f"   難易度: {'⭐' * book.difficulty}")
        print(f"   理由: {book.reason}\n")
except Exception as e:
    print(f"パースエラー: {e}")
    print(f"生の出力: {output}")

  output = chain.run({})


📚 プログラミング初心者向けおすすめ本

1. 『Python言語プログラミング入門』
   著者: 宮本和典
   難易度: ⭐⭐
   理由: Pythonの基本から応用まで丁寧に解説しており、初心者にもわかりやすい内容となっています。

2. 『Head First Java 第2版』
   著者: Kathy Sierra, Bert Bates
   難易度: ⭐⭐⭐
   理由: Javaの学習には欠かせない一冊であり、ユーモア溢れる解説が理解を助けてくれます。

3. 『JavaScript本格入門』
   著者: 山田祥寛
   難易度: ⭐⭐⭐
   理由: JavaScriptの基本から応用までを網羅した内容であり、実践的な学習ができます。



---

## 🏃 練習問題

ここまで学んだ内容を活用して、以下の課題に挑戦してみましょう！

In [None]:
# 練習問題1: 料理レシピ生成チェーンを作成
# ヒント: 材料を入力として、レシピを生成するチェーンを作ってみましょう

# あなたのコードをここに書いてください
recipe_template = PromptTemplate(
    input_variables=["ingredients"],
    template="""以下の材料を使って作れる料理のレシピを1つ提案してください：

材料: {ingredients}

レシピには以下を含めてください：
- 料理名
- 必要な調理時間
- 手順（箇条書き）
- ワンポイントアドバイス"""
)

# チェーンを作成して実行してみましょう
# recipe_chain = ...
# result = ...

In [None]:
# 練習問題2: 感情分析ツールの作成
# ヒント: テキストを入力として、感情（ポジティブ/ネガティブ/中立）を判定

# あなたのコードをここに書いてください
from enum import Enum

class Sentiment(str, Enum):
    positive = "ポジティブ"
    negative = "ネガティブ"
    neutral = "中立"

class SentimentAnalysis(BaseModel):
    sentiment: Sentiment = Field(description="感情の分類")
    confidence: float = Field(description="確信度（0-1）")
    explanation: str = Field(description="判定理由")

# パーサーとチェーンを作成して実装してみましょう
# sentiment_parser = ...
# sentiment_chain = ...

---

## 📚 さらなる学習リソース

### 公式ドキュメント
- [LangChain Documentation](https://python.langchain.com/docs/get_started/introduction)
- [LangChain API Reference](https://api.python.langchain.com/)

### 次のステップ
1. **より高度なRAGの実装**: より大きなドキュメントセットでの検索
2. **カスタムエージェント**: 独自のツールセットを持つエージェントの作成
3. **ストリーミング**: リアルタイムレスポンスの実装
4. **LangSmith**: デバッグとモニタリング
5. **LangServe**: APIとしてのデプロイ

### コミュニティ
- [GitHub](https://github.com/langchain-ai/langchain)
- [Discord](https://discord.gg/langchain)
- [Twitter](https://twitter.com/langchainai)

---

## 🎉 おめでとうございます！

このノートブックでLangChainの基礎を学びました。ここで学んだ概念を組み合わせることで、
より複雑で実用的なAIアプリケーションを構築できます。

**Happy Coding! 🚀**

---

## 🔧 トラブルシューティング

### よくある問題と解決方法

1. **APIキーエラー**:
   - OpenAIのAPIキーが正しく設定されているか確認
   - APIキーの有効期限や利用制限を確認

2. **インポートエラー**:
   - すべての必要なパッケージがインストールされているか確認
   - Google Colabのランタイムを再起動してみる

3. **メモリ不足**:
   - より小さいモデルを使用
   - バッチサイズを減らす

4. **レート制限**:
   - API呼び出しの間に適切な遅延を入れる
   - より高いティアのAPIプランを検討