# LangChain
「LangChain」は、LLMを活用したアプリケーションの開発を支援するライブラリです。
特に、開発のライフサイクルの最適化を狙っています。同様のことはChatGPTのサービスでも可能ですが、LangChainはOSSなので、他のプラットフォームやOSSとの組み合わせによって力を発揮します。

「LLM」という革新的テクノロジーによって、開発者は今まで不可能だったことが可能になりました。しかし、「LLM」を単独で使用するだけでは、真に強力なアプリケーションを作成するのに不十分です。真の力は、それを他の 計算 や 知識 と組み合わせた時にもたらされます。「LangChain」は、そのようなアプリケーションの開発をサポートします。

https://python.langchain.com/docs/use_cases

### Overview:
- Installation
- LLMs
- Prompt Templates
- Chains
- Agents and Tools
- Memory
- Document Loaders
- Indexes

## Installation

In [4]:
!pip install langchain

Collecting langchain
  Downloading langchain-0.1.6-py3-none-any.whl (811 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/811.8 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [91m━━━━━━━[0m[90m╺[0m[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m143.4/811.8 kB[0m [31m4.2 MB/s[0m eta [36m0:00:01[0m[2K     [91m━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[91m╸[0m[90m━━━━━━━━━━━━━[0m [32m542.7/811.8 kB[0m [31m8.0 MB/s[0m eta [36m0:00:01[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m811.8/811.8 kB[0m [31m8.2 MB/s[0m eta [36m0:00:00[0m
Collecting dataclasses-json<0.7,>=0.5.7 (from langchain)
  Downloading dataclasses_json-0.6.4-py3-none-any.whl (28 kB)
Collecting jsonpatch<2.0,>=1.33 (from langchain)
  Downloading jsonpatch-1.33-py2.py3-none-any.whl (12 kB)
Collecting langchain-community<0.1,>=0.0.18 (from langchain)
  Downloading langchain_community-0.0.19-py3-none-any.whl (1.6 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

## 1. LLMs

すべてのLLMのための汎用インターフェイス。LangChainで接続できるLLMプロバイダはこちら: https://python.langchain.com/en/latest/modules/models/llms/integrations.html

In [None]:
!pip install openai

In [None]:
import os
os.environ["OPENAI_API_KEY"] ="YOUR_OPENAI_TOKEN"

In [None]:
from langchain.llms import OpenAI

llm = OpenAI(temperature=0.9)  # model_name="text-davinci-003"
text = "What would be a good company name for a company that makes colorful socks?"
print(llm(text))

In [2]:
!pip install huggingface_hub



In [None]:
os.environ["HUGGINGFACEHUB_API_TOKEN"] = "YOUR_HF_TOKEN"

In [None]:
from langchain import HuggingFaceHub

In [None]:
# https://huggingface.co/google/flan-t5-xl
llm = HuggingFaceHub(repo_id="google/flan-t5-xl", model_kwargs={"temperature":0, "max_length":128})

llm("translate English to German: How old are you?")

## 2. Prompt Templates

LangChainはプロンプトの管理と最適化を容易にします。

通常、アプリケーションでLLMを使う場合、ユーザー入力を直接LLMに送ることはありません。その代わりに、ユーザ入力を受け取ってプロンプトを作成し、それをLLMに送る必要があります。

In [None]:
llm("Can Barack Obama have a conversation with George Washington?")

In [None]:
prompt = """Question: Can Barack Obama have a conversation with George Washington?

Let's think step by step.

Answer: """
llm(prompt)

In [None]:
from langchain import PromptTemplate

template = """Question: {question}

Let's think step by step.

Answer: """

prompt = PromptTemplate(template=template, input_variables=["question"])

In [None]:
prompt.format(question="Can Barack Obama have a conversation with George Washington?")

In [None]:
llm(prompt)

## 3. Chains

マルチステップワークフローでLLMとプロンプトを組み合わせる。このChainを抽象化したのが、LCELというLangChainのコアになります。後ほど解説します。

In [None]:
from langchain import LLMChain

llm_chain = LLMChain(prompt=prompt, llm=llm)

question = "Can Barack Obama have a conversation with George Washington?"

print(llm_chain.run(question))

## 4. Agents and Tools

エージェントは、LLMがどのアクションをとるか決定し、そのアクションをとり、オブザベーション（観察）を見て、それを完了するまで繰り返します。


エージェントを正しく使えば、非常に強力になります。エージェントをロードするためには、以下の概念を理解する必要があります：

- ツール： 特定の義務を果たす機能。以下のようなものがあります： Google検索、データベース検索、Python REPL、その他のチェーンなどです。
- LLM: エージェントを動かす言語モデル。
- エージェント： 使用するエージェント。

ツール: https://python.langchain.com/en/latest/modules/agents/tools.html

エージェントの種類: https://python.langchain.com/docs/modules/agents/agent_types/

In [5]:
from langchain.agents import load_tools
from langchain.agents import initialize_agent

In [2]:
!pip install wikipedia

Collecting wikipedia
  Downloading wikipedia-1.4.0.tar.gz (27 kB)
  Preparing metadata (setup.py) ... [?25l[?25hdone
Building wheels for collected packages: wikipedia
  Building wheel for wikipedia (setup.py) ... [?25l[?25hdone
  Created wheel for wikipedia: filename=wikipedia-1.4.0-py3-none-any.whl size=11678 sha256=fafd95d81c046e628e2ea1b132c3dc416a04560cbbe7b03e4a38e5d53d210cf8
  Stored in directory: /root/.cache/pip/wheels/5e/b6/c5/93f3dec388ae76edc830cb42901bb0232504dfc0df02fc50de
Successfully built wikipedia
Installing collected packages: wikipedia
Successfully installed wikipedia-1.4.0


In [6]:
from langchain.llms import OpenAI
llm = OpenAI(temperature=0)
tools = load_tools(["wikipedia", "llm-math"], llm=llm)

  warn_deprecated(


ValidationError: 1 validation error for OpenAI
__root__
  Did not find openai_api_key, please add an environment variable `OPENAI_API_KEY` which contains it, or pass `openai_api_key` as a named parameter. (type=value_error)

In [None]:
agent = initialize_agent(tools, llm, agent="zero-shot-react-description", verbose=True)

In [None]:
agent.run("In what year was the film Departed with Leopnardo Dicaprio released? What is this year raised to the 0.43 power?")

### Google検索と計算
・serpapi : Google検索
・llm-math : 数学の計算

In [None]:
!pip install google-search-results

In [None]:
import os
os.environ["SERPAPI_API_KEY"] = "<SerpAPIのトークン>"

Agentで使う「Language Model」は、LLM (テキスト生成モデル)のtempereture低めが推奨されています。

In [None]:
from langchain.agents import AgentType
from langchain.agents import initialize_agent
from langchain.agents import load_tools
from langchain.llms import OpenAI

# LanguageModelの準備
llm_model = OpenAI(temperature=0)

# Toolの準備
tools = load_tools(["serpapi", "llm-math"], llm=llm_model)

# Agentの準備
agent_executor = initialize_agent(
    tools=tools,
    llm=llm_model,
    agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
    verbose=True
)

「serpapi」が役立ちそうな質問をします。

In [None]:
# Agentの実行
agent_executor.invoke({"input": "今日のトレンドとなったニュースは？"})

「llm-math」が役立ちそうな質問をします。

In [None]:
# Agentの実行
agent_executor.invoke({"input": "富士山の高さは？それに2を掛けると？"})

## 5. Memory

チェーンとエージェントにステートを追加

メモリとは、チェーン/エージェントの呼び出しの間に状態を保持する概念です。LangChainはメモリーの標準インターフェース、メモリー実装のコレクション、メモリーを使うチェーン/エージェントの例を提供します。

In [None]:
from langchain.chains import LLMChain
from langchain.chat_models import ChatOpenAI
from langchain.memory import ConversationBufferMemory
from langchain.prompts import PromptTemplate

# LanguageModelの準備
chat_model = ChatOpenAI(temperature=0.9)

# PromptTemplateの準備
template = """You are a nice chatbot having a conversation with a human.

Previous conversation:
{chat_history}

New human question: {question}
Response:"""
prompt = PromptTemplate.from_template(template)

# Memoryの準備
memory = ConversationBufferMemory(memory_key="chat_history")

# Chainの準備
conversation = LLMChain(
    llm=chat_model,
    prompt=prompt,
    memory=memory,
    verbose=True,
)

In [None]:
# 会話の実行
conversation({"question": "私の好きな小説家は吉田修一です。"})

In [None]:
# 履歴から情報を引き出す会話の実行
conversation({"question": "私の好きな小説家を選んでください。"})

## 6. Document Loaders

言語モデルを独自のテキストデータと組み合わせることは、それらを差別化する強力な方法です。この方法がRAGと呼んでいます。そのための最初のステップは、データを "ドキュメント "にロードすることです。このモジュールは、これを簡単にすることを目的としています。

https://python.langchain.com/en/latest/modules/indexes/document_loaders.html

In [None]:
from langchain.document_loaders import NotionDirectoryLoader

loader = NotionDirectoryLoader("Notion_DB")

docs = loader.load()

## 7. Indexes

インデックスとは、LLMが文書と最適にやりとりできるように、文書を構造化する方法のことです。このモジュールには、文書を扱うためのユーティリティ関数が含まれています。

- 埋め込み： エンベッディングとは、例えばテキスト、文書、画像、音声などの情報の一部を数値で表現したものです。
- テキスト分割： 長いテキストを扱いたいとき、そのテキストを塊に分割する必要があります。
- ベクトルストア： ベクトル・データベースは、より正確で関連性の高い検索結果を得るために、テキスト、文章、文書全体の文字列の意味や文脈を理解するための、自然言語処理モデルからのベクトル埋め込みを保存し、インデックス化します。

In [None]:
import requests

url = "https://raw.githubusercontent.com/hwchase17/langchain/master/docs/modules/state_of_the_union.txt"
res = requests.get(url)
with open("state_of_the_union.txt", "w") as f:
  f.write(res.text)

In [None]:
# Document Loader
from langchain.document_loaders import TextLoader
loader = TextLoader('./state_of_the_union.txt')
documents = loader.load()

In [None]:
# Text Splitter
from langchain.text_splitter import CharacterTextSplitter
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
docs = text_splitter.split_documents(documents)

In [None]:
!pip install sentence_transformers

In [None]:
# Embeddings
from langchain.embeddings import HuggingFaceEmbeddings
embeddings = HuggingFaceEmbeddings()

#text = "This is a test document."
#query_result = embeddings.embed_query(text)
#doc_result = embeddings.embed_documents([text])

In [None]:
!pip install faiss-cpu

In [None]:
# Vectorstore: https://python.langchain.com/en/latest/modules/indexes/vectorstores.html
from langchain.vectorstores import FAISS

db = FAISS.from_documents(docs, embeddings)

query = "What did the president say about Ketanji Brown Jackson"
docs = db.similarity_search(query)

In [None]:
print(docs[0].page_content)

Tonight. I call on the Senate to: Pass the Freedom to Vote Act. Pass the John Lewis Voting Rights Act. And while you’re at it, pass the Disclose Act so Americans can know who is funding our elections. 

Tonight, I’d like to honor someone who has dedicated his life to serve this country: Justice Stephen Breyer—an Army veteran, Constitutional scholar, and retiring Justice of the United States Supreme Court. Justice Breyer, thank you for your service. 

One of the most serious constitutional responsibilities a President has is nominating someone to serve on the United States Supreme Court. 

And I did that 4 days ago, when I nominated Circuit Court of Appeals Judge Ketanji Brown Jackson. One of our nation’s top legal minds, who will continue Justice Breyer’s legacy of excellence.


In [None]:
db.save_local("faiss_index")
new_db = FAISS.load_local("faiss_index", embeddings)
docs = new_db.similarity_search(query)
print(docs[0].page_content)