<a href="https://colab.research.google.com/github/maninog/langchain/blob/main/LangChain_Indexes_Cite_Source.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# LangChain Cite Source

## README
- author: [Masumi Morishige](https://twitter.com/masumi_creator)
- created_at: 2023-08-05
- updated_at: 2023-08-05

### 実行方法
1. OpenAIのAPIキーを発行
2. `os.environ["OPENAI_API_KEY"] = "..."`の`""`の中にご自身のAPIキーを代入
3. 「ランタイム > すべてのセルを実行」を実行

### 参考情報
- Zenn: [文献参照をするChatGPTの作り方【LangChain / Python】](https://zenn.dev/umi_mori/articles/langchain-cite-source)
- YouTube: [文献参照をするChatGPTの作り方【LangChain / Python】](https://youtu.be/KuoSiUwkWts)

### OpenAI APIの発行方法

[<img src="https://img.youtube.com/vi/frpsKLNW1q4/maxresdefault.jpg" width="600px">](https://youtu.be/frpsKLNW1q4)

[【エンジニア向け】OpenAIのAPI連携方法【環境構築 + GASによるGoogle Documentへの組み込み】](https://youtu.be/frpsKLNW1q4)

## 環境構築

In [None]:
!pip install langchain==0.0.252

In [None]:
!pip install openai==0.27.8

In [None]:
import os

#TODO: APIキーの登録が必要
os.environ["OPENAI_API_KEY"] = "..."

## 実装方法

In [None]:
from langchain.chains import create_citation_fuzzy_match_chain
from langchain.chat_models import ChatOpenAI

llm = ChatOpenAI(temperature=0, model="gpt-4")
chain = create_citation_fuzzy_match_chain(llm)

question = "今の日本の総理大臣は、何代目？"
context = """
内閣総理大臣（ないかくそうりだいじん、英: Prime Minister）は、日本の内閣の首長たる国務大臣。
文民である国会議員が就任し、その地位及び権限は日本国憲法や内閣法などに規定されている。
現任は、第101代岸田文雄（在任: 2021年〈令和3年〉11月10日 - ）。
""" # Wikipediaより引用

result = chain.run(question=question, context=context)
print(result)

In [None]:
def highlight(text, span):
    return (
        "..."
        + text[span[0] - 20 : span[0]]
        + "*"
        + "\033[91m"
        + text[span[0] : span[1]]
        + "\033[0m"
        + "*"
        + text[span[1] : span[1] + 20]
        + "..."
    )

for fact in result.answer:
    print("Statement:", fact.fact)
    for span in fact.get_spans(context):
        print("Citation:", highlight(context, span))
    print()