<a href="https://colab.research.google.com/github/nyanta012/chatgpt_api_practice/blob/main/section8/section8.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Google Colaboratoryのショートカットキー
1. **現在のセルを実行し、次のセルを選択**: `Shift + Enter`
2. **コードセルをテキストセルにする**: `Ctrl + M M`
3. **コードセルを上に追加**: `Ctrl + M A`
4. **コードセルを下に追加**: `Ctrl + M B`
5. **セルの削除**: `Ctrl + M D`

# API KEYの設定など

In [None]:
%%capture
!pip install openai==0.27.2
!pip install llama-index==0.6.26
!wget https://github.com/nyanta012/chatgpt_api_practice/raw/main/pdf/コンプライアンスのすべて.pdf
!wget https://github.com/nyanta012/chatgpt_api_practice/raw/main/pdf/健康のすべて.pdf

In [None]:
import getpass
import json
import os
from pathlib import Path

import openai
from IPython.display import Markdown, display
from langchain.chat_models import ChatOpenAI
from llama_index import (GPTVectorStoreIndex, LLMPredictor, ServiceContext,
                         StorageContext, VectorStoreIndex, download_loader,
                         load_index_from_storage)

apikey = getpass.getpass(prompt="OpenAIのAPIキーを入力してください")
os.environ["OPENAI_API_KEY"] = apikey # llama indexは環境変数じゃないとエラーがでる？
openai.api_key = apikey

OpenAIのAPIキーを入力してください··········


In [None]:
PDFReader = download_loader("PDFReader")

loader = PDFReader()
documents = loader.load_data(file=Path("コンプライアンスのすべて.pdf"))

In [None]:
service_context = ServiceContext.from_defaults(
    llm_predictor=LLMPredictor(
        llm=ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)
    )
)

In [None]:
# indexを作成
index = VectorStoreIndex.from_documents(documents, service_context=service_context)
index.storage_context.persist(persist_dir="./storage/")

In [None]:
query_engine = index.as_query_engine()

In [None]:
response = query_engine.query("AIとコンプライアンスについて教えて")

In [None]:
print(response)

AIとコンプライアンスについては、人工知能によるリスク評価や予測、自動監視やデータ分析、倫理や透明性などが取り上げられています。また、AIを活用することでコンプライアンス活動を効率化し、洞察力やリスク管理能力を向上させることができるとされています。詳細は不明です。


In [None]:
print((response.source_nodes[0].node.get_text()))

page_label: 4
file_name: コンプライアンスのすべて.pdf

この章では、 グローバルなコンプライアンスの課題に
焦点を当てます。異文化間のコミュニケーション、法的要件の遵守、グローバルなチームの
調整、政府との関係構築などに関する具体的なアドバイスやベストプラクティスを紹介し
ます。 読者はグローバルなコンプライアンスの課題に対処し、 国際的な展開におけるリスク
を最小化するための手法を学ぶことができます。  
 
【20. テクノロジーの活用とコンプライアンス】 （ 500文字程度）  
テクノロジーの進化は、コンプライアンス活動において革新的な手法とチャンスをもたら
しています。 この章では、 テクノロジーの活用とコンプライアンスの関連性について探求し
ます。 AI（人工知能）や機械学習、ブロックチェーンなどのテクノロジーがコンプライアン
スプロセスやリスク管理にどのように活用されているかを解説します。 また、 データ分析や
自動化ツールの導入による効率化や精度向上の具体例についても紹介します。読者はテク
ノロジーを活用してコンプライアンス活動を効果的に支援し、効率性と正確性を向上させ
る方法を学ぶことができま す。  
 
【21. デジタルトランスフォーメーションとコンプライアンス】 （ 500文字程度）  
デジタルトランスフォーメーションの進展により、ビジネスプロセスのデジタル化と効率
化が進んでいます。 この章では、 デジタルトランスフォーメーションとコンプライアンスの
関係に焦点を当てます。 デジタルプラットフォームやクラウドサービスの活用、 データの保


In [None]:
response = query_engine.query("猫について教えてください")

In [None]:
print(response)

I'm sorry, I cannot answer that question as it is not related to the context information provided.


# 一度index化して保存すると再度読み込むことが可能

別のpdfを読み込んでみる

In [None]:
PDFReader = download_loader("PDFReader")

loader = PDFReader()
documents = loader.load_data(file=Path("健康のすべて.pdf"))

In [None]:
service_context = ServiceContext.from_defaults(
    llm_predictor=LLMPredictor(
        llm=ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)
    )
)

# indexを作成
index = VectorStoreIndex.from_documents(documents, service_context=service_context)
index.storage_context.persist(persist_dir="./health/")

In [None]:
query_engine = index.as_query_engine()

In [None]:
response = query_engine.query("健康とストレスについて何が書かれていますか？")

In [None]:
print(response)

健康とストレスについて、ストレスマネジメントの重要性やリラックス法、睡眠の重要性、健康的な食事の必要性などが書かれています。また、自己管理や生涯学習、予防医学の重要性も言及されています。


In [None]:
print((response.source_nodes[0].node.get_text()))

page_label: 5
file_name: 健康のすべて.pdf

切なストレスマネジメントが必要です。 ストレスの原因を特定し、 対策を講じることが重要
です。リラックス法やストレス軽減のための活動（例：ヨガ、瞑想、散歩など） 、時間管理
やプライオリティの設定、コミュニケーションスキルの向上などが有効なストレスマネジ
メントの手法です。 健康なストレスマネジメントは心身のバランスを取り戻し、 健康な生活
を実現するために重要です。  
 
１８．健康と睡眠の重要性  
 
良質な睡眠は健康にとって極めて重要 です。 十分な睡眠を確保することは、 身体と心の回復
やリフレッシュに不可欠です。 睡眠不足や睡眠の質の低下は、 免疫機能の低下やメンタルヘ
ルスの悪化、 集中力や注意力の低下などの健康問題を引き起こす可能性があります。 健康な
睡眠のためには、 定期的な睡眠スケジュールの確立や快適な睡眠環境の整備、 リラックスす
る習慣の導入などが重要です。また、適切な睡眠のためには、日中の活動や食事、運動など
も考慮する必要があります。良質な睡眠を確保することで、健康な身体と心を維持し、日々
の活動に充実感をもたらすことができます。  
 
１９．健康 と栄養の関係  
 
栄養は健康に直接的な影響を与える重要な要素です。バランスの取れた食事を摂取するこ
とは、健康を維持するために不可欠です。食事は私たちの身体の燃料となり、成長や修復に
必要な栄養素を提供します。健康的な食事は、ビタミン、ミネラル、たんぱく質、繊維など
の栄養素をバランス良く摂取することを意味します。 また、


In [None]:
# コンプライアンスのpdfの構造化データを読み込む
storage_context = StorageContext.from_defaults(persist_dir="./storage/")
index = load_index_from_storage(storage_context)

In [None]:
query_engine = index.as_query_engine()

In [None]:
response = query_engine.query("健康とストレスについて何が書かれていますか？")

In [None]:
print(response)


This information is not provided in the context information given.


In [None]:
print((response.source_nodes[0].node.get_text()))

page_label: 5
file_name: コンプライアンスのすべて.pdf

護とプライバシーの確保、エレクトロニックコンプライアンスツールの導入などに関する
具体的なアドバイスや課題を取り上げます。読者はデジタルトランスフォーメーションと
コンプライアンスの 融合に向けた戦略を学び、組織の競争力と遵守の両立を図ることがで
きます。  
 
【22. インシデント管理とレスポンス】 （ 500文字程度）  
コンプライアンス違反やセキュリティインシデントが発生した場合、適切なインシデント
管理とレスポンスが求められます。 この章では、 インシデント管理プロセスの構築と効果的
なレスポンスについて詳しく解説します。インシデントの検知と報告、対応計画の策定、情
報の収集と分析、 修復措置の実施、 外部への報告手続きなどに関するベストプラクティスを
紹介します。 読者はインシデント管理とレスポンス能力を 高め、 迅速かつ適切な対応を行う
ためのガイドラインを学ぶことができます。  
 
【23. コンプライアンスとエシックスの融合】 （ 500文字程度）  
コンプライアンスとエシックス（倫理）は密接に関連しており、組織の持続可能性と信頼性
を確保するためには両者の融合が重要です。 この章では、 コンプライアンスとエシックスの
関係性について探求します。エシックスの概念と原則、組織文化とエシックスの関連、エシ
カルリーダーシップの重要性などについて詳しく解説します。 また、 コンプライアンスとエ
シックスの統合を実現するための手法や成功事例 を紹介します。読者はコンプライアンス
とエシックスを組み合わせることで、 組織全体の倫理的な行動を促進し、 リスクを軽減する
手段を学ぶことができます。  
 
【24. 組織内のコンプライアンスリーダーシップ】 （ 500文字程度） 


# プロンプトを書き変える

In [None]:
from llama_index import QuestionAnswerPrompt

PROMPT_TEMPLATE = (
    "下記の情報が与えられています。 \n"
    "---------------------\n"
    "{context_str}"
    "\n---------------------\n"
    "この情報を参照して次の質問に答えてください: {query_str}\n"
)
PROMPT = QuestionAnswerPrompt(PROMPT_TEMPLATE)

In [None]:
# 健康すべてのpdfの構造化データを読み込む
storage_context = StorageContext.from_defaults(persist_dir="./health/")
index = load_index_from_storage(storage_context)

In [None]:
query_engine = index.as_query_engine(text_qa_template=PROMPT)

In [None]:
response = query_engine.query("健康とストレスについて何が書かれていますか？")

In [None]:
print(response)


ストレスマネジメントが必要であること、ストレスの原因を特定し、対策を講じることが重要であること、リラックス法やストレス軽減のための活動（例：ヨガ、瞑想、散歩など）、時間管理やプライオリティの設定、コミュニケーションスキルの向上などが有効なストレスマネジメントの手法であることが書かれています。


In [None]:
PROMPT_TEMPLATE = (
    "下記の情報が与えられています。 \n"
    "---------------------\n"
    "{context_str}"
    "\n---------------------\n"
    "次の質問に答えてください: {query_str}\n 出力は箇条書きで書いてください"
)
PROMPT = QuestionAnswerPrompt(PROMPT_TEMPLATE)

query_engine = index.as_query_engine(text_qa_template=PROMPT)

In [None]:
response = query_engine.query("健康とストレスについて何が書かれていますか？")
print(response)

。

- 切なストレスマネジメントが必要であること
- ストレスの原因を特定し、対策を講じることが重要であること
- リラックス法やストレス軽減のための活動（例：ヨガ、瞑想、散歩など）、時間管理やプライオリティの設定、コミュニケーションスキルの向上などが有効なストレスマネジメントの手法であること
- 自己管理を通じて、自分自身の健康を主体的に管理し、健康な生活を実現することができること
- 健康とストレス管理の手法の学習などが挙げられること


# 演習

FunctionCallingを用いてユーザーからの入力を基に、2つの参照情報を切り替える実装をしてみよう

In [None]:
document_1 = loader.load_data(file=Path("コンプライアンスのすべて.pdf"))
document_2 = loader.load_data(file=Path("健康のすべて.pdf"))

INDEX_1 = VectorStoreIndex.from_documents(document_1)
INDEX_2 = VectorStoreIndex.from_documents(document_2)

In [None]:
def get_index_engine(index_name):
    """
    プロンプトを回答するのに適切なindexを提供する
    """
    PROMPT_TEMPLATE = (
        "下記の情報が与えられています。 \n"
        "---------------------\n"
        "{context_str}"
        "\n---------------------\n"
        "この情報を参照して次の質問に答えてください:  {query_str}\n"
    )
    PROMPT = QuestionAnswerPrompt(PROMPT_TEMPLATE)

    if index_name == "コンプライアンス":
        return INDEX_1.as_query_engine(text_qa_template=PROMPT)
    elif index_name == "健康問題":
        return INDEX_2.as_query_engine(text_qa_template=PROMPT)
    else:
        return None

In [None]:
def get_chatgpt_response_from_different_sources(user_input):
    # 与えた関数の説明を記載
    my_functions = [
        {
            "name": "get_index_engine",
            "description": "ユーザーの質問・指示に答えるために使われる関数",
            "parameters": {
                "type": "object",
                "properties": {
                    "index_name": {
                        "type": "string",
                        "enum": ["コンプライアンス", "健康問題", "該当なし"],
                        "description": "ユーザーの質問に答えるために、関連が高い単語を1つ選択してください",
                    },
                },
                "required": ["index_name"],
            },
        }
    ]

    response = openai.ChatCompletion.create(
        model="gpt-3.5-turbo-0613",
        messages=[{"role": "user", "content": user_input}],
        functions=my_functions,
        function_call={"name": "get_index_engine"},
    )

    message = response["choices"][0]["message"]
    function_args = json.loads(message["function_call"]["arguments"])

    engine = get_index_engine(function_args["index_name"])

    if engine:
        function_response = engine.query(user_input)
        source = function_response.get_formatted_sources(200)  # 200文字まで表示
        used_index = function_args["index_name"]
        display(
            Markdown(
                f"## ユーザー入力\n\n{user_input}\n\n## AI回答\n\n{function_response}\n\n## 参照情報({used_index}) \n\n{source}"
            )
        )
    else:
        print("関連する情報がありません")

In [None]:
get_chatgpt_response_from_different_sources("AIとコンプライアンスについて教えてください")

In [None]:
get_chatgpt_response_from_different_sources("AIと健康について教えてください")

In [None]:
get_chatgpt_response_from_different_sources("Llama indexとは何ですか？")