## LLMをプログラム的に操作する

これまでに ChatGPT のような大規模言語モデル (LLM) とやり取りしたことがあるはずです。これは通常、UI またはアプリケーションを通じて行われます。

このノートブックでは、Python を使用して、API を介して直接 LLM に接続し、クエリを実行します。このラボでは、**OLLAMA Mistral-7B** モデルを選択しました。[(https://ollama.com/library/mistral](https://ollama.com/library/mistral))。これは完全にオープン ソースのモデル (Apache 2.0 ライセンス) であり、他の商用モデルやオープン ソース モデルよりもはるかに軽量ですが、特に私たちが使用しようとしているタスクでは非常に優れています。

このモデルは既にラボ クラスターにデプロイされています。これは、モデルが小さい場合でも GPU ではなく CPU でホストしているため、LLM サービスの速度は低下しますが、デモ環境用の低コスト オプションが提供されるためです。

In [1]:
!pip install -q langchain==0.1.14


[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m23.3.2[0m[39;49m -> [0m[32;49m24.0[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m


### 要件とインポート

ラボの指示に従って起動する適切なワークベンチ イメージを選択した場合は、必要なライブラリがすべてすでに用意されているはずです。そうでない場合は、次のセルの最初の行のコメントを解除して、適切なパッケージをすべてインストールします。その後、必要なライブラリをインポートします。

In [2]:
# インポート
import json
import os
from os import listdir
from os.path import isfile, join
from langchain.chains import ConversationChain
from langchain.memory import ConversationBufferMemory
from langchain_community.llms import Ollama
from langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain

### Langchain

Langchain (https://www.langchain.com/) は、言語モデルを利用したアプリケーションを開発するためのフレームワークです。LLM を適切にクエリするために手動で記述する必要のあるすべての定型コードを処理します。

まず、LLM API をクエリできる場所とモデルに適用されるいくつかのパラメータで定義される **llm** インスタンスを作成します。たとえば、`max_new_tokens` は、モデルに最大 96 個のトークン (単語または単語の一部) で応答するように指示します。ここで非常に低く設定されている `temperature` は、モデルに真実に基づいたままで、あまり "創造的" にならないように指示します。結局のところ、ここでは派手な詩を書こうとしているわけではありません。

In [3]:
inference_server_url = "http://llm.ic-shared-llm.svc.cluster.local:11434"

In [4]:
# LLMの設定
llm = Ollama(
    base_url=inference_server_url,
    model="mistral",
    top_p=0.92,
    temperature=0.01,
    num_predict=512,
    repeat_penalty=1.03,
    callbacks=[StreamingStdOutCallbackHandler()]
)

print(llm)

[1mOllama[0m
Params: {'model': 'mistral', 'format': None, 'options': {'mirostat': None, 'mirostat_eta': None, 'mirostat_tau': None, 'num_ctx': None, 'num_gpu': None, 'num_thread': None, 'num_predict': 512, 'repeat_last_n': None, 'repeat_penalty': 1.03, 'temperature': 0.01, 'stop': None, 'tfs_z': None, 'top_k': None, 'top_p': 0.92}, 'system': None, 'template': None, 'keep_alive': None}


また、モデルに送信するすべてのリクエスト ("プロンプト") に適用する **テンプレート** も必要です。

モデルにクエリを実行する場合、ユーザーが入力した内容をそのまま送信することはほとんどないでしょう。この入力に加えて、モデルがそれをどのように処理するかを認識できるように、適切な指示を与える必要があります。何をどのように回答するか、何に回答してはいけないか、どのような口調で答えるかなどです。

In [5]:
template="""<s>[INST]<<SYS>>
You are a helpful, respectful and honest assistant. Always be as helpful as possible, while being safe.
You will be asked a question, to which you must give an answer.
Your answer should not include any harmful, unethical, racist, sexist, toxic, dangerous, or illegal content.
Please ensure that your responses are socially unbiased and positive in nature.
If a question does not make any sense, or is not factually coherent, explain why instead of answering something not correct.
If you don't know the answer to a question, answer "I don't know".
<</SYS>>

### QUESTION:
{input}

### ANSWER:
[/INST]
"""
PROMPT = PromptTemplate(input_variables=["input"], template=template)

Langchain を使用すると、これらの要素を簡単に "つなぎ合わせ"、モデルのクエリに使用する **会話** オブジェクトを作成できるようになりました。

In [6]:
conversation = LLMChain(llm=llm,
                        prompt=PROMPT,
                        verbose=False
                        )

In [8]:
# Read the claims and populate a dictionary
claims_path = 'claims'
onlyfiles = [f for f in listdir(claims_path) if isfile(join(claims_path, f))]

claims = {}

for filename in onlyfiles:
    # Opening JSON file
    with open(os.path.join(claims_path, filename), 'r') as file:
        data = json.load(file)
    claims[filename] = data


In [9]:
for filename in onlyfiles:
    print(f"***************************")
    print(f"* Claim: {filename}")
    print(f"***************************")
    print("Original content:")
    print("-----------------")
    print(f"Subject: {claims[filename]['subject']}\nContent:\n{claims[filename]['content']}\n\n")
    print('Summary:')
    print("--------")
    summary_input = f"Subject: {claims[filename]['subject']}\nContent:\n{claims[filename]['content']}"
    conversation.predict(input=summary_input);
    print("\n\n                          ----====----\n")

***************************
* Claim: claim3.json
***************************
Original content:
-----------------
Subject: Urgent: Car Accident Claim Assistance Needed
Content:
Dear AssuranceCare Inc.,\n\nI hope this email finds you well. I'm writing to, uh, inform you about, well, something that happened recently. It's, um, about a car accident, and I'm not really sure how to, you know, go about all this. I'm kinda anxious and confused, to be honest.\n\nSo, the accident, uh, occurred on January 15, 2024, at around 3:30 PM. I was driving, or, um, attempting to drive, my car at the intersection of Maple Street and Elm Avenue. It's kinda close to, um, a gas station and a, uh, coffee shop called Brew Haven? I'm not sure if that matters, but, yeah.\n\nSo, I was just, you know, driving along, and suddenly, out of nowhere, another car, a Blue Crest Sedan, crashed into the, uh, driver's side of my car. It was like, whoa, what just happened, you know? There was this screeching noise and, uh, so