## Collection-specific API - Conversation
Collection-specific API（事前に作成したCollectionのAPIキーを利用）を利用したLLMの利用。RAGなし

In [1]:
from h2ogpte import H2OGPTE

import json

In [2]:
with open('_secret') as f:
    key = json.load(f)

In [3]:
client = H2OGPTE(
    address='https://playground.h2ogpte.h2o.ai',
    api_key=key['client-access-test'],
)

client

<h2ogpte.h2ogpte.H2OGPTE at 0x10aa3c2e0>

In [16]:
# LLM一覧
models = client.get_llms()
[(i, m['base_model']) for i,m in enumerate(models)]

[(0, 'mistralai/Mixtral-8x7B-Instruct-v0.1'),
 (1, 'meta-llama/Meta-Llama-3-8B-Instruct'),
 (2, 'meta-llama/Meta-Llama-3-70B-Instruct'),
 (3, 'nvidia/Llama3-ChatQA-1.5-70B'),
 (4, 'NousResearch/Nous-Capybara-34B'),
 (5, 'mistralai/Mistral-7B-Instruct-v0.3'),
 (6, 'h2oai/h2o-danube2-1.8b-chat'),
 (7, 'mistralai/Mistral-Nemo-Instruct-2407'),
 (8, 'OpenGVLab/InternVL-Chat-V1-5'),
 (9, 'THUDM/cogvlm2-llama3-chat-19B'),
 (10, 'liuhaotian/llava-v1.6-34b'),
 (11, 'lmms-lab/llama3-llava-next-8b'),
 (12, 'mistral-small-latest'),
 (13, 'mistral-large-latest'),
 (14, 'mistral-medium'),
 (15, 'claude-3-5-sonnet-20240620'),
 (16, 'claude-3-sonnet-20240229'),
 (17, 'claude-3-opus-20240229'),
 (18, 'claude-3-haiku-20240307'),
 (19, 'microsoft/Phi-3-vision-128k-instruct'),
 (20, 'microsoft/Phi-3-medium-128k-instruct'),
 (21, 'google/gemma-2-27b-it'),
 (22, 'gemini-1.5-pro-latest'),
 (23, 'gemini-1.5-flash-latest'),
 (24, 'gpt-3.5-turbo-0613'),
 (25, 'gpt-3.5-turbo-16k-0613'),
 (26, 'gpt-35-turbo-1106'

In [17]:
models[20]

{'display_name': 'microsoft/Phi-3-medium-128k-instruct',
 'base_model': 'microsoft/Phi-3-medium-128k-instruct',
 'prompt_type': 'unknown',
 'prompt_dict': {'promptA': None,
  'promptB': None,
  'PreInstruct': None,
  'PreInput': None,
  'PreResponse': None,
  'terminate_response': [],
  'chat_sep': '\n',
  'chat_turn_sep': '\n',
  'humanstr': None,
  'botstr': None,
  'generates_leading_space': False,
  'system_prompt': '',
  'can_handle_system_prompt': False},
 'chat_template': "{% for message in messages %}{% if (message['role'] == 'user') %}{{'<|user|>' + '\n' + message['content'] + '<|end|>' + '\n' + '<|assistant|>' + '\n'}}{% elif (message['role'] == 'assistant') %}{{message['content'] + '<|end|>' + '\n'}}{% endif %}{% endfor %}",
 'load_8bit': False,
 'load_4bit': False,
 'low_bit_mode': 1,
 'load_half': False,
 'use_flash_attention_2': False,
 'load_gptq': '',
 'load_awq': '',
 'load_exllama': False,
 'use_safetensors': True,
 'revision': None,
 'use_gpu_id': False,
 'gpu_id': N

In [20]:
#client.get_llm_names()

In [4]:
chat_session_id = client.create_chat_session_on_default_collection()
chat_session_id

'73d297dd-c51b-441e-9530-3f6315df9164'

In [8]:
with client.connect(chat_session_id) as session:
    reply = session.query(
        message='こんにちは。あなたのモデル名は？',
        timeout=60,
    )
    print(reply)

id='8f1f7662-7ec5-4549-a54a-063efa08bb25' content='こんにちは！私は h2oGPTe です。H2O.ai によって作成されたエキスパートの質問応答 AI システムです。OpenAI による GPT-4 と同様に機能します。よろしくお願いします。' reply_to='a672fa4a-0a90-4c53-9919-ee92ea7989a6' votes=0 created_at=datetime.datetime(2024, 7, 21, 10, 21, 2, 480253) type_list=[] error=None


In [9]:
reply.content

'こんにちは！私は h2oGPTe です。H2O.ai によって作成されたエキスパートの質問応答 AI システムです。OpenAI による GPT-4 と同様に機能します。よろしくお願いします。'

Session.query(): https://h2oai.github.io/h2ogpte/h2ogpte.html#h2ogpte.session.Session.query

In [25]:
SYS_PROMPT = '''
あなたは日本語AIアシスタントです。必ず日本語で回答します。
'''

MESSAGE = '''
こんにちは、Phi-3。あなたのモデル名をフルネームで答えて？
'''

MODEL = 'microsoft/Phi-3-medium-128k-instruct'

with client.connect(chat_session_id) as session:
    reply = session.query(
        message = MESSAGE,
        system_prompt=SYS_PROMPT,
        llm=MODEL,
        rag_config={"rag_type": "llm_only",},
    )
    print(reply.content)

こんにちは、Phi-3。私のモデル名は「Phi-3」です。


In [26]:
SYS_PROMPT = '''
あなたは日本語AIアシスタントです。必ず日本語で回答します。
'''

MESSAGE = '''
神奈川のおすすめの観光スポットを5つ教えて？
'''

MODEL = 'microsoft/Phi-3-medium-128k-instruct'

with client.connect(chat_session_id) as session:
    reply = session.query(
        message = MESSAGE,
        system_prompt=SYS_PROMPT,
        llm=MODEL,
        rag_config={"rag_type": "llm_only",},
    )
    print(reply.content)

神奈川県には多くの魅力的な観光スポットがあります。以下に、おすすめの5つの観光地をご紹介します。

1. 横浜中華街: 日本最大級の中華街で、豊富な中華料理店や雑貨店があります。夜にはライトアップされた街並みが美しいです。

2. 鎌倉: 古都として知られる鎌倉は、歴史的な建造物や寺院が多くあります。特に、鎌倉大仏や円覚寺などが有名です。

3. 江の島: 横浜市の沖合にある小さな島で、海水浴やショッピングが楽しめます。島の中心にある大仏は、日本でも有名な観光スポットです。

4. 小田原城: 小田原城は、江戸時代に建てられた城で、城内には歴史的な建造物や美術館があります。城の周りには緑豊かな公園もあります。

5. 箱根: 箱根は、自然豊かな観光地で、箱根ロープウェイや箱根彫刻の森美術館などがあります。また、箱根の温泉も有名です。

これらの観光地は、神奈川県の多様な魅力を堪能するのに最適な場所です。


In [27]:
SYS_PROMPT = '''
あなたは日本語AIアシスタントです。必ず日本語で回答します。
'''

MESSAGE = '''
日本の総理大臣は誰ですか？その年齢を掛ける3した値を教えて？
'''

MODEL = 'microsoft/Phi-3-medium-128k-instruct'

with client.connect(chat_session_id) as session:
    reply = session.query(
        message = MESSAGE,
        system_prompt=SYS_PROMPT,
        llm=MODEL,
        rag_config={"rag_type": "llm_only",},
    )
    print(reply.content)

現在の日本の総理大臣は岸田文雄です。彼の年齢は2023年時点で58歳です。58を3で掛けると174になります。そして、174を2で割ると87になります。

したがって、岸田文雄の年齢を3で掛けた値を2で割った結果は87です。


In [28]:
SYS_PROMPT = '''
あなたは日本語AIアシスタントです。必ず日本語で回答します。
'''

MESSAGE = '''
日本の総理大臣は誰ですか？その年齢を掛ける3した値を教えて？
'''

MODEL = 'gpt-4-turbo-2024-04-09'

with client.connect(chat_session_id) as session:
    reply = session.query(
        message = MESSAGE,
        system_prompt=SYS_PROMPT,
        llm=MODEL,
        rag_config={"rag_type": "llm_only",},
    )
    print(reply.content)

日本の総理大臣は岸田文雄です。彼の年齢は2023年2月時点で65歳です。65歳を3倍すると195歳になります。


In [32]:
SYS_PROMPT = '''
あなたは日本語AIアシスタントです。必ず日本語で回答します。
'''

r2 = 0.6

MESSAGE = '''
予測モデルの決定係数が{}でした。以下の決定係数の目安に従って、精度を判定して下さい。

### 決定係数の目安
0.3以下: 精度が低い
0.3~0.7: 中位の精度
0.7以上: 精度が高い
'''.format(r2)

MODEL = 'microsoft/Phi-3-medium-128k-instruct'

with client.connect(chat_session_id) as session:
    reply = session.query(
        message = MESSAGE,
        system_prompt=SYS_PROMPT,
        llm=MODEL,
        rag_config={"rag_type": "llm_only",},
    )
    print(reply.content)

与えられた決定係数の目安に従って、0.6の決定係数は「0.3~0.7」の範囲に収まるため、中位の精度と判定されます。


In [35]:
SYS_PROMPT = '''
あなたは日本語AIアシスタントです。必ず日本語で回答します。
'''

r2 = 0.1

MESSAGE = '''
予測モデルの決定係数が{}でした。以下の決定係数の目安に従って、精度を判定して下さい。

### 決定係数の目安
0.3以下: 精度が低い
0.3~0.7: 中位の精度
0.7以上: 精度が高い
'''.format(r2)

MODEL = 'microsoft/Phi-3-medium-128k-instruct'

with client.connect(chat_session_id) as session:
    reply = session.query(
        message = MESSAGE,
        system_prompt=SYS_PROMPT,
        llm=MODEL,
        rag_config={"rag_type": "llm_only",},
    )
    print(reply.content)

与えられた決定係数の目安に従って、0.1の決定係数は「精度が低い」と判定されます。


In [38]:
SYS_PROMPT = '''
あなたは日本語AIアシスタントです。必ず日本語で回答します。
'''

r2 = 0.7

MESSAGE = '''
予測モデルの決定係数が{}でした。以下の決定係数の目安に従って、精度を判定して下さい。

### 決定係数の目安
0.3以下: 精度が低い
0.3~0.7: 中位の精度
0.7以上: 精度が高い
'''.format(r2)

MODEL = 'microsoft/Phi-3-medium-128k-instruct'

with client.connect(chat_session_id) as session:
    reply = session.query(
        message = MESSAGE,
        system_prompt=SYS_PROMPT,
        llm=MODEL,
        rag_config={"rag_type": "llm_only",},
    )
    print(reply.content)

与えられた決定係数の目安に従って、0.7の決定係数は「0.7以上」の範囲にあります。したがって、この予測モデルは「精度が高い」と判定されます。


In [45]:
SYS_PROMPT = '''
あなたは日本語AIアシスタントです。必ず日本語で回答します。
'''

r2 = 0.7
vars = ['A', 'C', 'G']

MESSAGE = '''
予測モデルの決定係数が{}でした。以下の決定係数の目安に従って、精度を判定して下さい。
また、予測モデルの変数重要度に{}が現れました。以下の注意が必要な変数に従って、警報を出す必要があるか判断して下さい。

予測精度も低く、警報も出ている場合は注意が必要ですので、注意喚起を促して下さい。

### 決定係数の目安
0.3以下: 精度が低い
0.3~0.7: 中位の精度
0.7以上: 精度が高い

### 注意が必要な変数
変数AまたはBがあった場合: 警報X
変数AとCがあった場合: 警報Y
'''.format(r2, vars)

MODEL = 'microsoft/Phi-3-medium-128k-instruct'

with client.connect(chat_session_id) as session:
    reply = session.query(
        message = MESSAGE,
        system_prompt=SYS_PROMPT,
        llm=MODEL,
        rag_config={"rag_type": "llm_only",},
    )
    print(reply.content)

決定係数が0.7であるため、中位の精度と判断できます。変数重要度に['A', 'C', 'G']が現れているため、警報Yを出す必要があります。したがって、精度は中位ですが、警報Yが出ているため注意が必要です。

注意喚起:

この予測モデルは中位の精度を示していますが、変数重要度に基づいて警報Yが出ています。これは、変数AとCの両方が重要な影響を与えていることを意味します。このモデルを使用する際には、これらの変数の影響をより深く理解し、必要に応じてモデルの改善を検討することが重要です。


In [46]:
SYS_PROMPT = '''
あなたは日本語AIアシスタントです。必ず日本語で回答します。
'''

r2 = 0.7
vars = ['A', 'C', 'G']

MESSAGE = '''
予測モデルの決定係数が{}でした。以下の決定係数の目安に従って、精度を判定して下さい。
また、予測モデルの変数重要度に{}が現れました。以下の注意が必要な変数に従って、警報を出す必要があるか判断して下さい。

予測精度も低く、警報も出ている場合は注意が必要ですので、注意喚起を促して下さい。

### 決定係数の目安
0.3以下: 精度が低い
0.3~0.7: 中位の精度
0.7以上: 精度が高い

### 注意が必要な変数
変数AまたはBがあった場合: 警報X
変数AとCがあった場合: 警報Y
'''.format(r2, vars)

MODEL = 'gpt-4-turbo-2024-04-09'

with client.connect(chat_session_id) as session:
    reply = session.query(
        message = MESSAGE,
        system_prompt=SYS_PROMPT,
        llm=MODEL,
        rag_config={"rag_type": "llm_only",},
    )
    print(reply.content)

決定係数が0.7であるため、予測モデルの精度は「高い」と判定されます。

変数重要度に['A', 'C', 'G']が含まれているため、注意が必要な変数の条件に該当します。具体的には、「変数AまたはBがあった場合: 警報X」と「変数AとCがあった場合: 警報Y」の両方の警報が発生します。

予測精度は高いですが、警報が発生しているため、モデルの使用には注意が必要です。特に変数AとCの影響を慎重に評価し、必要に応じてモデルの改善を検討することをお勧めします。


In [44]:
SYS_PROMPT = '''
あなたは日本語AIアシスタントです。必ず日本語で回答します。
'''

r2 = 0.2
vars = ['A', 'C', 'B']

MESSAGE = '''
予測モデルの決定係数が{}でした。以下の決定係数の目安に従って、精度を判定して下さい。
また、予測モデルの変数重要度に{}が現れました。以下の注意が必要な変数に従って、警報を出す必要があるか判断して下さい。

予測精度も低く、警報も出ている場合は注意が必要ですので、注意喚起を促して下さい。

### 決定係数の目安
0.3以下: 精度が低い
0.3~0.7: 中位の精度
0.7以上: 精度が高い

### 注意が必要な変数
変数AまたはBがあった場合: 警報X
変数AとCがあった場合: 警報Y
'''.format(r2, vars)

MODEL = 'microsoft/Phi-3-medium-128k-instruct'

with client.connect(chat_session_id) as session:
    reply = session.query(
        message = MESSAGE,
        system_prompt=SYS_PROMPT,
        llm=MODEL,
        rag_config={"rag_type": "llm_only",},
    )
    print(reply.content)

決定係数が0.2であるため、精度が低いと判断されます。

変数重要度に['A', 'C', 'B']が現れているため、警報Yを出す必要があります。

したがって、予測精度が低く、警報も出ているため、注意が必要です。注意喚起を促します。
