# Chat History
OpenAI APIでチャット履歴を送る方法

チャットは過去の話の流れを考慮した会話が出来るが、実際は過去の会話履歴も含めてLLMに問い合わせている
。このため、会話が長くなるほど、入力文章が長くなり、処理に時間がかかる。  
また、入出力の合計token数がmax_tokensを超えないように注意する必要がある。  

role:userとassistantが交互に続く。  
```python
messages=[
    {"role": "system", "content":  "システムプロンプト"},
    {"role": "user", "content": "ユーザの質問1"},
    {"role": "assistant", "content": "LLMの回答1"},
    {"role": "user", "content": "ユーザの質問2"},
],
```

In [3]:
from openai import OpenAI

client = OpenAI(
    base_url='http://localhost:8080/v1', ## Endpoint
    api_key='Dummy' ## Dummy Key
)

model = 'gpt-3.5-turbo' ## LLM Model Name

system = 'あなたは優秀な日本の観光ガイドです。' ## システムプロンプト
prompt = '"東京の観光名所を３つ教えてください。' ## 質問文

response = client.chat.completions.create(
    model=model, ## Model Name
    max_tokens=4096, ## 最大トークン数
    temperature=0.01,
    top_p=0.01,
    messages=[
        {"role": "system", "content": "あなたは優秀な日本の観光ガイドです。"},
        {"role": "user", "content": "東京の観光名所を３つ教えてください"},
        {"role": "assistant", "content": """承知しました。東京にはたくさんの観光スポットがありますが、ここでは三つをご紹介します: 

1. 東京スカイツリー: 2012年に開業した東京スカイツリーは、東京都有形文化財に指定されているタワービルのひとつです。高さ378mあり、展望台からは東京の街並みや富士山などを一望することができます。

2. 東京タワー: 1958年に開業した東京タワーは、日本初の本格的な電波塔として有名です。高さ333mあり、展望台からは東京の街並みやレインボーブリッジなどを一望することができます。

3. 東京国立博物館: 1959年に開業した東京国立博物館は、日本最古で最大級の美術館の一つです。国宝や重要文化財を含む約110,000点もの美術品を収蔵しており、そのコレクションは世界的に有名です。"""},
        {"role": "user", "content": "他にお勧めはありますか？"},
    ],
    stream=True, ## Streaming output
)

# Streaming output
for chunk in response:
    s = chunk.choices[0].delta.content
    ## 最初と最後にNoneが入るため除外（理由不明）
    if s is not None:
        print(s, end='')

  はい、他にもおすすめの観光スポットはありますが、ここでは3つほどご紹介します:

1. 東京駅: 2012年に開業した新幹線ホームやグランスタなどの商業施設を備えた東京駅は、日本の代表的な駅の一つです。

2. 皇居: 1945年以降は現天皇の住まいである皇居は、日本で最も有名な観光スポットの一つです。

3. 明治神宮: 1920年に創建された明治神宮は、平和と幸運を願う人々の祈りの場として知られています。

### Server Message
```
llama_print_timings:        load time =   75647.07 ms  
llama_print_timings:      sample time =      61.24 ms /   145 runs   (    0.42 ms per token,  2367.89 tokens per second  )
llama_print_timings: prompt eval time =   75646.47 ms /   296 tokens (  255.56 ms per token,     3.91 tokens per secon  d)
llama_print_timings:        eval time =   37538.98 ms /   144 runs   (  260.69 ms per token,     3.84 tokens per seco  nd)
llama_print_timings:       total time =  114777.0  

```0 ms