# COT GPT3.5

In [3]:
import openai
from dotenv import load_dotenv

load_dotenv(verbose=True)

client = openai.OpenAI()

def chat_completions(messages, model="gpt-4-1106-preview"):
    response = client.chat.completions.create(
        model=model,
        messages=messages,
        max_tokens=4096,
        temperature=0
    )
    return response

In [4]:
USER_PROMPT = """
## Question: {question}
{answer_choices}
## Answer
model generated chain of thought explanation
Therefore, the answer is [final model answer (e.g. 1,2,3,4,5)]
"""

### GPT-4: 実行時間、コストを推計する

In [20]:
import csv
import pandas as pd

exam_no = 70
with open(f'../data/processed/exam-{exam_no}.csv', mode='r', encoding='utf-8') as file:
    reader = csv.DictReader(file)
    dict_list = [row for row in reader]

item = dict_list[10] 
input =  USER_PROMPT.format(
    question=item['question'],
    answer_choices=item['answer_choices']
)
messages = [
    {
        "role": "user",
        "content": input
    }
]
response = chat_completions(messages)
output = response.choices[0].message.content

In [22]:
print("INPUT:")
print(input)
print("OUTPUT:")
print(output)

INPUT:

## Question: 薬剤耐性の発現機序に関する記述として適当でないのはどれか。
１．R プラスミドが菌種を越えた薬剤耐性遺伝子の拡散に関与している。
２．β - ラクタマーゼによりペニシリンが加水分解される。
３．流入した薬剤を菌体外へ排出することにより耐性化する。
４．外膜ポーリンの構造変化により薬剤透過性が低下して耐性化する。
５．抗菌薬による突然変異体の誘発により耐性菌が出現する。
## Answer
model generated chain of thought explanation
Therefore, the answer is [final model answer (e.g. 1,2,3,4,5)]

OUTPUT:
薬剤耐性の発現機序に関する記述を見ていきましょう。

１．R プラスミドが菌種を越えた薬剤耐性遺伝子の拡散に関与している。
→これは正しい記述です。Rプラスミドは抗生物質耐性遺伝子を含むことがあり、これが異なる菌種間で転移することによって、耐性が広がることが知られています。

２．β - ラクタマーゼによりペニシリンが加水分解される。
→これも正しい記述です。β-ラクタマーゼはペニシリンなどのβ-ラクタム系抗生物質を分解する酵素であり、この酵素を産生する菌はペニシリンに対して耐性を持ちます。

３．流入した薬剤を菌体外へ排出することにより耐性化する。
→これも正しい記述です。多くの耐性菌は、抗生物質を細胞外に排出するポンプ機構を持っており、これによって薬剤の効果を無効化します。

４．外膜ポーリンの構造変化により薬剤透過性が低下して耐性化する。
→これも正しい記述です。グラム陰性菌の外膜にあるポーリンは、抗生物質などの物質の細胞内への透過を助ける役割を持っていますが、これらの構造が変化することで薬剤の細胞内への進入が阻害され、耐性が生じることがあります。

５．抗菌薬による突然変異体の誘発により耐性菌が出現する。
→これは適当でない記述です。抗菌薬が突然変異を誘発するわけではありません。耐性菌の出現は、既に存在する耐性遺伝子を持つ菌が抗菌薬の選択圧によって生き残り、増殖することによって起こります。抗菌薬が直接突然変異を誘発するわけではなく、むしろ既存の突然変異や遺伝的変異がある中で、抗菌薬の存在がそれらの変異を

In [23]:
import tiktoken
from tiktoken.core import Encoding

encoding: Encoding = tiktoken.encoding_for_model("gpt-4-1106-preview")

In [27]:
# REF: https://openai.com/pricing
# gpt-4-1106-preview input: $0.01 / 1K tokens	output: $0.03 / 1K tokens

input_tokens = encoding.encode(input)
input_tokens_count = len(input_tokens)
input_cost = (input_tokens_count / 1000) * 0.01

output_tokens = encoding.encode(output)
output_tokens_count = len(output_tokens)
output_cost = (output_tokens_count / 1000) * 0.03

# print result
print(f"INPUT TOKENS: {input_tokens_count}")
print(f"INPUT COST: {input_cost}")
print(f"OUTPUT TOKENS: {output_tokens_count}")
print(f"OUTPUT COST: {output_cost}")
print(f"TOTAL COST PER QUESTION: {input_cost + output_cost}")
print(f"TOTAL TIME PER QUESTION: 50s")
print(f"TOTAL COST PER EXAM: {(input_cost + output_cost) * 80}")
print(f"TOTAL TIME PER EXAM: 66.67 minutes")

INPUT TOKENS: 258
INPUT COST: 0.0025800000000000003
OUTPUT TOKENS: 820
OUTPUT COST: 0.024599999999999997
TOTAL COST PER QUESTION: 0.027179999999999996
TOTAL TIME PER QUESTION: 50s
TOTAL COST PER EXAM: 2.1743999999999994
TOTAL TIME PER EXAM: 66.67 minutes


### GPT-3.5: 実行時間、コストを推計する

In [13]:
import csv
import pandas as pd

exam_no = 70
with open(f'../data/processed/exam-{exam_no}.csv', mode='r', encoding='utf-8') as file:
    reader = csv.DictReader(file)
    dict_list = [row for row in reader]

item = dict_list[1] 
input =  USER_PROMPT.format(
    question=item['question'],
    answer_choices=item['answer_choices']
)
messages = [
    {
        "role": "user",
        "content": input
    }
]
response = chat_completions(messages, model='gpt-3.5-turbo-1106')
output = response.choices[0].message.content

In [14]:
print("INPUT:")
print(input)
print("OUTPUT:")
print(output)

INPUT:

## Question: ホスホジエステラーゼを阻害する気管支喘息の治療薬はどれか。
１．テルブタリン
２．オザグレル
３．テオフィリン
４．イプラトロピウム
５．クロモグリク酸ナトリウム
## Answer
model generated chain of thought explanation
Therefore, the answer is [final model answer (e.g. 1,2,3,4,5)]

OUTPUT:
ホスホジエステラーゼを阻害する気管支喘息の治療薬は、テオフィリンです。したがって、答えは３です。


### Exam 72: MedPromptでCOT templateを作成するためのもの

In [31]:
import csv
import pandas as pd
import random

def exam_result(exam_no):
    with open(f'../data/processed/exam-{exam_no}.csv', mode='r', encoding='utf-8') as file:
        reader = csv.DictReader(file)
        dict_list = [row for row in reader]

    random.shuffle(dict_list)
    result_items = []
    for i, item in enumerate(dict_list[:20]):
        print(i)
        messages = [
            {
                "role": "user",
                "content": USER_PROMPT.format(
                    question=item['question'],
                    answer_choices=item['answer_choices']
                )
            }
        ]
        response = chat_completions(messages)
        content = response.choices[0].message.content
        item['response'] = content
        result_items.append(item)
    
    exam_result_df = pd.DataFrame(result_items)
    return exam_result_df

In [32]:
exam_result_df = exam_result(72)

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19


In [33]:
exam_result_df.to_csv('../data/cot-gpt4/exam-72-result.csv', index=False)

### Exam74: GPT4で不正解だったものを対象とする

In [1]:
import pandas as pd

exam74_df = pd.read_csv('../data/simple-gpt4/exam-74-result.csv')
exam74_false_df = exam74_df[exam74_df['result'] == False]

In [5]:
exam74_false_list = exam74_false_df.to_dict('records')
result74 = []

for i, item in enumerate(exam74_false_list):
    print(i)
    messages = [
        {
            "role": "user",
            "content": USER_PROMPT.format(
                question=item['question'],
                answer_choices=item['answer_choices']
            )
        }
    ]
    response = chat_completions(messages)
    content = response.choices[0].message.content
    item['response'] = content
    result74.append(item)
    

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19


In [6]:
exam74_result_df = pd.DataFrame(result74)
exam74_result_df.head()

Unnamed: 0,no,question,answer_choices,answer,response,result
0,問5,牛の創傷性心外膜炎と関連のある病変・病態として最も適当なのはどれか。,１．心タンポナーデ\n２．うっ血性心不全\n３．心内膜の逆流性病変\n４．虎斑心\n５．真珠病,2,牛の創傷性心外膜炎は、心外膜の炎症を伴う病態であり、通常は心外膜と心筋の間に炎症による液体が...,False
1,問6,マレック病に関する記述として適当なのはどれか。,a 末梢神経線維の腫脹がみられる。\nb B リンパ球由来のリンパ腫である。\nc 大...,2,マレック病は家禽に感染するヘルペスウイルス科のウイルスによって引き起こされる病気です。この病...,False
2,問8,兎出血病に関する記述として正しいのはどれか。,１．病原体はフラビウイルス科に属する。\n２．感染経路は節足動物による生物学的伝播である。\...,5,"兎出血病（Rabbit Hemorrhagic Disease, RHD）についての記述を検...",False
3,問9,クラミジアによる疾患はどれか。,a 牛肺疫\nb Q 熱\nc オウム病\nd 流行性羊流産\ne 仮性皮疽\n１...,4,クラミジアは細菌の一種であり、様々な疾患を引き起こすことが知られています。選択肢からクラミジ...,False
4,問10,トリ白血病・肉腫（鶏白血病）に関する記述として適切なのはどれか。,１．病原ウイルスは血清学的に単一である。\n２．垂直感染しない。\n３．増殖欠損型ウイルスは...,3,トリ白血病・肉腫（鶏白血病）は、鶏に影響を与えるウイルス性の疾患であり、レトロウイルス科に属...,False


In [7]:
exam74_result_df.to_csv('../data/cot-gpt4/exam-74-result.csv', index=False)

In [8]:
import pandas as pd

exam74_result_manual_format_df = pd.read_csv('../data/cot-gpt4/exam-74-result-manual-format.csv')
exam74_result_manual_format_df.head()

Unnamed: 0,no,question,answer_choices,answer,response,result,result_with_cot
0,問5,牛の創傷性心外膜炎と関連のある病変・病態として最も適当なのはどれか。,１．心タンポナーデ\n２．うっ血性心不全\n３．心内膜の逆流性病変\n４．虎斑心\n５．真珠病,2,牛の創傷性心外膜炎は、心外膜の炎症を伴う病態であり、通常は心外膜と心筋の間に炎症による液体が...,False,False
1,問6,マレック病に関する記述として適当なのはどれか。,a 末梢神経線維の腫脹がみられる。\nb B リンパ球由来のリンパ腫である。\nc 大...,2,マレック病は家禽に感染するヘルペスウイルス科のウイルスによって引き起こされる病気です。この病...,False,False
2,問8,兎出血病に関する記述として正しいのはどれか。,１．病原体はフラビウイルス科に属する。\n２．感染経路は節足動物による生物学的伝播である。\...,5,"兎出血病（Rabbit Hemorrhagic Disease, RHD）についての記述を検...",False,False
3,問9,クラミジアによる疾患はどれか。,a 牛肺疫\nb Q 熱\nc オウム病\nd 流行性羊流産\ne 仮性皮疽\n１...,4,クラミジアは細菌の一種であり、様々な疾患を引き起こすことが知られています。選択肢からクラミジ...,False,True
4,問10,トリ白血病・肉腫（鶏白血病）に関する記述として適切なのはどれか。,１．病原ウイルスは血清学的に単一である。\n２．垂直感染しない。\n３．増殖欠損型ウイルスは...,3,トリ白血病・肉腫（鶏白血病）は、鶏に影響を与えるウイルス性の疾患であり、レトロウイルス科に属...,False,False


In [9]:
print(len(exam74_result_manual_format_df[exam74_result_manual_format_df['result_with_cot'] == True]) / len(exam74_result_manual_format_df))

0.25
