## 概要

メインの実験用。
`gemini`を使用して、論文のアブストラクトの評価を行う。

システムプロンプトは`src/prompt/system_instructions.txt`に記載。

アブストラクトの評価指標は`src/prompt/rules.txt`に記載。

## モデルについて

- `gemini-1.5-flash`
- 回答は`JSON`に固定
- `temperature`: 0
- `Top-P`: 0

## 使い方

『分野』と『high or low』を指定して実行するだけ

実行結果は`data/results/{分野名}`に csv ファイルとして保存されます。

構造は`[ID,Abstract,rule1,rule2,...,rule31]`


# データの読み込み


In [None]:
# import
import sys
import os
import google.generativeai as genai
from dotenv import load_dotenv

current_dir = os.getcwd()
project_root = os.path.abspath(os.path.join(current_dir, ".."))
sys.path.append(project_root)

from utils import load_file_content
from gemini_processor import process_gemini

In [None]:
# システムプロンプトと評価指標をロード
system_instructions_path = "../prompt/system_instructions.txt"
rules_path = "../prompt/rules.txt"

system_instructions = load_file_content(system_instructions_path)
rules = load_file_content(rules_path)

In [None]:
# パスの設定
base_input_path = "../../data/csv"
base_output_path = "../../data/results"
fields = ["Biochemistry_Molecular_Biology", "Chemistry", "Engineering", "Materials_Science", "Physics"]

# モデルの設定


In [None]:
# モデルのインスタンスを作成
load_dotenv()
genai.configure(api_key=os.getenv("GEMINI_API_KEY"))
model = genai.GenerativeModel(
    model_name = "gemini-1.5-flash",
    system_instruction = system_instructions,
    generation_config={
                        "response_mime_type": "application/json",
                        "temperature": 0,
                        "top_p": 0,
                    }
)

# Gemini を使用した回答の生成


In [None]:
# 分野を指定
    # 0: Biochemistry_Molecular_Biology
    # 1: Chemistry
    # 2: Engineering
    # 3: Materials_Science
    # 4: Physics
selected_field = fields[0]
citation_type = "high"  # "high" or "low" 

In [None]:
# 処理を実行
process_gemini(model, rules, base_input_path, base_output_path, selected_field, citation_type)