In [None]:
# 必要なモジュールをインポート
import os
import json
from dotenv import load_dotenv
from openai import OpenAI
import pandas as pd

# 環境変数の取得
load_dotenv()

# OpenAI APIクライアントを生成
client = OpenAI(api_key=os.environ['API_KEY'])

# モデル名
MODEL_NAME = "gpt-4o-mini"

In [None]:
# データの読み込みと前処理を行う関数
def load_and_process_data(file_path):
    # Excelファイルを読み込む
    df = pd.read_excel(file_path, sheet_name='売上データ')

    # 「売上」列を追加（単価 * 数量）
    df["売上"] = df["単価"] * df["数量"]

    # 「売上日」列をdatetime型に変換
    df["売上日"] = pd.to_datetime(df["売上日"])

    # 「年月」列を追加（売上日の年と月を抽出）
    df["年月"] = df["売上日"].dt.strftime('%Y-%m')

    # データフレームを返す
    return df


def sum_sales_data(df):
    # 月ごとのカテゴリー別売上合計を集計
    pivot_table = pd.pivot_table(
        df,
        index='カテゴリー',   # 行にする項目
        columns='年月',      # 列にする項目
        values='売上',       # 集計対象の項目
        aggfunc='sum',       # 集計方法（ここでは合計を指定）
        fill_value=0         # NaNの代わりに埋める値
    )

    # ピボットテーブルを返す
    return pivot_table


# データをプロンプトに変換する関数
def convert_to_prompt(df, pivot_table):
    # データフレーム全体を文字列に変換
    sales_data_text = df.astype(str)

    # 集計結果を文字列に変換
    pivot_table_text = pivot_table.astype(str)

    # プロンプトの作成
    prompt_text = f"""
    売上データ:
    {sales_data_text}
    月ごとのカテゴリー別売上合計：
    {pivot_table_text}
    上記の「売上データ」と「月ごとのカテゴリー別売上合計」をもとに、カテゴリー毎の売上戦略を考案してください。
    """

    # デバック
    print("convert_to_promptメソッド")
    print(prompt_text)

    # プロンプトを返す
    return prompt_text


# OpenAI APIの呼び出しを行う関数
def get_openai_response(client, prompt_text, model_name="gpt-4o-mini"):
    # 役割を設定
    role = "あなたはマーケティング分野に精通したデータサイエンティストです。企業の成長をサポートするために、効果的なインサイトを提供します。"

    # APIへリクエスト
    response = client.chat.completions.create(
        model=model_name,
        messages=[
            {"role": "system", "content": role},
            {"role": "user", "content": prompt_text},
        ],
    )

    # 結果を取得
    result = response.choices[0].message.content.strip()

    # デバック
    print("get_openai_responseメソッド")
    print(result)

    # 結果を返す
    return result


# 結果をファイルに保存する関数
def save_result_to_file(result, file_path="../output_sample/category_strategy.md"):
    with open(file_path, mode="w", encoding="utf-8") as file:
        file.write(result)

In [None]:
# ワークフロー（メイン処理）
def main():
    print("処理を開始します。")

    # 1.データの読み込みと前処理
    print("（1/5）データの読み込みと前処理")
    df = load_and_process_data('../sample_data.xlsx')

    # 2.集計
    print("（2/5）集計")
    pivot_table = sum_sales_data(df)

    # 3.プロンプト生成
    print("（3/5）プロンプト生成")
    prompt_text = convert_to_prompt(df, pivot_table)

    # 4.OpenAI APIからの応答を取得
    print("（4/5）OpenAI APIからの応答を取得")
    result = get_openai_response(client, prompt_text)

    # 5.結果をファイルに保存
    print("（5/5）結果をファイルに保存")
    save_result_to_file(result)
    print("分析結果を保存しました。")

# ワークフローの実行
main()

In [None]:
from openai.types.chat import ChatCompletionToolParam

# ツール定義
tools=[
    ChatCompletionToolParam({
        "type": "function",
        "function": {
            "name": "get_products",
            "description": "グループごとに統一した商品名「group_name」と、グループに属する商品名のリスト「products」を結合した結果を返す",
            "parameters": {
                "type": "object",
                "properties": {
                    "product_data": {
                        "type": "array",
                        "items": {
                            "product_name": {
                                "type": "string",
                                "description": "グループごとに統一した商品名",
                            },
                            "products": {
                                "type": "string",
                                "description": "グループに属する商品名をカンマ区切りで並べた文字列",
                            },
                        },
                    }
                },
                "required": ["product_name", "products"],
            },
        },
    })
]

In [None]:
print("処理を開始します。")

# 1. Excelファイルを読み込む
df = pd.read_excel('../sample_data.xlsx', sheet_name='商品名')

# 2. データをLLM用にテキスト形式に変換
product_data_text = df.astype(str)
prompt_text = f"""
次の商品名のリストから、似た名前の商品をグループ化し、グループごとに統一した商品名「product_name」を提案し、グループに属する商品名をカンマ区切りで並べた文字列「products」を作成し、「product_nameとproductsのリスト」で構成されるJSONデータ「product_data」を出力してください。
{product_data_text}
"""

# 3. OpenAI APIの呼び出し
response = client.chat.completions.create(
    model=MODEL_NAME,
    messages=[
        {"role": "user", "content": prompt_text},
    ],
    tools=tools,
    tool_choice={
        "type":"function",
        "function":{"name":"get_products"}
    },
    response_format={"type":"json_object"}
)

# 4. 分析結果をJSONオブジェクトに変換
# ツール呼出情報を取得
tool = response.choices[0].message.tool_calls[0]
# JSONオブジェクトに変換
data = json.loads(tool.function.arguments)

# データフレームに変換
df_out = pd.DataFrame(data['product_data'])

# 5. 結果をExcelファイルに保存
df_out.to_excel("../output_sample/product_grouping.xlsx", index=False)

print("Excelファイルに処理結果を保存しました。")