In [2]:
import os
from dotenv import load_dotenv
from openai import OpenAI
import pandas as pd

load_dotenv("../.env")
client = OpenAI(api_key=os.environ['API_KEY'])

MODEL_NAME = "gpt-4o-mini"


In [3]:
df = pd.read_excel('サンプルデータ.xlsx', sheet_name='売上データ')
df.head()


Unnamed: 0,カテゴリー,商品コード,商品名,売上日,単価,数量,原価
0,食品,1001,りんご,2023-01-01,200,50,120
1,食品,1002,バナナ,2023-01-01,150,100,80
2,食品,1003,牛乳,2023-01-02,180,80,100
3,衣服,2001,Tシャツ,2023-01-02,1500,20,800
4,衣服,2002,ジーンズ,2023-01-03,5000,10,2500


In [4]:
sales_data_text = df.astype(str)
prompt_text = f"売上データ:\n{sales_data_text}\nこの売上データの傾向を分析してください。"
print(prompt_text)

売上データ:
    カテゴリー 商品コード      商品名         売上日    単価   数量    原価
0      食品  1001      りんご  2023-01-01   200   50   120
1      食品  1002      バナナ  2023-01-01   150  100    80
2      食品  1003       牛乳  2023-01-02   180   80   100
3      衣服  2001     Tシャツ  2023-01-02  1500   20   800
4      衣服  2002     ジーンズ  2023-01-03  5000   10  2500
..    ...   ...      ...         ...   ...  ...   ...
235    衣服  2077   レインパンツ  2023-04-28  2000   18  1000
236    食品  1085      ザクロ  2023-04-29   600   40   300
237   日用品  3077    バスブラシ  2023-04-29   400   60   200
238    衣服  2078  レインシューズ  2023-04-30  2500   15  1250
239    食品  1086    ココナッツ  2023-04-30   300   80   150

[240 rows x 7 columns]
この売上データの傾向を分析してください。


In [5]:
# 3. OpenAI APIの呼び出し

role = "あなたはマーケティング分野に精通したデータサイエンティストです。企業の成長をサポートするために、効果的なインサイトを提供します。"

response = client.chat.completions.create(
    model=MODEL_NAME,
    messages=[
        {"role": "system", "content": role},
        {"role": "user", "content": prompt_text},
    ],
)

print(response.choices[0].message.content.strip())

売上データの分析を行うために、いくつかの重要な指標やトレンドを考慮する必要があります。以下に示す各分析ポイントをもとに、売上データの傾向をまとめます。

### 1. **売上とカテゴリーの分析**
   - 各カテゴリー（食品、衣服、日用品）ごとの総売上や売上数量を比較します。これにより、顧客がどのカテゴリーに最も関心を持っているのかを把握できます。

### 2. **時間の経過による売上の傾向**
   - 売上日を基に、時間ごとの売上トレンド（例えば、月別、週別、日別）を可視化します。これにより、季節性や特定のキャンペーン期間における売上の変動を確認できます。

### 3. **利益率の分析**
   - 売上単価、数量、原価をもとに、各商品の粗利益を計算し、利益率を算出します。利益率が高い商品と低い商品を特定することで、在庫の最適化やプロモーション戦略を練りやすくなります。

### 4. **人気商品ランキング**
   - 各商品の売上数量や売上金額に基づいて、人気商品をランキングします。これにより、どの商品が最も販売されているのか、または販売が伸び悩んでいるのかを把握できます。

### 5. **顧客セグメンテーションとターゲット施策**
   - 特定の商品やカテゴリーへの売上が高い顧客層（年齢、性別、地域など）があれば、それに適したマーケティング施策を考えることができます。

### 6. **異常値やトレンドの強調**
   - 特定の日や月で異常に売上が高い、または低い場合、それに対する原因分析を行います。この際、競合状況やキャンペーンとの関連を考察することが重要です。

### 7. **販売数量の平均と散布度のチェック**
   - 売上数量の平均値と標準偏差を計算することで、販売数量の変動を理解。特に、極端に多くの販売があった商品の取り扱いや在庫管理に関する提言が可能になります。

### 8. **競合分析**
   - 業界内の競合商品やサービスを考慮し、価格設定やプロモーション戦略に対するフィードバックを行います。

### 結論
この売上データを基に、具体的な分析を行うことで、企業は売上向上のための明確な戦略を策定できます。顧客ニーズに基づいたマーケティング施策や効果的な在庫管理を行うことで、収益性の最大化を図ることが可能で

In [7]:
# 4. 分析結果をデータフレームに変換

result_list = response.choices[0].message.content.strip().split("\n")
df_out = pd.DataFrame(result_list, columns=['結果'])
print(df_out)

                                                   結果
0   売上データの分析を行うために、いくつかの重要な指標やトレンドを考慮する必要があります。以下に...
1                                                    
2                              ### 1. **売上とカテゴリーの分析**
3      - 各カテゴリー（食品、衣服、日用品）ごとの総売上や売上数量を比較します。これにより、...
4                                                    
5                            ### 2. **時間の経過による売上の傾向**
6      - 売上日を基に、時間ごとの売上トレンド（例えば、月別、週別、日別）を可視化します。こ...
7                                                    
8                                   ### 3. **利益率の分析**
9      - 売上単価、数量、原価をもとに、各商品の粗利益を計算し、利益率を算出します。利益率が...
10                                                   
11                               ### 4. **人気商品ランキング**
12     - 各商品の売上数量や売上金額に基づいて、人気商品をランキングします。これにより、どの...
13                                                   
14                     ### 5. **顧客セグメンテーションとターゲット施策**
15     - 特定の商品やカテゴリーへの売上が高い顧客層（年齢、性別、地域など）があれば、それに...
16                                                   
17                          

In [8]:
# 5. 結果をExcelファイルに保存

df_out.to_excel("売上データ分析結果.xlsx", index=False)

In [9]:
# ワークフロー化

print("処理を開始します")

# ファイル読み込み
df = pd.read_excel('サンプルデータ.xlsx', sheet_name='売上データ')

# テキスト形式に変換
sales_data_text = df.astype(str)
prompt_text = f"売上データ:\n{sales_data_text}\nこの売上データの傾向を分析してください。"

# OpenAIのAPI呼び出し
role = "あなたはマーケティング分野に精通したデータサイエンティストです。企業の成長をサポートするために、効果的なインサイトを提供します。"
response = client.chat.completions.create(
    model=MODEL_NAME,
    messages=[
        {"role": "system", "content": role},
        {"role": "user", "content": prompt_text},
    ],
)

# データフレーム形式に変換
result_list = response.choices[0].message.content.strip().split("\n")
df_out = pd.DataFrame(result_list, columns=['結果'])

# エクセルに保存
df_out.to_excel("売上データ分析結果.xlsx", index=False)

print("Excelファイルに分析結果を保存しました")

処理を開始します
Excelファイルに分析結果を保存しました
