In [None]:
# 必要なモジュールをインポート
import os
import json
from dotenv import load_dotenv
from openai import OpenAI
import pandas as pd

# 環境変数の取得
load_dotenv()

# OpenAI APIクライアントを生成
client = OpenAI(api_key=os.environ['API_KEY'])

# モデル名
MODEL_NAME = "gpt-4o-mini"

In [None]:
# 住所から県名を推測して補完する関数
def extract_prefecture(address):
    # プロンプトの作成
    prompt_text = f"次の住所に基づいて、対応する都道府県名を推測し、「都道府県名」のみを答えてください：{address}"

    try:
        # OpenAI APIで応答を生成
        response = client.chat.completions.create(
            model=MODEL_NAME,
            messages=[
                {"role": "user", "content": prompt_text},
            ],
            max_tokens=100,  # 応答の長さを調整
            temperature=0.3  # 創造性の調整
        )
        # キーワード抽出結果を取得
        keywords = response.choices[0].message.content.strip()
        return keywords

    except Exception as e:
        print(f"API呼び出しでエラーが発生しました: {e}")
        return "エラー"

# 電話番号のフォーマットを統一する関数
def format_phone_numbers(phone_number):
    # プロンプトの作成
    prompt_text = f"次の電話番号を統一した形式「xxx-xxxx-xxxx」に変換してください。電話番号のみを出力してください: {phone_number}"

    try:
        # OpenAI APIで応答を生成
        response = client.chat.completions.create(
            model=MODEL_NAME,
            messages=[
                {"role": "user", "content": prompt_text},
            ],
            max_tokens=100,  # 応答の長さを調整
            temperature=0.3  # 創造性の調整
        )
        # キーワード抽出結果を取得
        keywords = response.choices[0].message.content.strip()
        return keywords

    except Exception as e:
        print(f"API呼び出しでエラーが発生しました: {e}")
        return "エラー"

In [None]:
# ワークフロー化
print("処理を開始します。")

# Excelファイルを読み込む
df = pd.read_excel('../sample_data.xlsx', sheet_name='住所')

# A列の各行のアンケートに対してキーワード抽出を実行し、B列に書き込む
df['都道府県'] = df['住所'].apply(extract_prefecture)

# 結果をExcelファイルに保存
df.to_excel("../output_sample/../output_sample/prefecture_addresses.xlsx", index=False)

print("Excelファイルに結果を保存しました。")


In [None]:
# ワークフロー化
print("処理を開始します。")

# Excelファイルを読み込む
df = pd.read_excel('../sample_data.xlsx', sheet_name='電話番号')

# A列の各行のアンケートに対してキーワード抽出を実行し、B列に書き込む
df['フォーマット後'] = df['電話番号'].apply(format_phone_numbers)

# 結果をExcelファイルに保存
df.to_excel("../output_sample/formatted_phone_numbers.xlsx", index=False)

print("Excelファイルに結果を保存しました。")
