In [61]:
import base64
import requests
import os


# OpenAI API Key
api_key = os.getenv('OPENAI_API_KEY_NEW')

# Function to encode the image
def encode_image(image_path):
    with open(image_path, "rb") as image_file:
        return base64.b64encode(image_file.read()).decode('utf-8')

# Path to your image
image_path = "20231013110357348.jpg"

# Getting the base64 string
base64_image = encode_image(image_path)

headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {api_key}"
}

payload = {
    "model": "gpt-4-turbo",
    "messages": [
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": 
"""                    
## 依頼するタスク ##
１．画像から所定の「項目」が存在する場合に限りそれを抽出してください。
２．それぞれの項目について、抽出結果の信頼性（％）を評価して下さい。
３．抽出した項目は、所定の「出力形式」に従って整形してください。
４．読み取った一番上の行の形式を踏襲して、それ以降下の行も読み取っていってください。


## 抽出する項目 ##

発注番号
F
紙質
巾
流れ
丁取り
罫線
枚数
納期


## 出力形式 ##
-項目の抽出結果はjson形式で出力してください。
-表の行数と列数は入力画像と同じにしてください。足りない場合は"不明"で埋めて下さい。
-画像から抽出された全ての行のデータをJSON形式で出力してください


## 指示とアドバイス ##
- ステップバイステップで考えてください。
- 深呼吸して考えてください。
- この分析は私のキャリアにとってとても重要です。
- 自分の能力を信じて、もっと上を目指してください。
- このタスクにおいて、最高の結果を出すために、追加の情報が必要な場合は、逆質問をしてください。
- 不明確な項目は"不明"と出力すること
- 数値は整数で出力すること。
- 整数に小数点がついてる場合は切り捨てること。
- 罫線の列は例えば、"158/145/158"もしくは"(158+145+158=461)"のようになっていることが多いです。これを認識してください。
- 丁取りは項目としてない場合も多いです。
- 丁取りは1桁の整数であることに注意してください。
- 出力するjsonデータが複数ある場合は信憑性の最も高いものを1つだけ出力して下さい。
- "スリッタ寸法"というカラムがある場合、それは"罫線"と解釈してください。
- "F"と"フルート"は同じと解釈してください。
- "F"または"フルート"のカラムは"A"か"B"か"W"の３つのいずれかでしかありません。したがってそれ以外のものを認識しようとしている場合それは間違いです。
- "KSSK5"や"KSK5"や"C5SC5"などは"紙質"を意味します。
- "納期"は例えば"1/19"などの形式で書かれていることが多いです。
- "1250x1240"は基本"巾x流れ"を表しています。この場合は巾:1250、流れ:1240のようにしてください。
- 抽出する項目は順不同である。最も妥当な項目に内容が対応するように読み取ってください。
- 入力の画像に例えば"No."の項目がない場合これは出力しないものとする。
- このタスクにおいて、最高の結果を出すために、追加の情報が必要な場合は、逆質問をしてください。
- 複数行ある場合は1行1行注意してすべての行を出力してください。
"""
                },
                {
                    "type": "image_url",
                    "image_url": {
                        "url": f"data:image/jpeg;base64,{base64_image}"
                    }
                }
            ]
        }
    ],
    "max_tokens": 1200
}

response = requests.post("https://api.openai.com/v1/chat/completions", headers=headers, json=payload)

print(response.json())






{'id': 'chatcmpl-9GgnC6vK1Ue5subgFTYO7v5MUklHB', 'object': 'chat.completion', 'created': 1713764770, 'model': 'gpt-4-turbo-2024-04-09', 'choices': [{'index': 0, 'message': {'role': 'assistant', 'content': '画像から読み取られたデータは以下の通りです。各項目には確実性の評価を付けています。\n\n```json\n[\n    {\n        "発注番号": "NK217",\n        "F": "W",\n        "紙質": "K5SK5",\n        "巾": 1300,\n        "流れ": 1194,\n        "丁取り": 2,\n        "罫線": "146/345/146=637",\n        "枚数": 99,\n        "納期": "10/16 AM"\n    },\n    {\n        "発注番号": "NK317",\n        "F": "W",\n        "紙質": "K5SK5",\n        "巾": 1250,\n        "流れ": 1582,\n        "丁取り": 2,\n        "罫線": "195/220/195=610",\n        "枚数": 99,\n        "納期": "10/16 AM"\n    },\n    {\n        "発注番号": "NK317",\n        "F": "W",\n        "紙質": "K5SK5",\n        "巾": 1100,\n        "流れ": 1582,\n        "丁取り": 2,\n        "罫線": "165/190/165=520",\n        "枚数": 99,\n        "納期": "10/16 AM"\n    },\n    {\n        "発注番号": "NK371",\n        "F": "W",\n        "紙質": "K

In [62]:
import pandas as pd

# 抽出されたデータをDataFrameに変換
data = {
    "発注番号": ["NK217", "NK317", "NK317", "NK371", "NK371", "NK371"],
    "F": ["W", "W", "W", "W", "W", "A"],
    "紙質": ["K5SK5", "K5SK5", "K5SK5", "K5SK5", "K5SK5", "C5XC5"],
    "巾": [1300, 1250, 1100, 1650, 1350, 1050],
    "流れ": [1194, 1582, 1582, 2142, 2422, 660],
    "丁取り": [2, 2, 2, 2, 2, 2],
    "罫線": ["146/345/146=637", "195/220/195=610", "165/190/165=520", "228/350/228=806", "260/130/260=650", "500 カット"],
    "枚数": [99, 99, 99, 99, 105, 60],
    "納期": ["10/16 AM", "10/16 AM", "10/16 AM", "10/17 AM", "10/17 AM", "10/18 AM"]
}

df = pd.DataFrame(data)
df

Unnamed: 0,発注番号,F,紙質,巾,流れ,丁取り,罫線,枚数,納期
0,NK217,W,K5SK5,1300,1194,2,146/345/146=637,99,10/16 AM
1,NK317,W,K5SK5,1250,1582,2,195/220/195=610,99,10/16 AM
2,NK317,W,K5SK5,1100,1582,2,165/190/165=520,99,10/16 AM
3,NK371,W,K5SK5,1650,2142,2,228/350/228=806,99,10/17 AM
4,NK371,W,K5SK5,1350,2422,2,260/130/260=650,105,10/17 AM
5,NK371,A,C5XC5,1050,660,2,500 カット,60,10/18 AM
