# Google Colabを利用してますでしょうか？
以下のコードを実行してください。
- API_KEYを取得・書き換え
- [Upstage API](https://console.upstage.ai/api-keys)
- [WANDB API](https://wandb.ai/authorize)


```sh
# ===============================
# 🔑 APIキーの設定
# ===============================
# https://console.upstage.ai/api-keys
os.environ["UPSTAGE_API_KEY"] = "YOUR_API_KEY"
print("🔐 Upstage APIキーを設定しました")

# https://wandb.ai/authorize (https://docs.wandb.ai/ja/support/find_api_key/ に解説があります)
os.environ["WANDB_API_KEY"] = "YOUR_API_KEY"
print("🔐 WANDB APIキーを設定しました")
```

他の設定は入りません。

In [None]:
import os

# ===============================
# 🧪 weaveのインストール
# ===============================
print("📦 weave をインストール中...")
!pip install -q weave==0.52.9

# ===============================
# 🔑 Upstage APIキーの設定
# ===============================
# https://console.upstage.ai/api-keys
os.environ["UPSTAGE_API_KEY"] = "YOUR_API_KEY"
print("🔐 Upstage APIキーを設定しました")

# https://wandb.ai/authorize (https://docs.wandb.ai/ja/support/find_api_key/ に解説があります)
os.environ["WANDB_API_KEY"] = "YOUR_API_KEY"
print("🔐 WANDB APIキーを設定しました")

# ===============================
# 📁 パス設定
# ===============================
ZIP_URL = "https://github.com/nhandsome-new/fc_2025_upstage_handson/raw/main/prep_google_colab/demo_imgs.zip"
ZIP_FILE = "demo_imgs.zip"
EXTRACT_DIR = "/content/demo_imgs"

# ===============================
# 📂 フォルダがあるかチェック
# ===============================
if not os.path.exists(EXTRACT_DIR):
    print("📂 フォルダが存在しません。初回セットアップを開始します...")

    # 🧭 1) 既存のフォルダ・ZIPファイルを削除（存在しなくてもOK）
    print("🧭 既存のフォルダ・ZIPファイルを削除中...")
    !rm -rf {EXTRACT_DIR} || true
    !rm -f {ZIP_FILE} || true

    # ⬇️ 2) wgetでZIPファイルをダウンロード
    print(f"⬇️ ZIPファイルをダウンロード中: {ZIP_URL}")
    !wget -q -O {ZIP_FILE} {ZIP_URL}
    print("✅ ダウンロード完了")

    # 📦 3) ZIPファイルを解凍
    print("📦 ZIPファイルを解凍中...")
    !unzip -q {ZIP_FILE} -d .
    print("✅ 解凍完了")

    # 🧼 4) ZIPファイルを削除
    print("🧼 ZIPファイルを削除中...")
    !rm {ZIP_FILE}
    print("✅ ZIPファイル削除完了")

else:
    print("✅ 既にフォルダが存在するため、ダウンロードと解凍はスキップします。")

# ===============================
# 📂 展開結果の確認
# ===============================
print(f"📂 展開結果の確認: {EXTRACT_DIR}")
!ls -l {EXTRACT_DIR}


# 📄 Document AI + LLM を活用したドキュメント業務の効率化

---

## 🪜 ① なぜ Document AI なのか？

### 🏢 多くの企業で「紙」「PDF」「スキャン画像」が業務の中核に存在
- 契約書・請求書・領収書・申請書 など
- デジタル化されていない文書が多数残っている

### ⏳ 業務効率化・自動化の「ボトルネック」になりやすい
- システム連携しにくい
- 情報検索・転記・集計などに人手が必要
- 自動化・高度化の足かせになるケースが多い

### 📈 最近増えている「ドキュメントの要約・抽出・分類」サービス
- AIによって文書を構造化する技術が進歩
- 既存システムと連携することで業務効率が飛躍的に向上
- 例：Document AI × LLM の組み合わせによる高度な処理

---

## 🚀 ② 活用のメリット

| 項目                   | 内容                                                                 |
|------------------------|----------------------------------------------------------------------|
| 🧑‍💼 作業者の負担軽減       | 手入力・目視確認などの単純作業を削減                                 |
| ⚡ 処理の高速化         | 数秒〜数分で情報抽出・整理が完了                                     |
| 🧭 ミスの防止           | 人手による確認・転記ミスを減らし、品質を安定化                         |
| 🔗 業務連携の自動化     | データ化することで他のシステムと連携しやすくなり、ワークフロー全体を自動化可能 |

---

## 🧪 ③ 活用例

### 🧠 Upstage Document Parse / LLM を活用した情報抽出デモ
- パートナー企業が開発した情報抽出DEMO
- 紙・PDF・画像形式の文書から必要な項目を自動で抽出
- 出力結果を構造化してシステム連携することで大幅な効率化を実現

![ie_demo](docs_imgs/Information_Extraction_DEMO.png)


# 🧠 ハンズオンの目的と概要

---

## 🪜 ① 目的

### 📄 Document AI と LLM の役割を理解
- **Document AI**：Upstage Document Parse  
  → 文書の構造化とテキスト抽出  
- **LLM**：Upstage Syn Pro
  → 抽出データの要約・質問応答・分類

### ⚙️ Document AI と LLM の活用方法を理解
- 実用シナリオの紹介
- 精度向上のための実践的 Tip

### 🧪 Weave の活用方法を理解
- パイプラインの **Trace（処理の可視化）**
- モデル結果の **評価と改善**

---

## 🪜 ② ハンズオンの流れ

### 🧭 Step 1：環境設定
- Upstage_HandsOn_Test.ipynb
- Upstage API / Weave の設定
- 必要な Function（Document Parse / LLM 生成 など）の定義

### 📄 Step 2：Document Parse の動作確認
- Upstage_HandsOn_1.ipynb
- **入力**：スマホ撮影した仮のドキュメント  
- **出力**：HTML  
- **目的**：構造化とテキスト抽出の仕組みを理解  
- Weave で処理の Trace を確認

### 🧠 Step 3：Syn（LLM）の動作確認
- Upstage_HandsOn_1.ipynb
- **入力**：Parse の結果（HTML）＋ PROMPT  
- **出力**：要約結果  
- **目的**：構造化データからの要約フローを体験  
- Weave で処理の Trace を確認

### 🧪 Step 4：Document Parse + Solar の活用例
- Upstage_HandsOn_1.ipynb
- 情報の抽出（例：事故報告書）
- 質問応答
- ドキュメント分類（例：保険請求書）

### 🏢 Step 5：実業務での情報抽出活用方法
- Upstage_HandsOn_2.ipynb
- 保険会社の事故状況報告書を題材に実施
- 精度向上・実活用のための Tip
  - 抽出プロセスの段階化
  - 必要情報の明確化
  - 出力形式の統一化

### ☕ ：休憩・ディスカッション

### 📝 Step 6：情報抽出の結果確認
- Upstage_HandsOn_2_All_Results.ipynb
- 異なるテンプレートでの情報抽出結果を比較
- 出力の一貫性と汎用性を確認

### 📊 Step 7：Weave を用いた評価
- Upstage_HandsOn_3.ipynb
- Weave の Evaluate 機能を活用
- 抽出結果の可視化と差分の確認
- 評価手法の理解と重要性の把握

### 🧪 Step 8：サンプルデータを用いた自由試し・結果発表
- 参加者ごとに自由にプロンプトを改善
- 評価スコアの向上を目指す
- 独自のモデル（プロンプト or ロジック）の構築
- 結果を共有し、アプローチの違いを議論

### ☕ ：休憩・ディスカッション

### 💬 Step 9：金融系の事例紹介・ディスカッション
- 実務での Document AI 活用事例の紹介（金融・保険分野）
- 情報抽出・分類・自動化の実例共有
- 実ビジネスでの活用可能性についてディスカッション
- 今後の展開・応用のアイデアブレスト

# 🪜 ステップ①：基本設定

**ハンズオン開始前に以下を実行してください:**

- [TEST CODE](./Upstage_HandsOn_Test.ipynb)
- Upstage API Key
- Weave ライブラリーの設置

In [7]:
# ======================================================
# 📦 1. 必要なライブラリのインポート
# ======================================================
import weave
from weave import Content
import os
import requests
from datetime import datetime
from IPython.display import display, Image, HTML
from typing import Annotated

# ======================================================
# 🚀 2. Weaveの初期化
# ======================================================
weave.init("UPSTAGE-HANDSON-STEP1")

# ======================================================
# 🔐 3. APIキーの設定
# https://console.upstage.ai/api-keys
# ======================================================
# os.environ["UPSTAGE_API_KEY"] = 'YOUR_API_KEY' # ← 実際のキーをここに入れる

# ======================================================
# ✅ 4. 初期化確認
# ======================================================
print("📚 ライブラリ準備完了!")
print("🎯 Weaveが初期化されました - すべての処理が自動追跡されます")
print(f"🔑 UPSTAGE_API_KEY: {'設定済み' if 'UPSTAGE_API_KEY' in os.environ and os.environ['UPSTAGE_API_KEY'] != 'YOUR_API_KEY' else '❌未設定'}")

[36m[1mweave[0m: wandb version 0.22.3 is available!  To upgrade, please run:
[36m[1mweave[0m:  $ pip install wandb --upgrade
[36m[1mweave[0m: weave version 0.52.11 is available!  To upgrade, please run:
[36m[1mweave[0m:  $ pip install weave --upgrade
[36m[1mweave[0m: Logged in as Weights & Biases user: nhandsome.
[36m[1mweave[0m: View Weave data at https://wandb.ai/nhandsome/UPSTAGE-HANDSON-STEP1/weave


📚 ライブラリ準備完了!
🎯 Weaveが初期化されました - すべての処理が自動追跡されます
🔑 UPSTAGE_API_KEY: 設定済み


# 🪜 ステップ①：基本設定

### 必要なFunctionの定義
- **Upstage Document Parse**
- **Upstage Syn Pro(LLM)**

### 参考
- 「weave.op」デコレータ
  - wandbのウェブ上、関数の入力・出力などをTraceするため

In [8]:
# ======================================================
# 🧾 1. Document Parse 関数
# ------------------------------------------------------
# - 画像ファイル（ドキュメント）を Upstage Document AI に送信
# - HTML形式に変換して返却
# ======================================================

@weave.op()
def upstage_document_parse(file_path: Annotated[str, Content]) -> str:
    """
    📄 文書をHTMLに変換する関数
    - Upstage Document AI API を利用
    - ファイルを送信して OCR + HTML 化
    """
    
    # Step 1. APIキーを環境変数から取得
    api_key = os.environ.get("UPSTAGE_API_KEY")
    if not api_key:
        raise ValueError("❌ UPSTAGE_API_KEY が環境変数に設定されていません。")

    # Step 2. 画像ファイルの読み込み
    with open(file_path, 'rb') as file:
        files = {
            "document": (os.path.basename(file_path), file, "image/jpeg")
        }
        data = {
            "model": "document-parse-nightly",
            "ocr": "auto",
            "output_formats": "html"
        }

        # Step 3. APIリクエスト送信
        response = requests.post(
            "https://api.upstage.ai/v1/document-ai/document-parse",
            headers={"Authorization": f"Bearer {api_key}"},
            files=files,
            data=data
        )

    # Step 4. 結果をJSONで取得してHTML部分を返す
    result = response.json()
    return result.get("content", {}).get("html", "")


# ======================================================
# ☀️ 2. LLM 応答生成関数
# ------------------------------------------------------
# - Syn Pro モデルを利用
# - メッセージリストを与えると応答テキストを返す
# ======================================================
@weave.op()
def upstage_solar_pro2(messages: list) -> str:
    """
    🧠 LLMで応答を生成する関数
    - Syn Pro モデルを使用
    - messages には system / user ロールのプロンプトを含む
    """
    # Step 1. APIキーを環境変数から取得
    api_key = os.environ.get("UPSTAGE_API_KEY")
    if not api_key:
        raise ValueError("❌ UPSTAGE_API_KEY が環境変数に設定されていません。")

    # Step 2. リクエストペイロードの構築
    payload = {
        "model": "syn-pro", # "solar-pro2",
        "messages": messages,
        "temperature": 0.7,
        "max_tokens": 16384,
        "reasoning_effort": "high",
    }

    # Step 3. APIリクエスト送信
    response = requests.post(
        "https://api.upstage.ai/v1/chat/completions",
        headers={
            "Authorization": f"Bearer {api_key}",
            "Content-Type": "application/json"
        },
        json=payload
    )

    # Step 4. 応答メッセージ部分のみを抽出して返す
    result = response.json()
    return result["choices"][0]["message"]["content"]

![dp_solar](./docs_imgs/DP_Solar_Flow_1.png)

---

![demo](./demo_imgs/check/TEST_IMAGE.jpeg)


## 🧾 ステップ②：Document Parseの動作確認
- **役割**：画像／PDF → テキスト＆構造化
- **入力例**：
  - スマホで撮影したドキュメント
- **出力例**：
  - HTML形式
  - ドキュメント内テーブルも構造化される

📌 *テキスト抽出＋構造化の結果を可視化し、どんなデータが取れるか観察*

In [9]:
# ======================================================
# 📁 1. 学習・テスト用のサンプル文書パスを設定
# ======================================================
SAMPLE_DOCUMENTS = [
    "./demo_imgs/check/TEST_IMAGE.jpeg",
]
sample_file = SAMPLE_DOCUMENTS[0]

# ======================================================
# 📄 2. Document Parse 実行
# ------------------------------------------------------
# - Upstage Document AI API に送信し、HTML 形式に変換
# - 結果の全体を表示すると長くなる可能性があるため、
#   ここでは先頭 300 文字だけをプレビュー表示
# ======================================================
print("\n📋 Document Parse結果 (最初の300文字):")
html_result = upstage_document_parse(sample_file)
print(html_result[:300])

# ======================================================
# 🖼 3. HTML解析結果のプレビュー表示
# ======================================================
print("# 🖼 HTML解析結果のプレビュー表示")
display(HTML(html_result))

[36m[1mweave[0m: 🍩 https://wandb.ai/nhandsome/UPSTAGE-HANDSON-STEP1/r/call/019a2eb8-78d1-7821-a845-830e258eaf78



📋 Document Parse結果 (最初の300文字):
<p id='0' data-category='paragraph' style='font-size:22px'>清掃業務見積金額算定資料<br>(建物清掃業者向け)</p>
<br><h1 id='1' style='font-size:20px'>発行日:令和7年8月15日</h1>
<h1 id='2' style='font-size:18px'>本資料は、 清掃業務の見積金額を算定するための基準を示したものです。 建物の規模、 機材の使用、 階数、 作業日などによ<br>り、 価格が変動します。</h1>
<h1 id='3' style='font-size:20px'>【基本
# 🖼 HTML解析結果のプレビュー表示


広さ,基本料金 (税抜),基本料金 (税込)
~100m2,"8,000円","8,800円"
101~500m2,"12,000円","13,200円"
501~1000m2,"18,000円","19,800円"
1001~2000m2,"25,000円","27,500円"
2001m2~,"35,000円","38,500円"

条件,加算額 (税抜),加算額 (税込)
機材なし,0円,0円
機材あり (標準),"5,000円","5,500円"
機材あり (大型),"8,000円","8,800円"
機材あり (特殊),"12,000円","13,200円"
高所作業 (3m以上~6m未満),"4,000円","4,400円"
高所作業 (6m以上),"8,000円","8,800円"
特殊洗剤・薬品使用 (一般),"3,000円","3,300円"
特殊洗剤・薬品使用 (業務用),"6,000円","6,600円"
アスベスト除去対応,"15,000円","16,500円"

階数/条件,加算額 (税抜),加算額 (税込)
1階,0円,0円
2~5階 (エレベーターあり),"1,000円","1,100円"
2~5階 (エレベーターなし),"3,000円","3,300円"
6階以上 (エレベーターあり),"2,000円","2,200円"
6階以上 (エレベーターなし),"5,000円","5,500円"

曜日,加算額 (税抜),加算額 (税込)
平日,0円,0円
土曜日,"2,000円","2,200円"
日曜・祝日,"3,000円","3,300円"
早朝 (7時以前) ・夜間 (20時以降),"5,000円","5,500円"

頻度/期間,1ヶ月契約,6ヶ月契約,12ヶ月契約
週1回,0%,3%,5%
週2回,0%,5%,8%
週3回以上,2%,7%,10%

0,1,2
契約種別,追加費用 (税抜),追加費用 (税込)
定期契約,0円,0円
単発契約 (1回のみ),"10,000円","11,000円"
急ぎ依頼 (24時間以内対応),"15,000円","16,500円"
深夜依頼 (22時以降),"8,000円","8,800円"


[36m[1mweave[0m: 🍩 https://wandb.ai/nhandsome/UPSTAGE-HANDSON-STEP1/r/call/019a2eb8-926a-73ca-a4aa-992a1c28fccc
[36m[1mweave[0m: 🍩 https://wandb.ai/nhandsome/UPSTAGE-HANDSON-STEP1/r/call/019a2eb8-a7cf-7801-b3ff-80a4601f23eb
[36m[1mweave[0m: 🍩 https://wandb.ai/nhandsome/UPSTAGE-HANDSON-STEP1/r/call/019a2eb8-d46f-7a30-9390-59985d1ed763
[36m[1mweave[0m: 🍩 https://wandb.ai/nhandsome/UPSTAGE-HANDSON-STEP1/r/call/019a2eb9-0914-7608-abf8-15ef71f15d88
[36m[1mweave[0m: 🍩 https://wandb.ai/nhandsome/UPSTAGE-HANDSON-STEP1/r/call/019a2eb9-200b-7de6-a737-e8dd121715da
[36m[1mweave[0m: 🍩 https://wandb.ai/nhandsome/UPSTAGE-HANDSON-STEP1/r/call/019a2eb9-4b0f-71d5-b01b-0d356a39e6f6
[36m[1mweave[0m: 🍩 https://wandb.ai/nhandsome/UPSTAGE-HANDSON-STEP1/r/call/019a2eb9-68a1-7d5b-a831-4e302c00162f
[36m[1mweave[0m: 🍩 https://wandb.ai/nhandsome/UPSTAGE-HANDSON-STEP1/r/call/019a2eb9-8c87-7083-a8e2-ec4c81de3044
[36m[1mweave[0m: 🍩 https://wandb.ai/nhandsome/UPSTAGE-HANDSON-STEP1/r/call/01

## 🧭 Weave の結果確認

### 📝 背景
- コードに `@weave.op` のデコレータを付けるだけで、  
  各処理のログ・中間結果を自動でトレースできる。
- 通常、ログの実装やファイル管理を行う場合は
  - ログ出力処理の追加
  - ファイル・ディレクトリの管理
  - 再実行時のトレース確認  
  …といった工数がかかる。

### 🌐 Weave でできること
- Web UI 上で以下の情報を簡単に確認可能：
  - 処理ごとの **入力・出力**  
  - 実行履歴・トレース  
- コードの修正を最小限に抑えつつ、実験・検証をスムーズに進められる。

### ✅ まとめ
- `@weave.op` を活用することで、ログ管理の工数を削減できる  
- 中間処理の挙動をブラウザ上で確認でき、開発スピードが向上  

![dp_solar](./docs_imgs/DP_Solar_Flow_2.png)
## 📝 ステップ③：Solarの動作確認（要約）
- **役割**：構造化データをベースに、テキスト情報を抽出・修正・生成
- **入力**：
  - PROMPT：ユーザーの指示
  - Document ParseのHTML出力
- **出力**：
  - 要約結果（自然言語）

In [10]:
# ======================================================
# 📝 Step ① LLMに渡すプロンプトを定義
# ------------------------------------------------------
# - 文書全体をざっくりと要約して「どんな種類のドキュメントか」
#   を LLM に説明させるためのプロンプト
# ======================================================
PROMPT = """
文書内容を見て、どんなドキュメントかを1-2文で簡潔に説明してください。
"""

# ======================================================
# 🧠 2. LLMに送信するメッセージの準備
# ------------------------------------------------------
# - userロールで HTML内容とプロンプトを一緒に渡す
# - HTMLは事前に upstage_document_parse() で取得済み
# ======================================================
explanation_messages = [
    {
        "role": "system",
        "content": "あなたは、HTML形式のドキュメント構造を理解し、ユーザーの指示に従ってタスクを実行するアシスタントです。必ず日本語で答えてください。"
    },
    {
        "role": "user",
        "content": f"# ドキュメント内容(HTML):\n{html_result}\n\n# プロンプト指示:\n{PROMPT}"
    }
]

# ======================================================
# ☀️ 3. Syn Pro による LLM 推論の実行
# ======================================================
print("\n🧠 LLMの答え:")
result = upstage_solar_pro2(explanation_messages)
print(result)



🧠 LLMの答え:
このドキュメントは、建物清掃業務の見積金額を算定するための基準を示す資料です。建物面積、機材使用、階数、作業日時、契約種別などに応じた基本料金、加算額、割引率を詳細に定めたもので、税抜・税込価格表や注意事項、事例を含む業界標準の料金体系を提供しています。


## 🧠 ステップ④：活用例

要約以外にも、**Document Parse + Syn（LLM）** を組み合わせることで  
実際の業務現場で幅広い作業を自動化・効率化することが可能。

![img](./docs_imgs/DP_Solar_Flow_3.png)

---

### 🧾 1. 情報抽出
- **入力例**：建物清掃業務の見積金額算定基準  
- **目的**：指定された情報（例：清掃対象面積）のみを抽出  
- **プロンプト例**：
```yaml
清掃対象の面積に関する情報のみ抽出してください。


In [11]:
# ======================================================
# 📝 1. LLMに渡すプロンプトを定義
# ======================================================
PROMPT = """
文書内容を見て、清掃対象の面積に関する情報（値段）のみ抽出してください。
"""

# ======================================================
# 🧠 2. LLMに送信するメッセージを準備
# ======================================================
explanation_messages = [
    {
        "role": "system",
        "content": "あなたは、HTML形式のドキュメント構造を理解し、ユーザーのプロンプトに従ってタスクを実行するアシスタントです。必ず日本語で答えてください。"
    },
    {
        "role": "user",
        "content": f"# ドキュメント内容(HTML):\n{html_result}\n\n# プロンプト指示:\n{PROMPT}"
    }
]

# ======================================================
# ☀️ 3. Syn Pro による LLM 推論の実行
# ======================================================
print("\n🧠 LLMの答え:")
result = upstage_solar_pro2(explanation_messages)
print(result)



🧠 LLMの答え:
以下の表は、清掃対象の面積に応じた基本料金（税抜・税込）情報を抽出したものです：

| **広さ**       | **基本料金 (税抜)** | **基本料金 (税込)** |
|----------------|---------------------|---------------------|
| ~100m²         | 8,000円            | 8,800円            |
| 101~500m²      | 12,000円           | 13,200円           |
| 501~1000m²     | 18,000円           | 19,800円           |
| 1001~2000m²    | 25,000円           | 27,500円           |
| 2001m²~        | 35,000円           | 38,500円           |

### 備考:
- 面積算出時は「共用部・バックヤード・天井高」に留意が必要（※6参照）。
- 基本料金には「定期訪問費」「廃棄物処理費」は含まれていません（※7参照）。
- 500m²以下の小規模施設でも作業内容の複雑化により、面積加重型の見積もりが主流です（※20参照）。


### ❓ 2. 質問応答
- **入力例**：建物清掃業務の見積金額算定基準  
- **目的**：条件をもとに概算金額を問い合わせ + コスト削減案を検討  
- **プロンプト例**：
```yaml
面積（450m2）、素材あり（大型）、高所作業（6m以上）、1階、日曜の場合の概算を教えてください。
より安価に作業依頼をする方法はありますか？
```

In [12]:
# ======================================================
# 📝 1. LLMに渡すプロンプトを定義
# ======================================================
PROMPT = """
文書内容を見て、以下2つについて、簡単にまとめて答えてください。
・面積（450m2）、素材あり（大型）、高所作業（6m以上）、1階、日曜の場合の概算
・より安価に作業依頼をする方法はないか？
"""

# ======================================================
# 🧠 2. LLMに送信するメッセージを準備
# ======================================================
explanation_messages = [
    {
        "role": "system",
        "content": "あなたは、HTML形式のドキュメント構造を理解し、ユーザーのプロンプトに従ってタスクを実行するアシスタントです。必ず日本語で答えてください。"
    },
    {
        "role": "user",
        "content": f"# ドキュメント内容(HTML):\n{html_result}\n\n# プロンプト指示:\n{PROMPT}"
    }
]

# ======================================================
# ☀️ 3. Syn Pro による LLM 推論の実行
# ======================================================
print("\n🧠 LLMの答え:")
result = upstage_solar_pro2(explanation_messages)
print(result)



🧠 LLMの答え:
### 1. **面積（450m²）、素材あり（大型）、高所作業（6m以上）、1階、日曜の場合の概算**  
- **基本料金**: 101~500m² → **12,000円（税抜）**  
- **機材加算（大型）**: **8,000円（税抜）**  
- **高所作業加算（6m以上）**: **8,000円（税抜）**  
- **曜日加算（日曜）**: **3,000円（税抜）**  
- **合計（税抜）**: 12,000 + 8,000 + 8,000 + 3,000 = **31,000円**  
- **税込金額**: 31,000 × 1.1 = **34,100円**  

※追加費用（廃棄物処理費、定期訪問費、安全装備費）は含まれていません。  

---

### 2. **より安価に作業依頼する方法**  
- **契約期間の延長**:  
  - 6ヶ月以上契約で **3~5%割引**適用（例: 週1回作業の場合）。  
  - 12ヶ月契約で最大 **5~10%割引**可能。  
- **作業日時調整**:  
  - 土日・深夜作業を避け、平日昼間の作業を選ぶことで **2,000~5,000円/回節約**。  
- **機材選定**:  
  - 「大型」機材の代わりに「標準」機材使用で **3,000円/回節約**。  
- **自社資源活用**:  
  - 電源・水道を自社で確保し、別途費用を回避。  
- **単発契約回避**:  
  - 定期契約を選択し、**10,000円（税抜）の単発追加費を回避**。  
- **作業範囲縮小**:  
  - アスベスト除去や特殊洗剤使用を避け、**15,000~6,000円/回の加算費を削減**。  

※詳細な条件は現場状況により変動します。


![step_2](./docs_imgs/DP_Solar_Classification.png)
---
### 🗂 3. ドキュメント分類
- **目的**：文書の種類を自動判別  
  - 例：請求書／領収書／契約書／見積書 など  
- **応用例**：
  - 文書種類ごとの自動ワークフロー振り分け
  - 特定ドキュメント種別に応じた LLM プロンプト分岐

In [13]:
# ======================================================
# 🧾 1. 分類対象のファイルリストを定義
# ======================================================
RANDOM_FILES = [
    "./demo_imgs/classification/sample_1.jpeg",
    "./demo_imgs/classification/sample_2.jpeg",
    "./demo_imgs/classification/sample_3.jpeg",
    "./demo_imgs/classification/sample_4.jpeg",
    "./demo_imgs/classification/sample_5.jpeg",
]

# ======================================================
# 📝 2. LLM用プロンプトを定義
# ------------------------------------------------------
# - 「医療査定部」と「賠償・傷害対応部」の
#   どちらに該当するドキュメントかを分類させる
# - 担当部署名と簡単な理由を返すよう指示
# ======================================================
PROMPT = """
「医療査定部」と「賠償・傷害対応部」の業務のため、ドキュメントを分類してください。
- 医療査定部：医療・入院・通院関連の請求処理に特化した標準的な名称。実務感が強い。
- 賠償・傷害対応部：傷害保険と賠償責任をまとめて扱う場合に汎用性が高い。

## 出力の例
  - 担当部署
  - その理由（簡単に）
"""

# ======================================================
# 🧠 3. 各ファイルを順番に処理
# ======================================================
for sample_file in RANDOM_FILES:
    print(f"\n🧠 FILE_PATH: {sample_file}")

    # --- 1. Document Parse（HTML化） ---
    html_result = upstage_document_parse(sample_file)

    # --- 2. LLMに渡すメッセージの準備 ---
    explanation_messages = [
        {
            "role": "system",
            "content": "あなたは、HTML形式のドキュメント構造を理解し、ユーザーのプロンプトに従ってタスクを実行するアシスタントです。必ず日本語で答えてください。"
        },
        {
            "role": "user",
            "content": f"# ドキュメント内容(HTML):\n{html_result}\n\n# プロンプト指示:\n{PROMPT}"
        }
    ]

    # --- 3. Syn Pro による LLM分類 ---
    result = upstage_solar_pro2(explanation_messages)

    # --- 4. 分類結果の出力 ---
    print(result)



🧠 FILE_PATH: ./demo_imgs/classification/sample_1.jpeg
- **担当部署**: 賠償・傷害対応部  
- **理由**:  
  ドキュメントは「傷害保険金請求書」であり、事故状況（転倒による捻挫）や保険金支払先情報など、**傷害保険に基づく補償請求**を目的とした内容です。  
  「医療査定部」は医療費・通院費などの**医療関連費用の査定**に特化した部署ですが、本文書は傷害保険金の請求手続き全体（事故状況、支払先口座等）を網羅しており、**傷害保険と賠償責任を統合的に扱う「賠償・傷害対応部」**が適切です。  
  また、文書内に第三者責任や賠償関連の記述は明示されていませんが、「傷害保険」自体が該当部署の管轄範囲に含まれるため、分類の根拠となります。

🧠 FILE_PATH: ./demo_imgs/classification/sample_2.jpeg
- **担当部署**: 賠償・傷害対応部  
- **その理由**:  
  ドキュメントは「賠償責任保険金請求書」であり、以下の内容を含むためです。  
  1. **賠償責任**関連: 相手方の財物損害（丸太転倒による通行人転倒）及び人身損害（腕の骨折）への補償請求が明記されています。  
  2. **傷害保険**関連: 相手方の傷害部位・診断名（腕の骨折）、病院名、治療経過が記載されています。  
  3. ドキュメント全体が「賠償責任」と「傷害」を同時に扱う構造であり、両部署の業務範囲を跨ぐため、汎用性の高い「賠償・傷害対応部」が最適です。  

  ※「医療査定部」は純粋な医療費・入院費請求に特化した部署であり、本ドキュメントは賠償責任が主軸であるため不適です。

🧠 FILE_PATH: ./demo_imgs/classification/sample_3.jpeg
- **担当部署**: 賠償・傷害対応部  
- **その理由**:  
  ドキュメントは傷病名、外傷の原因、後遺障害の有無、入院・通院期間、治療経過、既往症の影響など、**傷害保険および賠償責任判断に必要な情報**を網羅しています。特に「主たる発症原因」(外傷/疾患/既往症増悪)、「後遺障害残存見込」「転帰(治癒/継続/転医)」などの項目は、賠償額算定や保険金支払いの

---

# 次：Upstage_HandsOn_2
## 実務での活用方法：保険会社 — 事故状況報告書からの情報抽出
![](./docs_imgs/Step_2.png)