YOLO Sample - AWS Lambda Object Detection

AWS LambdaでYOLOv8を使った物体検出を行うシンプルなサンプルプロジェクトです。

現在の実装状態

本プロジェクトはベース実装の状態で提供されています。パフォーマンス最適化の試行錯誤の履歴は、ソースコード内にコメントとして保存されており、必要に応じて有効化することができます。

ベース構成

Lambda メモリ: 3GB (3008 MB)
アーキテクチャ: x86_64
JSON処理: 標準json
インポート方式: グローバルインポート
ログ: CloudWatch Logs有効（print文あり）

最適化履歴

過去に試行された最適化はコメントで保存:

メモリ増量（3GB → 10GB）
YOLO推論最適化（model.fuse(), torch.inference_mode()）
画像エンコード形式変更（PNG → JPEG quality=85）
ARM64アーキテクチャ変更
オーバーヘッド削減（print文削減、orjson、遅延インポート）

詳細は lambda_function.py および cdk-stack.ts のコメントを参照してください。

プロジェクト構成

lambda-yolo-sample/
├── cdk/                      # CDKプロジェクト
│   ├── bin/
│   │   └── cdk.ts           # CDKアプリエントリーポイント
│   ├── lib/
│   │   └── cdk-stack.ts     # CDKスタック定義
│   ├── lambda/
│   │   ├── Dockerfile       # Lambda用Dockerイメージ
│   │   ├── requirements.txt # Python依存関係
│   │   └── lambda_function.py # Lambdaハンドラー
│   ├── package.json
│   ├── tsconfig.json
│   └── cdk.json
├── scripts/                  # テストスクリプト
│   ├── invoke_lambda.py     # Lambda呼び出しスクリプト（単発テスト）
│   ├── measurement.py       # パフォーマンス計測スクリプト（31回実行）
│   └── requirements.txt     # スクリプト用依存関係
└── README.md

機能

YOLOv8を使った物体検出
Base64エンコードされた画像を受け取り、検出結果を返す
検出結果画像（バウンディングボックス付き）をBase64で返す
検出されたオブジェクトのリスト（クラス名、信頼度、位置）を返す

前提条件

Node.js 18以上
Python 3.11以上
AWS CLI設定済み
Docker

セットアップ

1. CDK依存関係のインストール

cd cdk
pnpm install

2. CDKのブートストラップ（初回のみ）

pnpm exec cdk bootstrap

3. デプロイ

pnpm exec cdk deploy

デプロイには10-15分程度かかります（Dockerイメージのビルドに時間がかかります）。

4. テストスクリプトの準備

cd ../scripts
python3 -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate
pip install -r requirements.txt

使い方

Lambda関数の呼び出し（単発テスト）

cd scripts
source venv/bin/activate  # Windows: venv\Scripts\activate

# 基本的な使い方
python invoke_lambda.py --image path/to/your/image.jpg

# 検出結果画像を保存
python invoke_lambda.py --image path/to/your/image.jpg --save-result result.jpg

# カスタムLambda関数名を指定
python invoke_lambda.py --image path/to/your/image.jpg --function-name your-function-name

# リージョンを指定
python invoke_lambda.py --image path/to/your/image.jpg --region us-east-1

パフォーマンス計測（31回実行）

cd scripts
source venv/bin/activate  # Windows: venv\Scripts\activate

# デフォルト設定（31回実行、1回目除外して30回平均）
python measurement.py --image path/to/your/image.jpg

# 実行回数を変更
python measurement.py --image path/to/your/image.jpg --runs 51

# 関数名とリージョンを指定
python measurement.py --image path/to/your/image.jpg \
  --function-name your-function-name \
  --region us-east-1

出力例（invoke_lambda.py）

総検出数: 3
検出されたクラス: person, car, dog

詳細:

  [1] person
      信頼度: 0.952
      位置: [120.5, 80.3, 350.2, 450.8]

  [2] car
      信頼度: 0.887
      位置: [400.1, 200.5, 600.3, 380.2]

  [3] dog
      信頼度: 0.723
      位置: [50.2, 300.1, 150.8, 420.5]

総処理時間: 718.56 ms
   Lambda内の計測: 413.75 ms
      Base64デコード: 4.23 ms
      YOLO処理合計: 63.71 ms
         - 推論: 49.15 ms
         - 結果描画: 14.39 ms
         - 検出リスト作成: 0.15 ms
      Base64エンコード: 342.28 ms
      サマリー作成: 0.01 ms
   その他（オーバーヘッド等）: 304.81 ms

※ 処理時間の内訳は階層的インデントで表示されます。 ※ 「総処理時間」はクライアント側で計測したLambda呼び出しのラウンドトリップ時間です。 ※ 「その他（オーバーヘッド等）」は、ネットワーク遅延やJSON処理など、Lambda内で計測されていない時間です。

出力例（measurement.py）

Lambda関数を31回実行します...
============================================================

[1/31] 実行中... 完了（コールドスタート - 集計対象外）
[2/31] 実行中... 完了（718.56 ms）
[3/31] 実行中... 完了（712.34 ms）
...
[31/31] 実行中... 完了（715.89 ms）

============================================================

集計: 30回の平均値を計算

============================================================
計測結果（平均値）
============================================================
総処理時間: 716.23 ms
   Lambda内の計測: 412.45 ms
      Base64デコード: 4.18 ms
      YOLO処理合計: 63.52 ms
         - 推論: 49.03 ms
         - 結果描画: 14.35 ms
         - 検出リスト作成: 0.14 ms
      Base64エンコード: 341.89 ms
      サマリー作成: 0.01 ms
   その他（オーバーヘッド等）: 303.78 ms
============================================================

全体の実行時間: 45.23 秒

Lambda関数のAPI仕様

リクエスト

{
  "image": "base64エンコードされた画像文字列"
}

レスポンス（成功時）

{
  "statusCode": 200,
  "body": {
    "annotatedImage": "base64エンコードされた検出結果画像",
    "detections": [
      {
        "class_id": 0,
        "class_name": "person",
        "confidence": 0.95,
        "bbox": [120.5, 80.3, 350.2, 450.8]
      }
    ],
    "summary": {
      "total_detections": 3,
      "classes_detected": ["person", "car", "dog"]
    }
  }
}

レスポンス（エラー時）

{
  "statusCode": 400,
  "body": {
    "error": "エラーメッセージ",
    "type": "エラータイプ"
  }
}

環境変数

Lambda関数で設定可能な環境変数:

変数名	デフォルト値	説明
`MODEL_NAME`	`yolov8n.pt`	使用するYOLOモデル
`CONF_THRESHOLD`	`0.25`	信頼度の閾値
`IOU_THRESHOLD`	`0.45`	IoUの閾値

カスタマイズ

異なるYOLOモデルを使う

cdk/lib/cdk-stack.ts の環境変数を変更:

environment: {
  MODEL_NAME: 'yolov8m.pt',  // n, s, m, l, x から選択
  CONF_THRESHOLD: '0.25',
  IOU_THRESHOLD: '0.45',
},

メモリとタイムアウトの調整

cdk/lib/cdk-stack.ts で変更:

memorySize: 3008,  // MB
timeout: cdk.Duration.seconds(120),  // 秒

トラブルシューティング

デプロイ時にエラーが発生する

Dockerが起動しているか確認
AWS認証情報が正しく設定されているか確認
十分なディスク容量があるか確認

Lambda関数がタイムアウトする

メモリサイズを増やす（メモリを増やすとCPUも増える）
タイムアウト時間を延長する

検出精度が低い

CONF_THRESHOLD を調整（低くすると検出数が増えるが誤検出も増える）
より大きなモデル（yolov8m, yolov8l など）を使用

クリーンアップ

リソースを削除する場合:

cd cdk
pnpm exec cdk destroy

参考リンク

ライセンス

MIT License

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
cdk		cdk
scripts		scripts
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

License

furuya02/lambda-yolo-sample

Folders and files

Latest commit

History

Repository files navigation