Skip to content

Latest commit

 

History

History
39 lines (22 loc) · 1.55 KB

README.md

File metadata and controls

39 lines (22 loc) · 1.55 KB

yolov5_Beer_Logo_Detection

ビールメーカーのロゴをYOLOv5を使って検出するWEBアプリです。

キリンビールの麒麟キリンロゴ画像とアサヒビールのAsahiアサヒロゴ画像を対象としています。

必要なライブラリについて

requirements.txtに記載されているYOLOv5の実行に必要なライブラリに加え、Flaskが必要です。

実行について

Anaconda Prompt等からapp.pyを引数無しで実行してください。

なお、クラス判定の閾値は0.7に設定しています。

(image_process.pyの38行目のconf_thresで変更可能です。)

学習用データセット(01.training_dataset)について

YOLOv5自体に「albumentations」を使った画像水増しが存在しますが、ローカルで画像水増しを行いました。

「albumentations」を使って回転(RandomRotate)と切り出し(RandomSizedCrop)を行い、

4倍(65枚→260枚)に増やしています。

また、全体の40%に対してGridMaskを行っています。

なお、画像サイズは640*640にリサイズしています。

モデルについて

YOLOv5sをベースに学習させたモデルがbest_beer_yolov5s.pt、

YOLOv5mをベースに学習させたモデルがbest_beer_yolov5m.ptです。

(image_process.pyの35行目でモデルの変更が可能です。)

その他

動画ファイル(mp4)も対応しています。

02.detect_samplesに検出用のサンプル画像を置いています。