ビールメーカーのロゴをYOLOv5を使って検出するWEBアプリです。
キリンビールの麒麟とアサヒビールのAsahiを対象としています。
requirements.txtに記載されているYOLOv5の実行に必要なライブラリに加え、Flaskが必要です。
Anaconda Prompt等からapp.pyを引数無しで実行してください。
なお、クラス判定の閾値は0.7に設定しています。
(image_process.pyの38行目のconf_thresで変更可能です。)
YOLOv5自体に「albumentations」を使った画像水増しが存在しますが、ローカルで画像水増しを行いました。
「albumentations」を使って回転(RandomRotate)と切り出し(RandomSizedCrop)を行い、
4倍(65枚→260枚)に増やしています。
また、全体の40%に対してGridMaskを行っています。
なお、画像サイズは640*640にリサイズしています。
YOLOv5sをベースに学習させたモデルがbest_beer_yolov5s.pt、
YOLOv5mをベースに学習させたモデルがbest_beer_yolov5m.ptです。
(image_process.pyの35行目でモデルの変更が可能です。)
動画ファイル(mp4)も対応しています。
02.detect_samplesに検出用のサンプル画像を置いています。