<p align="center">
    <img src="https://github.com/YoungsukHan/Hyundai_equip/assets/44924554/076ffad6-abf4-431b-af15-10373ba06182" align="right">
</p>

# ** 용접 공정 객체 탐지 데이터 AI 실습**

**제목:** 자동차 용접 공정에서 수집된 이미지를 가지고 딥러닝 학습을 통해 자동차와 로봇을 객체 탐지하고자 함.

**Description:** 본 자료는 Roboflow에서 제공하는 Car Factory Computer Vision Project 데이터셋을 기반으로 작성된 교육자료입니다.

https://universe.roboflow.com/sintlievenscollege-iwai-j5/car-factory

※ 분석하기에 앞서 다음과 같은 가상환경이 구축되어있는지 확인해주세요. <br>
Python 버전 : 3.10.12

In [1]:
!python --version

Python 3.10.12


## 1. 분석 개요

### 1.1 분석 배경

**공정(설비) 개요:**
- 용접 공정은 자동차 제조, 조선, 항공우주 등 다양한 산업에서 중요하게 사용됩니다.
- 주요 설비로는 용접 로봇, 용접기, 그리고 이를 제어하는 시스템 등이 있습니다.<br>


    |<b>자동차 용접 공정 예시</b> |
    | :--: |
    | ![Welding_1](https://github.com/YoungsukHan/Hyundai_equip/assets/44924554/9827652a-a39f-4228-acaf-e570368c6d66)|
    | (출처:https://www.autoelectronics.co.kr/article/articleView.asp?idx=927)|

**이슈사항(Pain Point):**
- 용접 공정에서 자동차와 로봇의 위치와 동작을 정확하게 모니터링하지 않으면, 용접 품질이 저하되거나 기계 손상이 발생할 수 있습니다. 
- 이를 방지하기 위해 정확한 객체 탐지가 필요합니다.
  
### 1.2 분석 목표

**분석 목표:**
- 용접 공정 모니터링 이미지를 분석하여 자동차와 로봇 객체를 탐지하기위해 딥러닝 알고리즘을 활용합니다.

**제조 데이터 분석 기대효과:**
- 데이터를 분석함으로써 공정 중 자동차와 로봇의 정확한 위치를 파악하고, 이상 상태를 사전에 감지하여 공정의 효율성과 안전성을 높일 수 있습니다.

### 1.3 제조데이터 소개

**데이터 수집 방법:**
- 제조 분야: 자동차 산업 분야
- 제조 공정명: 자동차 용접
- 수집장비: 이미지 센서
- 수집주기: 용접 공정 진행에 따른 연속적인 이미지 수집

**데이터 유형/구조:**<br>
    
|<b> 자동차 용접 공정 이미지 데이터 예시</b> |
| :--: |
| <img src="https://github.com/YoungsukHan/Hyundai_equip/assets/44924554/50077a55-d956-4740-a9d7-7332dd09c960" width="850" height="400" />|

|<b> 자동차 용접 공정에서의 객체 탐지 예시</b> |
| :--: |
| <img src="https://github.com/YoungsukHan/Hyundai_equip/assets/44924554/b2f1c979-f0ac-47be-86da-0b8995231c31" width="850" height="600" />|

 - 데이터 크기, 데이터 수량: 총 27개의 이미지(640X640)
 - 독립변수/종속변수 정의:<br>

|<b></b> |
| :--: |
| <img src="https://github.com/YoungsukHan/Hyundai_equip/assets/44924554/a0ecfb1a-e298-40a2-b026-fa301815dad6" width="500" height="600" /> |

## 2. 분석 실습


### 2-1. 라이브러리 / 데이터 불러오기

#### 필요한 라이브러리 설치 및 불러오기

In [2]:
!git clone https://github.com/YoungsukHan/yolov5.git

Cloning into 'yolov5'...


In [3]:
%cd yolov5

D:\구글 드라이브 백업\대학원\현대차 설비보전 강의\데이터셋\Welding\yolov5


  self.shell.db['dhist'] = compress_dhist(dhist)[-100:]


In [5]:
%pip install -qr requirements.txt comet_ml

Note: you may need to restart the kernel to use updated packages.


In [4]:
import torch
import utils
display = utils.notebook_init()  # checks

YOLOv5  2024-6-5 Python-3.10.12 torch-2.3.0+cpu CPU


Setup complete  (20 CPUs, 31.9 GB RAM, 1268.5/1863.0 GB disk)


#### 데이터 디렉토리 경로 설정

In [5]:
import os
dataset_loc = os.path.join("..", "dataset")
dataset_loc

'..\\dataset'

### 2-2. YOLOv5 Tutorial

#### Classification과 Object Detection 비교

Classification
- Classification은 이미지 내의 객체가 어떤 클래스에 속하는지를 판별하는 작업입니다.
- 입력 이미지가 주어지면, 이미지에 포함된 객체가 사전에 정의된 클래스들 중 하나로 분류됩니다.

Object Detection
- Object Detection은 이미지 내의 여러 객체들을 찾아내고, 각 객체가 어떤 클래스에 속하는지를 판별하는 작업입니다.
- 객체의 위치(바운딩 박스)와 클래스 라벨을 함께 예측합니다.

|<b> Classification과 Object Detection 비교 예시</b> |
| :--: |
| ![Clamp_4](https://github.com/YoungsukHan/Hyundai_equip/assets/44924554/7bc12e24-114f-4a28-9476-6bce2941344e)|

#### YOLOv5

- YOLOv5은 객체 검출(Object Detection) 분야에서 널리 사용되는 딥러닝 모델로, 'You Only Look Once'의 약자입니다.
- 이 모델은 이미지 내의 객체를 실시간으로 탐지하고 분류하는 데 뛰어난 성능을 발휘합니다.

|<b> YOLOv5 모델 구조</b> |
| :--: |
| ![Clamp_4](https://user-images.githubusercontent.com/31005897/172404576-c260dcf9-76bb-4bc8-b6a9-f2d987792583.png)|

- YOLOv5는 모델 복잡도에 따라서 총 5가지 모델을 제공합니다.

|<b> YOLOv5의 5가지 모델 종류</b> |
| :--: |
| ![Clamp_4](https://github.com/ultralytics/yolov5/releases/download/v1.0/model_comparison.png)|




#### 사전학습된 YOLOv5 모델을 사용한 객체 탐지

- YOLOv5는 COCO라는 이미지 벤치마크 데이터셋으로 사전학습된 모델을 제공합니다.

|<b> COCO 데이터셋의 이미지 예시</b> |
| :--: |
| ![Clamp_5](https://github.com/YoungsukHan/Hyundai_equip/assets/44924554/61a83e2f-adcb-4be2-b9e6-3542009ce48e)|

##### YOLOv5에서 제공하는 샘플 이미지를 대상으로 객체 탐지

In [6]:
!python detect.py --weights yolov5s.pt --img 640 --conf 0.4 --source data/images

[34m[1mdetect: [0mweights=['yolov5s.pt'], source=data/images, data=data\coco128.yaml, imgsz=[640, 640], conf_thres=0.4, iou_thres=0.45, max_det=1000, device=, view_img=False, save_txt=False, save_csv=False, save_conf=False, save_crop=False, nosave=False, classes=None, agnostic_nms=False, augment=False, visualize=False, update=False, project=runs\detect, name=exp, exist_ok=False, line_thickness=3, hide_labels=False, hide_conf=False, half=False, dnn=False, vid_stride=1
fatal: cannot change to 'D:\援ш��': No such file or directory
YOLOv5  2024-6-5 Python-3.10.12 torch-2.3.0+cpu CPU

Downloading https://github.com/ultralytics/yolov5/releases/download/v7.0/yolov5s.pt to yolov5s.pt...

  0%|          | 0.00/14.1M [00:00<?, ?B/s]
  1%|          | 128k/14.1M [00:00<00:28, 516kB/s]
  3%|2         | 384k/14.1M [00:00<00:13, 1.06MB/s]
  4%|4         | 640k/14.1M [00:00<00:10, 1.40MB/s]
  6%|6         | 896k/14.1M [00:00<00:08, 1.63MB/s]
 10%|9         | 1.38M/14.1M [00:00<00:05, 2.58MB/s]
 17%|

##### 자동차 용접 공정 샘플 이미지 데이터를 대상으로 객체 탐지

In [33]:
# train/images 폴더 내 파일 목록 가져오기
train_images_dir = os.path.join(dataset_loc, "train\images")

# 샘플 파일명과 파일경로 출력
file_list = os.listdir(train_images_dir)
sample_file = file_list[5]
sample_file_path = os.path.join(train_images_dir, sample_file)
print("샘플 파일명:", sample_file)
print("샘플 파일 경로:", sample_file_path)

샘플 파일명: stock-footage-aerial-car-factory-d-concept-automated-robot-arm-assembly-line-manufacturing-high-tech_mp4-19_jpg.rf.54989e851efa1f9aedd27907ba1a36e6.jpg
샘플 파일 경로: ..\dataset\train\images\stock-footage-aerial-car-factory-d-concept-automated-robot-arm-assembly-line-manufacturing-high-tech_mp4-19_jpg.rf.54989e851efa1f9aedd27907ba1a36e6.jpg


In [34]:
!python detect.py --weights yolov5s.pt --img 640 --conf 0.2 --source $first_file_path

[34m[1mdetect: [0mweights=['yolov5s.pt'], source=..\dataset\train\images\stock-footage-aerial-car-factory-d-concept-automated-robot-arm-assembly-line-manufacturing-high-tech_mp4-19_jpg.rf.54989e851efa1f9aedd27907ba1a36e6.jpg, data=data\coco128.yaml, imgsz=[640, 640], conf_thres=0.2, iou_thres=0.45, max_det=1000, device=, view_img=False, save_txt=False, save_csv=False, save_conf=False, save_crop=False, nosave=False, classes=None, agnostic_nms=False, augment=False, visualize=False, update=False, project=runs\detect, name=exp, exist_ok=False, line_thickness=3, hide_labels=False, hide_conf=False, half=False, dnn=False, vid_stride=1
fatal: cannot change to 'D:\援ш��': No such file or directory
YOLOv5  2024-6-5 Python-3.10.12 torch-2.3.0+cpu CPU

Fusing layers... 
YOLOv5s summary: 213 layers, 7225885 parameters, 0 gradients, 16.4 GFLOPs
image 1/1 D:\  \\  \\Welding\dataset\train\images\stock-footage-aerial-car-factory-d-concept-automated-robot-arm-assembly-line-manufacturing-high-tech_mp4-

### 2-3. YOLOv5 학습

#### tensorboard 설치
- TensorBoard는 TensorFlow 라이브러리와 함께 제공되는 시각화 도구로, 머신러닝 모델의 학습 과정을 모니터링하고 분석할 수 있게 도와줍니다.
- 주로 딥러닝 모델의 학습 과정 중 발생하는 다양한 로그를 시각화하는 데 사용됩니다.
  
|<b> tensorboard의 예시</b> |
| :--: |
| ![](https://www.tensorflow.org/static/tensorboard/images/tensorboard.gif?hl=ko)|


In [16]:
pip install tensorboard

Note: you may need to restart the kernel to use updated packages.


In [37]:
#@title Select YOLOv5 🚀 logger {run: 'auto'}
logger = 'TensorBoard' #@param ['Comet', 'ClearML', 'TensorBoard']

if logger == 'Comet':
  %pip install -q comet_ml
  import comet_ml; comet_ml.init()
elif logger == 'ClearML':
  %pip install -q clearml
  import clearml; clearml.browser_login()
elif logger == 'TensorBoard':
  %load_ext tensorboard
  %tensorboard --logdir runs/train

#### 모델 학습

In [41]:
# yaml 파일 경로 설정
yaml_loc = os.path.join(dataset_loc, "data.yaml")

In [39]:
!python train.py --img 640 --batch 16 --epochs 100 --data $yaml_loc --weights yolov5n.pt --cache

[34m[1mtrain: [0mweights=yolov5n.pt, cfg=, data=..\dataset\data.yaml, hyp=data\hyps\hyp.scratch-low.yaml, epochs=100, batch_size=16, imgsz=640, rect=False, resume=False, nosave=False, noval=False, noautoanchor=False, noplots=False, evolve=None, evolve_population=data\hyps, resume_evolve=None, bucket=, cache=ram, image_weights=False, device=, multi_scale=False, single_cls=False, optimizer=SGD, sync_bn=False, workers=8, project=runs\train, name=exp, exist_ok=False, quad=False, cos_lr=False, label_smoothing=0.0, patience=100, freeze=[0], save_period=-1, seed=0, local_rank=-1, entity=None, upload_dataset=False, bbox_interval=-1, artifact_alias=latest, ndjson_console=False, ndjson_file=False
[34m[1mgithub: [0mup to date with https://github.com/ultralytics/yolov5 
fatal: cannot change to 'D:\援ш��': No such file or directory
YOLOv5  2024-6-5 Python-3.10.12 torch-2.3.0+cpu CPU

[34m[1mhyperparameters: [0mlr0=0.01, lrf=0.01, momentum=0.937, weight_decay=0.0005, warmup_epochs=3.0, warmu

#### 모델 학습 결과

**성능지표: mAP (Mean Average Precision)**
- mAP는 객체 탐지(Object Detection) 모델의 성능을 평가하는 지표로, 모델이 이미지에서 객체를 얼마나 정확하게 탐지하고 분류하는지를 나타냅니다.

**mAP 계산 과정**
1. **Precision-Recall Curve**: 다양한 임계값에서 Precision과 Recall을 계산하여 곡선을 그립니다.
   - **Precision (정밀도)**: 모델이 예측한 객체 중 실제로 올바른 객체의 비율.
   - **Recall (재현율)**: 실제 객체 중에서 모델이 올바르게 검출한 객체의 비율.
3. **AP (Average Precision)**: Precision-Recall Curve 아래의 면적을 계산하여 특정 클래스에 대한 AP를 구합니다.
4. **mAP (Mean Average Precision)**: 모든 클래스에 대한 AP의 평균을 계산하여 mAP를 구합니다.


**참고지표**
|<b> F1</b> |
| :--: |
| <img src="https://github.com/YoungsukHan/Hyundai_equip/assets/44924554/55bc0420-71f8-4391-a508-a0d8bb28afd3" width="600" height="600" />|

#### 모델 평가

In [45]:
# 모델 파일 복사
pretraind_weight_loc = os.path.join(".", "runs\\train\\exp3\\weights")
pretraind_weight_loc = os.path.join(pretraind_weight_loc, "best.pt")

In [46]:
!python val.py --task "test" --weights $pretraind_weight_loc --data $yaml_loc --img 640 --conf-thres=0.683

[34m[1mval: [0mdata=..\dataset\data.yaml, weights=['.\\runs\\train\\exp3\\weights\\best.pt'], batch_size=32, imgsz=640, conf_thres=0.683, iou_thres=0.6, max_det=300, task=test, device=, workers=8, single_cls=False, augment=False, verbose=False, save_txt=False, save_hybrid=False, save_conf=False, save_json=False, project=runs\val, name=exp, exist_ok=False, half=False, dnn=False
fatal: cannot change to 'D:\援ш��': No such file or directory
YOLOv5  2024-6-5 Python-3.10.12 torch-2.3.0+cpu CPU

Fusing layers... 
Model summary: 157 layers, 1761871 parameters, 0 gradients, 4.1 GFLOPs

[34m[1mtest: [0mScanning D:\구글 드라이브 백업\대학원\현대차 설비보전 강의\데이터셋\Welding\dataset\test\labels...:   0%|          | 0/3 [00:00<?, ?it/s]
[34m[1mtest: [0mScanning D:\구글 드라이브 백업\대학원\현대차 설비보전 강의\데이터셋\Welding\dataset\test\labels... 1 images, 0 backgrounds, 0 corrupt:  33%|###3      | 1/3 [00:07<00:14,  7.47s/it]
[34m[1mtest: [0mScanning D:\구글 드라이브 백업\대학원\현대차 설비보전 강의\데이터셋\Welding\dataset\test\labels... 3 images, 

In [47]:
# test/images 폴더내 이미지를 대상으로 객체 탐지
test_images_dir = os.path.join(dataset_loc, "test\images")

In [48]:
!python detect.py --weights $pretraind_weight_loc --img 640 --conf=0.683 --source $test_images_dir

[34m[1mdetect: [0mweights=['.\\runs\\train\\exp3\\weights\\best.pt'], source=..\dataset\test\images, data=data\coco128.yaml, imgsz=[640, 640], conf_thres=0.683, iou_thres=0.45, max_det=1000, device=, view_img=False, save_txt=False, save_csv=False, save_conf=False, save_crop=False, nosave=False, classes=None, agnostic_nms=False, augment=False, visualize=False, update=False, project=runs\detect, name=exp, exist_ok=False, line_thickness=3, hide_labels=False, hide_conf=False, half=False, dnn=False, vid_stride=1
fatal: cannot change to 'D:\援ш��': No such file or directory
YOLOv5  2024-6-5 Python-3.10.12 torch-2.3.0+cpu CPU

Fusing layers... 
Model summary: 157 layers, 1761871 parameters, 0 gradients, 4.1 GFLOPs
image 1/3 D:\  \\  \\Welding\dataset\test\images\stock-footage-aerial-car-factory-d-concept-automated-robot-arm-assembly-line-manufacturing-high-tech_mp4-0_jpg.rf.c19e995c8c743ebea43a8d3389836c8f.jpg: 640x640 2 autos, 3 robots, 57.0ms
image 2/3 D:\  \\  \\Welding\dataset\test\imag

### 2-4. 모델 개선 - Data Argumentation 적용


**Data Argumentation (데이터 증강)**
- 데이터 증강은 기존 데이터로부터 새로운 데이터를 인위적으로 생성하여 데이터 세트를 확장하는 기술임
- 보유한 데이터를 변형하거나 조작하여 새로운 데이터를 만들어냄으로써 모델 성능 향상시킴

|<b>데이터 증강</b> |
| :--: |
| <img src="https://miro.medium.com/v2/resize:fit:720/format:webp/1*ae1tW5ngf1zhPRyh7aaM1Q.png" width="600" height="600" />|
|출처: https://medium.com/secure-and-private-ai-writing-challenge/data-augmentation-increases-accuracy-of-your-model-but-how-aa1913468722|



#### 모델 학습

In [51]:
!python train.py --img 640 --batch 16 --epochs 100 --data $yaml_loc --weights yolov5n.pt --cache --hyp hyp.scratch-high.yaml

[34m[1mtrain: [0mweights=yolov5n.pt, cfg=, data=..\dataset\data.yaml, hyp=hyp.scratch-high.yaml, epochs=100, batch_size=16, imgsz=640, rect=False, resume=False, nosave=False, noval=False, noautoanchor=False, noplots=False, evolve=None, evolve_population=data\hyps, resume_evolve=None, bucket=, cache=ram, image_weights=False, device=, multi_scale=False, single_cls=False, optimizer=SGD, sync_bn=False, workers=8, project=runs\train, name=exp, exist_ok=False, quad=False, cos_lr=False, label_smoothing=0.0, patience=100, freeze=[0], save_period=-1, seed=0, local_rank=-1, entity=None, upload_dataset=False, bbox_interval=-1, artifact_alias=latest, ndjson_console=False, ndjson_file=False
[34m[1mgithub: [0mup to date with https://github.com/ultralytics/yolov5 
fatal: cannot change to 'D:\援ш��': No such file or directory
YOLOv5  2024-6-5 Python-3.10.12 torch-2.3.0+cpu CPU

[34m[1mhyperparameters: [0mlr0=0.01, lrf=0.1, momentum=0.937, weight_decay=0.0005, warmup_epochs=3.0, warmup_momentum

#### 모델 평가

In [52]:
# 모델 파일 복사
pretraind_weight_loc = os.path.join(".", "runs\\train\\exp5\\weights")
pretraind_weight_loc = os.path.join(pretraind_weight_loc, "best.pt")

In [53]:
!python val.py --task "test" --weights $pretraind_weight_loc --data $yaml_loc --img 640 --conf-thres=0.354

[34m[1mval: [0mdata=..\dataset\data.yaml, weights=['.\\runs\\train\\exp5\\weights\\best.pt'], batch_size=32, imgsz=640, conf_thres=0.354, iou_thres=0.6, max_det=300, task=test, device=, workers=8, single_cls=False, augment=False, verbose=False, save_txt=False, save_hybrid=False, save_conf=False, save_json=False, project=runs\val, name=exp, exist_ok=False, half=False, dnn=False
fatal: cannot change to 'D:\援ш��': No such file or directory
YOLOv5  2024-6-5 Python-3.10.12 torch-2.3.0+cpu CPU

Fusing layers... 
Model summary: 157 layers, 1761871 parameters, 0 gradients, 4.1 GFLOPs

[34m[1mtest: [0mScanning D:\구글 드라이브 백업\대학원\현대차 설비보전 강의\데이터셋\Welding\dataset\test\labels.cache... 3 images, 0 backgrounds, 0 corrupt: 100%|##########| 3/3 [00:00<?, ?it/s]
[34m[1mtest: [0mScanning D:\구글 드라이브 백업\대학원\현대차 설비보전 강의\데이터셋\Welding\dataset\test\labels.cache... 3 images, 0 backgrounds, 0 corrupt: 100%|##########| 3/3 [00:00<?, ?it/s]

                 Class     Images  Instances          P         

In [54]:
# test/images 폴더내 이미지를 대상으로 객체 탐지
test_images_dir = os.path.join(dataset_loc, "test\images")

In [55]:
!python detect.py --weights $pretraind_weight_loc --img 640 --conf=0.354 --source $test_images_dir

[34m[1mdetect: [0mweights=['.\\runs\\train\\exp5\\weights\\best.pt'], source=..\dataset\test\images, data=data\coco128.yaml, imgsz=[640, 640], conf_thres=0.354, iou_thres=0.45, max_det=1000, device=, view_img=False, save_txt=False, save_csv=False, save_conf=False, save_crop=False, nosave=False, classes=None, agnostic_nms=False, augment=False, visualize=False, update=False, project=runs\detect, name=exp, exist_ok=False, line_thickness=3, hide_labels=False, hide_conf=False, half=False, dnn=False, vid_stride=1
fatal: cannot change to 'D:\援ш��': No such file or directory
YOLOv5  2024-6-5 Python-3.10.12 torch-2.3.0+cpu CPU

Fusing layers... 
Model summary: 157 layers, 1761871 parameters, 0 gradients, 4.1 GFLOPs
image 1/3 D:\  \\  \\Welding\dataset\test\images\stock-footage-aerial-car-factory-d-concept-automated-robot-arm-assembly-line-manufacturing-high-tech_mp4-0_jpg.rf.c19e995c8c743ebea43a8d3389836c8f.jpg: 640x640 2 autos, 4 robots, 58.0ms
image 2/3 D:\  \\  \\Welding\dataset\test\imag