In [1]:
import os
import json
import re
import numpy as np
import pandas as pd
from tqdm import tqdm
import cv2

In [2]:
def sort_dirs_by_specimen_id(root_dir):
    specimen_dirs = os.listdir(root_dir)
    specimen_dirs = [d for d in specimen_dirs if d.split('_')[0].isdigit()]
    
    specimen_ids = [d.split('_')[0] for d in specimen_dirs]
    specimen_ids = [int(i) for i in specimen_ids if i.isdigit()]
    
    return [d for i, d in sorted(zip(specimen_ids, specimen_dirs))]

In [3]:
def read_video_frames(video_path):
    vidcap = cv2.VideoCapture(video_path)
    img_list = []

    success, image = vidcap.read()
    while success:
        size = image.shape
        img_list.append(image[:, :, 0])
        success, image = vidcap.read()

    return len(img_list), size

# 200 장비

In [4]:
data_root = '/home/kikim/data/ai_data_230102/200/AI DB 금속 스파크 이미지 데이터'
image_root_dir = os.path.join(data_root, '원천데이터')

In [5]:
specimen_dirs = sort_dirs_by_specimen_id(image_root_dir)
specimen_dirs

['865_2_sus_0_1cycle',
 '866_2_sus_0_1cycle',
 '867_2_sus_0_1cycle',
 '868_2_sus_0_1cycle',
 '869_2_sus_0_1cycle',
 '870_2_sus_0_1cycle',
 '871_2_sus_0_1cycle',
 '872_2_sus_0_1cycle',
 '873_2_sus_0_1cycle',
 '874_2_sus_0_1cycle',
 '875_2_sus_0_1cycle',
 '876_2_sus_0_1cycle',
 '877_2_sus_0_1cycle',
 '878_2_sus_0_1cycle',
 '879_2_sus_0_1cycle',
 '880_2_sus_0_1cycle',
 '881_2_sus_0_2cycle',
 '882_2_sus_0_2cycle',
 '883_2_sus_0_2cycle',
 '884_2_sus_0_2cycle',
 '885_2_sus_0_2cycle',
 '886_2_sus_0_2cycle',
 '887_2_sus_0_2cycle',
 '888_2_sus_0_2cycle',
 '889_2_sus_0_2cycle',
 '890_2_sus_0_2cycle',
 '891_2_sus_0_2cycle',
 '892_2_sus_0_2cycle',
 '893_2_sus_0_2cycle',
 '894_2_sus_0_2cycle',
 '895_2_sus_0_2cycle',
 '896_2_sus_0_2cycle',
 '897_2_sus_0_3cycle',
 '898_2_sus_0_3cycle',
 '899_2_sus_0_3cycle',
 '900_2_sus_0_3cycle',
 '901_2_sus_0_3cycle',
 '902_2_sus_0_3cycle',
 '903_2_sus_0_3cycle',
 '904_2_sus_0_3cycle',
 '905_2_sus_0_3cycle',
 '906_2_sus_0_3cycle',
 '907_2_sus_0_3cycle',
 '908_2_sus

In [6]:
on_video_file_name = 'On_Axis_Images.avi'
off_video_file_name = 'Off_Axis_Images.avi'

for specimen_id in specimen_dirs:
    video_dir = os.path.join(image_root_dir, specimen_id, 'video')
    
    if not os.path.exists(video_dir):
        print('Video 폴더 없음', video_dir)
        continue
        
    video_files = [f for f in os.listdir(video_dir) if f.endswith('.avi')]
    on_img_files = [f for f in video_files if f.lower().startswith('on_')]
    off_img_files = [f for f in video_files if f.lower().startswith('off_')]
    
    if len(on_img_files) == 0:
        print(f'{on_video_file_name} 없음', video_dir)
        
    if len(off_img_files) == 0:
        print(f'{off_video_file_name} 없음', video_dir)
    
    if len(on_img_files) > 1:
        print(f'{on_video_file_name} 다수', video_dir, on_img_files)
        
    if len(off_img_files) > 1:
        print(f'{off_video_file_name} 다수', video_dir, off_img_files)
        
#     print(video_dir)
    for f in on_img_files:
        if f != on_video_file_name:
            print(f'{on_video_file_name} 파일명 오류: {f}', video_dir)
            
        video_path = os.path.join(video_dir, f)
#         print(video_path)
        len_video, size = read_video_frames(video_path)
        
        if size[:2] != (300, 300):
            print(f'해상도 오류: f{size}', video_path)
        
        len_imgs = len(os.listdir(os.path.join(image_root_dir, specimen_id, on_video_file_name[:-4])))
        if len_video != len_imgs and len_video < 500:
            print(f'{on_video_file_name}가 너무 짧음', f'프레임 수:{len_video}', f'이미지 수:{len_imgs}', video_dir)
        
        break
        
    for f in off_img_files:
        if f != off_video_file_name:
            print(f'{on_video_file_name} 파일명 오류: {f}', video_dir)
            
        video_path = os.path.join(video_dir, f)
#         print(video_path)
        len_video, size = read_video_frames(video_path)
        
        if size[:2] != (300, 300):
            print(f'해상도 오류: f{size}', video_path)
        
        len_imgs = len(os.listdir(os.path.join(image_root_dir, specimen_id, off_video_file_name[:-4])))
        if len_video != len_imgs and len_video < 500:
            print(f'{off_video_file_name}가 너무 짧음', f'프레임 수:{len_video}', f'이미지 수:{len_imgs}', video_dir)
        
        break

Off_Axis_Images.avi가 너무 짧음 프레임 수:292 이미지 수:293 /home/kikim/data/ai_data_230102/200/AI DB 금속 스파크 이미지 데이터/원천데이터/894_2_sus_0_2cycle/video
Off_Axis_Images.avi가 너무 짧음 프레임 수:411 이미지 수:343 /home/kikim/data/ai_data_230102/200/AI DB 금속 스파크 이미지 데이터/원천데이터/910_2_sus_0_3cycle/video
On_Axis_Images.avi가 너무 짧음 프레임 수:324 이미지 수:270 /home/kikim/data/ai_data_230102/200/AI DB 금속 스파크 이미지 데이터/원천데이터/1025_2_718_0_2cycle/video
On_Axis_Images.avi가 너무 짧음 프레임 수:37 이미지 수:7380 /home/kikim/data/ai_data_230102/200/AI DB 금속 스파크 이미지 데이터/원천데이터/1026_2_718_0_2cycle/video
On_Axis_Images.avi가 너무 짧음 프레임 수:376 이미지 수:314 /home/kikim/data/ai_data_230102/200/AI DB 금속 스파크 이미지 데이터/원천데이터/1041_2_718_0_3cycle/video
On_Axis_Images.avi가 너무 짧음 프레임 수:42 이미지 수:7 /home/kikim/data/ai_data_230102/200/AI DB 금속 스파크 이미지 데이터/원천데이터/1042_2_718_0_3cycle/video
해상도 오류: f(1080, 1920, 3) /home/kikim/data/ai_data_230102/200/AI DB 금속 스파크 이미지 데이터/원천데이터/1081_2_718_45_2cycle/video/On_Axis_Images.avi
해상도 오류: f(1080, 1920, 3) /home/kikim/data/ai_data_230102/20

[mpeg4 @ 0x937c5c0] ac-tex damaged at 9 5
[mpeg4 @ 0x937c5c0] Error at MB: 109


해상도 오류: f(1080, 1920, 3) /home/kikim/data/ai_data_230102/200/AI DB 금속 스파크 이미지 데이터/원천데이터/1668_C_maraging_45_3cycle/video/On_Axis_Images.avi
해상도 오류: f(1080, 1920, 3) /home/kikim/data/ai_data_230102/200/AI DB 금속 스파크 이미지 데이터/원천데이터/1668_C_maraging_45_3cycle/video/Off_Axis_Images.avi
해상도 오류: f(1080, 1920, 3) /home/kikim/data/ai_data_230102/200/AI DB 금속 스파크 이미지 데이터/원천데이터/1669_C_maraging_45_3cycle/video/On_Axis_Images.avi
해상도 오류: f(1080, 1920, 3) /home/kikim/data/ai_data_230102/200/AI DB 금속 스파크 이미지 데이터/원천데이터/1669_C_maraging_45_3cycle/video/Off_Axis_Images.avi
해상도 오류: f(1080, 1920, 3) /home/kikim/data/ai_data_230102/200/AI DB 금속 스파크 이미지 데이터/원천데이터/1677_C_maraging_45_3cycle/video/On_Axis_Images.avi
해상도 오류: f(1080, 1920, 3) /home/kikim/data/ai_data_230102/200/AI DB 금속 스파크 이미지 데이터/원천데이터/1678_C_maraging_45_3cycle/video/Off_Axis_Images.avi
해상도 오류: f(1080, 1920, 3) /home/kikim/data/ai_data_230102/200/AI DB 금속 스파크 이미지 데이터/원천데이터/1679_C_maraging_45_3cycle/video/Off_Axis_Images.avi
On_Axis_Images.avi가 너무 

[mpeg4 @ 0x2890780] illegal dc vlc
[mpeg4 @ 0x2890780] Error at MB: 202


# 300_500장비

In [7]:
data_root = '/home/kikim/data/ai_data_230102/300_500/AI DB 금속 스파크 이미지 데이터'
image_root_dir = os.path.join(data_root, '원천데이터', "기계적 특성치 데이터")

In [8]:
specimen_dirs = sort_dirs_by_specimen_id(image_root_dir)
specimen_dirs

['1_3_sus_0_1cycle',
 '2_3_sus_0_1cycle',
 '3_3_sus_0_1cycle',
 '4_3_sus_0_1cycle',
 '5_3_sus_0_1cycle',
 '6_3_sus_0_1cycle',
 '7_3_sus_0_1cycle',
 '8_3_sus_0_1cycle',
 '9_3_sus_0_1cycle',
 '10_3_sus_0_1cycle',
 '11_3_sus_0_1cycle',
 '12_3_sus_0_1cycle',
 '13_3_sus_0_1cycle',
 '14_3_sus_0_1cycle',
 '15_3_sus_0_1cycle',
 '16_3_sus_0_1cycle',
 '17_3_sus_0_2cycle',
 '18_3_sus_0_2cycle',
 '19_3_sus_0_2cycle',
 '20_3_sus_0_2cycle',
 '21_3_sus_0_2cycle',
 '22_3_sus_0_2cycle',
 '23_3_sus_0_2cycle',
 '24_3_sus_0_2cycle',
 '25_3_sus_0_2cycle',
 '26_3_sus_0_2cycle',
 '27_3_sus_0_2cycle',
 '28_3_sus_0_2cycle',
 '29_3_sus_0_2cycle',
 '30_3_sus_0_2cycle',
 '31_3_sus_0_2cycle',
 '32_3_sus_0_2cycle',
 '33_3_sus_0_3cycle',
 '34_3_sus_0_3cycle',
 '35_3_sus_0_3cycle',
 '36_3_sus_0_3cycle',
 '37_3_sus_0_3cycle',
 '38_3_sus_0_3cycle',
 '39_3_sus_0_3cycle',
 '40_3_sus_0_3cycle',
 '41_3_sus_0_3cycle',
 '42_3_sus_0_3cycle',
 '43_3_sus_0_3cycle',
 '44_3_sus_0_3cycle',
 '45_3_sus_0_3cycle',
 '46_3_sus_0_3cycle

In [9]:
on_video_file_name = 'On_Axis_Images.avi'
off_video_file_name = 'Off_Axis_Images.avi'

for specimen_id in specimen_dirs:
    video_dir = os.path.join(image_root_dir, specimen_id, 'video')
    
    if not os.path.exists(video_dir):
        print('Video 폴더 없음', video_dir)
        continue
        
    video_files = [f for f in os.listdir(video_dir) if f.endswith('.avi')]
    on_img_files = [f for f in video_files if f.lower().startswith('on_')]
    off_img_files = [f for f in video_files if f.lower().startswith('off_')]
    
    if len(on_img_files) == 0:
        print(f'{on_video_file_name} 없음', video_dir)
        
    if len(off_img_files) == 0:
        print(f'{off_video_file_name} 없음', video_dir)
    
    if len(on_img_files) > 1:
        print(f'{on_video_file_name} 다수', video_dir, on_img_files)
        
    if len(off_img_files) > 1:
        print(f'{off_video_file_name} 다수', video_dir, off_img_files)
        
#     print(video_dir)
    for f in on_img_files:
        if f != on_video_file_name:
            print(f'{on_video_file_name} 파일명 오류: {f}', video_dir)
            
        video_path = os.path.join(video_dir, f)
#         print(video_path)
        len_video, size = read_video_frames(video_path)
        
        if size[:2] != (300, 300):
            print(f'해상도 오류: f{size}', video_path)
        
        len_imgs = len(os.listdir(os.path.join(image_root_dir, specimen_id, on_video_file_name[:-4])))
        if len_video != len_imgs and len_video < 500:
            print(f'{on_video_file_name}가 너무 짧음', f'프레임 수:{len_video}', f'이미지 수:{len_imgs}', video_dir)
        
        break
        
    for f in off_img_files:
        if f != off_video_file_name:
            print(f'{on_video_file_name} 파일명 오류: {f}', video_dir)
            
        video_path = os.path.join(video_dir, f)
#         print(video_path)
        len_video, size = read_video_frames(video_path)
        
        if size[:2] != (300, 300):
            print(f'해상도 오류: f{size}', video_path)
        
        len_imgs = len(os.listdir(os.path.join(image_root_dir, specimen_id, off_video_file_name[:-4])))
        if len_video != len_imgs and len_video < 500:
            print(f'{off_video_file_name}가 너무 짧음', f'프레임 수:{len_video}', f'이미지 수:{len_imgs}', video_dir)
        
        break

Off_Axis_Images.avi가 너무 짧음 프레임 수:164 이미지 수:138 /home/kikim/data/ai_data_230102/300_500/AI DB 금속 스파크 이미지 데이터/원천데이터/기계적 특성치 데이터/1_3_sus_0_1cycle/video
On_Axis_Images.avi 파일명 오류: On_Axis_images.avi /home/kikim/data/ai_data_230102/300_500/AI DB 금속 스파크 이미지 데이터/원천데이터/기계적 특성치 데이터/2_3_sus_0_1cycle/video
On_Axis_Images.avi 파일명 오류: On_Axis_lmages.avi /home/kikim/data/ai_data_230102/300_500/AI DB 금속 스파크 이미지 데이터/원천데이터/기계적 특성치 데이터/3_3_sus_0_1cycle/video
해상도 오류: f(1080, 1920, 3) /home/kikim/data/ai_data_230102/300_500/AI DB 금속 스파크 이미지 데이터/원천데이터/기계적 특성치 데이터/16_3_sus_0_1cycle/video/On_Axis_Images.avi
Off_Axis_Images.avi가 너무 짧음 프레임 수:307 이미지 수:308 /home/kikim/data/ai_data_230102/300_500/AI DB 금속 스파크 이미지 데이터/원천데이터/기계적 특성치 데이터/17_3_sus_0_2cycle/video
해상도 오류: f(1080, 1920, 3) /home/kikim/data/ai_data_230102/300_500/AI DB 금속 스파크 이미지 데이터/원천데이터/기계적 특성치 데이터/22_3_sus_0_2cycle/video/On_Axis_Images.avi
해상도 오류: f(1080, 1920, 3) /home/kikim/data/ai_data_230102/300_500/AI DB 금속 스파크 이미지 데이터/원천데이터/기계적 특성치 데이터/24_3_su

[mpeg4 @ 0x35e65c0] ac-tex damaged at 10 5
[mpeg4 @ 0x35e65c0] Error at MB: 110


Off_Axis_Images.avi가 너무 짧음 프레임 수:136 이미지 수:3025 /home/kikim/data/ai_data_230102/300_500/AI DB 금속 스파크 이미지 데이터/원천데이터/기계적 특성치 데이터/282_3_718_90_3cycle/video


[mpeg4 @ 0x277cd440] ac-tex damaged at 10 5
[mpeg4 @ 0x277cd440] Error at MB: 110


Off_Axis_Images.avi가 너무 짧음 프레임 수:136 이미지 수:2818 /home/kikim/data/ai_data_230102/300_500/AI DB 금속 스파크 이미지 데이터/원천데이터/기계적 특성치 데이터/283_3_718_90_3cycle/video
Off_Axis_Images.avi가 너무 짧음 프레임 수:271 이미지 수:5827 /home/kikim/data/ai_data_230102/300_500/AI DB 금속 스파크 이미지 데이터/원천데이터/기계적 특성치 데이터/285_3_718_90_3cycle/video


[mpeg4 @ 0x277cda00] ac-tex damaged at 13 7
[mpeg4 @ 0x277cda00] Error at MB: 153


Off_Axis_Images.avi가 너무 짧음 프레임 수:411 이미지 수:5159 /home/kikim/data/ai_data_230102/300_500/AI DB 금속 스파크 이미지 데이터/원천데이터/기계적 특성치 데이터/286_3_718_90_3cycle/video


[mpeg4 @ 0x277cd800] ac-tex damaged at 13 7
[mpeg4 @ 0x277cd800] Error at MB: 153


Off_Axis_Images.avi가 너무 짧음 프레임 수:411 이미지 수:5198 /home/kikim/data/ai_data_230102/300_500/AI DB 금속 스파크 이미지 데이터/원천데이터/기계적 특성치 데이터/287_3_718_90_3cycle/video
On_Axis_Images.avi가 너무 짧음 프레임 수:47 이미지 수:40 /home/kikim/data/ai_data_230102/300_500/AI DB 금속 스파크 이미지 데이터/원천데이터/기계적 특성치 데이터/289_3_maraging_0_1cycle/video
Off_Axis_Images.avi가 너무 짧음 프레임 수:254 이미지 수:212 /home/kikim/data/ai_data_230102/300_500/AI DB 금속 스파크 이미지 데이터/원천데이터/기계적 특성치 데이터/289_3_maraging_0_1cycle/video
Off_Axis_Images.avi가 너무 짧음 프레임 수:454 이미지 수:378 /home/kikim/data/ai_data_230102/300_500/AI DB 금속 스파크 이미지 데이터/원천데이터/기계적 특성치 데이터/293_3_maraging_0_1cycle/video
Off_Axis_Images.avi가 너무 짧음 프레임 수:467 이미지 수:389 /home/kikim/data/ai_data_230102/300_500/AI DB 금속 스파크 이미지 데이터/원천데이터/기계적 특성치 데이터/295_3_maraging_0_1cycle/video
Off_Axis_Images.avi가 너무 짧음 프레임 수:457 이미지 수:381 /home/kikim/data/ai_data_230102/300_500/AI DB 금속 스파크 이미지 데이터/원천데이터/기계적 특성치 데이터/297_3_maraging_0_1cycle/video
Off_Axis_Images.avi가 너무 짧음 프레임 수:472 이미지 수:393 /home/kikim/data/ai_dat

In [10]:
video_dir = "/home/kikim/data/ai_data_230102/300_500/AI DB 금속 스파크 이미지 데이터/원천데이터/기계적 특성치 데이터/287_3_718_90_3cycle/video"

read_video_frames(os.path.join(video_dir, 'On_Axis_Images.avi'))

(4000, (300, 300, 3))

In [11]:

read_video_frames(os.path.join(video_dir, 'Off_Axis_Images.avi'))

[mpeg4 @ 0x35e65c0] ac-tex damaged at 13 7
[mpeg4 @ 0x35e65c0] Error at MB: 153


(411, (300, 300, 3))

In [12]:
specimen_id = '280_3_718_90_3cycle'
axis = 'Off_Axis_Images'


vidcap = cv2.VideoCapture(os.path.join(image_root_dir, specimen_id, 'video', f'{axis}.avi'))
img_list = []

cnt = 0
success, image = vidcap.read()
while success:
    cnt += 1
    print(cnt)
    size = image.shape
    img_list.append(image[:, :, 0])
    success, image = vidcap.read()


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277


2762
2763
2764
2765
2766
2767
2768
2769
2770
2771
2772
2773
2774
2775
2776
2777
2778
2779
2780
2781
2782
2783
2784
2785
2786
2787
2788
2789
2790
2791
2792
2793
2794
2795
2796
2797
2798
2799
2800
2801
2802
2803
2804
2805
2806
2807
2808
2809
2810
2811
2812
2813
2814
2815
2816
2817
2818
2819
2820
2821
2822
2823
2824
2825
2826
2827
2828
2829
2830
2831
2832
2833
2834
2835
2836
2837
2838
2839
2840
2841
2842
2843
2844
2845
2846
2847
2848
2849
2850
2851
2852
2853
2854
2855
2856
2857
2858
2859
2860
2861
2862
2863
2864
2865
2866
2867
2868
2869
2870
2871
2872
2873
2874
2875
2876
2877
2878
2879
2880
2881
2882
2883
2884
2885
2886
2887
2888
2889
2890
2891
2892
2893
2894
2895
2896
2897
2898
2899
2900
2901
2902
2903
2904
2905
2906
2907
2908
2909
2910
2911
2912
2913
2914
2915
2916
2917
2918
2919
2920
2921
2922
2923
2924
2925
2926
2927
2928
2929
2930
2931
2932
2933
2934
2935
2936
2937
2938
2939
2940
2941
2942
2943
2944
2945
2946
2947
2948
2949
2950
2951
2952
2953
2954
2955
2956
2957
2958
2959
2960
2961


In [13]:
_img_dir = os.path.join(image_root_dir, specimen_id, axis)

len(os.listdir(_img_dir))

3213