In [None]:
"""
This notebook is used to go through all the Wing Scan Tifs, and segment them into the individual slides
as well as use OCR to automatically extract the name of the slide
"""

In [1]:
import os 
import cv2
import shutil
import easyocr
import pytesseract
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt


from copy import deepcopy
from glob import glob
from tqdm import tqdm
from skimage.feature import match_template
from scipy import ndimage
from skimage.io import imread
from scipy.signal import fftconvolve
from skimage.feature import peak_local_max


In [36]:
DEBUG = False

# Get List of Img File Paths
img_fps = glob('../WWBEE24_images/WingScans/*.tif')
img_fps = sorted(img_fps)
# For reading the slide numbers
reader = easyocr.Reader(['en'])

for img_fp in tqdm(img_fps):
    if DEBUG:
        img_fp = '../WWBEE24_images/WingScans/Hive06_Sheet_04.tif'

    sheet = img_fp.split('/')[-1].split('.')[0]
    
    img = cv2.imread(img_fp)
    img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    
    # Scale image so it's faster to process
    scale_factor = 10
    scaled_img = img_gray[::scale_factor,::scale_factor] > 150

    if DEBUG:
        plt.figure()
        plt.imshow(scaled_img)
    
    structured_element = (np.ones((330,117))*150).astype('uint8')

    # convolve structured element with scaled image, to find light slides in images
    convolved = fftconvolve(scaled_img, structured_element, mode='same', axes=None)
    points = peak_local_max(convolved, min_distance=50, threshold_abs=34000, num_peaks=24)

    # manual correction
    if img_fp == '../WWBEE24_images/WingScans/Hive01_Sheet_03.tif':
        points = points[:-1]
        points = np.array(list(points) + [[1490, 412]])

    if DEBUG:
        plt.figure()
        plt.imshow(convolved)
        plt.savefig(f'../for_presentation/{sheet}_convolution.jpg')
        # visualize the peaks that we found
        for i in range(len(points)):
            convolved[points[i][0]-10:points[i][0]+10, points[i][1]-10:points[i][1]+10] = 0
        plt.figure()
        plt.imshow(convolved)
        plt.savefig(f'../for_presentation/{sheet}_convolution_with_peaks.jpg')

    
    # Crop and rotate Individual Slides
    slide_size = np.multiply(structured_element.shape, scale_factor)
    
    #img_c = deepcopy(img)
    for i in range(len(points)):
        # convert the position back to space in the original image
        p = deepcopy(points[i].astype('float'))
        p[0] = int(img.shape[0]*p[0]/convolved.shape[0])
        p[1] = int(img.shape[1]*p[1]/convolved.shape[1])
        p = p.astype('int')
        #img_c[p[0]-100:p[0]+100, p[1]-100:p[1]+100] = 0
        start_x, end_x = max(int(p[0] - slide_size[0] // 2),0), int(p[0] + slide_size[0] // 2)
        start_y, end_y = max(int(p[1] - slide_size[1] // 2),0), int(p[1] + slide_size[1] // 2)
        slide = np.rot90( img[start_x:end_x, start_y:end_y])

        texts = reader.readtext(cv2.blur(slide, (11,11)))
        number = '-'.join(sorted([x[1] for x in texts]))
        number = number.lower().replace('o','0')


        # remove ones with mostly white backgrounds
        
        
        
        if DEBUG:
            plt.figure()
            plt.imshow(slide)
            if (slide < 100).sum() > 100_000:
                plt.title('YES!' + number + str((slide < 100).sum()))
            else:
                plt.title('NO!!!!!!!!!!!!!!!!!!!!!!!!!'+number + str((slide < 100).sum()))

        if (number != '0') and ((slide < 100).sum() > 100_000):
            slide_fp = '../slides/1_slides/' + sheet + '_slide' + number + '.png'
        else:
            slide_fp = '../slides/1_empty/' + sheet + '_slide_empty' + str(i) + '.png'

        if not DEBUG:
            if os.path.exists(slide_fp):
                print(f'Image Already Exists at {slide_fp}!!')                
            else:
                cv2.imwrite(slide_fp, slide)

    if DEBUG:
        break

  0%|                                                                                                                                                                                | 0/112 [00:00<?, ?it/s]

81
50
1
87
95
94
92
70
57
17
75
12
58
71
5
56
32
48
34
80
35
4
55
'-45


  1%|█▌                                                                                                                                                                      | 1/112 [00:16<29:53, 16.16s/it]

ww17
ww37
ww33
ww16
ww4
41
ww26
ww19
103
ww43
ww30
ww1
ww3
ww36
115
ww35
ww41
ww13
ww20
107
105
22
40
121


  2%|███                                                                                                                                                                     | 2/112 [00:31<29:02, 15.84s/it]

0
0
ww7
ww51
ww57
ww71
ww70
ww47
ww62
ww41
ww34
ww19
ww35
ww70
ww36
ww22
ww49
ww63
ww46
ww49
ww46
ww2
wwl0
ww2]


  3%|████▌                                                                                                                                                                   | 3/112 [00:47<28:56, 15.93s/it]

56
33
20
36
43
22
38
49
45
57
59
51
12
)-47
44
21
35-`
26
23
56
32
37
25
16


  4%|██████                                                                                                                                                                  | 4/112 [01:03<28:24, 15.78s/it]

142
107
64
73
97
77
103
114
74
84
111
93
82
65
90
76
72
71
85
87
113
102
62
105


  4%|███████▌                                                                                                                                                                | 5/112 [01:20<28:47, 16.14s/it]

ww35
ww19
ww71
ww57
-ww34
ww47
ww70
ww36
ww49
ww63
ww2
ww14
ww62
ww17
ww46
ww41
ww10
ww16
-ww11
107
ww51
ww22
ww56
ww42


  5%|█████████                                                                                                                                                               | 6/112 [01:36<28:37, 16.20s/it]

0
0
0
0
0
0
0
0
0
0
ww33
31
ww73
115
ww45
ww41
40
46
ww29
12
16
21
(`-53
wwl7


  6%|██████████▌                                                                                                                                                             | 7/112 [01:52<28:31, 16.30s/it]

0
0
0
0
65
0
ww47
ww28
ww42
ww36
ww51
ww41
ww48
ww44
ww37
48
45
ww25
ww45
42
71
38
41
64


  7%|████████████                                                                                                                                                            | 8/112 [02:09<28:28, 16.43s/it]

0
0
0
0
65
0
ww47
ww28
ww42
ww36
ww51
ww41
ww48
ww37
ww44
48
45
ww25
ww45
42
71
38
41
64


  8%|█████████████▌                                                                                                                                                          | 9/112 [02:26<28:40, 16.71s/it]

-0
0
0
0
0
0
0
0
ww95
ww90
ww92
ww94
ww87
ww82
67
107
118
ww27
ww62
wv15
ww64
ww48
ww42
ww3g


  9%|██████████████▉                                                                                                                                                        | 10/112 [02:43<28:13, 16.61s/it]

28
1
5
17
25
41
2
30
35
16
31
15
26
23
34
21
20
37
19
3
13
38
4
10


 10%|████████████████▍                                                                                                                                                      | 11/112 [03:00<28:23, 16.87s/it]

74
62-^
63
53
52
67
65
44
60
70
64
54
47
42
58
48
56
59
50
73
55
43
72
49


 11%|█████████████████▉                                                                                                                                                     | 12/112 [03:17<28:14, 16.94s/it]

114
107
-80
115
116
117
94
75
95
102
87
113
105
111
97
5-77
110
79
101
78
76
92
81
112


 12%|███████████████████▍                                                                                                                                                   | 13/112 [03:36<28:34, 17.31s/it]

136
143
142
145
140
122
138
125
134
127-x
131
133
146
137
120
139
141
128
147
123
118
132
135-x
129-x


 12%|████████████████████▉                                                                                                                                                  | 14/112 [03:52<27:57, 17.12s/it]

0
0
0
159
163
162
151
156
154
167
164
160
155
165
149
158
148-6
119
114
129-x
126
0-127
39
0-135


 13%|██████████████████████▎                                                                                                                                                | 15/112 [04:11<28:19, 17.52s/it]

-38
4
42
33
21
36
37
34
41
2
17
25
24
11
12
32
13
39
40
22
29
3
14
30


 14%|███████████████████████▊                                                                                                                                               | 16/112 [04:30<28:38, 17.90s/it]

63
76
56
57
67
73
53
59
74
47
54
55
62
70
48
64
43
45
58
50
77
61
49
52


 15%|█████████████████████████▎                                                                                                                                             | 17/112 [04:49<29:03, 18.35s/it]

91
112
101
81
105
94
114
113
107
110
111
87
97
80
95
79
84
78
102
4-83
93
90
92
103


 16%|██████████████████████████▊                                                                                                                                            | 18/112 [05:09<29:41, 18.96s/it]

115
124
130
132
131
136
121
117
123
135
120
126
129
128
139
125
140
122
116
141
119-d-y
138
118-d-x
d-ww37


 17%|████████████████████████████▎                                                                                                                                          | 19/112 [05:29<29:53, 19.29s/it]

163
146
153
154
157
142
.-160
158-6
162
164
147
155
145
143
148
159
71
144
165
15
152
156
119-d-x
149


 18%|█████████████████████████████▊                                                                                                                                         | 20/112 [05:50<30:04, 19.61s/it]

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
-0
0
0
0
171
170
137-d
118-d-x


 19%|███████████████████████████████▎                                                                                                                                       | 21/112 [06:09<29:42, 19.59s/it]

23
14
13
48
25
19
20
42
31
27
18
40
12
16
21
26
43
17
32
11
37
22
47
49


 20%|████████████████████████████████▊                                                                                                                                      | 22/112 [06:30<29:47, 19.86s/it]

74
94
95
71
4(-60
51
92
93
70
91
97
73
85
54
90
-72
87
84
82
67-`
83
52
-53
65


 21%|██████████████████████████████████▎                                                                                                                                    | 23/112 [06:51<29:52, 20.14s/it]

114
130
128
110
7
131
124
126
129
112
2
119
122
125
127
105
116
/-15
117
132
121
103
101
104


 21%|███████████████████████████████████▊                                                                                                                                   | 24/112 [07:11<29:46, 20.30s/it]

155
142
158
153
.-141
139
137
148
157
151
140
144
147
134
154
150
138
136
152
146
149
135
156
.-33


 22%|█████████████████████████████████████▎                                                                                                                                 | 25/112 [07:32<29:27, 20.31s/it]

179-dek0rmed wings
170
185
161
194
160
163
1-162
183
164
173
197
74
180
175
181
167
178
165
59
177
187
38
-192


 23%|██████████████████████████████████████▊                                                                                                                                | 26/112 [07:52<29:22, 20.50s/it]

0
75
57
3
176
77
193
55
61
14
4
30
58
81
115
56
174
107
62
190
133
10
159
28


 24%|████████████████████████████████████████▎                                                                                                                              | 27/112 [08:13<29:13, 20.63s/it]

21
4
20
34
33-s`
5
26
35
28
29
27
19
31
30
1
11
18
37
16
17
38
3
12
25


 25%|█████████████████████████████████████████▊                                                                                                                             | 28/112 [08:35<29:09, 20.83s/it]

47
49
46
57
44
65
45
51
64
41
50
67
62
56
43
42
72
-54
61
58
55
39
48
70


 26%|███████████████████████████████████████████▏                                                                                                                           | 29/112 [08:56<28:56, 20.92s/it]

104
85
105
107
81
78
91
90
82
80
73
93
94
102
110
103
74
101
95
87
79
76
97
84


 27%|████████████████████████████████████████████▋                                                                                                                          | 30/112 [09:17<28:39, 20.97s/it]

135
132
111
117
114
116
139
125
133
137
112
129
140
138
118
121
127
134
131
123
122
124
120
128


 28%|██████████████████████████████████████████████▏                                                                                                                        | 31/112 [09:38<28:13, 20.90s/it]

0
160
145
154
151
161-4
156
143
165
159
144
157
146
152
153
141
155
148
147
163
167
162
.-170
115


 29%|███████████████████████████████████████████████▋                                                                                                                       | 32/112 [09:59<28:01, 21.02s/it]

6
37
30
3
36
7
31
4
34
5
42
37
13
35
1
-10
24
26
21
22
29-4 ) `
28
32
38


 29%|█████████████████████████████████████████████████▏                                                                                                                     | 33/112 [10:21<27:59, 21.26s/it]

51
46
53
"-52
44
74
63
67
65
43
54
73
49
56
64
45
59
61
48
62
50
72
57
60


 30%|██████████████████████████████████████████████████▋                                                                                                                    | 34/112 [10:43<27:55, 21.48s/it]

94
105
87
-p-.-90
83
82
107
77
110
111
81
102
105
92
76
91
93
101
84
103
97
85
104
.-95


 31%|████████████████████████████████████████████████████▏                                                                                                                  | 35/112 [11:04<27:37, 21.53s/it]

133
119
118
130-7
113
112
127
135
139
115
140
137
'(-123
122
126
129
132
131
--124
121
136
134
-117
128


 32%|█████████████████████████████████████████████████████▋                                                                                                                 | 36/112 [11:26<27:13, 21.49s/it]

158
155
165
161
158
167
146
144
147
156
159
154
160
162
157
152
170
163
141
164
149
142
148
145


 33%|███████████████████████████████████████████████████████▏                                                                                                               | 37/112 [11:47<26:38, 21.32s/it]

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
2
171


 34%|████████████████████████████████████████████████████████▋                                                                                                              | 38/112 [12:06<25:37, 20.77s/it]

0
0
14
30
26
24
ww13
27
7
25
ww28
10
11
18
19
29
4
w25
.-ww17
16
ww20
-1
15
ww16


 35%|██████████████████████████████████████████████████████████▏                                                                                                            | 39/112 [12:27<25:17, 20.79s/it]

23
26
16
13
28
3
30
25
12
4
20
2
17
7
31
14
34
21
27
-22
18
29
ww05
ww07


 36%|███████████████████████████████████████████████████████████▋                                                                                                           | 40/112 [12:49<25:12, 21.01s/it]

0
0
0
0
0
0
0
0
0
0
ww43
ww37
ww16
ww23
ww21
ww28
ww41
--ww10
ww19
ww31
ww29
^ (-ww18
ww12
ww20


 37%|█████████████████████████████████████████████████████████████▏                                                                                                         | 41/112 [13:09<24:45, 20.92s/it]

39
33
11
36
35
1
16
5
37
34
20
2
32
31
22
4
-26
12
(-30
14
19
21
40
3


 38%|██████████████████████████████████████████████████████████████▋                                                                                                        | 42/112 [13:30<24:24, 20.92s/it]

0
ww37
48
56
41
ww16
ww12
ww19
50
47
ww32-x
54
42
57
i <-ww23
52
ww28
46
ww22
ww18
44
ww24
ww26
ww15


 38%|████████████████████████████████████████████████████████████████                                                                                                       | 43/112 [13:52<24:13, 21.07s/it]

30
22
34
ww18
25
18
ww02
38
1
20
17
5
29
ww21
26
11
10
13
ww17
16
ww01
ww03
ww22
ww12


 39%|█████████████████████████████████████████████████████████████████▌                                                                                                     | 44/112 [14:13<23:53, 21.09s/it]

0
0
0
0
0
0
0
0
0
0
0
0
ww38
ww25
ww40
ww28
ww30
ww33
ww39
ww37
ww34
ww35
ww32
ww36


 40%|███████████████████████████████████████████████████████████████████                                                                                                    | 45/112 [14:34<23:30, 21.06s/it]

65
64
25
12
11
49
26
57
56
5
43
19
28
44
34
62
30
63
36
37
38
-40
32
35


 41%|████████████████████████████████████████████████████████████████████▌                                                                                                  | 46/112 [14:55<23:13, 21.12s/it]

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
2-ww31
ww14
ww19
-ww24
ww05
ww04
ww03
6-90-hive40
83-hive40


 42%|██████████████████████████████████████████████████████████████████████                                                                                                 | 47/112 [15:16<22:43, 20.98s/it]

22
26
10-`
17
2
25
16
11
15
23
7
30
27
12
4
21
-13
24
31
5
19
(-28
- '-29
18


 43%|███████████████████████████████████████████████████████████████████████▌                                                                                               | 48/112 [15:37<22:25, 21.02s/it]

0
0
0
0
0
0
0
0
0
0
0
74
38
35
ww37
-33
39
36
40
20
ww41
14
44-ww
42-ww


 44%|█████████████████████████████████████████████████████████████████████████                                                                                              | 49/112 [15:56<21:30, 20.49s/it]

28
32
31
23
34
17
25
24
3
16
7
12
33
20
4
19
10
29
5
30
13
15
1
26


 45%|██████████████████████████████████████████████████████████████████████████▌                                                                                            | 50/112 [16:16<20:57, 20.29s/it]

71
50
38
43
56
41
47
42
60
57
39
36
45
63
37
44
-51
54
59
46
64
52-7
55
62


 46%|████████████████████████████████████████████████████████████████████████████                                                                                           | 51/112 [16:37<20:45, 20.41s/it]

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
2
11
21


 46%|█████████████████████████████████████████████████████████████████████████████▌                                                                                         | 52/112 [16:56<20:12, 20.21s/it]

19
10
14
21
1'-22
2
1
3
27
12-{
20
11
13
17
5
25
26
16
24
23
4
28
18
15


 47%|███████████████████████████████████████████████████████████████████████████████                                                                                        | 53/112 [17:16<19:48, 20.14s/it]

34
39
48
47
46
30
54
41
40
44
43
53
29
49
33
36
32
38
45
50
37
55
35
51


 48%|████████████████████████████████████████████████████████████████████████████████▌                                                                                      | 54/112 [17:36<19:25, 20.09s/it]

0
0
0
0
0
0
0
0
0
67
83
58
85
104
80
101
103
57
70
73
59
75
60
102


 49%|██████████████████████████████████████████████████████████████████████████████████                                                                                     | 55/112 [17:55<18:49, 19.81s/it]

5
7
3
26
20
2
25
11
14
15
19
16
18
13
17
24
32
12
28
31
30
27
29
10


 50%|███████████████████████████████████████████████████████████████████████████████████▌                                                                                   | 56/112 [18:14<18:12, 19.51s/it]

48
58
49
34
57
38
-45
41
40
42
36
37-`
50
44
47
46
55
33
56
54
53
%4-51
4-52
3-39


 51%|████████████████████████████████████████████████████████████████████████████████████▉                                                                                  | 57/112 [18:35<18:08, 19.79s/it]

0
0
0
0
0
0
0
0
0
0
64
62
76
65
74
72
77
-67
63
61
73
70
59
43


 52%|██████████████████████████████████████████████████████████████████████████████████████▍                                                                                | 58/112 [18:54<17:36, 19.56s/it]

23
12
16
3
11
4
1
19
32
26
22
25
17
27
20
31
29
33
14
13
5
18
30
28


 53%|███████████████████████████████████████████████████████████████████████████████████████▉                                                                               | 59/112 [19:14<17:28, 19.77s/it]

46
49
47
43
35
42
50
58
40
53
56
54
44
34
48
39
59
61
36
60
51
63
57
52


 54%|█████████████████████████████████████████████████████████████████████████████████████████▍                                                                             | 60/112 [19:34<17:15, 19.91s/it]

0
0
0
0
0
0
74
73
77
24
71
83
75
79
81
82
65
70
80
64
78
76
41
67


 54%|██████████████████████████████████████████████████████████████████████████████████████████▉                                                                            | 61/112 [19:55<17:11, 20.22s/it]

0
0
0
0
0
0
0
0
0
0
53
20
12
ww04
46
14
22
41
40
39
52
28
24
ww27


 55%|████████████████████████████████████████████████████████████████████████████████████████████▍                                                                          | 62/112 [20:15<16:40, 20.01s/it]

0
0
0
0
0
'-0
0
0
0
45
24
4
ww11
ww13
19
33
26
ww12
37
17
22
32
ww16
ww32


 56%|█████████████████████████████████████████████████████████████████████████████████████████████▉                                                                         | 63/112 [20:36<16:34, 20.29s/it]

0
0
0
0
0
0
0
0
0
0
0
0
31
23
33
24
2
ww10
14
15
36
ww21
ww05
18


 57%|███████████████████████████████████████████████████████████████████████████████████████████████▍                                                                       | 64/112 [20:55<16:03, 20.08s/it]

0
0
0
0
0
0
-0
0
0
0
0
27
25
10
ww18
11
24
36
3
12
17
18
19
5


 58%|████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                      | 65/112 [21:16<15:51, 20.25s/it]

0
0
0
0
0
70
ww15
ww12
60
ww30
44
48
30
14
45
17
18
38
51
63
65
ww32
ww16
ww27


 59%|██████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                    | 66/112 [21:35<15:22, 20.06s/it]

18
15
25
12
17
3
5
23
22
4
13
29
30
14
7
11
24
2
10
19
1
28
27
26


 60%|███████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                   | 67/112 [21:57<15:19, 20.44s/it]

56
40
38
33
32
36
53
37
49
34
45
44
48
55
46
39
31
51
47
57
43
41
42
54


 61%|█████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                 | 68/112 [22:17<14:51, 20.26s/it]

90
93
64
92
83
61
91
87
74
84
80
79
81
73
62
"-65
70
2-60
67
77
58
76
75
72-`


 62%|██████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                | 69/112 [22:38<14:44, 20.57s/it]

0
0
0
0
0
0
0
0
113
116
97
115
107
114
103
102
111
101
104
110
94
95
112
105


 62%|████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                              | 70/112 [22:58<14:19, 20.46s/it]

5
21
25
30
10
15
27-:
 .-14
16
11
7
1
26
13
2
23
24
3
20
12
18
29
17
28


 63%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                             | 71/112 [23:18<13:57, 20.43s/it]

0
70
80
83
78
62
57
63
82
81
75
56
32
77
84
46
49
65
40
31-7,
36
61
37
38


 64%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                           | 72/112 [23:38<13:23, 20.08s/it]

26
14
4
23
21
30
25
15
5
1
13
10
16
7
22
2
27
29
19
11
17
20
18
24


 65%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                          | 73/112 [23:58<13:02, 20.06s/it]

33
57
40
50
46
53
36
34
48
38
43
63
44
45
58
51
55
39
59
49
62
32
61
60


 66%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                        | 74/112 [24:17<12:27, 19.67s/it]

0
0
0
0
81
65
72
95
84
78
64
75
93
87
80
79
73
70
83
90
85
67
71
76


 67%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                       | 75/112 [24:36<12:10, 19.74s/it]

16
19
12
7
15
30
11
24
22
25
4
17
3
23
5
10
27
28
26
31
18
21
14
107


 68%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                     | 76/112 [24:55<11:42, 19.51s/it]

58
'-45
56
52
44
41
54
42
46
55
60
51
39
48
43
50
40
62
34
36
32
47
33
38


 69%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                    | 77/112 [25:16<11:33, 19.82s/it]

74
67
82
71
85
87
65
90-li-del0rmed-n9s
72
95
73
70
81
93
77
76
92
64
78
94
91
1-84
79
80


 70%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                  | 78/112 [25:36<11:13, 19.82s/it]

0
0
0
0
0
0
0
0
0
0
0
0
111
117
103
115
114
97
113
110
101
112
104
116


 71%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                 | 79/112 [25:57<11:08, 20.25s/it]

39
36
34
31
37
16
30
19
35
27
15
32
2
4
11
3
33
1
20
38
21
7
28
22


 71%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                               | 80/112 [26:17<10:42, 20.07s/it]

60
42
50
52
46
44
67
45
63
55
70
59
47
51
64
53
48
58
61
56
62
40
49
54


 72%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                              | 81/112 [26:37<10:27, 20.24s/it]

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
78
75
71
72
76
74


 73%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                            | 82/112 [26:57<10:01, 20.07s/it]

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
51
ww1
ww26


 74%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                           | 83/112 [27:17<09:37, 19.92s/it]

0
0
ww44
ww11
ww26
38
ww16
59
20
44
ww31
57
ww13
ww29
50
ww18
35
(-74
63
5
28
22
39
ww1


 75%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                         | 84/112 [27:36<09:16, 19.86s/it]

0
0
0
0
0
0
0
0
0-pe
0
0
0
0
0
0
ww3
60
ww59
ww42
ww28
ww24
29
ww7
ww49


 76%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                        | 85/112 [27:56<08:54, 19.79s/it]

0
ww27
47
50
31
46
39
43
ww26
ww37
14
ww15
ww56
ww48
13
22
5
ww14
ww13
18
ww53
3
ww31
27


 77%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                      | 86/112 [28:16<08:34, 19.79s/it]

23
30
19
13
22
14
36
24
32
31
20
1
27
7
16
2
5
26
28
21
10
37-s`
12
3


 78%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                     | 87/112 [28:36<08:17, 19.90s/it]

58
63
'-53
40
43
61
50
49
47
56
48
52
62
59
41
45
57
39
54
70
55
38
64
67


 79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                   | 88/112 [28:56<08:01, 20.05s/it]

79
121
75
101
95
72
115
107
91
84
'-81
90
104-:
124
78
94
119
116
118
122
114
93
82
92


 79%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                  | 89/112 [29:17<07:47, 20.31s/it]

0
0
0
0
0
0
0
.`-0
140
143
139
138
141
135
127
131
130
128
133
136
137
129
125
ww74


 80%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                | 90/112 [29:37<07:23, 20.15s/it]

10
25
22
4
13
-'-11
20
(-31
26
32
7
23
14
33
16
3
2
29
21
12
18
19
27
28


 81%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                               | 91/112 [29:58<07:10, 20.51s/it]

52
60
61
34
- --56
62
39
'-47
45
42
58
63
50
51
40
57
46
55
41
54
48
-53
37
44


 82%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                             | 92/112 [30:19<06:48, 20.44s/it]

0
0
0
.-0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
64
65
72
71
67
70


 83%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                            | 93/112 [30:39<06:30, 20.53s/it]

33-del0rmed-wiags
35
26
23
31
11
4
3
13
34
7
2
27
21
25
5
36
28
19
"-22
1
16
24
12


 84%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                          | 94/112 [30:59<06:07, 20.42s/it]

44
48
46
70
47
39
41
51
42
60
57
40
78
67
71
38
73
74
75
52
59
64
79
49


 85%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                         | 95/112 [31:21<05:52, 20.76s/it]

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
(sings-81-del0cmecl
80


 86%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                       | 96/112 [31:41<05:30, 20.66s/it]

5
25
3
4
35
18
11
37
26
33
20
24
29
-28
21-7
16
7
15
19
31
17
12
22
23


 87%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                      | 97/112 [32:02<05:10, 20.73s/it]

51
43
53
54
'-77
47
75
40
48
55
56
45
52
73
65
41
44
71
38
46
60
59
76
ww49


 88%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                    | 98/112 [32:24<04:53, 20.99s/it]

0
0
ww62
102
94
85
90
121
87
91
ww63
113
110
118
112
120
104-rerarmed-wing
101
83
105
ww30
119
92
116


 88%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                   | 99/112 [32:45<04:33, 21.03s/it]

16
4
33
2
35
21
29
13
5
3
11
1
34
24
26-hy
12
7
27
23
10
14
18
15
28


 89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                 | 100/112 [33:06<04:11, 20.99s/it]

62
54
43
52
5-61
53
50
'-59
42
41
65
72
56
63
64
36
67
38
44
58
60
55
49
47


 90%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                | 101/112 [33:28<03:53, 21.25s/it]

115
116
78
97
&rawd-87-ce-lfag
107
-79
92
75
118
111
85
91
105
81
112
82
95
93
104
"-84
103
110
80


 91%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏              | 102/112 [33:49<03:30, 21.08s/it]

0
135
144
136
122
121
127
ww76
130
131
123
128
132
125
ww48
134
143
133
142
ww57
119
ww73
ww74
".-ww40


 92%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋             | 103/112 [34:09<03:07, 20.84s/it]

12
4
18
22
17
23
10
15
6
3
5
19
21
2-4`
11
20
14
1
7
8
9
16
13
24


 93%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏           | 104/112 [34:30<02:47, 20.92s/it]

47
48
46
44
31
32
45
34
42
28
39
26
41
35
43
36
30
25
29
33
40
38
27
37


 94%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋          | 105/112 [34:50<02:25, 20.81s/it]

2
7
21
8
5
-3
6
15
9
4
11
19
16
24
13
23
1
14
12
18
17
22
20
10


 95%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████         | 106/112 [35:11<02:03, 20.58s/it]

47
46
41
48
40
42
33
'-'-43
35
37
34
39
30
28
38
32
44
29
36
45
25
26
31
27


 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌       | 107/112 [35:31<01:42, 20.46s/it]

27
44
46
32
43
34
39
30
26
33
25
-36
41
48
31-4
29
47
.-38
42
40
45
37
28
35


 96%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████      | 108/112 [35:50<01:21, 20.26s/it]

66
62
50
60
49
53
64
65
59
51
55
71
52
57
70
72
69
56
63
67
58
54
61
68


 97%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌    | 109/112 [36:11<01:01, 20.42s/it]

4
23
1
16
5
18
22
15
8
7
2
12
"3-6
21
14
20
19
10
3
9
11
17
13
24


 98%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████   | 110/112 [36:31<00:40, 20.27s/it]

31
47
39
37
27
42
29
46
25
45
38
35
48
26
34
28
43
40
44
41
33
32
36
30


 99%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌ | 111/112 [36:52<00:20, 20.29s/it]

66
65
64
59
70
60
55
54
63
53
52
67
56
72
49
69
58
51
61
50
57
71
--62
68


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 112/112 [37:11<00:00, 19.93s/it]


In [3]:
# Manual renamings - some automatic captures did not work as intended
orig_to_new = {
    "Hive01_Sheet_01_slide'-45":"Hive01_Sheet_01_slide45",
    "Hive01_Sheet_02_slide121":"Hive01_Sheet_02_slide121-x",
    "Hive01_Sheet_03_slideww2]":"Hive01_Sheet_03_slideww21-x",
    "Hive01_Sheet_03_slidewwl0":"Hive01_Sheet_03_slideww10",
    "Hive02_Sheet_01_slide35-`":"Hive02_Sheet_01_slide35",
    "Hive02_Sheet_01_slide)-47":"Hive02_Sheet_01_slide47",
    "Hive02_Sheet_03_slide-ww11":"Hive02_Sheet_03_slideww11",
    "Hive02_Sheet_03_slide-ww34":"Hive02_Sheet_03_slideww34",
    "Hive03_Sheet_01_slide(`-53":"Hive03_Sheet_01_slide53",
    "Hive03_Sheet_01_slidewwl7":"Hive03_Sheet_01_slideww17",
    "Hive05_Sheet_01_slideww3g":"Hive05_Sheet_01_slideww39",
    "Hive06_Sheet_02_slide62-^":"Hive06_Sheet_02_slide62",
    "Hive06_Sheet_03_slide5-77":"Hive06_Sheet_03_slide77",
    "Hive06_Sheet_03_slide-80":"Hive06_Sheet_03_slide80",
    "Hive06_Sheet_05_slide0-127":"Hive06_Sheet_05_slide127-x",
    "Hive06_Sheet_05_slide0-135":"Hive06_Sheet_05_slide135-x",
    "Hive06_Sheet_05_slide148-6":"Hive06_Sheet_05_slide148",
    "Hive07_Sheet_01_slide-38":"Hive07_Sheet_01_slide38",
    "Hive07_Sheet_03_slide4-83":"Hive07_Sheet_03_slide83",
    "Hive07_Sheet_04_slide118-d-x":"Hive07_Sheet_04_slide118-x",
    "Hive07_Sheet_04_slide119-d-y":"Hive07_Sheet_04_slide119-x",
    "Hive07_Sheet_04_slided-ww37":"Hive07_Sheet_04_slideww37",
    "Hive07_Sheet_05_slide.-160":"Hive07_Sheet_05_slide160",
    "Hive07_Sheet_05_slide119-d-x":"Hive07_Sheet_05_slide119-x",
    "Hive07_Sheet_05_slide158-6":"Hive07_Sheet_05_slide158",
    "Hive07_Sheet_06_slide118-d-x":"Hive07_Sheet_06_slide118-x",
    "Hive07_Sheet_06_slide137-d":"Hive07_Sheet_06_slide137",
    "Hive08_Sheet_02_slide4(-60":"Hive08_Sheet_02_slide60",
    "Hive08_Sheet_02_slide67-`":"Hive08_Sheet_02_slide67",
    "Hive08_Sheet_02_slide-53":"Hive08_Sheet_02_slide53",
    "Hive08_Sheet_02_slide-72":"Hive08_Sheet_02_slide72",
    "Hive08_Sheet_04_slide.-33":"Hive08_Sheet_04_slide33",
    "Hive08_Sheet_04_slide.-141":"Hive08_Sheet_04_slide141",
    "Hive08_Sheet_05_slide1-162":"Hive08_Sheet_05_slide162",
    "Hive08_Sheet_05_slide-192":"Hive08_Sheet_05_slide192",
    "Hive09_Sheet_01_slide33-s`":"Hive09_Sheet_01_slide33",
    "Hive09_Sheet_02_slide-54":"Hive09_Sheet_02_slide54",
    "Hive09_Sheet_05_slide.-170":"Hive09_Sheet_05_slide170",
    "Hive09_Sheet_05_slide161-4":"Hive09_Sheet_05_slide161",
    "Hive10_Sheet_01_slide29-4 ) `":"Hive10_Sheet_01_slide29",
    "Hive10_Sheet_01_slide-10":"Hive10_Sheet_01_slide10",
    'Hive10_Sheet_02_slide"-52':"Hive10_Sheet_02_slide52",
    "Hive10_Sheet_03_slide.-95":"Hive10_Sheet_03_slide95",
    "Hive10_Sheet_03_slide-p-.-90":"Hive10_Sheet_03_slide90",
    "Hive10_Sheet_04_slide130-7":"Hive10_Sheet_04_slide130",
    "Hive10_Sheet_04_slide'(-123":"Hive10_Sheet_04_slide123",
    "Hive10_Sheet_04_slide--124":"Hive10_Sheet_04_slide124",
    "Hive11_Sheet_01_slide.-ww17":"Hive11_Sheet_01_slideww17",
    "Hive11_Sheet_01_slide-1":"Hive11_Sheet_01_slide1",
    "Hive11_Sheet_01_slidew25":"Hive11_Sheet_01_slideww25",
    "Hive12_Sheet_01_slide-22":"Hive12_Sheet_01_slide22",
    "Hive12_Sheet_02_slide--ww10":"Hive12_Sheet_02_slideww10",
    "Hive12_Sheet_02_slide^ (-ww18":"Hive12_Sheet_02_slideww18",
    "Hive13_Sheet_01_slide(-30":"Hive13_Sheet_01_slide30",
    "Hive13_Sheet_01_slide-26":"Hive13_Sheet_01_slide26",
    "Hive13_Sheet_02_slidei <-ww23":"Hive13_Sheet_02_slideww23",
    "Hive13_Sheet_02_slideww32-x":"Hive13_Sheet_02_slideww32",
    "Hive15_Sheet_01_slide-40":"Hive15_Sheet_01_slide40",
    "Hive15_Sheet_02_slide2-ww31":"Hive15_Sheet_02_slideww31",
    "Hive15_Sheet_02_slide6-90-hive40":"Hive40_Sheet_02_slide90",
    "Hive15_Sheet_02_slide83-hive40":"Hive40_Sheet_02_slide83",
    "Hive15_Sheet_02_slide-ww24":"Hive15_Sheet_02_slideww24",
    "Hive16_Sheet_01_slide10-`":"Hive16_Sheet_01_slide10",
    "Hive16_Sheet_01_slide(-28":"Hive16_Sheet_01_slide28",
    "Hive16_Sheet_01_slide-13":"Hive16_Sheet_01_slide13",
    "Hive16_Sheet_01_slide- '-29":"Hive16_Sheet_01_slide29",
    "Hive16_Sheet_02_slide42-ww":"Hive16_Sheet_02_slideww42",
    "Hive16_Sheet_02_slide44-ww":"Hive16_Sheet_02_slideww44",
    "Hive16_Sheet_02_slide-33":"Hive16_Sheet_02_slide33",
    "Hive17_Sheet_02_slide52-7":"Hive17_Sheet_02_slide52",
    "Hive17_Sheet_02_slide-51":"Hive17_Sheet_02_slide51",
    "Hive18_Sheet_01_slide1'-22":"Hive18_Sheet_01_slide22",
    "Hive18_Sheet_01_slide12-{":"Hive18_Sheet_01_slide12",
    "Hive19_Sheet_02_slide3-39":"Hive19_Sheet_02_slide39",
    "Hive19_Sheet_02_slide4-52":"Hive19_Sheet_02_slide52",
    "Hive19_Sheet_02_slide37-`":"Hive19_Sheet_02_slide37",
    "Hive19_Sheet_02_slide%4-51":"Hive19_Sheet_02_slide51",
    "Hive19_Sheet_02_slide-45":"Hive19_Sheet_02_slide45",
    "Hive19_Sheet_03_slide-67":"Hive19_Sheet_03_slide67",
    "Hive26_Sheet_03_slide2-60":"Hive26_Sheet_03_slide60",
    "Hive26_Sheet_03_slide72-`":"Hive26_Sheet_03_slide72",
    'Hive26_Sheet_03_slide"-65':"Hive26_Sheet_03_slide65",
    "Hive27_Sheet_01_slide27-:":"Hive27_Sheet_01_slide27",
    "Hive27_Sheet_01_slide .-14":"Hive27_Sheet_01_slide14",
    "Hive27_Sheet_02_slide31-7,":"Hive27_Sheet_02_slide31",
    "Hive29_Sheet_02_slide'-45":"Hive29_Sheet_02_slide45",
    "Hive29_Sheet_03_slide1-84":"Hive29_Sheet_03_slide84",
    "Hive32_Sheet_01_slide(-74":"Hive32_Sheet_01_slide74",
    "Hive36_Sheet_01_slide37-s`":"Hive36_Sheet_01_slide37",
    "Hive36_Sheet_02_slide'-53":"Hive36_Sheet_02_slide53",
    "Hive36_Sheet_03_slide104-:":"Hive36_Sheet_03_slide104",
    "Hive36_Sheet_03_slide'-81":"Hive36_Sheet_03_slide81",
    "Hive37_Sheet_01_slide(-31":"Hive37_Sheet_01_slide31",
    "Hive37_Sheet_01_slide-'-11":"Hive37_Sheet_01_slide11",
    "Hive37_Sheet_02_slide'-47":"Hive37_Sheet_02_slide47",
    "Hive37_Sheet_02_slide-53":"Hive37_Sheet_02_slide53",
    "Hive37_Sheet_02_slide- --56":"Hive37_Sheet_02_slide56",
    'Hive38_Sheet_01_slide"-22':"Hive38_Sheet_01_slide22",
    "Hive39_Sheet_01_slide21-7":"Hive39_Sheet_01_slide21",
    "Hive39_Sheet_01_slide-28":"Hive39_Sheet_01_slide28",
    "Hive39_Sheet_02_slide'-77":"Hive39_Sheet_02_slide77",
    "Hive39_Sheet_03_slide104-rerarmed-wing":"Hive39_Sheet_03_slide104",
    "Hive40_Sheet_01_slide26-hy":"Hive40_Sheet_01_slide26",
    "Hive40_Sheet_02_slide5-61":"Hive40_Sheet_02_slide61",
    "Hive40_Sheet_02_slide'-59":"Hive40_Sheet_02_slide59",
    'Hive40_Sheet_03_slide"-84':"Hive40_Sheet_03_slide84",
    "Hive40_Sheet_03_slide&rawd-87-ce-lfag":"Hive40_Sheet_03_slide87",
    'Hive40_Sheet_04_slide".-ww40':"Hive40_Sheet_04_slideww40",
    "HiveC1_Sheet_01_slide2-4`":"HiveC1_Sheet_01_slide2",
    "HiveC2_Sheet_01_slide-3":"HiveC2_Sheet_01_slide3",
    "HiveC2_Sheet_02_slide'-'-43":"HiveC2_Sheet_02_slide43",
    "HiveC4_Sheet_01_slide.-38":"HiveC4_Sheet_01_slide38",
    "HiveC4_Sheet_01_slide31-4":"HiveC4_Sheet_01_slide31",
    "HiveC4_Sheet_01_slide-36":"HiveC4_Sheet_01_slide36",
    'HiveC5_Sheet_01_slide"3-6':"HiveC5_Sheet_01_slide6",
    "HiveC5_Sheet_03_slide--62":"HiveC5_Sheet_03_slide62",
    "Hive40_Sheet_03_slide-79":"Hive40_Sheet_03_slide79",
    "Hive05_Sheet_01_slidewv15":"Hive05_Sheet_01_slidewv16",
    "Hive10_Sheet_04_slide-117":"Hive10_Sheet_04_slide117"
}
remove = ['Hive08_Sheet_05_slide179-dek0rmed wings', 
         'Hive29_Sheet_03_slide90-li-del0rmed-n9s',
         'Hive38_Sheet_01_slide33-del0rmed-wiags',
          'Hive38_Sheet_03_slide(sings-81-del0cmecl']

In [12]:
# Update slide names from above
for old, new in orig_to_new.items():
    fp = glob(f'../slides/1_slides/{old}.png')
    print(fp)
    assert len(fp) <= 1

    if len(fp) == 0:
        print(old, new)
        continue
    fp = fp[0]
    print(fp)
    
    new_fp = fp.replace(old, new)
    if not os.path.exists(new_fp):
        shutil.move(fp, new_fp)
old, new, fp, new_fp

[]
Hive01_Sheet_01_slide'-45 Hive01_Sheet_01_slide45
[]
Hive01_Sheet_02_slide121 Hive01_Sheet_02_slide121-x
[]
Hive01_Sheet_03_slideww2] Hive01_Sheet_03_slideww21-x
[]
Hive01_Sheet_03_slidewwl0 Hive01_Sheet_03_slideww10
[]
Hive02_Sheet_01_slide35-` Hive02_Sheet_01_slide35
[]
Hive02_Sheet_01_slide)-47 Hive02_Sheet_01_slide47
[]
Hive02_Sheet_03_slide-ww11 Hive02_Sheet_03_slideww11
[]
Hive02_Sheet_03_slide-ww34 Hive02_Sheet_03_slideww34
[]
Hive03_Sheet_01_slide(`-53 Hive03_Sheet_01_slide53
[]
Hive03_Sheet_01_slidewwl7 Hive03_Sheet_01_slideww17
[]
Hive05_Sheet_01_slideww3g Hive05_Sheet_01_slideww39
[]
Hive06_Sheet_02_slide62-^ Hive06_Sheet_02_slide62
[]
Hive06_Sheet_03_slide5-77 Hive06_Sheet_03_slide77
[]
Hive06_Sheet_03_slide-80 Hive06_Sheet_03_slide80
[]
Hive06_Sheet_05_slide0-127 Hive06_Sheet_05_slide127-x
[]
Hive06_Sheet_05_slide0-135 Hive06_Sheet_05_slide135-x
[]
Hive06_Sheet_05_slide148-6 Hive06_Sheet_05_slide148
[]
Hive07_Sheet_01_slide-38 Hive07_Sheet_01_slide38
[]
Hive07_Sheet_03_

('Hive01_Sheet_02_slide121-x-x',
 'Hive01_Sheet_02_slide121-x',
 '../slides/1_slides/Hive01_Sheet_02_slide121-x-x.png',
 '../slides/1_slides/Hive01_Sheet_02_slide121-x.png')

In [47]:
# remove unuseful slides
for rem in remove:
    fp = glob(f'../slides/1_slides/{rem}*')

    assert len(fp) <= 1

    if len(fp) == 0:
        print(rem)
        continue

    fp = fp[0]
    os.remove(fp)