In [1]:
import pandas as pd
import numpy as np
import os

from shutil import copyfile
import json

import re
from tqdm import tqdm
pd.set_option('display.max_rows', 1000+1)

In [2]:
pdb_labeled_dir = 'dataset/Godess_gnn/preprocess_data/Godess_carbon_labeled_pdb_all/'
pdb_file_list = os.listdir(pdb_labeled_dir)

##### Delete illegal glycan from step 3

In [3]:
illegal_no_list = [17, 516, 214]
illegal_name_list = ['labeled_all_' + str(i) + '.pdb.csv' for i in illegal_no_list]

##### Reformulate shift values, relabel shift values for ranges, relabel empty/missing shifts

In [4]:
def reformulate_shift(pdb_f, pdb_f_name):

    shift_list = pdb_f['shift'].values
    
#     assert(isinstance(shift_list[0], str))
    
    if isinstance(shift_list[0], str):
    
        for i in range(len(shift_list)):
            
            if ( pd.isna(shift_list[i]) ) or (shift_list[i] == '?'):

                current_shift = '-1'

                pdb_f.loc[i, ['shift']] = current_shift
            
            elif pdb_f.loc[i, :]['Residual_accurate_name'] == 'Cho':
            
                pdb_f.loc[i, ['shift']] = '-1'
            

            elif ('-' in shift_list[i]) and (shift_list[i] != '-1') and (shift_list[i] != '-1.0') and \
                (len(shift_list[i]) > 2):
                
                current_shift = shift_list[i]

                reformulate_current_shift = current_shift.split('-')

                current_atom = pdb_f.loc[i, :]['Atom_name']

                current_atom_second = current_atom + '1'

                next_atom = pdb_f.loc[i+1, :]['Atom_name']

                if current_atom_second != next_atom:
#                     print(pdb_f_name, i, current_atom, 'next atom is not', current_atom_second, 
#                           'it is:', next_atom)

                    if current_atom == next_atom:

                        pdb_f.loc[i+1, ['Atom_name']] = current_atom_second

                    else:
                        raise Exception('Next atom is not consistent with current atom')
                        
#                 print(i, reformulate_current_shift, current_atom, current_atom_second)

                pdb_f.loc[i, ['shift']] = reformulate_current_shift[0]
                pdb_f.loc[i+1, ['shift']] = reformulate_current_shift[1]


            elif ('-' in shift_list[i]) and (len(shift_list[i]) == 1):
                print(pdb_f_name, i)
                
                current_shift = '-1'

                pdb_f.loc[i, ['shift']] = current_shift

        pdb_f_out = pdb_f.astype({'shift': 'float'})

        return pdb_f_out
    
    else:
        
        return pdb_f

##### Reformulate monosaccharides

In [5]:
glycan_list = ['gal', 'galnac', 'galn', 'gala', 'galanac', 'glc', 'glcnac', 'glcn', 'glca', 'fuc', 
               'man', 'mannac', 'mann', 'mana', 'kdn', 'neu5ac', 'xyl', 'idoa', 'neu5gc', 'kdo', 
               'kdn', 'qui',  'quinac', 'rhap', 'ara', 'gula', 'rib', 'neu5ac', 'tal', 'rha', 
               'rhanac', 'fucnac', 'rhanac', 'ido', '3,6anhgal', 'neu', 'fru', 'api', 'qui4n', 'galna', 'glcna',
              'fucn', 'qui3n', 'quin', 'rha4n', 'rhan']

non_mono_component_list = ['Ac', 'Asn', 'Gc', 'Me', 'P', 'S', 'Ser', 'Missing Monosaccharide', 'Cho', 'bu', 'bz',
                          'caf', 'fer', 'lyx', 'mal', 'myoIno', '17hoole', 'allyl', 'pcoum', 'gallic']
non_mono_component_list = [x.lower() for x in non_mono_component_list]
glycan_list_extend = glycan_list + non_mono_component_list

In [6]:
def split_single_mono_bound(mono):
    
    mono = mono.lower()
    
    ab = 'missing_a_b'
    ld = 'missing_L_D'
    abbrev = ''
    
    _ct = mono.count('-')
    temp_mono_list = mono.split('-')
    if _ct == 2:
        
        if mono in ['d-gal-ol', 'd-glc-ol', 'd-glcn-ol', 'l-ara-ol', 'd-rib-ol']:
            
            ld = mono.split('-')[0]
            abbrev = mono[2:]
            
        else:
        
            ab = temp_mono_list[0]
            ld = temp_mono_list[1]
            abbrev = temp_mono_list[2]
        
    elif _ct == 1:
#         the following are wired only one appeared
#         D-Glca
#         b-Neup
        temp_bound_incomp = temp_mono_list[0]
        
        if mono == 'kdo-ol' :
            
            temp_mono_list = ['', 'kdo-ol']
        
        elif temp_bound_incomp in ['delta', 'd', 'l']:
            ld = temp_bound_incomp
            
            if ld == 'delta':
                ld = 'd'
            
        elif temp_bound_incomp in ['a', 'b']:
            ab = temp_bound_incomp 
        
        abbrev = temp_mono_list[1]
    
    elif _ct == 0:
        abbrev = mono
        
    return ab, ld, abbrev

In [7]:
split_single_mono_bound('Kdo-ol')

('missing_a_b', 'missing_L_D', 'kdo-ol')

In [8]:
def reformulate_monosaccharide(abbrev, g_list):
    
    if abbrev == 'p':
        carbon_number = 'missing_carbon_number'
        current_split_list = [abbrev]
    
    elif abbrev in ['caf', 'pr', 'fer', 'pcoum']:
        carbon_number = 'missing_carbon_number'
        current_split_list = [abbrev]
    
    elif abbrev == 'apif':
        carbon_number = 'F'
        current_split_list = abbrev.split('f')
    
    elif abbrev == 'fucpn':
        carbon_number = 'P'
        current_split_list = ['fucn']
    
    elif 'p' in abbrev:
        carbon_number = 'P'
        current_split_list = abbrev.split('p')
    
    elif 'f' in abbrev:
        carbon_number = 'F'
        current_split_list = abbrev.split('f')
    
    else:
        carbon_number = 'missing_carbon_number'
        current_split_list = [abbrev]

    print(current_split_list)
    
    if current_split_list[0] in ['gal-ol', 'glc-ol', 'glcn-ol', 'rib-ol', 'kdo-ol', 'ara-ol', 'pr', 'fucn']:
        
        return abbrev, current_split_list[0], carbon_number
    
    new_abbrev = ''.join(current_split_list)
    

    indicator = 0

    for m in g_list:
        if (m in new_abbrev) and (indicator == 0):
            
            new_mono = m
            indicator = 1
            prev_m = m
        elif (m in new_abbrev) and (indicator == 1):
            
            if len(m) > len(prev_m):
                new_mono = m
            else:
                new_mono = prev_m

    if 'fru' in abbrev:
        new_mono = 'fru'
    
    elif indicator == 0:
        new_mono = 'missing monosaccharide'
    
    return abbrev, new_mono, carbon_number

In [9]:
reformulate_monosaccharide('fucpn', glycan_list_extend)

['fucn']


('fucpn', 'fucn', 'P')

In [10]:
def reformulate_pdb_monosaccharide(pdb_f):
    
    ab_list = []
    ld_list = []
    abbrev_list = []
    pf_list = []
    standard_abbrev_list = []
    
    residual_name_list = pdb_f['Residual_accurate_name'].values
    
    for mono in residual_name_list:
        
        ab, ld, abbrev = split_single_mono_bound(mono)
    
        abbrev, new_mono, carbon_number = reformulate_monosaccharide(abbrev, glycan_list_extend)


        ab_list.append(ab)
        ld_list.append(ld)
        abbrev_list.append(abbrev)
        standard_abbrev_list.append(new_mono)
        pf_list.append(carbon_number)

        del ab, ld, abbrev, new_mono, carbon_number
        
    pdb_f_copy = pdb_f.copy()
    
    assert(len(ab_list) == len(pdb_f))
    assert(len(ld_list) == len(pdb_f))
    assert(len(standard_abbrev_list) == len(pdb_f))
    assert(len(abbrev_list) == len(pdb_f))
    assert(len(pf_list) == len(pdb_f))
    
    pdb_f_copy['bound_AB'] = ab_list
    pdb_f_copy['fischer_projection_DL'] = ld_list
    pdb_f_copy['origin_mono'] = abbrev_list
    pdb_f_copy['reformulated_standard_mono'] = standard_abbrev_list
    pdb_f_copy['carbon_number_PF'] = pf_list
    
    return pdb_f_copy

##### Combine the above three steps

In [11]:
out_dir = 'dataset/Godess_final_data/Godess_data/'

In [12]:
# pdb_f = pd.read_csv('dataset/Godess_gnn/preprocess_data/Godess_carbon_labeled_pdb_all/labeled_all_' 
#                             +str(17) + '.pdb.csv')
# 'Godess_carbon_labeled_pdb_all/labeled_all_' +str(17) + '.pdb.csv'

In [13]:
# mono_list = ['Ac', 'Asn', 'D-Glca', 'Gc', 'Me', 'Missing Monosaccharide', 'P',
#        'S', 'Ser', 'a-D-3,6anhGalp', 'a-D-Fruf', 'a-D-Frup', 'a-D-Fucp',
#        'a-D-Galf', 'a-D-Galp', 'a-D-GalpA', 'a-D-GalpN', 'a-D-Glcp',
#        'a-D-GlcpA', 'a-D-GlcpN', 'a-D-Manp', 'a-D-ManpA', 'a-D-Xylp',
#        'a-L-3,6anhGalp', 'a-L-Araf', 'a-L-Fucp', 'a-L-Galp', 'a-L-GulpA',
#        'a-L-IdopA', 'a-L-Rhap', 'a-Neup', 'b-D-Fruf', 'b-D-Frup',
#        'b-D-Fucp', 'b-D-Galp', 'b-D-GalpA', 'b-D-GalpN', 'b-D-Glcp',
#        'b-D-GlcpA', 'b-D-GlcpN', 'b-D-Manp', 'b-D-ManpA', 'b-D-Xylp',
#        'b-L-3,6anhGalp', 'b-L-Fucp', 'b-Neup']

In [14]:
mono_list = []

In [15]:
for i in tqdm(range(len(pdb_file_list))):

# for i in [928]:
# for i in [262]:
# for i in [1809]:
# for i in [101]:
    pdb_f_name = pdb_file_list[i]
    
    # ignore illegal name
    if pdb_f_name in illegal_name_list:
        continue
    

    
    pdb_f_path = os.path.join(pdb_labeled_dir, pdb_f_name)
    pdb_f = pd.read_csv(pdb_f_path)
    
    # reformulate shift value
    pdb_f = reformulate_shift(pdb_f, pdb_f_name)
    
    
    # reformulate monosaccharide name
    pdb_f = reformulate_pdb_monosaccharide(pdb_f)
    pdb_f['Atom_type'] = pdb_f[['Atom_type']].replace({'0': 'O'})
    
    out_path_f = os.path.join(out_dir, pdb_f_name)
    
    pdb_f.to_csv(out_path_f, index = False)

    mono_list.extend(list(np.unique(pdb_f['Residual_accurate_name'].values)))

  0%|                                          | 6/2402 [00:00<00:41, 57.83it/s]

['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', 

['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['s']
['s']
['s'

  0%|▏                                        | 12/2402 [00:00<00:57, 41.45it/s]

['me']
['me']
['me']
['me']
['me']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['g

  1%|▎                                        | 17/2402 [00:00<00:54, 43.84it/s]

labeled_all_746.pdb.csv 193
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']


  1%|▍                                        | 22/2402 [00:00<01:00, 39.03it/s]

labeled_all_2000.pdb.csv 99
labeled_all_2000.pdb.csv 147
labeled_all_2000.pdb.csv 199
labeled_all_2000.pdb.csv 226
['me']
['me']
['me']
['me']
['me']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['

  1%|▍                                        | 27/2402 [00:00<00:57, 41.34it/s]

['me']
['me']
['me']
['me']
['me']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
labeled_all_1375.pdb.csv 66
labeled_all_1375.pdb.csv 93


  1%|▌                                        | 32/2402 [00:00<01:00, 39.45it/s]

['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']

['glc', '']

  2%|▋                                        | 42/2402 [00:01<01:02, 37.83it/s]


['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['fuc', '']
['fuc', '']
['fuc', '']
['f

  2%|▊                                        | 51/2402 [00:01<01:02, 37.40it/s]

labeled_all_313.pdb.csv 67
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', ''

  2%|█                                        | 60/2402 [00:01<00:58, 40.12it/s]

labeled_all_1383.pdb.csv 263
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['glc', 'a']
['glc', 'a']
['g

  3%|█▏                                       | 72/2402 [00:01<00:56, 41.26it/s]

['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['xyl', 

  3%|█▍                                       | 84/2402 [00:02<00:51, 44.93it/s]

['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['ga

  4%|█▌                                       | 89/2402 [00:02<00:54, 42.71it/s]

['me']
['me']
['me']
['me']
['me']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['gal', '

  4%|█▋                                       | 99/2402 [00:02<01:00, 38.32it/s]

['me']
['me']
['me']
['me']
['me']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['m

  4%|█▊                                      | 106/2402 [00:02<00:56, 40.66it/s]

labeled_all_567.pdb.csv 26
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
[

  5%|█▉                                      | 115/2402 [00:02<01:04, 35.62it/s]

['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc'

  5%|██                                      | 123/2402 [00:03<01:01, 36.77it/s]

['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a'

  5%|██▏                                     | 128/2402 [00:03<00:57, 39.49it/s]

labeled_all_39.pdb.csv 67
labeled_all_39.pdb.csv 109
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['p']
['p']
['p']
['p']
['p']
['missing monosaccharide']
['missing monosaccharide

  6%|██▎                                     | 140/2402 [00:03<00:50, 44.93it/s]

['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['me']
['me']
['me']
['me']
['me']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc

  6%|██▍                                     | 150/2402 [00:03<01:01, 36.69it/s]

labeled_all_622.pdb.csv 45
labeled_all_622.pdb.csv 107
labeled_all_622.pdb.csv 178
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['s']
['s']
['s']
['s']
['s']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['neu', '']
['neu', '']
[

  6%|██▌                                     | 154/2402 [00:03<01:07, 33.45it/s]

labeled_all_878.pdb.csv 146
labeled_all_878.pdb.csv 294
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['s']
['s']
['s']
['s']
['s']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['s']
['s']
['s']
['s']
['s']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', ''

  7%|██▋                                     | 163/2402 [00:04<01:04, 34.56it/s]

labeled_all_2331.pdb.csv 72
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['ac']
['ac']
['ac']
['ac']
['ac']
['ac']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['

  7%|██▉                                     | 173/2402 [00:04<01:03, 34.96it/s]

['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['glc', '']
['gl

  8%|███                                     | 184/2402 [00:04<00:53, 41.83it/s]

labeled_all_1801.pdb.csv 53
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['ga

  8%|███▏                                    | 195/2402 [00:04<00:53, 41.20it/s]

labeled_all_1343.pdb.csv 76
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu'

  8%|███▎                                    | 201/2402 [00:05<00:48, 45.08it/s]

labeled_all_685.pdb.csv 72
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['s']
['s']
['s']
['

  9%|███▌                                    | 216/2402 [00:05<00:50, 43.17it/s]

labeled_all_2358.pdb.csv 24
labeled_all_2358.pdb.csv 76
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['cho']
['cho']
['cho']
['cho']
['cho']
['cho']
['cho']
['cho']
['cho']
['cho']
['cho']
['cho']
['cho']
['cho']
['cho']
['cho']
['cho']
['cho']
['cho']
['p']
['p']
['p']
['p']
['p']
['p']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal'

  9%|███▋                                    | 222/2402 [00:05<00:50, 43.45it/s]

['me']
['me']
['me']
['me']
['me']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', 

 10%|███▊                                    | 232/2402 [00:05<00:52, 41.63it/s]

['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['xyl', '']
['xyl', '']
[

 10%|████                                    | 244/2402 [00:06<00:46, 46.86it/s]

['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
labeled_all_1929.pdb.csv 29
labeled_all_1929.pdb.csv 291
labeled_all_1929.pdb.csv 342
labeled_all_1929.pdb.csv 395
['me']
['me']
['me']
['me']
['me']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['

 10%|████▏                                   | 249/2402 [00:06<00:50, 42.70it/s]

['me']
['me']
['me']
['me']
['me']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
labeled_all_693.pdb.csv 219
labeled_all_693.pdb.csv 290
labeled_all_693.pdb.csv 353
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal

 11%|████▍                                   | 267/2402 [00:06<00:42, 50.23it/s]

['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['ma

 11%|████▌                                   | 273/2402 [00:06<00:44, 47.59it/s]

['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['me']
['me']
['me']
['me']
['me']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '

 12%|████▋                                   | 283/2402 [00:06<00:54, 38.56it/s]

labeled_all_854.pdb.csv 96
labeled_all_854.pdb.csv 122
labeled_all_854.pdb.csv 281
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['n

 12%|████▉                                   | 294/2402 [00:07<00:50, 41.55it/s]

['me']
['me']
['me']
['me']
['me']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['f

 12%|████▉                                   | 299/2402 [00:07<00:50, 42.02it/s]

labeled_all_1587.pdb.csv 71
labeled_all_1587.pdb.csv 122
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['s']
['s']
['s']
['s']
['s']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['s']
['s']
['s']
['s']
['s']
['fuc', '']
['fuc', '']
['fuc

 13%|█████▏                                  | 312/2402 [00:07<00:57, 36.52it/s]

['me']
['me']
['me']
['me']
['me']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a

 13%|█████▎                                  | 316/2402 [00:07<01:01, 33.89it/s]

['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
labeled_all_912.pdb.csv 68
labeled_all_912.pdb.csv 202
labeled_all_912.pdb.csv 234
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal',

 14%|█████▍                                  | 326/2402 [00:08<00:54, 37.75it/s]

['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['ga

 14%|█████▌                                  | 336/2402 [00:08<00:52, 39.58it/s]

['me']
['me']
['me']
['me']
['me']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', ''

 14%|█████▊                                  | 346/2402 [00:08<00:48, 42.05it/s]

['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['17hoole']
['17hoole']
['17hoole']
['17hoole']
['17hoole'

 15%|█████▉                                  | 357/2402 [00:08<00:51, 39.51it/s]

['me']
['me']
['me']
['me']
['me']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
labeled_all_554.pdb.csv 26
labeled_all_554.pdb.csv 53
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['gl

 15%|██████                                  | 367/2402 [00:09<00:50, 40.04it/s]

['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
[

 16%|██████▎                                 | 378/2402 [00:09<00:44, 45.19it/s]

labeled_all_1489.pdb.csv 119
['me']
['me']
['me']
['me']
['me']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']


 16%|██████▍                                 | 388/2402 [00:09<00:45, 44.32it/s]

labeled_all_1446.pdb.csv 278
['me']
['me']
['me']
['me']
['me']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc'

 16%|██████▌                                 | 395/2402 [00:09<00:44, 45.35it/s]

['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', ''

 17%|██████▋                                 | 405/2402 [00:10<00:54, 36.55it/s]

labeled_all_1276.pdb.csv 70
['me']
['me']
['me']
['me']
['me']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
labeled_all_1764.pdb.csv 68
labeled_all_1764.pdb.csv 94
['glc', '']
['glc', '']
['glc', '']
[

 17%|██████▊                                 | 409/2402 [00:10<01:00, 33.12it/s]

['me']
['me']
['me']
['me']
['me']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc'

 18%|███████                                 | 421/2402 [00:10<00:46, 42.69it/s]

['me']
['me']
['me']
['me']
['me']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
[

 18%|███████▏                                | 431/2402 [00:10<00:45, 43.17it/s]

['me']
['me']
['me']
['me']
['me']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['neu', '']
['neu', '']

 18%|███████▍                                | 443/2402 [00:10<00:42, 46.02it/s]

labeled_all_2179.pdb.csv 26
labeled_all_2179.pdb.csv 74
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['g

 19%|███████▌                                | 454/2402 [00:11<00:43, 44.36it/s]

labeled_all_1689.pdb.csv 120
labeled_all_1689.pdb.csv 206
labeled_all_1689.pdb.csv 274
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
[

 19%|███████▋                                | 465/2402 [00:11<00:41, 46.42it/s]

labeled_all_1524.pdb.csv 330
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man'

 20%|███████▉                                | 478/2402 [00:11<00:37, 51.92it/s]

labeled_all_1607.pdb.csv 36
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['me']
['me']
['me']
['me']
['me']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['gal', '']
['gal', '']
[

 20%|████████▏                               | 489/2402 [00:11<00:39, 49.04it/s]

labeled_all_1963.pdb.csv 69
labeled_all_1963.pdb.csv 250
labeled_all_1963.pdb.csv 323
['me']
['me']
['me']
['me']
['me']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', '

 21%|████████▎                               | 501/2402 [00:12<00:37, 50.12it/s]

labeled_all_499.pdb.csv 26
labeled_all_499.pdb.csv 74
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['ga

 21%|████████▌                               | 513/2402 [00:12<00:38, 49.13it/s]

['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
[

 22%|████████▊                               | 527/2402 [00:12<00:34, 54.42it/s]

['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['me']
['me']
['me']
['me']
['me']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['me']
['me']
['me']
['me']
['me']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal'

 22%|████████▉                               | 539/2402 [00:12<00:33, 55.89it/s]

['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', ''

 23%|█████████                               | 545/2402 [00:13<00:39, 46.93it/s]

['me']
['me']
['me']
['me']
['me']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal

 23%|█████████▎                              | 557/2402 [00:13<00:40, 45.37it/s]

labeled_all_1916.pdb.csv 45
labeled_all_1916.pdb.csv 106
labeled_all_1916.pdb.csv 200
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['s']
['s']
['s']
['s']
['s']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['neu', '']
[

 23%|█████████▎                              | 562/2402 [00:13<00:42, 43.19it/s]

labeled_all_444.pdb.csv 66
labeled_all_444.pdb.csv 135
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal',

 24%|█████████▌                              | 572/2402 [00:13<00:46, 39.28it/s]

['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', 

 24%|█████████▋                              | 585/2402 [00:13<00:37, 48.78it/s]

['me']
['me']
['me']
['me']
['me']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
labeled_all_1411.pdb.csv 29
labeled_all_1411.pdb.csv 56
labeled_all_1411.pdb.csv 309
['me']
['me']
['me']
['me']
['me']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', '

 25%|█████████▊                              | 591/2402 [00:14<00:39, 45.51it/s]

['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['g

 25%|██████████                              | 601/2402 [00:14<00:42, 42.15it/s]

['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', ''

 25%|██████████▏                             | 611/2402 [00:14<00:45, 39.35it/s]

labeled_all_405.pdb.csv 67
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', 

 26%|██████████▎                             | 619/2402 [00:14<00:48, 36.49it/s]

['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', ''

 26%|██████████▍                             | 629/2402 [00:15<00:45, 39.20it/s]

['me']
['me']
['me']
['me']
['me']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
labeled_all_1539.pdb.csv 70
labeled_all_1539.pdb.csv 101
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', 

 26%|██████████▌                             | 634/2402 [00:15<00:43, 40.99it/s]

['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
labeled_all_2254.pdb.csv 47
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '

 27%|██████████▊                             | 646/2402 [00:15<00:40, 43.16it/s]

labeled_all_1716.pdb.csv 56
['me']
['me']
['me']
['me']
['me']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
[

 27%|██████████▉                             | 657/2402 [00:15<00:36, 47.53it/s]

['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
labeled_all_2249.pdb.csv 26
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']


 28%|███████████                             | 668/2402 [00:15<00:36, 47.09it/s]

['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gl

 28%|███████████▎                            | 679/2402 [00:16<00:37, 46.00it/s]

labeled_all_688.pdb.csv 98
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', '

 29%|███████████▌                            | 691/2402 [00:16<00:35, 48.74it/s]

labeled_all_1831.pdb.csv 60
['me']
['me']
['me']
['me']
['me']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc

 29%|███████████▋                            | 701/2402 [00:16<00:37, 45.85it/s]

['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc',

 30%|███████████▉                            | 715/2402 [00:16<00:30, 55.04it/s]

labeled_all_83.pdb.csv 68
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']

 30%|████████████                            | 727/2402 [00:17<00:34, 48.24it/s]

labeled_all_1511.pdb.csv 277
['me']
['me']
['me']
['me']
['me']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']


 31%|████████████▎                           | 740/2402 [00:17<00:32, 50.82it/s]

labeled_all_1136.pdb.csv 143
['me']
['me']
['me']
['me']
['me']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['

 31%|████████████▍                           | 746/2402 [00:17<00:34, 47.92it/s]

['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['s']
['s']
['s']
['s']
['s']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc

 32%|████████████▌                           | 757/2402 [00:17<00:35, 46.22it/s]

labeled_all_226.pdb.csv 68
labeled_all_226.pdb.csv 126
labeled_all_226.pdb.csv 164
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', '']
['gal', '']
['gal', '']
['

 32%|████████████▊                           | 768/2402 [00:18<00:35, 45.67it/s]

['me']
['me']
['me']
['me']
['me']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
labeled_all_1748.pdb.csv 57
['me']
['me']
['me']
['me']
['me']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['

 32%|████████████▉                           | 778/2402 [00:18<00:40, 40.47it/s]

labeled_all_2219.pdb.csv 47
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['ac']
['ac']
['ac']
['ac']
['ac']
['ac']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['g

 33%|█████████████                           | 783/2402 [00:18<00:45, 35.68it/s]

['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
labeled_all_1440.pdb.csv 39
labeled_all_1440.pdb.csv 128
labeled_all_1440.pdb.csv 165
['me']
['me']
['me']
['me']
['me']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']


 33%|█████████████▏                          | 794/2402 [00:18<00:38, 41.26it/s]

labeled_all_1461.pdb.csv 79
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']


 33%|█████████████▍                          | 804/2402 [00:18<00:40, 39.43it/s]

labeled_all_1106.pdb.csv 123
labeled_all_1106.pdb.csv 161
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', ''

 34%|█████████████▍                          | 809/2402 [00:19<00:40, 39.34it/s]

labeled_all_835.pdb.csv 115
['me']
['me']
['me']
['me']
['me']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['

 34%|█████████████▋                          | 821/2402 [00:19<00:34, 46.02it/s]

['me']
['me']
['me']
['me']
['me']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']


 35%|█████████████▊                          | 831/2402 [00:19<00:36, 42.84it/s]

['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', ''

 35%|██████████████                          | 843/2402 [00:19<00:35, 43.38it/s]

labeled_all_1513.pdb.csv 244
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['g

 36%|██████████████▏                         | 853/2402 [00:20<00:40, 38.58it/s]

['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['s']
['s']
['s']
['s']
['s']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a'

 36%|██████████████▎                         | 858/2402 [00:20<00:38, 39.84it/s]

['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
labeled_all_919.pdb.csv 174
labeled_all_919.pdb.csv 218
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', 

 36%|██████████████▍                         | 868/2402 [00:20<00:35, 43.32it/s]

labeled_all_290.pdb.csv 68
labeled_all_290.pdb.csv 116
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal'

 37%|██████████████▌                         | 878/2402 [00:20<00:35, 43.23it/s]

['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosacch

 37%|██████████████▊                         | 888/2402 [00:20<00:37, 40.20it/s]

['gul', 'a']
['gul', 'a']
['gul', 'a']
['gul', 'a']
['gul', 'a']
['gul', 'a']
['gul', 'a']
['gul', 'a']
['gul', 'a']
['gul', 'a']
['gul', 'a']
['gul', 'a']
['gul', 'a']
['gul', 'a']
['gul', 'a']
['gul', 'a']
['gul', 'a']
['gul', 'a']
['gul', 'a']
['gul', 'a']
['gul', 'a']
['gul', 'a']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['g

 37%|██████████████▉                         | 898/2402 [00:21<00:35, 42.75it/s]

labeled_all_48.pdb.csv 26
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '

 38%|███████████████▏                        | 909/2402 [00:21<00:38, 38.33it/s]

['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['gl

 38%|███████████████▏                        | 914/2402 [00:21<00:40, 37.09it/s]

labeled_all_1425.pdb.csv 122
labeled_all_1425.pdb.csv 174
labeled_all_1425.pdb.csv 221
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
[

 39%|███████████████▍                        | 929/2402 [00:21<00:34, 42.57it/s]

['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['fuc', '']
['fuc', '']
['fu

 39%|███████████████▋                        | 940/2402 [00:22<00:32, 44.69it/s]

labeled_all_1248.pdb.csv 29
labeled_all_1248.pdb.csv 56
labeled_all_1248.pdb.csv 101
labeled_all_1248.pdb.csv 133
['me']
['me']
['me']
['me']
['me']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man'

 40%|███████████████▊                        | 951/2402 [00:22<00:30, 48.36it/s]

['me']
['me']
['me']
['me']
['me']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man'

 40%|████████████████                        | 963/2402 [00:22<00:29, 48.84it/s]

['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gl

 40%|████████████████                        | 968/2402 [00:22<00:32, 43.77it/s]

['me']
['me']
['me']
['me']
['me']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']

 41%|████████████████▎                       | 981/2402 [00:23<00:31, 45.83it/s]

labeled_all_594.pdb.csv 75
['me']
['me']
['me']
['me']
['me']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']


 41%|████████████████▍                       | 986/2402 [00:23<00:34, 41.38it/s]

['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['xyl', '']
['xyl', '']
['xy

 41%|████████████████▌                       | 996/2402 [00:23<00:33, 42.12it/s]

labeled_all_399.pdb.csv 37
['ser']
['ser']
['ser']
['ser']
['ser']
['ser']
['ser']
['ser']
['ser']
['ser']
['ser']
['ser']
['ser']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['

 42%|████████████████▎                      | 1006/2402 [00:23<00:34, 39.98it/s]

labeled_all_2408.pdb.csv 109
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
[

 42%|████████████████▍                      | 1016/2402 [00:23<00:32, 42.49it/s]

['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
[

 43%|████████████████▋                      | 1026/2402 [00:24<00:35, 38.27it/s]

labeled_all_1502.pdb.csv 91
labeled_all_1502.pdb.csv 142
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu',

 43%|████████████████▊                      | 1036/2402 [00:24<00:32, 42.42it/s]

labeled_all_2414.pdb.csv 26
labeled_all_2414.pdb.csv 115
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a

 43%|████████████████▉                      | 1041/2402 [00:24<00:31, 42.64it/s]

labeled_all_770.pdb.csv 26
labeled_all_770.pdb.csv 53
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['

 44%|█████████████████                      | 1050/2402 [00:24<00:37, 36.45it/s]

labeled_all_1814.pdb.csv 132
['me']
['me']
['me']
['me']
['me']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']


 44%|█████████████████▏                     | 1061/2402 [00:25<00:31, 42.26it/s]

['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['me']
['me']
['me']
['me']
['me']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man

 45%|█████████████████▍                     | 1072/2402 [00:25<00:32, 41.40it/s]

['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', ''

 45%|█████████████████▌                     | 1082/2402 [00:25<00:31, 41.85it/s]

['me']
['me']
['me']
['me']
['me']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['s']
['s']
['s']
['s']
['s']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', 

 45%|█████████████████▋                     | 1092/2402 [00:25<00:33, 38.65it/s]

labeled_all_1603.pdb.csv 105
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xy

 46%|█████████████████▊                     | 1096/2402 [00:25<00:35, 37.19it/s]

labeled_all_378.pdb.csv 68
labeled_all_378.pdb.csv 117
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal'

 46%|██████████████████                     | 1114/2402 [00:26<00:28, 45.49it/s]

['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['xyl', '']
['xyl', '']
['xy

 47%|██████████████████▏                    | 1119/2402 [00:26<00:30, 42.64it/s]

['me']
['me']
['me']
['me']
['me']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['s']
['s']
['s']
['s']
['s']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '

 47%|██████████████████▎                    | 1129/2402 [00:26<00:33, 38.54it/s]

labeled_all_664.pdb.csv 107
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['s']
['s']
['s']
['s']
['s']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu'

 47%|██████████████████▍                    | 1139/2402 [00:27<00:34, 36.78it/s]

['me']
['me']
['me']
['me']
['me']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['gal', '']
['gal', '']
['gal', '']

 48%|██████████████████▌                    | 1143/2402 [00:27<00:34, 37.01it/s]

labeled_all_10.pdb.csv 67
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']


 48%|██████████████████▋                    | 1153/2402 [00:27<00:31, 39.55it/s]

labeled_all_833.pdb.csv 78
labeled_all_833.pdb.csv 129
['me']
['me']
['me']
['me']
['me']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu',

 48%|██████████████████▉                    | 1163/2402 [00:27<00:32, 38.57it/s]

labeled_all_1504.pdb.csv 171
['me']
['me']
['me']
['me']
['me']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['ma

 49%|███████████████████                    | 1174/2402 [00:27<00:28, 42.89it/s]

labeled_all_2325.pdb.csv 114
['fucn']
['fucn']
['fucn']
['fucn']
['fucn']
['fucn']
['fucn']
['fucn']
['fucn']
['fucn']
['fucn']
['fucn']
['fucn']
['fucn']
['fucn']
['fucn']
['fucn']
['fucn']
['fucn']
['fucn']
['fucn']
['fucn']
['ac']
['ac']
['ac']
['ac']
['ac']
['ac']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']

 49%|███████████████████▏                   | 1184/2402 [00:28<00:30, 39.31it/s]

labeled_all_1065.pdb.csv 68
labeled_all_1065.pdb.csv 156
['me']
['me']
['me']
['me']
['me']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['s']
['s']
['s']
['s']
['s']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']


 50%|███████████████████▍                   | 1194/2402 [00:28<00:30, 39.62it/s]

labeled_all_1069.pdb.csv 77
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['

 50%|███████████████████▌                   | 1205/2402 [00:28<00:28, 42.03it/s]

labeled_all_127.pdb.csv 68
labeled_all_127.pdb.csv 116
labeled_all_127.pdb.csv 175
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['gal', '']
['gal', '']
['gal', '']
['

 51%|███████████████████▋                   | 1216/2402 [00:28<00:26, 45.33it/s]

['glc-ol']
['glc-ol']
['glc-ol']
['glc-ol']
['glc-ol']
['glc-ol']
['glc-ol']
['glc-ol']
['glc-ol']
['glc-ol']
['glc-ol']
['glc-ol']
['glc-ol']
['glc-ol']
['glc-ol']
['glc-ol']
['glc-ol']
['glc-ol']
['glc-ol']
['glc-ol']
['glc-ol']
['glc-ol']
['glc-ol']
['glc-ol']
['glc-ol']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['xyl', '']
['xyl', '']
['xyl

 51%|███████████████████▉                   | 1230/2402 [00:29<00:21, 54.37it/s]

['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n'

 51%|████████████████████                   | 1236/2402 [00:29<00:25, 45.44it/s]

['me']
['me']
['me']
['me']
['me']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man

 52%|████████████████████▏                  | 1246/2402 [00:29<00:25, 45.18it/s]

labeled_all_1407.pdb.csv 68
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '

 52%|████████████████████▍                  | 1258/2402 [00:29<00:25, 44.85it/s]

labeled_all_1422.pdb.csv 121
labeled_all_1422.pdb.csv 158
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']


 53%|████████████████████▌                  | 1268/2402 [00:30<00:27, 41.85it/s]

labeled_all_647.pdb.csv 127
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['s']
['s']
['s']
['s']
['s']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal',

 53%|████████████████████▊                  | 1284/2402 [00:30<00:20, 54.53it/s]

['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gl

 54%|████████████████████▉                  | 1290/2402 [00:30<00:21, 51.13it/s]

['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['g

 54%|█████████████████████▏                 | 1302/2402 [00:30<00:22, 48.88it/s]

labeled_all_1396.pdb.csv 85
['me']
['me']
['me']
['me']
['me']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc'

 54%|█████████████████████▏                 | 1308/2402 [00:30<00:24, 45.52it/s]

['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']

 55%|█████████████████████▍                 | 1318/2402 [00:31<00:24, 43.65it/s]

labeled_all_2339.pdb.csv 148
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']

 55%|█████████████████████▌                 | 1328/2402 [00:31<00:26, 40.56it/s]

['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['gal', '']
['gal', '']
['gal', '']
['ga

 56%|█████████████████████▊                 | 1340/2402 [00:31<00:22, 47.46it/s]

['me']
['me']
['me']
['me']
['me']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['ara-ol']
['ara-ol']
['ara-ol']
['ara-ol']
['ara-ol']
['ara-ol']
['ara-ol']
['ara-ol']
['ara-ol']
['ara-ol']
['ara-ol']
['ara-ol']
['ara-ol']
['ara-ol']
['ara-ol']
['ara-ol']
['ara-ol']
['ara-ol']
['ara-ol']
['ara-ol']
['ara-ol']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
labeled_all_847.pdb.csv 26
labeled_all_847.pdb.csv

 56%|█████████████████████▉                 | 1352/2402 [00:31<00:22, 47.00it/s]

['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
[

 57%|██████████████████████▏                | 1364/2402 [00:32<00:20, 50.57it/s]

labeled_all_699.pdb.csv 129
['me']
['me']
['me']
['me']
['me']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal',

 57%|██████████████████████▎                | 1376/2402 [00:32<00:19, 52.64it/s]

['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gl

 58%|██████████████████████▌                | 1387/2402 [00:32<00:22, 44.86it/s]

labeled_all_1790.pdb.csv 67
labeled_all_1790.pdb.csv 146
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n'

 58%|██████████████████████▋                | 1397/2402 [00:32<00:23, 42.59it/s]

['me']
['me']
['me']
['me']
['me']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
[

 58%|██████████████████████▊                | 1402/2402 [00:32<00:26, 37.63it/s]

labeled_all_968.pdb.csv 79
['me']
['me']
['me']
['me']
['me']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['glc', 'n']
[

 59%|██████████████████████▉                | 1416/2402 [00:33<00:24, 40.88it/s]

labeled_all_1186.pdb.csv 39
['me']
['me']
['me']
['me']
['me']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
labeled_all_753.pdb.csv 86
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal',

 59%|███████████████████████                | 1421/2402 [00:33<00:23, 40.88it/s]

labeled_all_1404.pdb.csv 199
labeled_all_1404.pdb.csv 294
labeled_all_1404.pdb.csv 392
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']


 60%|███████████████████████▏               | 1430/2402 [00:33<00:25, 38.16it/s]

labeled_all_1322.pdb.csv 118
labeled_all_1322.pdb.csv 175
labeled_all_1322.pdb.csv 342
['me']
['me']
['me']
['me']
['me']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
[

 60%|███████████████████████▍               | 1441/2402 [00:33<00:22, 42.58it/s]

labeled_all_1907.pdb.csv 67
['me']
['me']
['me']
['me']
['me']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['s']
['s']
['s']
['s']
['s']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['

 60%|███████████████████████▌               | 1452/2402 [00:34<00:20, 45.24it/s]

['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']

 61%|███████████████████████▊               | 1465/2402 [00:34<00:19, 47.92it/s]

labeled_all_1823.pdb.csv 142
labeled_all_1823.pdb.csv 216
['me']
['me']
['me']
['me']
['me']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
[

 61%|███████████████████████▉               | 1475/2402 [00:34<00:20, 45.36it/s]

['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['ara', '']
['ara', '']
['ar

 62%|████████████████████████               | 1480/2402 [00:34<00:23, 39.08it/s]

labeled_all_602.pdb.csv 79
['me']
['me']
['me']
['me']
['me']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', ''

 62%|████████████████████████▏              | 1489/2402 [00:35<00:26, 35.07it/s]

labeled_all_725.pdb.csv 254
labeled_all_725.pdb.csv 344
['me']
['me']
['me']
['me']
['me']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['g

 62%|████████████████████████▎              | 1498/2402 [00:35<00:23, 38.82it/s]

labeled_all_338.pdb.csv 67
labeled_all_338.pdb.csv 126
labeled_all_338.pdb.csv 163
labeled_all_338.pdb.csv 200
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', '']
['gal', ''

 63%|████████████████████████▌              | 1509/2402 [00:35<00:22, 40.19it/s]

labeled_all_1978.pdb.csv 300
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']

 63%|████████████████████████▋              | 1520/2402 [00:35<00:20, 44.09it/s]

['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
labeled_all_744.pdb.csv 158
['me']
['me']
['me']
['me']
['me']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fu

 64%|████████████████████████▊              | 1530/2402 [00:36<00:21, 41.18it/s]

['me']
['me']
['me']
['me']
['me']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['gal', '']
['gal

 64%|█████████████████████████              | 1540/2402 [00:36<00:20, 42.74it/s]

labeled_all_235.pdb.csv 66
labeled_all_235.pdb.csv 136
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['ga

 65%|█████████████████████████▏             | 1551/2402 [00:36<00:19, 43.81it/s]

labeled_all_2363.pdb.csv 45
labeled_all_2363.pdb.csv 104
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['rha', 'n']
['rha', 'n']
['rha', 'n']
['rha', 'n']
['rha', 'n']
['rha', 'n']
['rha', 'n']
['rha', 'n']
['rha', 'n']
['rha', 'n']
['rha', 'n']
['rha', 'n']
['rha', 'n']
['rha', 'n']
['rha', 'n']
['rha', 'n']
['rha', 'n']
['rha', 'n']
['rha', 'n']
['rha', 'n']
['ac']
['ac']
['ac']
['ac']
['ac']
['ac']
['ac']
['ac']
['a

 65%|█████████████████████████▎             | 1557/2402 [00:36<00:17, 47.03it/s]

['me']
['me']
['me']
['me']
['me']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
[

 65%|█████████████████████████▍             | 1567/2402 [00:36<00:20, 40.60it/s]

labeled_all_1197.pdb.csv 120
['me']
['me']
['me']
['me']
['me']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
[

 66%|█████████████████████████▌             | 1577/2402 [00:37<00:20, 40.76it/s]

labeled_all_18.pdb.csv 68
labeled_all_18.pdb.csv 127
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', 

 66%|█████████████████████████▊             | 1590/2402 [00:37<00:16, 48.27it/s]

['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['xyl', '']
['xyl', '']
['xyl', '']
[

 66%|█████████████████████████▉             | 1596/2402 [00:37<00:15, 50.45it/s]

labeled_all_603.pdb.csv 114
['me']
['me']
['me']
['me']
['me']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '

 67%|██████████████████████████▏            | 1612/2402 [00:37<00:18, 42.36it/s]

labeled_all_812.pdb.csv 128
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', '

 67%|██████████████████████████▎            | 1617/2402 [00:38<00:20, 38.52it/s]

labeled_all_1862.pdb.csv 92
labeled_all_1862.pdb.csv 129
labeled_all_1862.pdb.csv 264
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '

 68%|██████████████████████████▍            | 1628/2402 [00:38<00:18, 41.58it/s]

labeled_all_239.pdb.csv 67
labeled_all_239.pdb.csv 126
labeled_all_239.pdb.csv 164
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['

 68%|██████████████████████████▌            | 1639/2402 [00:38<00:18, 41.36it/s]

['me']
['me']
['me']
['me']
['me']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
labeled_all_2399.pdb.csv 26
labeled_all_2399.pdb.csv 94
labeled_all_2399.pdb.csv 144
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']


 69%|██████████████████████████▊            | 1648/2402 [00:38<00:20, 37.54it/s]

labeled_all_1555.pdb.csv 240
['me']
['me']
['me']
['me']
['me']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc'

 69%|██████████████████████████▉            | 1658/2402 [00:39<00:18, 39.78it/s]

['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', ''

 69%|███████████████████████████            | 1663/2402 [00:39<00:18, 40.93it/s]

labeled_all_779.pdb.csv 302
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['s']
['s']
['s']
['s']
['s']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc'

 70%|███████████████████████████▏           | 1674/2402 [00:39<00:17, 42.77it/s]

labeled_all_769.pdb.csv 46
labeled_all_769.pdb.csv 98
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['s']
['s']
['s']
['s']
['s']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n'

 70%|███████████████████████████▎           | 1685/2402 [00:39<00:15, 45.90it/s]

labeled_all_1061.pdb.csv 53
labeled_all_1061.pdb.csv 80
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 

 71%|███████████████████████████▌           | 1698/2402 [00:39<00:14, 48.90it/s]

['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', 

 71%|███████████████████████████▋           | 1703/2402 [00:40<00:14, 46.84it/s]

['me']
['me']
['me']
['me']
['me']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal

 71%|███████████████████████████▊           | 1713/2402 [00:40<00:17, 40.44it/s]

['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['3,6anhgal', '']
['3,6anhgal', '']
['3,6anhgal', '']
['3,6anhgal', '']
['3,6anhgal', '']
['3,6anhgal', '']
['3,6anhgal', '']
['3,6anhgal', '']
['3,6anhgal', '']
['3,6anhgal', '']
['3,6anhgal', '']
['3,6anhgal', '']
['3,6anhgal', '']
['3,6anhgal', '']
['3,6anhgal', '']
['3,6anhgal', '']
['3,6anhgal', '']
['s']
['s']
['s']
['s']
['s']
labeled_all_928.pdb.csv 166
['me']
['me']
['me']
['me']
['me']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 

 72%|███████████████████████████▉           | 1724/2402 [00:40<00:16, 40.75it/s]

labeled_all_1593.pdb.csv 29
labeled_all_1593.pdb.csv 56
labeled_all_1593.pdb.csv 93
labeled_all_1593.pdb.csv 300
labeled_all_1593.pdb.csv 388
['me']
['me']
['me']
['me']
['me']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
[

 72%|████████████████████████████▏          | 1734/2402 [00:40<00:15, 42.18it/s]

['me']
['me']
['me']
['me']
['me']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal'

 73%|████████████████████████████▎          | 1746/2402 [00:41<00:14, 46.40it/s]

['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['gl

 73%|████████████████████████████▌          | 1760/2402 [00:41<00:12, 52.03it/s]

['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a'

 74%|████████████████████████████▋          | 1766/2402 [00:41<00:12, 51.18it/s]

labeled_all_1967.pdb.csv 53
labeled_all_1967.pdb.csv 90
labeled_all_1967.pdb.csv 137
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu',

 74%|████████████████████████████▊          | 1777/2402 [00:41<00:15, 41.56it/s]

labeled_all_1642.pdb.csv 170
['me']
['me']
['me']
['me']
['me']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', 

 74%|█████████████████████████████          | 1789/2402 [00:42<00:13, 46.09it/s]

['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']


 75%|█████████████████████████████▏         | 1799/2402 [00:42<00:14, 41.01it/s]

['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc',

 75%|█████████████████████████████▎         | 1809/2402 [00:42<00:14, 40.03it/s]

labeled_all_1630.pdb.csv 47
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
labeled_all_1308.pdb.csv 68
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['fuc', '']
['fuc'

 76%|█████████████████████████████▍         | 1814/2402 [00:42<00:14, 40.43it/s]

labeled_all_1317.pdb.csv 105
['me']
['me']
['me']
['me']
['me']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['s']
['s']
['s']
['s']
['s']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['s']
['s']
['s']
['s']
['s']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc',

 76%|█████████████████████████████▋         | 1825/2402 [00:42<00:13, 44.31it/s]

labeled_all_1097.pdb.csv 155
['me']
['me']
['me']
['me']
['me']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc

 76%|█████████████████████████████▊         | 1834/2402 [00:43<00:15, 37.52it/s]

labeled_all_1686.pdb.csv 144
labeled_all_1686.pdb.csv 267
['me']
['me']
['me']
['me']
['me']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc'

 77%|█████████████████████████████▉         | 1845/2402 [00:43<00:13, 41.36it/s]

['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
[

 77%|██████████████████████████████         | 1855/2402 [00:43<00:13, 39.44it/s]

['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
labeled_all_1816.pdb.csv 150
['me']
['me']
['me']
['me']
['me']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']


 78%|██████████████████████████████▏        | 1863/2402 [00:43<00:11, 48.81it/s]

['me']
['me']
['me']
['me']
['me']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['s']
['s']
['s']
['s']
['s']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '

 78%|██████████████████████████████▍        | 1876/2402 [00:44<00:11, 46.69it/s]

labeled_all_1836.pdb.csv 48
labeled_all_1836.pdb.csv 222
['me']
['me']
['me']
['me']
['me']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['s']
['s']
['s']
['s']
['s']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
[

 79%|██████████████████████████████▋        | 1888/2402 [00:44<00:11, 46.48it/s]

labeled_all_1523.pdb.csv 94
['me']
['me']
['me']
['me']
['me']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['gl

 79%|██████████████████████████████▊        | 1900/2402 [00:44<00:10, 49.40it/s]

['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', 

 79%|██████████████████████████████▉        | 1906/2402 [00:44<00:10, 46.75it/s]

['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal',

 80%|███████████████████████████████▏       | 1918/2402 [00:45<00:11, 42.68it/s]

labeled_all_1460.pdb.csv 101
labeled_all_1460.pdb.csv 170
['me']
['me']
['me']
['me']
['me']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', ''

 80%|███████████████████████████████▎       | 1931/2402 [00:45<00:09, 48.64it/s]

['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['xyl', '']
['xyl', '']
['xy

 81%|███████████████████████████████▌       | 1943/2402 [00:45<00:08, 51.39it/s]

['me']
['me']
['me']
['me']
['me']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '

 81%|███████████████████████████████▋       | 1955/2402 [00:45<00:08, 52.44it/s]

labeled_all_1385.pdb.csv 121
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
[

 82%|███████████████████████████████▉       | 1967/2402 [00:45<00:08, 48.68it/s]

labeled_all_1480.pdb.csv 56
labeled_all_1480.pdb.csv 103
['me']
['me']
['me']
['me']
['me']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a'

 82%|████████████████████████████████       | 1978/2402 [00:46<00:08, 47.93it/s]

labeled_all_314.pdb.csv 67
labeled_all_314.pdb.csv 115
labeled_all_314.pdb.csv 153
labeled_all_314.pdb.csv 191
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', '']
['gal', ''

 83%|████████████████████████████████▏      | 1984/2402 [00:46<00:08, 50.65it/s]

['me']
['me']
['me']
['me']
['me']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gl

 83%|████████████████████████████████▍      | 1995/2402 [00:46<00:09, 40.88it/s]

['missing monosaccharide']
['missing monosaccharide']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
labeled_all_387.pdb.csv 68
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['ga

 84%|████████████████████████████████▌      | 2006/2402 [00:46<00:08, 45.04it/s]

['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['s']
['s']
['s']
['s']
['s']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['s']
['s']
['s']
['s']
['s']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc',

 84%|████████████████████████████████▋      | 2011/2402 [00:47<00:09, 41.58it/s]

labeled_all_1629.pdb.csv 103
labeled_all_1629.pdb.csv 129
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['s']
['s']
['s']
['s']
['s']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['s']
['s']
['s']
['s']
['s']
['glc', 'n']
['glc', 'n']
['

 84%|████████████████████████████████▊      | 2021/2402 [00:47<00:10, 38.07it/s]

labeled_all_469.pdb.csv 67
labeled_all_469.pdb.csv 116
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal'

 85%|████████████████████████████████▉      | 2030/2402 [00:47<00:09, 37.24it/s]

['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['s']
['s']
['s']
['s']
['s']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['s']
['s']
['s']
['s']
['s']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['

 85%|█████████████████████████████████      | 2038/2402 [00:47<00:10, 33.87it/s]

labeled_all_1443.pdb.csv 141
labeled_all_1443.pdb.csv 210
['me']
['me']
['me']
['me']
['me']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
[

 85%|█████████████████████████████████▎     | 2050/2402 [00:48<00:08, 43.35it/s]

['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['rha', '']
['me']
['me']
['me']
['me']
['me']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc

 86%|█████████████████████████████████▍     | 2060/2402 [00:48<00:07, 44.23it/s]

labeled_all_750.pdb.csv 39
labeled_all_750.pdb.csv 65
['me']
['me']
['me']
['me']
['me']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['s']
['s']
['s']
['s']
['s']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['g

 86%|█████████████████████████████████▋     | 2071/2402 [00:48<00:07, 44.70it/s]

labeled_all_1122.pdb.csv 90
labeled_all_1122.pdb.csv 211
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n

 87%|█████████████████████████████████▊     | 2081/2402 [00:48<00:07, 40.61it/s]

labeled_all_1870.pdb.csv 220
labeled_all_1870.pdb.csv 271
labeled_all_1870.pdb.csv 372
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['

 87%|█████████████████████████████████▊     | 2086/2402 [00:48<00:07, 39.79it/s]

labeled_all_838.pdb.csv 87
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['

 87%|██████████████████████████████████     | 2097/2402 [00:49<00:07, 40.39it/s]

['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['s']
['s']
['s']
['s']
['s']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', 

 88%|██████████████████████████████████▏    | 2107/2402 [00:49<00:07, 41.20it/s]

['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['fuc', '']
['fuc', '']
['fu

 88%|██████████████████████████████████▍    | 2118/2402 [00:49<00:06, 42.86it/s]

['me']
['me']
['me']
['me']
['me']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['rib', '']
['rib', '']
['rib', '']
['rib', '']
['rib', '']
['rib', '']
['rib', '']
['rib', '']
['rib', '']
['rib', '']
['rib', '']
['rib', '']
['rib', '']
['rib', '']
['rib', '']
['rib', '']
['rib', '']
['rib', 

 89%|██████████████████████████████████▌    | 2130/2402 [00:49<00:05, 46.14it/s]

['missing monosaccharide']
['missing monosaccharide']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['ga

 89%|██████████████████████████████████▋    | 2137/2402 [00:50<00:05, 51.65it/s]

['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
labeled_all_1144.pdb.csv 36
labeled_all_1144.pdb.csv 64
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', 

 89%|██████████████████████████████████▉    | 2148/2402 [00:50<00:05, 44.59it/s]

['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
labeled_all_1002.pdb.csv 39
labeled_all_1002.pdb.csv 91
labeled_all_1002.pdb.csv 347
['me']
['me']
['me']
['me']
['me']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']

 90%|███████████████████████████████████    | 2158/2402 [00:50<00:05, 41.58it/s]

labeled_all_1390.pdb.csv 26
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
labeled_all_1917.pdb.csv 126
['me']
['me']
['me']
['me']
['me']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['g

 90%|███████████████████████████████████▏   | 2168/2402 [00:50<00:05, 41.89it/s]

labeled_all_1159.pdb.csv 81
labeled_all_1159.pdb.csv 239
['me']
['me']
['me']
['me']
['me']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', 

 91%|███████████████████████████████████▎   | 2178/2402 [00:51<00:05, 41.34it/s]

labeled_all_342.pdb.csv 67
labeled_all_342.pdb.csv 126
labeled_all_342.pdb.csv 164
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']

 91%|███████████████████████████████████▍   | 2183/2402 [00:51<00:05, 40.49it/s]

labeled_all_1810.pdb.csv 173
labeled_all_1810.pdb.csv 237
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']


 91%|███████████████████████████████████▋   | 2195/2402 [00:51<00:04, 42.81it/s]

['me']
['me']
['me']
['me']
['me']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
labeled_all_340.pdb.csv 123
labeled_all_340.pdb.csv 158
labeled_all_340.pdb.csv 187
labeled_all_340.pdb.csv 202
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc',

 92%|███████████████████████████████████▊   | 2205/2402 [00:51<00:04, 41.74it/s]

labeled_all_1573.pdb.csv 220
labeled_all_1573.pdb.csv 252
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['s']
['s']
['s']
['s']
['s']
['glc', '']
['glc', '']
['gl

 92%|███████████████████████████████████▉   | 2216/2402 [00:51<00:04, 45.14it/s]

['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glca']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
[

 93%|████████████████████████████████████   | 2222/2402 [00:52<00:03, 47.76it/s]

labeled_all_1863.pdb.csv 36
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
labeled_all_772.pdb.csv 39
['me']
['me']
['me']
['me']
['me']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
[

 93%|████████████████████████████████████▎  | 2233/2402 [00:52<00:04, 39.74it/s]

['pr']
['pr']
['pr']
['pr']
['pr']
['pr']
['pr']
['pr']
['pr']
['pr']
['pr']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['s']
['s']
['s']
['s']
['s']
['s']
['s']
['s']
['s']
['s']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['s']
['s']
['s']
['s']
['s']
['s']
['s']
['s']
['s']
['s']
['s']
['s']
['s']
['s']
['s']
labeled_all_1634.pdb.csv 66
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
[

 94%|████████████████████████████████████▍  | 2247/2402 [00:52<00:02, 52.06it/s]

['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['missing monosaccharide']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 

 94%|████████████████████████████████████▌  | 2253/2402 [00:52<00:03, 44.24it/s]

['me']
['me']
['me']
['me']
['me']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['s']
['s']
['s']
['s']
['s']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '

 94%|████████████████████████████████████▊  | 2265/2402 [00:53<00:02, 46.66it/s]

['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['ara', '']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc'

 95%|████████████████████████████████████▉  | 2275/2402 [00:53<00:03, 40.66it/s]

['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['s']
['s']
['s']
['s']
['s']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['s']
['s']
['s']
['s']
['s']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['ga

 95%|█████████████████████████████████████  | 2280/2402 [00:53<00:02, 42.24it/s]

['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gl

 95%|█████████████████████████████████████▏ | 2289/2402 [00:53<00:03, 36.65it/s]

labeled_all_1534.pdb.csv 182
labeled_all_1534.pdb.csv 370
['me']
['me']
['me']
['me']
['me']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['g

 96%|█████████████████████████████████████▍ | 2302/2402 [00:53<00:02, 44.97it/s]

['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['s']
['s']
['s']
['s']
['s']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['gl

 96%|█████████████████████████████████████▌ | 2313/2402 [00:54<00:02, 43.95it/s]

['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['', 'ru', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['me']
['me']
['me']
['me']
['me']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']
['gal', 'a']


 97%|█████████████████████████████████████▋ | 2324/2402 [00:54<00:01, 42.59it/s]

labeled_all_938.pdb.csv 57
labeled_all_938.pdb.csv 95
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', '']
['neu', ''

 97%|█████████████████████████████████████▊ | 2330/2402 [00:54<00:01, 46.17it/s]

labeled_all_1835.pdb.csv 70
labeled_all_1835.pdb.csv 113
['me']
['me']
['me']
['me']
['me']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['man', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['s']
['s']
['s']
['s']
['s']
['neu', '']
['neu', '']
['neu', '']


 97%|█████████████████████████████████████▉ | 2340/2402 [00:54<00:01, 38.78it/s]

['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', 

 98%|██████████████████████████████████████ | 2345/2402 [00:54<00:01, 40.31it/s]

['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
labeled_all_407.pdb.csv 68
labeled_all_407.pdb.csv 116
labeled_all_407.pdb.csv 164
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal',

 98%|██████████████████████████████████████▎| 2356/2402 [00:55<00:01, 38.97it/s]

['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['xyl', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['s']
['s']
['s']
['s']
['s']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['ga

 99%|██████████████████████████████████████▍| 2366/2402 [00:55<00:00, 41.76it/s]

['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fu

 99%|██████████████████████████████████████▌| 2377/2402 [00:55<00:00, 41.06it/s]

labeled_all_1758.pdb.csv 118
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['glc', 'a']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fu

 99%|██████████████████████████████████████▊| 2388/2402 [00:56<00:00, 42.96it/s]

labeled_all_1441.pdb.csv 68
labeled_all_1441.pdb.csv 155
labeled_all_1441.pdb.csv 181
['me']
['me']
['me']
['me']
['me']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['fuc', '']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['s']
['s']
['s']
['s']
['s']
['gal', '']
['gal', '']
['gal',

100%|██████████████████████████████████████▉| 2400/2402 [00:56<00:00, 45.90it/s]

labeled_all_492.pdb.csv 68
labeled_all_492.pdb.csv 127
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', 'n']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal', '']
['gal'

100%|███████████████████████████████████████| 2402/2402 [00:56<00:00, 42.64it/s]

['me']
['me']
['me']
['me']
['me']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['man', 'a']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['glc', '']
['s']
['s']
['s']
['s']
['s']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc', 'n']
['glc'




In [16]:
len(pdb_file_list)

2402

In [17]:
out_path_f

'dataset/Godess_final_data/Godess_data/labeled_all_1494.pdb.csv'

In [18]:
pdb_f_name

'labeled_all_1494.pdb.csv'

In [19]:
df_match = pd.read_csv('new_matching_table.csv')
df_match.loc[df_match['2'] == 2358]

Unnamed: 0,0,1,2
2357,Glycoscience_Linear_Nonlinear/,74,2358


In [20]:
pdb_f = pdb_f[['Atom_type']].replace({'0': 'O'})

In [21]:
mono_list = ['17HOOle', 'Ac', 'Allyl', 'Asn', 'Bu', 'Bz', 'Caf', 'Cho',
       'D-Gal-ol', 'D-Glc-ol', 'D-GlcN-ol', 'D-Glca', 'D-Rib-ol', 'Fer',
       'Gallic', 'Gc', 'Kdo-ol', 'L-Ara-ol', 'Mal', 'Me',
       'Missing Monosaccharide', 'P', 'Pr', 'S', 'Ser', 'a-D-3,6anhGalp',
       'a-D-Apif', 'a-D-Araf', 'a-D-Fruf', 'a-D-Frup', 'a-D-Fucp',
       'a-D-FucpN', 'a-D-Galf', 'a-D-Galp', 'a-D-GalpA', 'a-D-GalpN',
       'a-D-GalpNA', 'a-D-Glcp', 'a-D-GlcpA', 'a-D-GlcpN', 'a-D-GlcpNA',
       'a-D-Idop', 'a-D-Lyxp', 'a-D-Manp', 'a-D-ManpA', 'a-D-ManpN',
       'a-D-Quip4N', 'a-D-Rhap', 'a-D-Rhap4N', 'a-D-RhapN', 'a-D-Ribf',
       'a-D-Ribp', 'a-D-Xylp', 'a-Kdop', 'a-L-3,6anhGalp', 'a-L-6dTalp',
       'a-L-Araf', 'a-L-Arap', 'a-L-Fucp', 'a-L-FucpN', 'a-L-Galp',
       'a-L-GulpA', 'a-L-IdopA', 'a-L-Rhap', 'a-Neup', 'b-D-Apif',
       'b-D-Araf', 'b-D-Fruf', 'b-D-Frup', 'b-D-Fucp', 'b-D-FucpN',
       'b-D-Galf', 'b-D-Galp', 'b-D-GalpA', 'b-D-GalpN', 'b-D-GalpNA',
       'b-D-Glcp', 'b-D-GlcpA', 'b-D-GlcpN', 'b-D-GlcpNA', 'b-D-Idop',
       'b-D-Lyxp', 'b-D-Manp', 'b-D-ManpA', 'b-D-ManpN', 'b-D-Quip',
       'b-D-Quip3N', 'b-D-Quip4N', 'b-D-QuipN', 'b-D-Rhap', 'b-D-Rhap4N',
       'b-D-Ribf', 'b-D-Ribp', 'b-D-Xylp', 'b-Galf', 'b-Kdop',
       'b-L-3,6anhGalp', 'b-L-Arap', 'b-L-Fucp', 'b-L-Galp', 'b-L-Rhap',
       'b-L-RhapN', 'b-L-Xylp', 'b-Neup', 'myoIno', 'pCoum']

In [22]:
mono_list = np.unique(mono_list)

In [23]:
ab_list = []
ld_list = []
abbrev_list = []
pf_list = []
standard_abbrev_list = []

In [24]:
for mono in np.unique(np.unique(mono_list)):

# for mono in ['missing monosaccharide']:

    ab, ld, abbrev = split_single_mono_bound(mono)
    
    abbrev, new_mono, carbon_number = reformulate_monosaccharide(abbrev, glycan_list_extend)
    
    
    ab_list.append(ab)
    ld_list.append(ld)
    abbrev_list.append(abbrev)
    standard_abbrev_list.append(new_mono)
    pf_list.append(carbon_number)
    
    del ab, ld, abbrev, new_mono, carbon_number
    

['17hoole']
['ac']
['allyl']
['asn']
['bu']
['bz']
['caf']
['cho']
['gal-ol']
['glc-ol']
['glcn-ol']
['glca']
['rib-ol']
['fer']
['gallic']
['gc']
['kdo-ol']
['ara-ol']
['mal']
['me']
['missing monosaccharide']
['p']
['pr']
['s']
['ser']
['3,6anhgal', '']
['api', '']
['ara', '']
['', 'ru', '']
['fru', '']
['fuc', '']
['fucn']
['gal', '']
['gal', '']
['gal', 'a']
['gal', 'n']
['gal', 'na']
['glc', '']
['glc', 'a']
['glc', 'n']
['glc', 'na']
['ido', '']
['lyx', '']
['man', '']
['man', 'a']
['man', 'n']
['qui', '4n']
['rha', '']
['rha', '4n']
['rha', 'n']
['rib', '']
['rib', '']
['xyl', '']
['kdo', '']
['3,6anhgal', '']
['6dtal', '']
['ara', '']
['ara', '']
['fuc', '']
['fucn']
['gal', '']
['gul', 'a']
['ido', 'a']
['rha', '']
['neu', '']
['api', '']
['ara', '']
['', 'ru', '']
['fru', '']
['fuc', '']
['fucn']
['gal', '']
['gal', '']
['gal', 'a']
['gal', 'n']
['gal', 'na']
['glc', '']
['glc', 'a']
['glc', 'n']
['glc', 'na']
['ido', '']
['lyx', '']
['man', '']
['man', 'a']
['man', 'n']
['qu

In [25]:
mono_list[[8, 9, 10, 17]]

array(['D-Gal-ol', 'D-Glc-ol', 'D-GlcN-ol', 'L-Ara-ol'], dtype='<U22')

In [26]:
pd.DataFrame([mono_list, ab_list, ld_list, \
              abbrev_list, pf_list, standard_abbrev_list]).T

Unnamed: 0,0,1,2,3,4,5
0,17HOOle,missing_a_b,missing_L_D,17hoole,missing_carbon_number,17hoole
1,Ac,missing_a_b,missing_L_D,ac,missing_carbon_number,ac
2,Allyl,missing_a_b,missing_L_D,allyl,missing_carbon_number,allyl
3,Asn,missing_a_b,missing_L_D,asn,missing_carbon_number,asn
4,Bu,missing_a_b,missing_L_D,bu,missing_carbon_number,bu
5,Bz,missing_a_b,missing_L_D,bz,missing_carbon_number,bz
6,Caf,missing_a_b,missing_L_D,caf,missing_carbon_number,caf
7,Cho,missing_a_b,missing_L_D,cho,missing_carbon_number,cho
8,D-Gal-ol,missing_a_b,d,gal-ol,missing_carbon_number,gal-ol
9,D-Glc-ol,missing_a_b,d,glc-ol,missing_carbon_number,glc-ol


In [27]:
pd.DataFrame([mono_list, ab_list, ld_list, \
              abbrev_list, pf_list, standard_abbrev_list]).T.to_csv('new_encode_mono.csv', index = False)

In [28]:
# # def reformulate_shift(pdb_f, pdb_f_name):

# shift_list = pdb_f['shift'].values

# if isinstance(shift_list[0], str):


#     for i in range(len(shift_list)):

#         if ( pd.isna(shift_list[i]) ) or (shift_list[i] == '?'):

#             current_shift = '-1'

#             pdb_f.loc[i, ['shift']] = current_shift

#         elif ('-' in shift_list[i]) and (shift_list[i] != '-1') and (shift_list[i] != '-1.0') and (len(shift_list[i]) > 2):

#             current_shift = shift_list[i]

#             reformulate_current_shift = current_shift.split('-')

#             current_atom = pdb_f.loc[i, :]['Atom_name']

#             current_atom_second = current_atom + '1'

#             next_atom = pdb_f.loc[i+1, :]['Atom_name']

#             if current_atom_second != next_atom:
#                 print(pdb_f_name, i, current_atom, 'next atom is not', current_atom_second)

#                 if current_atom == next_atom:

#                     pdb_f.loc[i+1, :]['Atom_name'] = current_atom_second
#                     print(current_atom_second)
                    
#                 else:

#                     raise Exception(i, 'Next atom is not consistent with current atom')

#             print(i, reformulate_current_shift, current_atom, current_atom_second)

#             pdb_f.loc[i, ['shift']] = reformulate_current_shift[0]
#             pdb_f.loc[i+1, ['shift']] = reformulate_current_shift[1]


#         elif ('-' in shift_list[i]) and (len(shift_list[i]) == 1):
            
#             current_shift = '-1'

#             pdb_f.loc[i, ['shift']] = current_shift

#     pdb_f_out = pdb_f.astype({'shift': 'float'})


In [29]:
# pdb_f

In [30]:
# shift_list[0]