driver.py

import os
import datetime
import pprint
import builder
import helpers
from consts import LIB_DIR

start_time = datetime.datetime.now()

def build():
    invalids = dict()

    # Get book library
    library = dict()
    for dir in os.listdir(os.path.join(LIB_DIR,'lang')):
        if dir == 'chars' or dir == 'hin': continue # TODO Make tuple in consts
        library[dir] = []
        with open(os.path.join(LIB_DIR,'lang/'+dir+'/invalid.txt')) as invalid_chars:
            invalids[dir] = invalid_chars.read().splitlines()
        for files in os.listdir(os.path.join(LIB_DIR,'lang/'+dir+'/txt')):
            if files.endswith('txt'):
                path = os.path.join(LIB_DIR,'lang/'+dir+'/txt/'+files)
                library[dir].append(path)

    # Get user library
    # TODO privacy
    users = dict()
    for dir in os.listdir(os.path.join(LIB_DIR,'users')):
        users[dir] = []
        with open(os.path.join(LIB_DIR,'users/'+dir+'/invalid.txt')) as invalid_chars:
            invalids[dir] = invalid_chars.read().splitlines()
        for files in os.listdir(os.path.join(LIB_DIR,'users/'+dir+'/txt')):
            if files.endswith('txt'):
                path = os.path.join(LIB_DIR,'users/'+dir+'/txt/'+files)
                users[dir].append(path)

    # Get illegal characters
    illegal_chars = []
    for typ in invalids.keys():
        illegal_chars = helpers.merge_lists([invalids[typ],illegal_chars])

    # Build tries
    users_data = builder.def_trie_builder(users,illegal_chars)
    books_data = builder.def_trie_builder(library,illegal_chars)

    # Update files at 0420hrs
    # if str(datetime.datetime.now().time())[:5] == '04:20':
    builder.update_files(books_data)
    builder.update_files(users_data) # TODO Privacy

    return books_data,users_data

books,users = build()

# print(books['eng']['root'].get_counts(books['eng']['root'],'and'))
# print()
# nodeInTrie = books['eng']['root'].update_counts(books['eng']['root'],'and')
# print(books['eng']['root'].get_counts(books['eng']['root'],'and'))
# print()
# nodeInTrie = nodeInTrie.update_counts(books['eng']['root'],'a')
# print(books['eng']['root'].get_counts(books['eng']['root'],'and'))
# print()
# nodeInTrie = nodeInTrie.update_counts(nodeInTrie,'nd')
# print(books['eng']['root'].get_counts(books['eng']['root'],'and'))
# print()
# print(books['eng']['root'].get_counts(books['eng']['root'],'palash'))
# print()

pprint.pprint(books)
pprint.pprint(users)
for lang in books.keys():
    print(books[lang]['root'])
    print(books[lang]['sentence_root'])
for user in users.keys():
    print(users[user]['root'])
    print(users[user]['sentence_root'])

print('time',datetime.datetime.now()-start_time)

# with sentences: time 0:00:45.412665
# w/o sentences : 2 secs