In [1]:
import numpy as np
import pandas as pd
import time, datetime
from ast import literal_eval
import matplotlib.pyplot as plt
import seaborn as sns
import zipfile

In [2]:
report = ''
FOLDER = 'resources/'
REPORT_FOLDER = 'report/'

In [3]:
import sys
JOIN_OPS, ZIP, PRINT = False, False, True
if len(sys.argv) > 1:
    if 'ops' in sys.argv:
        JOIN_OPS = True
    if 'zip' in sys.argv:
        ZIP = True 
    if 'noprint' in sys.argv:
        PRINT = False

In [4]:
time_format = '%b %d, %H:%M'
def nice_time(x):
    return time.strftime(time_format, time.localtime(x))

In [5]:
def add_line(line, p=PRINT):    
    global report        
    if p:                
        if type(line) == pd.core.frame.DataFrame:
            print(line.to_string(index=False))
        elif type(line) == pd.core.series.Series:
            print(line.to_string())
        else:
            print(line)
    if type(line) == pd.core.frame.DataFrame:        
        report += ('%s<br>' % line.to_html(index=False))
    elif type(line) == pd.core.series.Series:
        report += ('%s<br>' % line.to_frame().reset_index().to_html(index=False))
    else:
        report += ('%s<br>' % line)
    
def add_header(header, h=4, p=PRINT):
    global report
    report += ('<h%d>%s</h%d>' % (h, header, h))
    if p:
        print(header)

def add_image(filename):
    global report
    report += ('<img src="%s" alt="%s" height="40%%">' % (filename, filename))

def create_report(filename):
    global report
    report = report.replace('<table border="1" class="dataframe">','<table class="table table-striped">')
    html_string = '''
        <html>
            <head>
                <link rel="stylesheet" href="skeleton.css">
                <style>body{ margin:20 20; background:whitesmoke; }
                table {table-layout : fixed}
                </style>
            </head>
            <body>                
                %s
            </body>
        </html>''' % (report)
    f = open(filename,'w', encoding='utf-8-sig')
    f.write(html_string)
    f.close()
    print('Отчет сформирован: %s' % filename)
    
def create_zip(filename):
    zip_filename = filename[:-5] + '.zip'
    zf = zipfile.ZipFile(zip_filename, mode='w')
    try:
        #print 'Отчет заархивирован в файл'
        zf.write(filename)
        zf.write('report\skeleton.css')
    finally:
        print('Отчет заархивирован в файл %s' % zip_filename)
        zf.close()    

In [6]:
pd.set_option('max_rows', 50)

start_time = time.time()
current_time = pd.read_csv(FOLDER + 'current_time.csv').current_time[0]
twr          = pd.read_csv(FOLDER + 'team_work_region.csv', converters={'twr':str})
links        = pd.read_csv(FOLDER + 'link.csv')
stations     = pd.read_csv(FOLDER + 'station.csv', converters={'station':str})
train_info   = pd.read_csv(FOLDER + 'train_info.csv', converters={'train': str, 'st_from':str, 'st_to':str})
train_plan   = pd.read_csv(FOLDER + 'slot_train.csv', converters={'train': str, 'st_from':str, 'st_to':str})
loco_info    = pd.read_csv(FOLDER + 'loco_attributes.csv', converters={'train':str, 'loco':str})
loco_plan    = pd.read_csv(FOLDER + 'slot_loco.csv', converters={'train':str, 'loco':str, 'st_from':str, 'st_to':str})
team_info    = pd.read_csv(FOLDER + 'team_attributes.csv', converters={'team':str,'depot':str, 'oper_location':str, \
                                                                 'st_from':str, 'st_to':str, 'loco':str, 'depot_st':str})
team_plan    = pd.read_csv(FOLDER + 'slot_team.csv', converters={'team':str,'loco':str, 'st_from':str, 'st_to':str})
loco_series  = pd.read_csv(FOLDER + 'loco_series.csv')

team_info.regions = team_info.regions.apply(literal_eval)
st_names = stations[['station', 'name', 'esr']].drop_duplicates().set_index('station')

In [7]:
# Мержим таблицы _plan и _info для поездов, локомотивов и бригад
# Добавляем во все таблицы названия станций на маршруте и времена отправления/прибытия в читабельном формате

def add_info(df):    
    if 'st_from' in df.columns:
        df['st_from_name'] = df.st_from.map(st_names.name)
    if 'st_to' in df.columns:
        df['st_to_name'] = df.st_to.map(st_names.name)
    if 'time_start' in df.columns:
        df['time_start_norm'] = df.time_start.apply(lambda x: time.strftime(time_format, time.localtime(x)))
    if 'time_end' in df.columns:
        df['time_end_norm'] = df.time_end.apply(lambda x: time.strftime(time_format, time.localtime(x)))
    if 'oper_location' in df.columns:
        df['oper_location_name'] = df.oper_location.map(st_names.name)    
        df.oper_location_name.fillna(0, inplace=True)
    if ('oper_location' in df.columns) & ('st_from' in df.columns) & ('st_to' in df.columns):        
        df['loc_name'] = df.oper_location_name
        df.loc[df.loc_name == 0, 'loc_name'] = df.st_from_name + ' - ' + df.st_to_name
    
add_info(train_plan)
add_info(loco_plan)
add_info(team_plan)
add_info(loco_info)
add_info(team_info)
train_plan = train_plan.merge(train_info, on='train', suffixes=('', '_info'), how='left')
loco_plan = loco_plan.merge(loco_info, on='loco', suffixes=('', '_info'), how='left')
team_plan = team_plan.merge(team_info, on='team', suffixes=('', '_info'), how='left')
team_plan['team_type'] = team_plan.team.apply(lambda x: 'Реальная' if str(x)[0] == '2' else 'Фейковая')
loco_plan['train_time'] = list(zip(loco_plan.train, loco_plan.time_start))
train_plan['train_time'] = list(zip(train_plan.train, train_plan.time_start))
train_plan['loco'] = train_plan.train_time.map(loco_plan.drop_duplicates('train_time').set_index('train_time').loco)
loco_plan['loco_time'] = list(zip(loco_plan.loco, loco_plan.time_start))
team_plan['loco_time'] = list(zip(team_plan.loco, team_plan.time_start))
loco_plan['team'] = loco_plan.loco_time.map(team_plan.drop_duplicates('loco_time').set_index('loco_time').team)

In [8]:
print('''--------
Возможные ключи: 
ops - добавляет в отчет последние операции с бригадами из последнего файла "Операции*.txt"
noprint - отключает вывод отладочных принтов
zip - архивирует отчет
--------''')

--------
Возможные ключи: 
ops - добавляет в отчет последние операции с бригадами из последнего файла "Операции*.txt"
noprint - отключает вывод отладочных принтов
zip - архивирует отчет
--------


In [9]:
import os
import time
files = [files for root, directories, files in os.walk('./resources/others')][0]
times = {}
os.chdir('./resources/others')
try:
    for f in files:
        if 'Бригады_УТХ' in f:
            times[f] = int(os.path.getmtime(f))    

    if times != {}:
        uth_filename = max(times, key=lambda k: times[k])
        date_modified = times[uth_filename]
    else:
        uth_filename = 'Бригады_УТХ' + '.xls'
        date_modified = 0
    print('Данные об УТХ-бригадах взяты из файла %s (дата изменения %s)' % (uth_filename, nice_time(date_modified)))
    os.chdir('..')
    os.chdir('..')
except:
    os.chdir('..')
    os.chdir('..')

Данные об УТХ-бригадах взяты из файла Бригады_УТХ_12_59_07.xls (дата изменения Jul 29, 12:59)


In [10]:
# Загрузка УТХ-бригад из экселевской выгрузки
import xlrd
uth = pd.read_excel('./resources/others/' + uth_filename)
uth.columns = ['Номер', 'Машинист', 'Депо', 'Вид движения', 'Факт.явка', 'План.явка']
uth['Вид движения'] = uth['Вид движения'].apply(lambda x: str(x).replace('\n\t\t\t', ';'))
uth['irk'] = uth['Депо'].apply(lambda x: 'ТЧЭ-5 В' in x)
uth = uth[uth.irk]
#time_f = '%Y-%m-%d %H:%M:%S'
##uth['uth_presence'] = uth['План.явка'].apply(lambda x: time.mktime(datetime.datetime.strptime(x, '%H:%M %d.%m.%y').timetuple()))
if (uth['План.явка'].dtype == float):
    uth['План.явка'] = uth['План.явка'].apply(lambda x: datetime.datetime(*xlrd.xldate.xldate_as_tuple(x, 0)))
    print('Формат времени в столбце "Плановая явка" заменен c формата Excel на python datetime')

try:
    uth['uth_presence'] = uth['План.явка'].apply(lambda x: time.mktime(x.timetuple()))
except:
    try:
        uth['uth_presence'] = uth['План.явка'].apply(lambda x: time.mktime(time.strptime(x, "%Y-%m-%d %H:%M:%S %z")))
    except:
        uth['uth_presence'] = uth['План.явка'].apply(lambda x: time.mktime(time.strptime(x, "%H:%M %d.%m.%y")))
uth.head()

Unnamed: 0,Номер,Машинист,Депо,Вид движения,Факт.явка,План.явка,irk,uth_presence
409,9205006900,КУЗЕМА,ТЧЭ-5 В-СИБ,ПАСС Б/ПРИГ; ГРУЗ Б/СБОР; ГРУЗ ВЫВОЗ; ХОЗ ОСТ,,03:00 28.07.16,True,1469664000
410,9205001355,ГРАЧЕВ,ТЧЭ-5 В-СИБ,ПАСС Б/ПРИГ; ГРУЗ Б/СБОР; ГРУЗ ВЫВОЗ; ХОЗ ОСТ,,03:00 28.07.16,True,1469664000
411,9205006741,ЦЫБУЛЬСКИЙ,ТЧЭ-5 В-СИБ,ГРУЗ Б/СБОР; ГРУЗ ПЕРЕДАТ; ГРУЗ СБОР; ГРУЗ ВЫВ...,,03:00 28.07.16,True,1469664000
412,9205004902,МАЛЫГИН,ТЧЭ-5 В-СИБ,ГРУЗ Б/СБОР; ГРУЗ ПЕРЕДАТ; ГРУЗ СБОР; ГРУЗ ВЫВ...,,07:15 28.07.16,True,1469679300
413,9205000232,ПАЩЕНКО,ТЧЭ-5 В-СИБ,ГРУЗ Б/СБОР; ГРУЗ ПЕРЕДАТ; ГРУЗ СБОР; ГРУЗ ВЫВ...,,01:10 28.07.16,True,1469657400


In [11]:
info_cols = ['number', 'name', 'loc_name', 'state', 'depot_time_norm', 'is_planned']
team_info['name'] = team_info.number.map(uth.set_index('Номер')['Машинист'])
team_info['uth_presence'] = team_info.number.map(uth.set_index('Номер').uth_presence)
team_info['depot_time_norm'] = team_info.depot_time.apply(lambda x: time.strftime(time_format, time.localtime(x)) if x !=-1 else x)
planned = team_plan[team_plan.state.isin([0, 1])].drop_duplicates('team')
team_info['is_planned'] = team_info.team.isin(planned.team)

In [12]:
df_input_show = team_info[team_info.number.isin(uth['Номер'])][info_cols]
df_input_show.is_planned.replace(False, 'Нет', inplace=True)
df_input_show.is_planned.replace(True, 'Да', inplace=True)
df_input_show.columns=['Номер', 'Машинист', 'Исх.местоположение', 'Исх.состояние', 'Время явки', 'В плане?']
cols = ['Номер', 'Машинист', 'Депо', 'Вид движения', 'План.явка', 'uth_presence']
df_show = uth[cols].set_index(['Номер', 'Машинист']).join(df_input_show.set_index(['Номер', 'Машинист'])).fillna('-').reset_index()

In [13]:
team_cols = ['number', 'name', 'st_from_name', 'st_to_name', 'time_start', 'time_start_norm', 
             'state', 'loco_number', 'train_number', 'all_states']
team_plan['name'] = team_plan.number.map(uth.set_index('Номер')['Машинист'])
team_plan['loco_number'] = team_plan.loco.map(loco_info.set_index('loco').number)
team_plan['loco_time'] = list(zip(team_plan.loco, team_plan.time_start))
loco_plan['loco_time'] = list(zip(loco_plan.loco, loco_plan.time_start))
loco_plan['train_number'] = loco_plan.train.map(train_info.drop_duplicates('train').set_index('train').number)
loco_plan.loc[loco_plan.train_number.isnull(), 'train_number'] = loco_plan.train.apply(lambda x: str(x)[-4:])
team_plan['train_number'] = team_plan.loco_time.map(loco_plan.drop_duplicates('loco_time').set_index('loco_time').train_number)
team_plan['all_states'] = team_plan.team.map(team_plan.groupby('team').state.unique())
uth_plan = team_plan[team_plan.number.isin(uth['Номер'])]
df_output_show = uth_plan[uth_plan.state.isin([0, 1])].drop_duplicates('team').sort_values('time_start')[team_cols]
df_output_show.loco_number.fillna(-1, inplace=True)
df_output_show.columns = ['Номер', 'Машинист', 'Ст.отпр.', 'Ст.направл.', 'plan_time_start', 'Время отпр.', 
                          'Состояние', 'Номер ЛОК', 'Номер П', 'Все состояния']

In [14]:
add_line('Время сбора данных и запуска планировщика: %s' % time.strftime(time_format, time.localtime(current_time)))
add_header('Всего %d иркутских бригад загружено в ОУЭР из УТХ' % uth['Номер'].count())
add_line('Из них:')
add_line('- передано в планировщик: %d' % team_info[team_info.number.isin(uth['Номер'])].team.count())
add_line('- не передано в планировщик: %d' % uth[uth['Номер'].isin(team_info.number) == False]['Номер'].count())
add_line('- запланировано: %d' % df_output_show['Номер'].count())
df_show_uth_plan = df_show.set_index(['Номер', 'Машинист']).join(df_output_show.set_index(['Номер', 'Машинист'])).fillna('-')

Время сбора данных и запуска планировщика: Jul 27, 16:31
Всего 33 иркутских бригад загружено в ОУЭР из УТХ
Из них:
- передано в планировщик: 31
- не передано в планировщик: 2
- запланировано: 21


In [15]:
def add_state_legend():
    add_line('Состояния бригад:')
    add_line('0 - следует пассажиром')
    add_line('1 - ведет локомотив')
    add_line('2 - явка в депо приписки')
    add_line('3 - находится на домашнем отдыхе')
    add_line('4 - отдыхает в пункте оборота')
    add_line('5 - прикреплена к локомотиву на станции')
    add_line('6 - прибыла на станцию с локомотивом')
    add_line('7 - прибыла на станцию пассажиром')
    add_line('8 - явка в пункте оборота')
    add_line('9 - сдача локомотива')

In [16]:
files = [files for root, directories, files in os.walk('./resources/others')][0]
times = {}
os.chdir('./resources/others')
try:
    for f in files:
        if ('Операции' in f) & ('.txt' in f):
            times[f] = int(os.path.getmtime(f))

    if times != {}:
        ops_filename = max(times, key=lambda k: times[k])
        date_modified = times[ops_filename]
    else:
        ops_filename = 'Операции с УТХшными ЛБ.txt'
        date_modified = 0
    os.chdir('..')
    os.chdir('..')
except:
    os.chdir('..')
    os.chdir('..')
print('Данные об операциях с УТХ-бригадами взяты из файла "%s" (дата изменения %s)' % (ops_filename, nice_time(date_modified)))

Данные об операциях с УТХ-бригадами взяты из файла "Операции с УТХшными ЛБ.txt" (дата изменения Jun 06, 14:11)


In [17]:
lines = []
cur_team_id = 0
cur_team_name = ''
with open ('./resources/others/' + ops_filename, encoding='utf-8-sig') as fop:
    for line in fop:        
        if line[:7] == 'Бригада':            
            sp = line[:-1].split()            
            cur_team_id = sp[2][:-1]
            cur_team_name = sp[1][:-1]
        if line[:4] == '2016':
            sp = line[:-1].split('\t')
            l = [cur_team_id, cur_team_name] + sp
            lines.append(l)
        
lines[:10]
cols = ['team', 'name', 'team_type', 'op_id', 'op_name', 'op_time', 'op_location']
df_ops = pd.DataFrame(lines, columns = ['team', 'name', 'op_time', 'op_id', 'team_type', 'op_name', 'op_location'])
df_ops = df_ops[cols]
df_ops.sample(3)

Unnamed: 0,team,name,team_type,op_id,op_name,op_time,op_location
8491,[200200196650,ЗЕМЛЯНИЧКИН,[ГРУЗ Б/СБОР(21)],1,Прибытие на станцию,2016-05-30 12:37:00 +0300,СЛЮДЯНКА I
15612,[200200227953,MИXAЛЬKOB,[ХОЗ ПУТЕВОЕ(42)],2,Отправление со станции,2016-05-18 11:26:00 +0300,ИРКУТСК-СОРТИРОВОЧНЫЙ
3677,[200200166657,ПИЕЦ,[ГРУЗ ПЕРЕДАТ(22)],1,Прибытие на станцию,2016-05-21 17:00:00 +0300,ЗУЙ


In [18]:
print('Всего бригад в файле %s: %d' % (ops_filename, df_ops.team.drop_duplicates().count()))
print('Время сбора данных: %s' % time.strftime(time_format, time.localtime(current_time)))

Всего бригад в файле Операции с УТХшными ЛБ.txt: 92
Время сбора данных: Jul 27, 16:31


In [19]:
df_ops['timestamp'] = df_ops['op_time'].apply(lambda x: \
                                              time.mktime(datetime.datetime.strptime(x[:-6], "%Y-%m-%d %H:%M:%S").timetuple()))
print('Время последней операции в файле %s: %s' 
      % (ops_filename, time.strftime(time_format, time.localtime(df_ops.timestamp.max()))))

Время последней операции в файле Операции с УТХшными ЛБ.txt: Jun 06, 13:54


In [20]:
mask = df_ops.timestamp <= current_time
cols = ['team', 'name', 'team_type', 'op_id', 'op_name', 'op_time', 'op_location']
last = df_ops[mask].groupby('team').timestamp.max().to_frame().reset_index().set_index(['team', 'timestamp'])\
            .join(df_ops.set_index(['team', 'timestamp'])).reset_index()
last[cols].sample(3)

Unnamed: 0,team,name,team_type,op_id,op_name,op_time,op_location
63,[200200223782,БУЛEHKO,[ГРУЗ Б/СБОР(21)],54,Начало выходного дня,2016-06-05 19:38:00 +0300,ЭКСПЛУАТАЦИОННОЕ ЛОКОМОТИВНОЕ ДЕПО ИРКУТСК-СОР...
31,[200200148399,УЛЫБИH,[ГРУЗ ПЕРЕДАТ(22)],31,Начало отдыха по месту жительства,2016-06-05 02:00:00 +0300,ЭКСПЛУАТАЦИОННОЕ ЛОКОМОТИВНОЕ ДЕПО ИРКУТСК-СОР...
38,[200200160016,СКРЯБИКОВ,[ГРУЗ ПЕРЕДАТ(22)],1,Прибытие на станцию,2016-06-06 10:10:00 +0300,ИРКУТСК-СОРТИРОВОЧНЫЙ


In [21]:
good = df_show[df_show['В плане?'] == 'Да']['Машинист'].unique()
last_good = last[last.name.isin(good) == False].sort_values(['op_name', 'timestamp']).reset_index()
last_good[cols].head()

Unnamed: 0,team,name,team_type,op_id,op_name,op_time,op_location
0,[200200172158,НАПРЕЙЧИКОВ,[ГРУЗ ПЕРЕДАТ(22)],56,Административный отпуск,2016-06-05 19:03:00 +0300,ЭКСПЛУАТАЦИОННОЕ ЛОКОМОТИВНОЕ ДЕПО ИРКУТСК-СОР...
1,[200200242882,ПАНЬКО,[ГРУЗ Б/СБОР(21)],57,Болезнь,2016-06-05 19:03:00 +0300,ЭКСПЛУАТАЦИОННОЕ ЛОКОМОТИВНОЕ ДЕПО ИРКУТСК-СОР...
2,[200200107915,MУXИTOB,[ГРУЗ Б/СБОР(21)],9,Готовность к отправлению,2016-06-06 13:37:00 +0300,БОЛЬШОЙ ЛУГ
3,[200200156222,АГЕЕВ,[ПАСС Б/ПРИГ(11)],54,Начало выходного дня,2016-06-03 21:33:00 +0300,ЭКСПЛУАТАЦИОННОЕ ЛОКОМОТИВНОЕ ДЕПО ИРКУТСК-СОР...
4,[200200140065,AHДPEEB,[ПАСС Б/ПРИГ(11)],54,Начало выходного дня,2016-06-04 01:58:00 +0300,ЭКСПЛУАТАЦИОННОЕ ЛОКОМОТИВНОЕ ДЕПО ИРКУТСК-СОР...


In [22]:
last.columns = ['Id', 'Timestamp', 'Машинист', 'Тип бр.', 
                       'Id посл.оп.', 'Посл.операция', 'Время посл.оп.', 'Место посл.оп.']
op_cols = ['Id', 'Машинист', 'Тип бр.', 'Id посл.оп.', 'Посл.операция', 'Время посл.оп.', 'Место посл.оп.']
if JOIN_OPS:    
    show_cols = ['Номер', 'Машинист', 'Депо', 'Вид движения', 'Тип бр.', 
             'Id посл.оп.', 'Посл.операция', 'Время посл.оп.', 'Место посл.оп.',
             'План.явка', 'Исх.местоположение', 'Исх.состояние', 'Время явки', 'В плане?', 'Ст.отпр.', 'Ст.направл.', 
             'Время отпр.', 'Состояние', 'Номер ЛОК', 'Номер П', 'Все состояния']
    res = df_show_uth_plan.reset_index().set_index('Машинист').join(last[op_cols].set_index('Машинист'))
else:
    show_cols = ['Номер', 'Машинист', 'Депо', 'Вид движения',              
             'План.явка', 'Исх.местоположение', 'Исх.состояние', 'Время явки', 'В плане?', 'Ст.отпр.', 'Ст.направл.', 
             'Время отпр.', 'Состояние', 'Номер ЛОК', 'Номер П', 'Все состояния']
    res = df_show_uth_plan
res_to_index_start_with_0 = res.reset_index().sort_values(['uth_presence', 'Машинист'])[show_cols].reset_index()
res_to_index_start_with_0['index'] = res_to_index_start_with_0['index'] + 1
add_line(res_to_index_start_with_0, p=False)

In [23]:
not_input = res_to_index_start_with_0[res_to_index_start_with_0['В плане?'] == '-']
not_planned = res_to_index_start_with_0[res_to_index_start_with_0['В плане?'] == 'Нет']
add_header('Не переданные бригады:')
add_line(list(not_input['Номер'].unique()))
add_header('Не запланированные бригады:')
add_line(list(not_planned['Номер'].unique()))

Не переданные бригады:
[9205000361, 9205002169]
Не запланированные бригады:
[9205031362, 9205001703, 9205008378, 9205031354, 9205002635, 9205004564, 9205003873, 9205030603, 9205007670, 9205004563]


In [24]:
add_state_legend()
filename = REPORT_FOLDER + 'uth_report_' + time.strftime('%Y%m%d_%H%M%S', time.localtime(time.time())) + '.html'
create_report(filename)
if ZIP:
    create_zip(filename)

Состояния бригад:
0 - следует пассажиром
1 - ведет локомотив
2 - явка в депо приписки
3 - находится на домашнем отдыхе
4 - отдыхает в пункте оборота
5 - прикреплена к локомотиву на станции
6 - прибыла на станцию с локомотивом
7 - прибыла на станцию пассажиром
8 - явка в пункте оборота
9 - сдача локомотива
Отчет сформирован: report/uth_report_20160802_083429.html


In [25]:
res_to_index_start_with_0[res_to_index_start_with_0['В плане?'] == 'Нет']['Номер'].unique()

array([9205031362, 9205001703, 9205008378, 9205031354, 9205002635,
       9205004564, 9205003873, 9205030603, 9205007670, 9205004563], dtype=int64)

In [26]:
print(nice_time(current_time))
arr = [9205000078, 9205007670, 9205002505, 9205008457, 9205006890, 9205003873, 9205008378, 9205008860, 9205031292, 
       9205002635, 9205004359, 9205007885, 9205007272, 9205002097, 9205004564, 9205031361, 9205007941, 9205007540]
cols = ['number', 'depot', 'ready_type', 'state', 'loc_name', 'oper_time_f', 'loco', 'ttype']
team_info['oper_time_f'] = team_info.oper_time.apply(nice_time)
team_info[team_info.number.isin(arr)][cols].sort_values('state')

Jul 27, 16:31


Unnamed: 0,number,depot,ready_type,state,loc_name,oper_time_f,loco,ttype
1169,9205007885,2000036956,depot,1,ИРКУТСК-СОРТИРОВОЧНЫЙ - ГОНЧАРОВО,"Jul 27, 15:19",200200084084,1
3585,9205007540,2000036956,depot,2,ИРКУТСК-СОРТИРОВОЧНЫЙ,"Jul 27, 16:15",-1,1
1438,9205004564,2000036956,depot,3,ИРКУТСК-СОРТИРОВОЧНЫЙ,"Jul 27, 07:24",-1,1
1673,9205031292,2000036956,depot,3,ИРКУТСК-СОРТИРОВОЧНЫЙ,"Jun 28, 06:08",-1,1
1722,9205007272,2000036956,depot,3,ИРКУТСК-СОРТИРОВОЧНЫЙ,"Jul 26, 11:32",-1,1
2181,9205031361,2000036956,depot,3,ИРКУТСК-СОРТИРОВОЧНЫЙ,"Jul 08, 12:21",-1,1
2638,9205008860,2000036956,depot,3,ИРКУТСК-СОРТИРОВОЧНЫЙ,"Jul 04, 15:16",-1,1
2773,9205002635,2000036956,depot,3,ИРКУТСК-СОРТИРОВОЧНЫЙ,"Jul 27, 03:01",-1,1
3303,9205006890,2000036956,depot,3,ИРКУТСК-СОРТИРОВОЧНЫЙ,"Jul 27, 07:20",-1,1
3682,9205008378,2000036956,depot,3,ИРКУТСК-СОРТИРОВОЧНЫЙ,"Jul 27, 00:00",-1,1


In [27]:
st_name = 'ИРКУТСК-СОРТИРОВОЧНЫЙ'
cols = ['team', 'st_from_name', 'st_to_name', 'depot_name', 'time_start_norm', 'state', 'loco', 'is_uth']
team_plan['depot_name'] = team_plan.depot.map(st_names.name)
team_plan['team_type'] = team_plan.team.apply(lambda x: int(str(x)[0]))
team_plan['is_uth'] = team_plan.number.isin(uth['Номер'])
a = team_plan[(team_plan.st_from_name == st_name)
         & (team_plan.time_start >= current_time) & (team_plan.time_end < current_time + 24 * 3600)
         & (team_plan.state.isin([0, 1]))]
b = a[(a.depot_name == st_name) & (a.is_uth == False)][cols]

In [28]:
cols = ['team', 'number', 'depot', 'ready_type', 'state', 'loc_name', 'oper_time_f', 'loco', 'ttype']
q = team_info[team_info.team.isin(b.team)][cols].sort_values('team')
print(q.head().to_string(index=False))
filt = pd.read_csv('./input/otsev_detail.csv', sep=';',
                  dtype={'team_id':str, 'train_id':str, 'loco_id':str})
filt_cols = ['team_id', 'team_type_asoup_id', 'team_type_name', 'team_time']
print(filt[(filt.team_id.isin(q.team)) & (filt.team_type_asoup_id == 31)][filt_cols].sort_values('team_id').head().to_string(index=False))
#filt.columns

         team      number       depot ready_type state               loc_name    oper_time_f          loco  ttype
 200200057803  9205007510  2000036956      depot     3  ИРКУТСК-СОРТИРОВОЧНЫЙ  Jun 09, 15:00            -1      1
 200200091118  9205003550  2000036956      depot     5  ИРКУТСК-СОРТИРОВОЧНЫЙ  Jul 27, 16:17  200200093935      1
 200200100354  9205007884  2000036956      depot     3  ИРКУТСК-СОРТИРОВОЧНЫЙ  Jul 28, 06:42            -1      1
 200200126979  9205004569  2000036956      depot     3  ИРКУТСК-СОРТИРОВОЧНЫЙ  Jul 27, 16:39  200200082964      1
 200200130594  9205002903  2000036956      depot     3              СУХОВСКАЯ  Jul 27, 19:00            -1      1
      team_id  team_type_asoup_id                     team_type_name            team_time
 200200091118                  31  Начало отдыха по месту жительства  2016-07-21 18:55:00
 200200100354                  31  Начало отдыха по месту жительства  2016-07-23 00:10:00
 200200126979                  31  Начало отды

In [49]:
# Создание входных данных с проставленным признаком uth() в сообщении +team_attributes.

# def get_team_attr(x):
#     regions = ','.join([('id(%s)' % reg) for reg in x.regions])
#     series = ','.join([('id(%s)' % ser) for ser in literal_eval(x.series)])
#     s = '+team_attributes(id(%s),attributes([team_work_regions([%s]),depot(station(%s)),loco_series([%s]),long_train(%s),heavy_train(%s),fake(%s),type(%s),uth(%s)]))' \
#          % (x.team, regions, x.depot, series, x.long, x.heavy, x.fake, x.ttype, int(x.uth))
#     return s

# uth = pd.read_excel('./resources/others/' + uth_filename)
# team_info['uth'] = team_info.number.isin(uth['Табельный номер'])
# team_info['depot_name'] = team_info.depot.map(st_names.name)
# team_info.apply(lambda row: get_team_attr(row), axis=1).to_csv('team_attr_uth.txt', index=False, sep=';')