In [18]:
import json
import requests
from datetime import date, datetime, timedelta
import pandas as pd
import os

from IPython.display import display, HTML, IFrame

host = "http://149.126.169.223:4410"

method_dict = {
    'getMarshWorkResult': {'path': '/mta/getMarshWorkResult.php', 'params': {'fmt': 'json', 'nd_from': '', 'nd_to': ''}}, 
    'getHourBusState': {'path': '/mta/getHourBusState.php', 'params': {'fmt': 'json', 'nd': 0}}, 
    'getHourWorkResult': {'path': '/mta/getHourWorkResult.php', 'params': {'fmt': 'json', 'nd': 0}}, 
}
method = list(method_dict.keys())[2]

def get_data(host, 
             method,
             method_dict,
             start_date=datetime.today()-timedelta(days=3), 
             end_date=datetime.today()):
    
    headers = {
    'Content-type': 'application/json',
    'Authorization': 'Basic UE9XUkJJOlBPV1JCSQ==', 
    'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.90 Safari/537.36'
    }
    
    url = host + method_dict[method]['path']
    if method == 'getMarshWorkResult':
        method_dict[method]['params']['nd_from'] = start_date.strftime('%Y-%m-%d')
        method_dict[method]['params']['nd_to'] = end_date.strftime('%Y-%m-%d')
        r = requests.get(
            url=url, 
            headers=headers, 
            params=method_dict[method]['params']
            )
        print(f'Status code {r.status_code}')
        data = r.json()
    
        return data
        
    else:
        date_range = (end_date - start_date)
        print(f'Start date {start_date}')
        print(f'End date {end_date}')
        print(f'Date range {date_range.days}')
        day_list = [start_date + timedelta(days=i) for i in range(date_range.days + 1)]
        data = []
        for day in day_list:
            method_dict[method]['params']['nd'] = day
            r = requests.get(
                url=url, 
                headers=headers, 
                params=method_dict[method]['params']
                )
            print(f'Status code in loop {r.status_code}')
            data += r.json()
            
        return data

def store_data(data):
    with open('data_archive.json', 'w') as f:
        json.dump(data, f)
    
def load_data_from_file(filename='data_archive.json'):
    with open(filename, 'r') as f:
        data = json.load(f)
        return data

def update_data(initial_days_offset=5, days_offset=1):
    if 'data_archive.json' not in os.listdir('./'):
        start_date = datetime.today() - timedelta(days=initial_days_offset)
        end_date = datetime.today()
        archive_data = get_data(host, method, method_dict, start_date, end_date)
        store_data(archive_data)
        print(f'Download {initial_days_offset} days archive data')
        df_archive = pd.DataFrame(data=archive_data)
    else:
        archive_data = load_data_from_file('data_archive.json')
        df_archive = pd.DataFrame(data=archive_data)
    start_date = datetime.today() - timedelta(days=days_offset)
    end_date = datetime.today()
    
    increment_data = get_data(host, method, method_dict, start_date, end_date)
    df_increment = pd.DataFrame(data=increment_data)
    
    df = pd.concat([df_archive, df_increment], axis=0, ignore_index=True).\
        drop_duplicates(['NariadDate','minIndex', 'rg_id', 'mr_id', 'crr_id', 'pk_id', 'mc_id'], keep='last')
    return df_archive, df_increment, df

In [19]:
output = update_data()

Start date 2022-05-11 23:40:13.270067
End date 2022-05-12 23:40:13.270100
Date range 1
Status code in loop 200
Status code in loop 200


In [20]:
output[0]

Unnamed: 0,NariadDate,minIndex,mr_id,mr_num,mr_title,mr_regnum,mc_id,mc_title,crr_id,crr_title,pk_id,pk_title,rg_id,rg_title,RacePlan,RaceFact,RaceRegular
0,2022-05-07,240,256,032,Шатура - Мишеронский,1524,13,ПРИГОРОДНЫЙ,5,МТА.МАП №04 г.Раменское,1459,Шатура,14,Шатура,1,1,0
1,2022-05-07,240,546,031,Волоколамск (Вокзал) - Шанино,55,13,ПРИГОРОДНЫЙ,8,МТА.МАП №07 г.Истра,1489,Волоколамск,23,Волоколамский,1,0,0
2,2022-05-07,240,1040,033в,Шаховская – Ивашково,1552,13,ПРИГОРОДНЫЙ,8,МТА.МАП №07 г.Истра,1513,Шаховская,13,Шаховская,2,1,1
3,2022-05-07,240,275,034в,Шаховская - Волочаново - Кр. Берег,1553,13,ПРИГОРОДНЫЙ,8,МТА.МАП №07 г.Истра,1513,Шаховская,13,Шаховская,1,1,0
4,2022-05-07,240,1041,035в,Шаховская – Соколово,1554,13,ПРИГОРОДНЫЙ,8,МТА.МАП №07 г.Истра,1513,Шаховская,13,Шаховская,2,0,0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
136080,2022-05-12,1320,11526,1,ст. Можайск-п.Стройгородок,636,11,ГОРОДСКОЙ,15,ВЕЛЕС,2720,Велес,0,-,280,269,256
136081,2022-05-12,1320,11527,2,ст. Можайск-п.им. Дзержинского,637,11,ГОРОДСКОЙ,15,ВЕЛЕС,2720,Велес,0,-,58,57,55
136082,2022-05-12,1320,11528,5,ст. Можайск-Дом культуры,2081,11,ГОРОДСКОЙ,15,ВЕЛЕС,2720,Велес,0,-,48,46,39
136083,2022-05-12,1320,11529,25,ст. Можайск-Колычево,641,11,ГОРОДСКОЙ,15,ВЕЛЕС,2720,Велес,0,-,66,63,61


In [21]:
output[1]

Unnamed: 0,NariadDate,minIndex,mr_id,mr_num,mr_title,mr_regnum,mc_id,mc_title,crr_id,crr_title,pk_id,pk_title,rg_id,rg_title,RacePlan,RaceFact,RaceRegular
0,2022-05-11,360,562,346,Красково (пос. Коренево) - Москва (м. Выхино),617,13,ПРИГОРОДНЫЙ,2,МТА.МАП №01 Люберцы а/к 1787,1482,ПБ Люберцы,33,Люберцы,4,4,3
1,2022-05-11,360,567,373,Люберцы (ул. Строителей) - Москва (м. Выхино),625,13,ПРИГОРОДНЫЙ,2,МТА.МАП №01 Люберцы а/к 1787,1482,ПБ Люберцы,33,Люберцы,2,1,0
2,2022-05-11,360,560,501,Люберцы (Таможенная академия) - Москва (м.Выхино),607,13,ПРИГОРОДНЫЙ,2,МТА.МАП №01 Люберцы а/к 1787,1482,ПБ Люберцы,33,Люберцы,5,5,5
3,2022-05-11,360,11341,1225,Люберцы (ул. Вертолетная) – Люберцы (Комсомоль...,4025,13,ПРИГОРОДНЫЙ,2,МТА.МАП №01 Люберцы а/к 1787,1482,ПБ Люберцы,33,Люберцы,2,2,2
4,2022-05-11,360,11342,1232,Люберцы (мкр. «Люберцы-2015») - Москва (м. Вых...,4032,13,ПРИГОРОДНЫЙ,2,МТА.МАП №01 Люберцы а/к 1787,1482,ПБ Люберцы,33,Люберцы,1,1,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
41821,2022-05-12,1320,11526,1,ст. Можайск-п.Стройгородок,636,11,ГОРОДСКОЙ,15,ВЕЛЕС,2720,Велес,0,-,280,269,256
41822,2022-05-12,1320,11527,2,ст. Можайск-п.им. Дзержинского,637,11,ГОРОДСКОЙ,15,ВЕЛЕС,2720,Велес,0,-,58,57,55
41823,2022-05-12,1320,11528,5,ст. Можайск-Дом культуры,2081,11,ГОРОДСКОЙ,15,ВЕЛЕС,2720,Велес,0,-,48,46,39
41824,2022-05-12,1320,11529,25,ст. Можайск-Колычево,641,11,ГОРОДСКОЙ,15,ВЕЛЕС,2720,Велес,0,-,66,63,61


In [22]:
output[2]

Unnamed: 0,NariadDate,minIndex,mr_id,mr_num,mr_title,mr_regnum,mc_id,mc_title,crr_id,crr_title,pk_id,pk_title,rg_id,rg_title,RacePlan,RaceFact,RaceRegular
0,2022-05-07,240,256,032,Шатура - Мишеронский,1524,13,ПРИГОРОДНЫЙ,5,МТА.МАП №04 г.Раменское,1459,Шатура,14,Шатура,1,1,0
1,2022-05-07,240,546,031,Волоколамск (Вокзал) - Шанино,55,13,ПРИГОРОДНЫЙ,8,МТА.МАП №07 г.Истра,1489,Волоколамск,23,Волоколамский,1,0,0
2,2022-05-07,240,1040,033в,Шаховская – Ивашково,1552,13,ПРИГОРОДНЫЙ,8,МТА.МАП №07 г.Истра,1513,Шаховская,13,Шаховская,2,1,1
3,2022-05-07,240,275,034в,Шаховская - Волочаново - Кр. Берег,1553,13,ПРИГОРОДНЫЙ,8,МТА.МАП №07 г.Истра,1513,Шаховская,13,Шаховская,1,1,0
4,2022-05-07,240,1041,035в,Шаховская – Соколово,1554,13,ПРИГОРОДНЫЙ,8,МТА.МАП №07 г.Истра,1513,Шаховская,13,Шаховская,2,0,0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
177906,2022-05-12,1320,11526,1,ст. Можайск-п.Стройгородок,636,11,ГОРОДСКОЙ,15,ВЕЛЕС,2720,Велес,0,-,280,269,256
177907,2022-05-12,1320,11527,2,ст. Можайск-п.им. Дзержинского,637,11,ГОРОДСКОЙ,15,ВЕЛЕС,2720,Велес,0,-,58,57,55
177908,2022-05-12,1320,11528,5,ст. Можайск-Дом культуры,2081,11,ГОРОДСКОЙ,15,ВЕЛЕС,2720,Велес,0,-,48,46,39
177909,2022-05-12,1320,11529,25,ст. Можайск-Колычево,641,11,ГОРОДСКОЙ,15,ВЕЛЕС,2720,Велес,0,-,66,63,61
