In [17]:
"""
Convert dataset of KudaGo places to FIFA(ITMO) format
"""

import json
from json import JSONDecodeError
from digitalise_timetable import digitalise


location = "msk"    # choose location here (spb, msk)

# Directory and in/out files:
direct = "D:/Work/Data_files/working_dir/"
origin_file = "places_2_expand_"
new_file = "new_format_"

# New categories are defined based on original
def find_category(categories):
    return [categories[0]] if categories else None

# Duration is defined based on new categories
def count_events(place_id):
    pass

def find_duration(categories):
    pass

def convert(place):
    
    categories = find_category(place["categories"])
    duration = find_duration(categories)
    
    # Number of KudaGo events refer to place
    # function is defined in count_events_KudaGo module
    events_count = count_events(place["id"])
    
    # Convert 'timetable' KudaGo to FIFA 'open_hours'
    # digitalise_timetable module is used
    open_hours = digitalise(place["timetable"])
    
    # First image from the original list
    image = place["images"][0] if place["images"] else None        

    # Place representation in new format (FIFA set)
    # in lack of information, some fields left empty
    new_format = {
        # New or changed metrics:
        "categories": categories,
        "duration": duration,
        "events_count_KudaGo" : events_count,
        "image": image,
        "open_hours": open_hours,
        
        # Migrated without changes:
        "id_KudaGo": place["id"],
        "title": place["title"],
        "favorites_count_KudaGo": place["favorites_count"],
        "comments_count_KudaGo": place["comments_count"],
        "address": place["address"],
        # To keep original list of categories
        "additional_categories": place["categories"],
        # Coordinates:
        "lat": place["coords"]["lat"],
        "lng": place["coords"]["lon"],
        
        # Empty in KudaGo set:
        "city_brand": None,
        "facebook_checkins": None,
        "facebook_rating": None, 
        "foursquare_checkinsCount": None,
        "foursquare_rating": None,
        "foursquare_ratingVotes": None,
        "foursquare_userCount": None,
        "instagram_title": None,
        "instagram_visitorsNumber": None,
        "tripAdvisor_rating": None,
        "tripAdvisor_reviewsNumber": None,
        "wikipedia_page": None,
        "wikipedia_title": None,
        # Coordinates in FIFA format (to be filled later):
        "x": None,
        "y": None
        }
    return new_format

with open(direct + origin_file + location + ".json",
           'r', encoding = "utf-8") as inf, \
     open(direct + new_file + location + ".json",
           'w', encoding = "utf-8") as ouf:
    before = json.load(inf)
    after = []
    for place in before:
        after.append(convert(place))
    json.dump(after, ouf)

with open(direct + origin_file + location + ".json",
           'r', encoding = "utf-8") as inf_1, \
     open(direct + new_file + location + ".json",
           'r', encoding = "utf-8") as inf_2:   
    initial_set = json.load(inf_1)
    formatted_set = json.load(inf_2)
    print("Places number in:")
    print("Initial set: ", len(initial_set))
    print("Formatted set: ", len(formatted_set))
    print("\n\nFirst place in:")
    print("Initial set:\n", initial_set[0])
    print("Formatted set:\n", formatted_set[0])
    print("\n\nLast place in:")
    print("Initial set:\n", initial_set[-1])
    print("Formatted set:\n", formatted_set[-1])

Places number in:
Initial set:  4795
Formatted set:  4795


First place in:
Initial set:
 {'id': 3, 'title': 'Московская филармония', 'slug': 'filarmoniya-msk', 'address': 'пл. Триумфальная, д. 4', 'timetable': '', 'phone': '+7 495 232-04-00', 'is_stub': False, 'body_text': '<p>Московская филармония, пожалуй, одна из самых крупных музыкальных площадок нашей страны, и одна и из старейших. Недавно она отпраздновала свое девяностолетие. В первые годы советской власти была создана филармония с целью пропаганды музыкального искусства, организации концертов отечественных и заграничных исполнителей, прежде всего в столице, но и по всей стране тоже. С тех пор она и выполняет эту функцию. Лучшие концертные площадки столицы к её услугам.</p>\n<p>Самая престижная из них — концертный зал имени П. И. Чайковского. Недавно при нём построили и камерный зал на 95 мест, где часто дебютируют молодые исполнители, в том числе и с авангардной музыкой. А в подвальном помещении под большим концертным залом ес