## Исследование данных о метро: JSON, Python

In [1]:
import json

In [2]:
file_mosmetro_json = 'mosmetro.json'

In [3]:
with open(file_mosmetro_json) as f:
    d = json.load(f)
print(d[0])
print(d[0]['Station'])

{'ID': 136, 'Station': 'Третьяковская', 'Line': 'Калининская линия', 'AdmArea': 'Центральный административный округ', 'District': 'район Замоскворечье', 'MCDStation': [], 'AeroexpressStation': [], 'RailwayStation': [], 'ObjectStatus': 'действует', 'global_id': 58701962}
Третьяковская


In [4]:
d[0]

{'ID': 136,
 'Station': 'Третьяковская',
 'Line': 'Калининская линия',
 'AdmArea': 'Центральный административный округ',
 'District': 'район Замоскворечье',
 'MCDStation': [],
 'AeroexpressStation': [],
 'RailwayStation': [],
 'ObjectStatus': 'действует',
 'global_id': 58701962}

In [6]:
# вывести в консоль список статусов станций (т.е. уникальных)
status = []
for line in d:
    status.append(line['ObjectStatus'])
    
print(list(set(status)))

['временно закрыт', 'строится', 'действует']


In [7]:
# вывести в консоль список статусов станций и количеством таких станций
status = {}
for line in d:
    if line['ObjectStatus'] not in status:
        status[line['ObjectStatus']] = 1
    else:
        status[line['ObjectStatus']] += 1

print(list(status.items()))

[('действует', 290), ('строится', 6), ('временно закрыт', 5)]


In [8]:
# вывести в консоль список станций в алфавитном порядке, где статус станции отличается от 'действует'
station = []
for line in d:
    if line['ObjectStatus'] != 'действует':
        station.append(line['Station'])

print(sorted(station))

['Волхонка', 'Дмитровское шоссе', 'Дорогомиловская', 'Кантемировская', 'Каширская', 'Коломенская', 'Плющиха', 'Суворовская', 'Технопарк', 'Третьяковская', 'Царицыно']


In [9]:
# вывести в консоль список станций в алфавитном порядке, которые имеют выход к железнодорожному вокзалу (RailwayTerminal)
station = []
for line in d:
    if 'RailwayTerminal' in line:
        station.append(line['Station'])

print(sorted(set(station)))

['Белорусская', 'Киевская', 'Комсомольская', 'Курская', 'Локомотив', 'Павелецкая', 'Рижская', 'Савёловская', 'Черкизовская', 'Чкаловская']


In [10]:
# вывести в консоль список железнодорожных вокзалов в алфавитном порядке (RailwayTerminal)
railway_station = []
for line in d:
    if 'RailwayTerminal' in line:
        railway_station.append(line['RailwayTerminal']['value'])

print(sorted(set(railway_station)))

['Белорусский', 'Восточный', 'Киевский', 'Курский', 'Ленинградский', 'Павелецкий', 'Рижский', 'Савеловский']


In [11]:
# вывести в консоль список районов, в которых метрополитен имеет выходы к станциям МЦД (MCDStation)
district = []
for line in d:
    if len(line['MCDStation']) != 0:
        district.append(line['District'])

print(list(set(district)))

['район Фили-Давыдково', 'район Печатники', 'район Текстильщики', 'район Марьина Роща', 'Войковский район', 'Мещанский район', 'Таганский район', 'район Кунцево', 'Пресненский район', 'Тимирязевский район', 'район Царицыно', 'район Покровское-Стрешнево', 'Красносельский район', 'район Митино', 'район Сокол', 'район Щукино', 'район Филёвский Парк', 'Тверской район', 'Басманный район', 'Бутырский район', 'Савёловский район', 'Нижегородский район']


In [12]:
# вывести в консоль список веток метрополитена и количеством станций на каждой ветке
line_metro = {}
for line in d:
    if line['Line'] not in line_metro:
        line_metro[line['Line']] = 1
    else:
        line_metro[line['Line']] += 1

print(list(line_metro.items()))

[('Калининская линия', 8), ('Калужско-Рижская линия', 24), ('Арбатско-Покровская линия', 22), ('Большая кольцевая линия', 31), ('Бутовская линия Лёгкого метро', 7), ('Замоскворецкая линия', 24), ('Люблинско-Дмитровская линия', 24), ('Солнцевская линия', 16), ('Серпуховско-Тимирязевская линия', 25), ('Московская монорельсовая транспортная система', 6), ('Таганско-Краснопресненская линия', 23), ('Некрасовская линия', 8), ('Сокольническая линия', 26), ('Кольцевая линия', 13), ('Филёвская линия', 13), ('Московское центральное кольцо', 31)]


In [13]:
# вывести в консоль список административных округов в алфавитном порядке и количеством станций
adm_area = {}
for line in d:
    if line['AdmArea'] not in adm_area:
        adm_area[line['AdmArea']] = 1
    else:
        adm_area[line['AdmArea']] += 1

print(sorted(adm_area.items()))

[('Восточный административный округ', 25), ('Западный административный округ', 38), ('Новомосковский административный округ', 6), ('Северный административный округ', 26), ('Северо-Восточный административный округ', 25), ('Северо-Западный административный округ', 16), ('Центральный административный округ', 79), ('Юго-Восточный административный округ', 31), ('Юго-Западный административный округ', 24), ('Южный административный округ', 31)]


In [14]:
# вывести в консоль список станций в порядке убывания количества символов в названии станции
stations = []
for line in d:
    stations.append(line['Station'])
    
print(sorted(stations, key=len, reverse=True))

['Бульвар адмирала Ушакова', 'Улица Сергея Эйзенштейна', 'Улица Академика Королёва', 'Бульвар Дмитрия Донского', 'Библиотека имени Ленина', 'Преображенская площадь', 'Ломоносовский проспект', 'Улица академика Янгеля', 'Лермонтовский проспект', 'Волгоградский проспект', 'Улица Старокачаловская', 'Петровско-Разумовская', 'Петровско-Разумовская', 'Бульвар Рокоссовского', 'Бульвар Рокоссовского', 'Мичуринский проспект', 'Нахимовский проспект', 'Мичуринский проспект', 'Крестьянская застава', 'Проспект Вернадского', 'Проспект Вернадского', 'улица Дмитриевского', 'Александровский сад', 'Улица Скобелевская', 'Славянский бульвар', 'Сретенский бульвар', 'Рязанский проспект', 'Ленинский проспект', 'Народное Ополчение', 'Улица Милашенкова', 'Красногвардейская', 'Выставочный центр', 'Краснопресненская', 'Нагатинский Затон', 'Площадь Революции', 'Шоссе Энтузиастов', 'Дмитровское шоссе', 'Шоссе Энтузиастов', 'Ботанический сад', 'Верхние Лихоборы', 'Электрозаводская', 'Октябрьское поле', 'Электрозавод

In [15]:
# вывести в консоль список количества символов по возрастанию и количеством станций указанной длины
station_symbol = {}
for line in d:
    if len(line['Station']) not in station_symbol:
        station_symbol[len(line['Station'])] = 1
    else:
        station_symbol[len(line['Station'])] += 1

print(sorted(station_symbol.items()))

[(3, 1), (4, 3), (5, 3), (6, 8), (7, 22), (8, 34), (9, 32), (10, 28), (11, 39), (12, 29), (13, 31), (14, 12), (15, 13), (16, 8), (17, 9), (18, 6), (19, 2), (20, 6), (21, 4), (22, 6), (23, 1), (24, 4)]


In [16]:
# вывести в консоль список букв русского алфавита в алфавитном порядке и количеством станций, начинающихся на каждую букву
bukvi_station = {}
for line in d:
    if line['Station'][0] not in bukvi_station:
        bukvi_station[line['Station'][0]] = 1
    else:
        bukvi_station[line['Station'][0]] += 1

print(sorted(bukvi_station.items()))

[('А', 15), ('Б', 26), ('В', 17), ('Г', 1), ('Д', 13), ('Ж', 1), ('З', 4), ('И', 2), ('К', 37), ('Л', 11), ('М', 15), ('Н', 18), ('О', 11), ('П', 34), ('Р', 9), ('С', 26), ('Т', 20), ('У', 10), ('Ф', 5), ('Х', 3), ('Ц', 3), ('Ч', 5), ('Ш', 6), ('Щ', 2), ('Э', 2), ('Ю', 3), ('Я', 1), ('у', 1)]


In [17]:
# создать json-файл, где будут храниться все станции метро, в названии которых одно слово (т.е. нет пробелов)
with open('temp_JSON_station_one_word.json', 'w') as f:
    station_one_word = []
    for line in d:
        if ' ' not in line['Station']:
            station_one_word.append(line['Station'])
            
    json.dump(station_one_word, f, ensure_ascii=False, indent=1)

In [18]:
# создать json-файл, где будут храниться только названия станций, линий и статусы станций
with open('temp_JSON_station_line_status.json', 'w') as f:
    station_line_status = []
    for line in d:
        station_line_status.append({'Station': line['Station'], 'Line': line['Line'], 'Status': line['ObjectStatus']})
            
    json.dump(station_line_status, f, ensure_ascii=False, indent=1)