In [1]:
import bz2
import json

In [2]:
def print_votes_protocol(district_votes):
    ordered_list = sorted(district_votes, key=district_votes.get, reverse=True)
    all_votes = sum(district_votes.values())
    for name in ordered_list:
        print(f"{name:50}\t{district_votes[name]}\t{100 * district_votes[name] / all_votes:.2f}%")

In [3]:
votes_stat = {}
voter_keys = set()
with bz2.BZ2File("votes-dump.json.bz2") as votes_dump:
    for ln in votes_dump:
        rec = json.loads(ln)
        _dstat = votes_stat.setdefault(rec['district_id'], {})
        _dstat[rec['decoded_choice']] = _dstat.get(rec['decoded_choice'], 0) + 1
        voter_keys.add(rec["voter_key"])
print("Votes number:", len(voter_keys))
print("\n<---=====--->\n")
for k in sorted(votes_stat):
    print(f"District{k}")
    print_votes_protocol(votes_stat[k])
    print("\n<---=====--->\n")

Votes number: 2021968

<---=====--->

District196
БАЖЕНОВ Тимофей Тимофеевич                        	60757	45.70%
РАШКИН Валерий Федорович                          	23360	17.57%
ФЕДОРОВ Георгий Владимирович                      	8104	6.10%
РВАЧЕВ Алексей Сергеевич                          	7826	5.89%
МИРОНОВА Виктория Александровна                   	7818	5.88%
КРЮКОВ Алексей Сергеевич                          	6343	4.77%
ЯНКОВ Кирилл Вадимович                            	5170	3.89%
ВИХАРЕВА Эльвира Владимировна                     	3329	2.50%
МАЛИНКОВИЧ Сергей Александрович                   	3253	2.45%
ТАРАСОВ Антон Александрович                       	3129	2.35%
СТРЕЛЬНИКОВА Елена Николаевна                     	2673	2.01%
ИВАНОВА Елена Ивановна                            	1171	0.88%

<---=====--->

District197
ПОПОВ Евгений Георгиевич                          	50420	40.56%
ЛОБАНОВ Михаил Сергеевич                          	30034	24.16%
БАЛЬМОНТ Борис Александрович                  

In [4]:
Parties = ["ЕДИНАЯ РОССИЯ", "КОММУНИСТИЧЕСКАЯ ПАРТИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ", 
           "НОВЫЕ ЛЮДИ", "ЛДПР", "СПРАВЕДЛИВАЯ РОССИЯ – ЗА ПРАВДУ",
          "ЗЕЛЁНЫЕ", "ПАРТИЯ ПЕНСИОНЕРОВ", "ЗЕЛЕНАЯ АЛЬТЕРНАТИВА",
          "ПАРТИЯ СВОБОДЫ И СПРАВЕДЛИВОСТИ", "ПАРТИЯ РОСТА",
          "ПОЛИТИЧЕСКАЯ ПАРТИЯ ‹‹РОДИНА››", "ПАРТИЯ КОММУНИСТЫ РОССИИ",
          "ЯБЛОКО", "‹Гражданская Платформа››"]

def get_short_party_name(decoded_choice, _cache = {}):
    if decoded_choice not in _cache:
        short_party_name = None
        for short_name in Parties:
            if short_name in decoded_choice:
                short_party_name = short_name
        assert short_party_name is not None, f"can't decode choice: {decoded_choice}"
        _cache[decoded_choice] = short_party_name
    return _cache[decoded_choice]

In [5]:
votes_stat = {}
global_stat = {}
with bz2.BZ2File("votes-dump-parties.json.bz2") as votes_dump:
    for ln in votes_dump:
        rec = json.loads(ln)
        _dstat = votes_stat.setdefault(rec['district_id'], {})
        choice = get_short_party_name(rec['decoded_choice'])
        _dstat[choice] = _dstat.get(choice, 0) + 1
        global_stat[choice] = global_stat.get(choice, 0) + 1

print("Global")
print_votes_protocol(global_stat)
print("\n<---=====--->\n")
for k in sorted(votes_stat):
    print(f"District{k}")
    print_votes_protocol(votes_stat[k])
    print("\n<---=====--->\n")

Global
ЕДИНАЯ РОССИЯ                                     	922695	43.59%
КОММУНИСТИЧЕСКАЯ ПАРТИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ      	336411	15.89%
НОВЫЕ ЛЮДИ                                        	169195	7.99%
ЛДПР                                              	162479	7.68%
СПРАВЕДЛИВАЯ РОССИЯ – ЗА ПРАВДУ                   	147248	6.96%
ЯБЛОКО                                            	85728	4.05%
ЗЕЛЁНЫЕ                                           	72428	3.42%
ПАРТИЯ ПЕНСИОНЕРОВ                                	54671	2.58%
ЗЕЛЕНАЯ АЛЬТЕРНАТИВА                              	48441	2.29%
ПАРТИЯ СВОБОДЫ И СПРАВЕДЛИВОСТИ                   	39456	1.86%
ПАРТИЯ РОСТА                                      	29424	1.39%
ПОЛИТИЧЕСКАЯ ПАРТИЯ ‹‹РОДИНА››                    	22537	1.06%
ПАРТИЯ КОММУНИСТЫ РОССИИ                          	19297	0.91%
‹Гражданская Платформа››                          	6874	0.32%

<---=====--->

District196
ЕДИНАЯ РОССИЯ                                     	58565	42.72%
КОММУНИСТИЧЕС