In [197]:
with open("result.json") as j:
    json_data = j.read()


In [198]:
from pydantic import BaseModel, ValidationError, Field
from typing import List, Optional

class TextEntity(BaseModel):
    type: str
    text: str

class Reaction(BaseModel):
    type: str
    count: int
    emoji: str

class ClassRecording(BaseModel):
    id: int
    type: str
    date: str
    date_unixtime: int
    edited: Optional[str] = ''
    edited_unixtime: Optional[str] = ''
    from_: str = Field(alias='from')  # Используем alias для поля 'from'
    from_id: str
    file: Optional[str] = ''
    file_name: str
    thumbnail: Optional[str] = ''
    media_type: str
    title: str
    mime_type: str
    performer: str
    duration_seconds: int
    text: Optional[list|str] = ''
    text_entities: Optional[list] = []
    reactions: Optional[list] = []

In [214]:
class All(BaseModel):
    name: str
    type: str
    messages: List[Message]

with open("result.json") as j:
    json_data = j.read()

import json

messages = json.loads(json_data)['messages']

classes = [ClassRecording(**m) for m in messages if m.get("media_type") == "audio_file"]




In [272]:
lectors = set()
for c in classes:
    lectors.add(c.performer.strip())
lectors

171

In [275]:
# lector aliases

aliases = {
    "враджа хари": "Враджа Хари дас",
    "радха крипа": "Радха Крипа д.д.",
    "Абхай Ч": "Абхай Чайтанья дас",
    "Юга Аватара": "Юга Аватара дас",
    "Преданные": "Разные преданные",
    "Мадана мукунда": "Мадана Мукунда дас",
    "Саттва Чандра дас": "Саттвата Чандра дас",
    "Гарура Радж": "Гаруда Радж дас",
    "Гарударадж": "Гаруда Радж дас",
    "Веда Вьяса": "Ведавьяса дас",
    "Ведавьяс": "Ведавьяса дас",
    "Бхакта Сергей": "Радха-канта дас",
    "Вьяса Шуно": "Вьяса дас",
    "Вьяса-шуно": "Вьяса дас",
    "Дамодар Ананда": "Дамодар Ананда дас",
    "Дамодара Ананда": "Дамодар Ананда дас",
    "Дамодарананда": "Дамодар Ананда дас",
    'Зинкевич': 'Аватари-Кришна дас',
    'Аватари-кришна дас': 'Аватари-Кришна дас',
    "Амрита Вишакха": "Амрита Вишакха д.д.",
    "Ананта-шайи дас": "Ананта Шайи дас",
    "Булавин": "Вайшнав Тхакур дас",
    "Ваишнав Тхакур": "Вайшнав Тхакур дас",
    "Бхактиведанта Свами": "Шрила Прабхупада",
    "Вананинатха": "Ванинатха Васу дас",
    "Вананинатха": "Ванинатха Васу дас",
    "Ванинитха": "Ванинатха Васу дас",
    "Ванинантха": "Ванинатха Васу дас",
    "Ваникришна": "Ваникришнадас дас",
    "Вани Кришна": "Ваникришнадас дас",
    "Встреча Общины": "Встреча общины",
    "Гауранга Вилас": "Гауранга Виласа дас",
    "Гуранга Вилас": "Гауранга Виласа дас",
    "Гиридхар": "Гоура Гиридхари дас",
    'Дхамершвара Махапрабху': "Дхамешвара Махапрабху дас",
    'Дхамешвара Махапрабхс': "Дхамешвара Махапрабху дас",
    'Дхамешвара Махпрабху': "Дхамешвара Махапрабху дас",
    "Адхокшаджа": "Адхокшаджа Свами",
    "Адхокшада": "Адхокшаджа Свами",
    "Вигьяна": "Бхакти Вигьяна Госвами",
    "Кришна Каруна": "Кришна Каруна дас",
    "Кришна Прия": "Кришна Прия .д.д.",
    "Кунджа Мали": "Кунджамали дас",
    "Мадана Мохан": "Мадана-мохан дас",
    "Модана Мохан": "Мадана-мохан дас",
    "Мадана-мохан": "Мадана-мохан дас",
    "Маза Говардхан": "Маха Говардхан дас",
    "Маллика- мала": "Малика Мала д.д.",
    "Нароттам Вилас": "Нароттам Вилас дас",
    "Прийа Сакхи": "Прия Сакхи д.д.",
    "Прия Сакхи": "Прия Сакхи д.д.",
    "Радха Дживан": "Радха Дживана дас",
    "Сандхйа Аватара": "Сандхья Аватара дас",
    "Сандхmz Аватара": "Сандхья Аватара дас",
    "Шачи Сута": "Шачи Сута дас",
    "Шри Нита": "Шри Нитай Гаура дас",
    "Dasa": "Амала Кришна дас",
}

def replace_lector_name(record_item: ClassRecording) -> ClassRecording:
    # print(record_item.performer)

    if len(record_item.performer.split(',')) > 1 or len(record_item.performer.split(' и ')) > 1:
        # print(record_item.performer)
        record_item.performer = 'Разные преданные'
        return record_item
        
    for a, n in aliases.items():
        # print(a)
        if a.lower() in record_item.performer.lower():
            record_item.performer = n
            # print(record_item.performer)
            return record_item
    return record_item
    
            
cl = [replace_lector_name(c.model_copy()) for c in classes]
lectors = set()
for c in cl:
    lectors.add(c.performer.strip())
len(lectors)

90

In [276]:
classes[0]

ClassRecording(id=14, type='message', date='2021-06-24T09:56:07', date_unixtime=1624517767, edited='', edited_unixtime='', from_='Лекции из храма Нью Джайпур (ИСККОН Минск Харе Кришна)', from_id='channel1426928424', file='(File not included. Change data exporting settings to download.)', file_name='ШБ_6_4_49_50_Сила_аскезы_Амала_Кришна_дас_23_06_2021_n2nFwFxviDk.mp3', thumbnail='', media_type='audio_file', title='ШБ 6.4.49-50. Сила аскезы. Амала Кришна дас 23.06.2021', mime_type='audio/mpeg', performer='Dasa', duration_seconds=5964, text='', text_entities=[], reactions=[])

In [277]:
[c for c in classes if 'Нарада' in c.performer]

[ClassRecording(id=949, type='message', date='2023-07-26T09:17:29', date_unixtime=1690352249, edited='2023-07-26T20:30:50', edited_unixtime='1690392650', from_='Лекции из храма Нью Джайпур (ИСККОН Минск Харе Кришна)', from_id='channel1426928424', file='(File not included. Change data exporting settings to download.)', file_name='ШБ_7_14_11_Нарада_Муни_дас_26_07_2023_2f0EEbt067w.mp3', thumbnail='(File not included. Change data exporting settings to download.)', media_type='audio_file', title='ШБ 7.14.11 - 26.07.23', mime_type='audio/mpeg', performer='Нарада Муни дас', duration_seconds=4576, text=['Нарада Муни дас\nШБ 7.14.11 - 26.07.23\nЛекции ', {'type': 'mention', 'text': '@newjaipur'}, ''], text_entities=[{'type': 'plain', 'text': 'Нарада Муни дас\nШБ 7.14.11 - 26.07.23\nЛекции '}, {'type': 'mention', 'text': '@newjaipur'}, {'type': 'plain', 'text': ''}], reactions=[{'type': 'emoji', 'count': 1, 'emoji': '🔥'}]),
 ClassRecording(id=950, type='message', date='2023-07-26T20:29:56', date