In [1]:
from natasha import Segmenter, NewsEmbedding, NewsNERTagger, NamesExtractor, Doc, MorphVocab, PER, LOC, ORG

Загружаем файл с текстом страницы Википедии о Китае

In [2]:
china_sentences = open('china.txt', encoding='utf-8').read().splitlines()

In [3]:
len(china_sentences)

343

In [9]:
china_sentences = [sentence for sentence in china_sentences if len(sentence) > 0 or sentence == '\n']  # Убираем пустые строки

In [13]:
print(
    f'Количество предложений: {len(china_sentences)}\n'
    f'Количество слов: {sum([len(china_sentences) for sentence in china_sentences])}'
)

Количество предложений: 203
Количество слов: 41209


In [6]:
text = '\n'.join(china_sentences)  # объединяем предложения в одну строку

Инициализируем необходимые классы

In [7]:
segmenter = Segmenter()  # необходим для разделения текста на токены и предложения (добавляет свойство 
morph_vocab = MorphVocab()  # класс для морфологии

emb = NewsEmbedding()
ner_tagger = NewsNERTagger(emb)  # извлекает именованные сущности: локации, организации

names_extractor = NamesExtractor(morph_vocab)  # извлекает имена персон

In [8]:
doc = Doc(text)

In [15]:
doc.segment(segmenter)  # проводим сегментацию текста

In [16]:
doc.tag_ner(ner_tagger)     # объявляет свойство spans с классификацией
doc.ner.print()             # визуализация именованных сущностей

Кита́й (кит. трад. 中國, упр. 中国, пиньинь Zhōngguó, палл. Чжунго), 
официальное название — Кита́йская Наро́дная Респу́блика (сокр. КНР), 
                       PER─────────────────────────────        LOC   
(кит. трад. 中華人民共和國, упр. 中华人民共和国, пиньинь Zhōnghuá Rénmín Gònghéguó, 
палл. Чжунхуа Жэньминь Гунхэго) — государство в Восточной Азии. 
      PER─────────────────────                  LOC───────────  
Занимает 4-е место в мире по территории среди государств (9 598 962 
км2), уступая России, Канаде и США, а по численности населения[13] — 1
              LOC───  LOC───   LOC                                    
 411 750 000 жителей (без Тайваня, Гонконга и Макао[14])[7] — второе 
                          LOC────  LOC─────   LOC──                  
после Индии[15]. Уровень урбанизации равен 65 %[14]. Большинство 
      LOC──                                                      
населения — этнические китайцы, самоназвание — хань.
Китайская Народная Республика, согласно конституции, — 
L

In [40]:
for m in doc.spans:
    print(m.tokens)

[DocToken(start=88, stop=98, text='Кита́йская'), DocToken(start=99, stop=108, text='Наро́дная'), DocToken(start=109, stop=120, text='Респу́блика')]
[DocToken(start=128, stop=131, text='КНР')]
[DocToken(start=210, stop=217, text='Чжунхуа'), DocToken(start=218, stop=226, text='Жэньминь'), DocToken(start=227, stop=234, text='Гунхэго')]
[DocToken(start=252, stop=261, text='Восточной'), DocToken(start=262, stop=266, text='Азии')]
[DocToken(start=350, stop=356, text='России')]
[DocToken(start=358, stop=364, text='Канаде')]
[DocToken(start=367, stop=370, text='США')]
[DocToken(start=432, stop=439, text='Тайваня')]
[DocToken(start=441, stop=449, text='Гонконга')]
[DocToken(start=452, stop=457, text='Макао')]
[DocToken(start=481, stop=486, text='Индии')]
[DocToken(start=593, stop=602, text='Китайская'), DocToken(start=603, stop=611, text='Народная'), DocToken(start=612, stop=622, text='Республика')]
[DocToken(start=766, stop=772, text='Совета'), DocToken(start=773, stop=785, text='безопасности'

In [17]:
for span in doc.spans:
    span.normalize(morph_vocab)  # проводим нормализацию слов

In [18]:
for span in doc.spans:
    print(span)  # можно заметить, что normal форма не отличается от text (в большинстве случаев)

DocSpan(start=88, stop=120, type='PER', text='Кита́йская Наро́дная Респу́блика', tokens=[...], normal='Кита́йская Наро́дная Респу́блика')
DocSpan(start=128, stop=131, type='LOC', text='КНР', tokens=[...], normal='КНР')
DocSpan(start=210, stop=234, type='PER', text='Чжунхуа Жэньминь Гунхэго', tokens=[...], normal='Чжунхуа Жэньминь Гунхэго')
DocSpan(start=252, stop=266, type='LOC', text='Восточной Азии', tokens=[...], normal='Восточной Азии')
DocSpan(start=350, stop=356, type='LOC', text='России', tokens=[...], normal='России')
DocSpan(start=358, stop=364, type='LOC', text='Канаде', tokens=[...], normal='Канаде')
DocSpan(start=367, stop=370, type='LOC', text='США', tokens=[...], normal='США')
DocSpan(start=432, stop=439, type='LOC', text='Тайваня', tokens=[...], normal='Тайваня')
DocSpan(start=441, stop=449, type='LOC', text='Гонконга', tokens=[...], normal='Гонконга')
DocSpan(start=452, stop=457, type='LOC', text='Макао', tokens=[...], normal='Макао')
DocSpan(start=481, stop=486, type='

In [19]:
for span in doc.spans:
    if span.text != span.normal:
        print(span)  # нормализация состояла в удалении служебных символов, попавших в сущность, и замены ё на е

DocSpan(start=3979, stop=3985, type='LOC', text='Жёлтым', tokens=[...], normal='Желтым')
DocSpan(start=4313, stop=4332, type='LOC', text='Чжэнчжоу\nТопография', tokens=[...], normal='Чжэнчжоу Топография')
DocSpan(start=5564, stop=5578, type='LOC', text='Лёссовое плато', tokens=[...], normal='Лессовое плато')
DocSpan(start=15946, stop=15966, type='PER', text='Цин\nИмператрица Цыси', tokens=[...], normal='Цин Императрица Цыси')
DocSpan(start=21440, stop=21466, type='PER', text='Чан Кайши\nПартия Гоминьдан', tokens=[...], normal='Чан Кайши Партия Гоминьдан')
DocSpan(start=35080, stop=35091, type='LOC', text='Пекин\nГород', tokens=[...], normal='Пекин Город')
DocSpan(start=35265, stop=35277, type='LOC', text='Жёлтому морю', tokens=[...], normal='Желтому морю')
DocSpan(start=36439, stop=36458, type='LOC', text='Чунцин\nЧунцин\nГород', tokens=[...], normal='Чунцин Чунцин Город')
DocSpan(start=36911, stop=36933, type='LOC', text='Гонконг\nБухта Виктория', tokens=[...], normal='Гонконг Бухта В

In [25]:
for span in doc.spans:
    if span.type == 'PER':
        span.extract_fact(names_extractor)  # добавляем разбор имен для персон (поле fact)

In [26]:
# выведем разобранные имена (некоторые не получилось разобрать fact = None)
# не всегда правильно разбирает китайские имена, например, Дэн Сяопин - Дэн - фамилия, Сяопин - имя, разобрано наоборот, также с Мао Цзэдун. А Си Цзиньпин разобрано правильно (можно предположить, что Си Цзиньпин мог встречаться в обучающей выборке, если обучение проходило по новостным заголовкам, поэтому разбор оказался корректным.
# Ещё можно заметить, что в выборку попали географические объекты, например Макао.
for span in doc.spans:
    if span.type == 'PER':
        try:
            print(f'"{span.normal}": "{span.fact.as_dict}"')
        except Exception:
            print(f'"{span.normal}": "{span.fact}"')

"Кита́йская Наро́дная Респу́блика": "{'last': 'Кита'}"
"Чжунхуа Жэньминь Гунхэго": "{'first': 'Чжунхуа'}"
"Си Цзиньпин": "{'first': 'Цзиньпин', 'last': 'Си'}"
"Фасмера": "None"
"Афанасия Никитина": "{'first': 'Афанасия', 'last': 'Никитина'}"
"Ляо": "None"
"Марко Поло": "{'first': 'Марко', 'last': 'Поло'}"
"Трансгималаи": "None"
"Чжуцзян": "{'first': 'Чжуцзян'}"
"Ялуцангпо": "None"
"Поянху": "None"
"Дунтинху": "None"
"Давида": "{'first': 'Давида'}"
"Конфуция": "{'first': 'Конфуция'}"
"Конфуция": "{'first': 'Конфуция'}"
"Лю Бэй Синь": "{'last': 'Лю'}"
"Сиу Фэньма": "None"
"Цин Императрица Цыси": "{'last': 'Цин'}"
"Цзинь": "None"
"Тайпинов": "None"
"Ефрона": "{'first': 'Ефрона'}"
"Цыси": "{'first': 'Цыси'}"
"Гуансюй": "None"
"Цыси": "{'first': 'Цыси'}"
"Гуансюй": "None"
"Цыси": "{'first': 'Цыси'}"
"Цыси": "{'first': 'Цыси'}"
"Регентом": "{'last': 'Регентом'}"
"Чунь": "None"
"Тибет": "None"
"Юань Шикай": "{'last': 'Шикай'}"
"Гоминьдан Сунь Ятсен": "{'first': 'Ятсен', 'last': 'Сунь'}"
"Сунь

Создадим списки именованных сущностей по категориям: персоны, локации, организации

In [37]:
persons = []
locations = []
organizations = []

for span in doc.spans:
    if span.type == 'PER':
        persons.append(span)
    elif span.type == 'LOC':
        locations.append(span)
    elif span.type == 'ORG':
        organizations.append(span)         

print(f'Количество персон: {len(persons)}\nКоличество локаций: {len(locations)}\nКоличество организаций: {len(organizations)}\n')

Количество персон: 96
Количество локаций: 600
Количество организаций: 106


In [34]:
for person in persons:
    try:
        print(f'"{person.normal}": "{person.fact.as_dict}"')
    except Exception:
            print(f'"{person.normal}": "{person.fact}"')

"Кита́йская Наро́дная Респу́блика": "{'last': 'Кита'}"
"Чжунхуа Жэньминь Гунхэго": "{'first': 'Чжунхуа'}"
"Си Цзиньпин": "{'first': 'Цзиньпин', 'last': 'Си'}"
"Фасмера": "None"
"Афанасия Никитина": "{'first': 'Афанасия', 'last': 'Никитина'}"
"Ляо": "None"
"Марко Поло": "{'first': 'Марко', 'last': 'Поло'}"
"Трансгималаи": "None"
"Чжуцзян": "{'first': 'Чжуцзян'}"
"Ялуцангпо": "None"
"Поянху": "None"
"Дунтинху": "None"
"Давида": "{'first': 'Давида'}"
"Конфуция": "{'first': 'Конфуция'}"
"Конфуция": "{'first': 'Конфуция'}"
"Лю Бэй Синь": "{'last': 'Лю'}"
"Сиу Фэньма": "None"
"Цин Императрица Цыси": "{'last': 'Цин'}"
"Цзинь": "None"
"Тайпинов": "None"
"Ефрона": "{'first': 'Ефрона'}"
"Цыси": "{'first': 'Цыси'}"
"Гуансюй": "None"
"Цыси": "{'first': 'Цыси'}"
"Гуансюй": "None"
"Цыси": "{'first': 'Цыси'}"
"Цыси": "{'first': 'Цыси'}"
"Регентом": "{'last': 'Регентом'}"
"Чунь": "None"
"Тибет": "None"
"Юань Шикай": "{'last': 'Шикай'}"
"Гоминьдан Сунь Ятсен": "{'first': 'Ятсен', 'last': 'Сунь'}"
"Сунь

In [35]:
for location in locations:
    print(location.text)

КНР
Восточной Азии
России
Канаде
США
Тайваня
Гонконга
Макао
Индии
Китайская Народная Республика
КНР
Китая
АТР
Китая
Китае
Шэньчжэнь
Гонконг
Гуанчжоу
Пекин
Шанхай
Сучжоу
КНР
Китай
Китайской Народной Республики
КНР
Китай
Китай
Маньчжурии
Северный Китай
Северного Китая
Западную Европу
Китай
Восточной Азии
Тихого океана
Китай
КНДР
Россией
Монголией
Россией
Казахстаном
Кыргызстаном
Таджикистаном
Афганистаном
Пакистаном
Гилгит-Балтистаном
Индией
Непалом
Бутаном
Мьянмой
Лаосом
Вьетнамом
Китая
Китай
Азии
России
России
Канаде
США
США
Китая
Китая
Северной Кореей
Вьетнамом
Китай
Жёлтым
Восточно-Китайским
Южно-Китайским морями
Тайвань
Тайваньским проливом
Памира
Шанхая
Амур
Россией
Хайнань
Чжэнчжоу
Топография
Китая
Китая
Джомолунгмы
Гималаях
Непалом
Китая
Гималаев
Куньлунь
Памир
Сино-Тибетские горы
Тянь-Шань
Турфанской впадине
Китая
Тибетское нагорье
Цинхай-Тибетское нагорье
Сино-Тибетские горы
Тангла
Кукушили
Гималаев
Каракорума
Памира
Куньлунь
Наньшань
Цайдамская
Северо-Западная
Тянь-Шань
Монгол

In [36]:
# Попало несколько аббревиатур: кВт.ч, ГЭС, АЭС, СМИ
for organization in organizations:
    print(organization.text)

Совета безопасности
ООН
ООН
ВТО
G20
БРИКС
ШОС
Коммунистическая партия Китая (КПК)
Kytai‎
Чжунго
Каракорум
ЮНЕСКО
Летнем дворце
КВЖД
Синьхайской революции
Бэйянское правительство
Богдо-хан
Юанем Шикаем
Коммунистическая партия
Военная академия
Парламент
Сената
Палаты Депутатов
Парламентом
Кабинет
Палаты Депутатов
Верховный Суд
Сената
Гоминьдана
Национально-революционная армия
ГМД
КПК
КПК
КПК
КПК
КПК
КПК
Гоминьданом
Henschel
Junkers
Heinkel
Messerschmitt
Rheinmetall
КПК
Компартия
Народный политический консультативный совет
Центральный Народный Правительственный Совет
НПКС
Государственный Административный Совет
ГАС
Центральный Народный Правительственный Совет
Постоянный Комитет Всекитайского Собрания Народных Представителей
Государственный Административный Совет
Государственный Совет
КПК
Всекитайское собрание народных представителей (ВСНП)
ВСНП
Всекитайского собрания
Постоянный комитет
ВСНП
Коммунистической партии
Народный политический консультативный совет
ВСНП
ЦК
КПК
Центрального военног

В целом разбор качественный, в категории попали нужные токены, но есть редкие ошибки

In [399]:
from yargy import Parser, rule, or_, and_, not_
from yargy.tokenizer import MorphTokenizer
from yargy.interpretation import fact
from yargy.predicates import gram, is_title, is_capitalized, dictionary, length_eq, type as word_type

Парсер населенных пунктов

In [386]:
City = fact(
    'City',
    ['type', 'title']
)

CITY_TYPE = and_(
    dictionary({
        'город',
        'провинция',
        'страна',
        'государство',
        'республика',
        'регион'
    }),
    not_(dictionary({
        'гора',
    })),
)
CITY_NAME = and_(
    gram('NOUN'),
    is_title(),
    # gram('anim'),  
    gram('inan'),
)
    
CITY = or_(
    rule(
        CITY_TYPE.interpretation(
            City.type.inflected()
        ),
        CITY_NAME.interpretation(
            City.title.inflected()
        ),
    ),
).interpretation(
    City
)
city_parser = Parser(CITY)

In [385]:
# если название объекта одушевленное
for sent in china_sentences:
    for match in city_parser.findall(sent):
        print(match.fact)

City(type='провинция', title='гуандун')
City(type='провинция', title='шаньдун')
City(type='провинция', title='юньнаня')
City(type='государство', title='президент')
City(type='город', title='наньчан')


In [387]:
# если название объекта неодушевленное
for sent in china_sentences:
    for match in city_parser.findall(sent):
        print(match.fact)

City(type='город', title='чжэнчжоу')
City(type='провинция', title='китай')
City(type='провинция', title='шаньсивший')
City(type='провинция', title='китай')
City(type='провинция', title='хэйлунцзян')
City(type='республика', title='чан')
City(type='провинция', title='гуанчжоу')
City(type='город', title='наньчан')
City(type='государство', title='маньчжоу')
City(type='провинция', title='цзянси')
City(type='город', title='яньань')
City(type='провинция', title='хэбэй')
City(type='провинция', title='цзянс')
City(type='город', title='шанхай')
City(type='республика', title='корея')


Парсер ландшафтов

In [388]:
Geo_loc = fact(
    'Geo_loc',
    ['type', 'title']
)

GEO_TYPE = and_(
    dictionary({
        'река',
        'гора',
        'равнина',
        'пустыня',
        'море',
        'океан',
    }),
)
GEO_NAME = and_(
    gram('NOUN'),
    is_title(),
)
    
GEO_LOC = or_(
    rule(
        GEO_TYPE.interpretation(
            Geo_loc.type.inflected()
        ),
        GEO_NAME.interpretation(
            Geo_loc.title.inflected()
        ),
    ),
).interpretation(
    Geo_loc
)
geo_parser = Parser(GEO_LOC)

In [389]:
for sent in china_sentences:
    for match in geo_parser.findall(sent):
        print(match.fact)

Geo_loc(type='река', title='амур')
Geo_loc(type='гора', title='джомолунгма')
Geo_loc(type='гора', title='иньшаня')
Geo_loc(type='гора', title='циньлина')
Geo_loc(type='гора', title='улиншаня')
Geo_loc(type='гора', title='циньлина')
Geo_loc(type='гора', title='лосяошань')
Geo_loc(type='равнина', title='сунляо')
Geo_loc(type='гора', title='конгур')
Geo_loc(type='река', title='янцзы')
Geo_loc(type='гора', title='наньлин')
Geo_loc(type='гора', title='циньлина')
Geo_loc(type='равнина', title='сунгари')
Geo_loc(type='река', title='китай')
Geo_loc(type='река', title='хуанхэ')
Geo_loc(type='река', title='янцзы')


Парсер персон с должностями

In [ ]:
# Председатель КНР (Си Цзиньпин (кит. 习近平))
# Премьер Госсовета КНР (Ли Кэцян (кит. 李克强))

In [311]:
tokenizer = MorphTokenizer()
list(tokenizer('Премьер Госсовета КНР (Ли Кэцян (кит. 李克强))'))

[MorphToken(
     value='Премьер',
     span=[0, 7),
     type='RU',
     forms=[Form('премьер', Grams(NOUN,anim,masc,nomn,sing)),
      Form('премьера', Grams(NOUN,femn,gent,inan,plur))]
 ),
 MorphToken(
     value='Госсовета',
     span=[8, 17),
     type='RU',
     forms=[Form('госсовет', Grams(NOUN,Orgn,gent,inan,masc,sing))]
 ),
 MorphToken(
     value='КНР',
     span=[18, 21),
     type='RU',
     forms=[Form('кнр', Grams(Fixd,Geox,NOUN,Sgtm,femn,inan,nomn,sing)),
      Form('кнр', Grams(Fixd,Geox,NOUN,Sgtm,femn,gent,inan,sing)),
      Form('кнр', Grams(Fixd,Geox,NOUN,Sgtm,datv,femn,inan,sing)),
      Form('кнр', Grams(Fixd,Geox,NOUN,Sgtm,accs,femn,inan,sing)),
      Form('кнр', Grams(Fixd,Geox,NOUN,Sgtm,ablt,femn,inan,sing)),
      Form('кнр', Grams(Fixd,Geox,NOUN,Sgtm,femn,inan,loct,sing))]
 ),
 Token(
     value='(',
     span=[22, 23),
     type='PUNCT'
 ),
 MorphToken(
     value='Ли',
     span=[23, 25),
     type='RU',
     forms=[Form('ли', Grams(PRCL)),
      Form('ли',

In [326]:
list(tokenizer('Председатель КНР (Си Цзиньпин (кит. 习近平))'))

[MorphToken(
     value='Председатель',
     span=[0, 12),
     type='RU',
     forms=[Form('председатель', Grams(NOUN,anim,masc,nomn,sing))]
 ),
 MorphToken(
     value='КНР',
     span=[13, 16),
     type='RU',
     forms=[Form('кнр', Grams(Fixd,Geox,NOUN,Sgtm,femn,inan,nomn,sing)),
      Form('кнр', Grams(Fixd,Geox,NOUN,Sgtm,femn,gent,inan,sing)),
      Form('кнр', Grams(Fixd,Geox,NOUN,Sgtm,datv,femn,inan,sing)),
      Form('кнр', Grams(Fixd,Geox,NOUN,Sgtm,accs,femn,inan,sing)),
      Form('кнр', Grams(Fixd,Geox,NOUN,Sgtm,ablt,femn,inan,sing)),
      Form('кнр', Grams(Fixd,Geox,NOUN,Sgtm,femn,inan,loct,sing))]
 ),
 Token(
     value='(',
     span=[17, 18),
     type='PUNCT'
 ),
 MorphToken(
     value='Си',
     span=[18, 20),
     type='RU',
     forms=[Form('си', Grams(Fixd,NOUN,inan,neut,nomn,sing)),
      Form('си', Grams(Fixd,NOUN,gent,inan,neut,sing)),
      Form('си', Grams(Fixd,NOUN,datv,inan,neut,sing)),
      Form('си', Grams(Fixd,NOUN,accs,inan,neut,sing)),
      Form('с

In [391]:
Person = fact(
    'Person',
    ['position', 'organization', 'name', 'orig_name']
)
Name = fact(
    'Name',
    ['first', 'last']
)

PERSON_POSITION = and_(
    dictionary({
        'глава',
        'президент',
        'руководитель',
        'лидер',
        'председатель',
        'премьер',
    }),
)
ORGANIZATION = and_(
    gram('NOUN'),
    or_(
        gram('Orgn'), 
        gram('Geox'),
    ),
    is_capitalized(),
)

NAME = and_(
    gram('NOUN'),
    is_title(),
    not_(gram('Geox'))
)

FULL_NAME = rule(
    NAME.interpretation(
        Name.last.inflected()
    ),
    NAME.interpretation(
        Name.first.inflected()
    ),
).interpretation(
    Name
)

HIEROGLYPH_NAME = word_type('OTHER').repeatable()

PERSON = or_(
    rule(
        PERSON_POSITION.interpretation(
            Person.position.inflected()
        ),
        ORGANIZATION.optional().repeatable().interpretation(
            Person.organization.inflected()
        ),
        '(',
        FULL_NAME.interpretation(
            Person.name
        ),
        '(',
        'кит',
        '.',
        word_type('OTHER').repeatable().interpretation(
            Person.orig_name.inflected()
        ),
        # '))'
    ),
).interpretation(
    Person
)
person_parser = Parser(PERSON)

In [392]:
for sent in china_sentences:
    for match in person_parser.findall(sent):
        print(match.fact)

Person(position='председатель', organization='кнр', name=Name(first='цзиньпин', last='си'), orig_name='习近平')
Person(position='премьер', organization='госсовет кнр', name=Name(first='кэцян', last='ли'), orig_name='李克强')


Улучшенный парсер для китайских имен

In [406]:
ChinaName = fact(
    'ChinaName',
    ['first', 'last']
)

CHINA_NAME = and_(
    gram('NOUN'),
    is_title(),
    not_(gram('Geox')),    
)

CHINA_LAST_NAME = and_(
    CHINA_NAME,
    or_(
        length_eq(2),
        length_eq(3),
        length_eq(4),
    )
)
CHINA_FIRST_NAME = CHINA_NAME

FULL_CHINA_NAME = rule(
    CHINA_LAST_NAME.interpretation(
        ChinaName.last.inflected()
    ),
    CHINA_FIRST_NAME.interpretation(
        ChinaName.first.inflected()
    ),
).interpretation(
    ChinaName
)

chinese_names_parser = Parser(FULL_CHINA_NAME)

In [407]:
for sent in china_sentences:
    for match in chinese_names_parser.findall(sent):
        print(match.fact)

ChinaName(first='цзиньпин', last='си')
ChinaName(first='фэньм', last='сиу')
ChinaName(first='цзолинь', last='чжан')
ChinaName(first='юаньхун', last='ли')
ChinaName(first='кайши', last='чан')
ChinaName(first='кайши', last='чан')
ChinaName(first='кайши', last='чан')
ChinaName(first='кайши', last='чан')
ChinaName(first='кайши', last='чан')
ChinaName(first='кайши', last='чан')
ChinaName(first='цзолинь', last='чжан')
ChinaName(first='кайши', last='чан')
ChinaName(first='кайши', last='чан')
ChinaName(first='кайши', last='чан')
ChinaName(first='кайши', last='чан')
ChinaName(first='кайши', last='чан')
ChinaName(first='кайши', last='чан')
ChinaName(first='цзэдун', last='мао')
ChinaName(first='цзэдун', last='мао')
ChinaName(first='сяопин', last='дэн')
ChinaName(first='цзэдун', last='мао')
ChinaName(first='сяопин', last='дэн')
ChinaName(first='цзэминь', last='цзян')
ChinaName(first='цзиньпин', last='си')
ChinaName(first='цзиньпин', last='си')
ChinaName(first='кэцян', last='ли')
ChinaName(first='ц