In [1]:
import os
import sys
import shutil

import numpy as np
import pandas as pd

from tqdm import tqdm
from itertools import combinations

import plotly
plotly.offline.init_notebook_mode(connected=True)

sys.path.append('../src')
from visualization import *

### Ручное построение иерархие

#### Структура иерархии

* **hr_level_0** - уровень разбивающий новости на категории: Политика, Спорт и т.д.
* **hr_level_1** - уровень подкатигорий
* **hr_level_2** - уровень масштабных событий, растянутых во времени, или экономических, политических и т.п. явлений
* **hr_level_3** - уровень точечных событий
* **hr_level_4** - уровень развития, уточнений, различных мнений и т.п. связанных с одним точечным событием

#### Замечания

На данный момент мной размеченны категории: Авто, Культура, Наука, Технологии, Экономика. 

**Замечание 1.** Если кажется, что подкатегория у документа проставлена не правильно, то можно смело перемещать. Часто бывало, что новости об одном событии разбросаны по разным категориям. Между категориями мне кажется лучше не тусовать, а то запутаемся.

**Замечание 2.** Не нужно стремиться заполнить все пустоты в таблицы. Вполне нормально, что событие не объединяется с другими в какое-то маштабное, или не имееет резонанса, развития или разных точек зрения на него. Таким образом, 3-ий уровень есть почти всегда, а 2-ого и 4-ого может и не быть проставлено для документа.

**Замечание 3.** Если имеющиеся темы на третьем уровне оказались слишком мелко раздроблены (несколько тем об одном и том же точечном событии), то объединяем их присваивая наименьший номер, объединяемых событий.

**Замечание 4.** Так как нумеровать темы на 2-ом и 4-ом уровне нужно самим, то предлагаю следующую схему:

    Пусть n - номер темы на уровень выше, m - порядковый номер нумеруемой тобой темы в данной теме на уровень выше. 
    
    Тогда текущий номер n_m. (Кажется это позволит нам не пересечься?)

In [2]:
articles = pd.read_csv('../data/interim/articles.csv')

### Авто

In [3]:
#level 2: Автосалон в Нью-Йорке
levels_3 = ['100-1522358370120418', '100-1522358371121094','100-1522358372237000', '100-1522358372780436',
            '100-1522358374129971', '100-1522358376621044', '100-1522358377188675', '100-1522358381243546',
            '100-1522358394976445', '100-1522358409959271', '100-1522358413009241', '100-1522358413322849',
            '100-1522358419116828', '100-1522358421084850',  '100-1522359399961722']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'Автосалон в Нью-Йорке'

#level 3: 100-1522358370120418 -- Hyundai Tucson
levels_3 = ['100-1522358370120418']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Hyundai Tucson'

#level 3: 100-1522358371121094 -- Mazda CX-3
levels_3 = ['100-1522358371121094']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Mazda CX-3'

#level 3: 100-1522358372237000 -- Прототип электрического купе Genesis Essentia
levels_3 = ['100-1522358372237000']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Прототип электрического купе Genesis Essentia'

#level 3: 100-1522358372780436 -- Subaru Forester 2019
levels_3 = ['100-1522358372780436']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Subaru Forester 2019'

#level 3: 100-1522358374129971 -- Maserati Levante
levels_3 = ['100-1522358374129971']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Maserati Levante'

#level 3: 100-1522358376621044 -- Определен лучший в мире автомобиль 2018 года
levels_3 = ['100-1522358376621044']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Определен лучший в мире автомобиль 2018 года'

#level 3: 100-1522358377188675 -- Acura RDX
levels_3 = ['100-1522358377188675']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Acura RDX'

#level 3: 100-1522358381243546 -- Nissan Altima
levels_3 = ['100-1522358381243546']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Nissan Altima'

#level 3: 100-1522358394976445 -- Audi RS 5 Sportback
levels_3 = ['100-1522358394976445']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Audi RS 5 Sportback'

#level 3: 100-1522358409959271 -- Volkswagen Atlas Sport
levels_3 = ['100-1522358409959271']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Volkswagen Atlas Sport'

#level 3: 100-1522358413009241 -- Toyota RAV4
levels_3 = ['100-1522358413009241']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Toyota RAV4'

#level 3: 100-1522358413322849 -- Cadillac XT4
levels_3 = ['100-1522358413322849']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Cadillac XT4'

#level 3: 100-1522358419116828 -- Jaguar F-Pace SVR
levels_3 = ['100-1522358419116828']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Jaguar F-Pace SVR'

#level 3: 100-1522358421084850 -- Электрокар от MINI
levels_3 = ['100-1522358421084850']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Электрокар от MINI'

#level 3: 100-1522359399961722 -- Honda Insight
levels_3 = ['100-1522359399961722']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Honda Insight'

### Культура

In [4]:
#Перенос в Культуру
levels_3 = ['20-1522357669402287', '26-1522358091062158', '26-1522358101937644', '71-1522358851924392']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_0'] = 'Культура'
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_1'] = np.nan

#level 3: Смерть Олега Анофриева
levels_3 = ['20-1522357669402287', '26-1522358091062158', '26-1522358101937644', '70-1522358864383890',
            '70-1522358882917863', '70-1522358888445517', '71-1522358851924392']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Смерть Анофриева'

#level 4: Похороны
ids = [3759, 3734, 3735, 3736, 3737, 3739, 3740, 3741, 3742, 3743, 3744, 3745, 3746, 3747, 3748, 3749, 3750, 3751, 3752, 3754, 
       3755, 3756]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Похороны'

#level 4: Гафт поделился воспоминаниями об ушедшем из жизни Анофриеве
ids = [4766, 4767, 4768, 4769, 4770, 4771, 4772]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Гафт поделился воспоминаниями об ушедшем из жизни Анофриеве'

#level 4: Леонид Ярмольник о смерти Олега Анофриева
ids = [4841, 4842, 4843]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Леонид Ярмольник о смерти Олега Анофриева'

#level 4: Названа причина смерти актера Олега Анофриева
ids = [9320, 9268, 9280, 9282, 9286, 9287, 9288, 9290, 9291, 9292, 9293]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Названа причина смерти актера Олега Анофриева'

#level 4: Прощание в ЦКБ
ids = [3757, 3760, 9298, 9299, 9300, 9301, 9302, 9303, 9304, 9305, 9306, 9307, 9308, 9309, 9310, 9311, 9312, 9313, 9314, 9315, 
       9316, 3761, 3762, 3763, 3764]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Прощание в ЦКБ'

#level 4: Стас Садальский высказался об Олеге Анофриеве
ids = [9273, 9277]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Стас Садальский высказался об Олеге Анофриеве'

#level 4: Мединский соболезнует родным Олега Анофриева
ids = [9386, 9387]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Мединский соболезнует родным Олега Анофриева'

#level 4: Медведев выразил соболезнования в связи со смертью Анофриева
ids = [9407, 9408, 9409, 9410]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Медведев выразил соболезнования в связи со смертью Анофриева'

#level 4: Путин выразил соболезнование родным Олега Анофриева
ids = [9384, 9389, 9390, 9391, 9392, 9393, 9394, 9395, 9396, 9397, 9398, 9399, 9400, 9401, 9402, 9403, 9405, 9406]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Путин выразил соболезнование родным Олега Анофриева'

**Кино**

In [5]:
#level 3: 71-1522358928459954 -- Александр Митта отмечает 85-летие
levels_3 = ['71-1522358928459954']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Александр Митта отмечает 85-летие'

#level 4: Медведев поздравил режиссёра Александра Митту
ids = [9508, 9509, 9510, 9511]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Медведев поздравил режиссёра Александра Митту'

**Музыка**

In [6]:
#level 3: 72-1522358987262504 -- Памятник Дэвиду Боуи в Великобритании
levels_3 = ['72-1522358987262504']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Памятник Дэвиду Боуи в Великобритании'

#level 4: Установка памятника
ids = [9600, 9601]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Установка памятника'

#level 4: Памятник пострадал от вандалов
ids = [9599, 9602, 9603, 9604, 9605, 9606, 9607, 9608]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Памятник пострадал от вандалов'

### Наука

**Космос**

In [7]:
#level 3: Падение космической станции «Тяньгун-1»
levels_3 = ['81-1522359317226149', '81-1522359317967937', '81-1522359318642529']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Падение космической станции «Тяньгун-1»'

#level 4: Астрономы засняли падающую китайскую космическую станцию
ids = [10185, 10186, 10187]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Астрономы засняли падающую китайскую космическую станцию'

#level 4: Ускорила вращение и начала быстро приближаться к Земле
ids = [10192, 10191, 10193, 10194, 10195, 10196, 10197, 10198]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Ускорила вращение и начала быстро приближаться к Земле'

#level 4: Китай предупредил о скором падении
ids = [10215, 10216, 10217, 10218, 10219, 10220, 10221, 10222, 10223, 10224, 10225, 10226, 10227, 10228, 10214, 10229, 10230]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Китай предупредил о скором падении'

#--------------------------------------------------------------------------------------------------------------------------------

#level 3: 81-1522359318472336 - Выход астронавтов НАСА в открытый космос
levels_3 = ['81-1522359318472336']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Выход астронавтов НАСА в открытый космос'

#level 4: Перенесли из-за проверки скафандров
ids = [10208, 10209, 10207]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Перенесли из-за проверки скафандров'

### Технологии

In [8]:
#Перенос в Технологии

levels_3 = ['20-1522358430515561']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_0'] = 'Технологии'

**Интернет**

In [9]:
#Перенос в Интернет
levels_3 = ['20-1522358430515561', '90-1522359099012794', '91-1522359105510389', '90-1522357663568071', 
            '90-1522359089978055', '90-1522359090369748', '90-1522359104964899', '90-1522359112011949']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_1'] = 'Интернет'

#level 2: Утечка данных из Facebook
levels_3 = ['20-1522358430515561', '90-1522359099012794', '91-1522359105510389', 
            '92-1522359092581758', '92-1522359109621401', '92-1522359159649577']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'Утечка данных из Facebook'

#level 3: Прекращение сотрудничества с информационными брокерами
levels_3 = ['90-1522359099012794', '92-1522359092581758']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Прекращение сотрудничества с информационными брокерами'

#level 3: Предоставление пользователям новые средства контроля конфиденциальности
levels_3 = ['92-1522359109621401', '92-1522359159649577']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Предоставление пользователям новые средства контроля конфиденциальности'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: 92-1522359093498559 - Обновление приложения VK
levels_3 = ['92-1522359093498559']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Обновление приложения VK'

#level 4: iOS
ids = [11037, 11039, 11040, 11041]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Обновленное приложение для iPhone'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: В работе Telegram произошел глобальный сбой
levels_3 = ['90-1522357663568071', '90-1522359089978055', '90-1522359090369748', '90-1522359104964899',
            '90-1522359112011949', '92-1522357694526714', '92-1522359091191072']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'В работе Telegram произошел глобальный сбой'

#level 4: Пользователи предпочли WhatsApp во время сбоя Telegram
ids = [10405, 10406, 10404, 10407, 10408]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Пользователи предпочли WhatsApp во время сбоя Telegram'

#level 4: Мошенники заработали на сбое Telegram
ids = [10414, 10415, 10416, 10417, 10418, 10419, 10420, 10421, 10422, 10423, 10424]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Мошенники заработали на сбое Telegram'

#level 4: Комментарии Дурова
ids = [10425, 10426, 10427, 10428, 10429, 10430, 10432, 10438, 10439, 10440, 10441, 10442, 10443, 10444, 
       10445, 10446, 10447, 10448, 10449, 10450, 10451, 10452, 10453, 10454, 10455, 10456, 10457, 10458]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Комментарии Дурова'

#level 4: Работа мессенджера восстановлена
ids = [10431, 10433, 10435, 10436, 10562, 10563, 10566, 11004, 11005, 11006, 11007, 11008, 11009, 11010, 
       11011, 11012, 11014, 11013, 11015, 11016, 11017, 11018, 11019, 11020, 11021, 11022, 11023, 11025]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Работа мессенджера восстановлена'

#level 4: Эксперт объяснил причины сбоя
ids = [10434, 10437, 10545, 10546, 10547, 10548]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Эксперт объяснил причины сбоя'

**Гаджеты**

In [10]:
#level 3: Huawei представила флагманские смартфоны P20 и P20 Pro
levels_3 = ['91-1522359113861533', '91-1522359134489571']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Huawei представила флагманские смартфоны P20 и P20 Pro'

#--------------------------------------------------------------------------------------------------------------------------------

#level 3: Презентация новых продуктов Apple
levels_3 = ['91-1522359167936264', '91-1522359172572994']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Презентация новых продуктов Apple'

#level 4: Онлайн-магазин Apple перед презентацией закрылся
ids = [10963, 10964, 10965, 10961]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Онлайн-магазин Apple перед презентацией закрылся'

#level 4: В Чикаго Apple проведет традиционную весеннюю презентацию
ids = [10956, 10957, 10958, 10955, 10960]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Чикаго Apple проведет традиционную весеннюю презентацию'

#level 4: В Чикаго завершилась худшая презентация продуктов Apple
ids = [10959, 10962]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'В Чикаго завершилась худшая презентация продуктов Apple'

### Экономика

In [11]:
#level 3: Распространение страхования средств в банках на юрлиц
levels_3 = ['30-1522358157014168', '30-1522358189013323']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Распространение страхования средств в банках на юрлиц'

#level 4: ЦБР за распространение страховки по вкладам на малый и средний бизнес, но не на всех юрлиц
ids = [5011, 5012, 5010, 5013, 5014]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'ЦБР за распространение страховки по вкладам на малый и средний бизнес, но не на всех юрлиц'

#level 4: АСВ предложило расширить систему страхования вкладов на все юрлица
ids = [5245, 5246, 5247]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'АСВ предложило расширить систему страхования вкладов на все юрлица'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: Великобритания хочет запретить продажу российских бондов
levels_3 = ['30-1522358157673120', '30-1522358158199629']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Великобритания хочет запретить продажу российских бондов'

#level 4: В Лондон предлагает ограничить обслуживание российских евробондов
ids = [5046, 5047, 5048, 5049, 5050, 5051, 5052, 5053, 5054, 5055, 5056, 5057, 5058, 5059, 5060, 5061, 5062, 5063, 5064, 5065, 
       5066, 5067, 5068, 5069, 5070, 5071, 5072, 5073, 5074, 5075, 5078, 5079, 5080, 5081, 5082, 5083, 5045, 5086, 5029, 5036]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'В Лондон предлагает ограничить обслуживание российских евробондов'

#level 4: Минфин прокомментировал возможный запрет на продажу российских долговых ценных бумаг в Лондоне
ids = [5025, 5026, 5027, 5028, 5085, 5030, 5031, 5032, 5033, 5034, 5024, 5035, 5037, 5038, 5039, 5040, 5041, 5042, 5043, 5044]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Минфин прокомментировал возможный запрет на продажу российских долговых ценных бумаг в Лондоне'

**Энергетика**

In [12]:
#Перенос в Энергетика
levels_3 = ['30-1522357542132941', '30-1522357587263124', '30-1522358167121964', '31-1522358266347617',
            '31-1522358275560303', '31-1522358256912455']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_1'] = 'Энергетика'

#level 2: Цены на нефть
levels_3 = ['31-1522358256912455', '31-1522358275560303', '32-1522358186946568', '32-1522358304207636']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] ='Цены на нефть'
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = np.nan

#-------------------------------------------------------------------------------------------------------------------------------

#level 2: Цены на бензин
levels_3 = ['32-1522358155907353', '32-1522358160263973', '32-1522358312593267']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] ='Цены на бензин'
articles.loc[articles.hr_level_3.isin(['32-1522358312593267']), 'hr_level_3'] = np.nan

#level 3: Риск роста цен на бензин до 5 руб. на литр и дефицит бензина
levels_3 = ['32-1522358155907353', '32-1522358160263973']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Риск роста цен на бензин до 5 руб. на литр и дефицит бензина'

#level 4: Трейдеры предупредили о риске роста цен на бензин до 5 руб. на литр
ids = [5632, 5633, 5634, 5635, 5636, 5637, 5638, 5639, 5640, 5641, 5642, 5643, 5644]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Трейдеры предупредили о риске роста цен на бензин до 5 руб. на литр'

#level 4: ФАС не видит дефицита бензина в РФ, готовит штрафы при необоснованном росте цен
ids = [5587, 5588, 5589, 5590, 5591, 5592, 5593, 5594, 5595, 5645, 5586, 5596, 5597, 5598, 5599, 5600, 5601, 5602, 5603, 5604]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'ФАС не видит дефицита бензина в РФ, готовит штрафы при необоснованном росте цен'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: «Лукойл» стал дороже «Роснефти»
levels_3 = ['32-1522358303212074', '32-1522358306659551']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = '«Лукойл» стал дороже «Роснефти»'

#level 4: Коментарии экспертов
ids = [5734, 5733, 5735]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Коментарии экспертов'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: Сделка ОПЕК+
levels_3 = ['32-1522358180851229', '32-1522358201380827']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Сделка ОПЕК+'

#level 4: Россия и ОПЕК готовят беспрецедентную сделку
ids = [5698, 5699, 5700, 5701, 5702, 5703, 5704, 5705, 5706, 5697]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Россия и ОПЕК готовят беспрецедентную сделку'

#level 4: Глава Минэнерго Новак отметил позитивную роль соглашения ОПЕК+
ids = [5661, 5662, 5663, 5660]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Глава Минэнерго Новак отметил позитивную роль соглашения ОПЕК+'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: Взысканию долга с российского «Газпрома» в пользу «Нафтогаза»
levels_3 = ['30-1522357587263124', '32-1522358159007642', '32-1522358167355220']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Взысканию долга с российского «Газпрома» в пользу «Нафтогаза»'

#level 4: «Газпром» отразит в отчете выплаты «Нафтогазу» по решению Стокгольмского суда
ids = [5605, 5606, 5607, 5608, 5611, 5631]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = '«Газпром» отразит в отчете выплаты «Нафтогазу» по решению Стокгольмского суда'

#level 4: Нафтогаз издевательски назвал Газпром «котиками»
ids = [5609, 5610, 5612, 5613, 5614, 5615, 5616, 5617, 5618, 5619, 5620, 5621, 5622, 5623, 5624, 5625, 5626, 5627, 5628, 5629, 
       5630]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Нафтогаз издевательски назвал Газпром «котиками»'

#level 4: Украина готовится к принудительному взысканию
ids = [5654, 5655, 5656, 5657, 5658, 5659]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Украина готовится к принудительному взысканию'

#level 4: «Нафтогаз» уже в апреле может начать взыскание долга с «Газпрома»
ids = [4956, 4957, 4958, 4959, 4961, 4962, 4963, 4955, 4966, 4968, 4969, 4971, 4972, 4973]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = '«Нафтогаз» уже в апреле может начать взыскание долга с «Газпрома»'

#level 4: «Нафтогаз» ждет от «Газпрома» добровольной выплаты долга
ids = [4960, 4964, 4965, 4967, 4970]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = '«Нафтогаз» уже в апреле может начать взыскание долга с «Газпрома»'

**Финансы**

In [13]:
#Перенос в Финансы
levels_3 = ['30-1522358168288029', '30-1522358189573605', '30-1522358207113085', '30-1522358229306495']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_1'] = 'Финансы'

#level 2: Курс валют
levels_3 = ['31-1522358163146846', '31-1522358190118045', '31-1522358245638452', '31-1522358247066017',
            '31-1522358259182358', '31-1522358259931529', '31-1522358263129975', '31-1522358275050498']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'Курс валют'
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = np.nan

#level 2: Рынок акций
levels_3 = ['30-1522358168288029', '30-1522358189573605', '30-1522358207113085', 
            '30-1522358229306495', '31-1522358164343013', '31-1522358243826568']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'Рынок акций'
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = np.nan

#level 2: Индекс доверия потребителей
levels_3 = ['31-1522358164897304', '31-1522358250867707', '31-1522358287487571']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'Индекс доверия потребителей'
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = np.nan

#level 2: Криптовалюта
levels_3 = ['31-1522358192965367', '31-1522358241159313']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'Криптовалюта'
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = np.nan

#level 2: Инфляция
levels_3 = ['31-1522358196683232']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'Инфляция'
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = np.nan

#level 2: Цены на золото
levels_3 = ['31-1522358272497897']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'Цены на золото'
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = np.nan

### Происшествия

In [14]:
#Перенос в Происшествия

levels_3 = ['20-1522357672400300']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_0'] = 'Происшествия'
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_1'] = np.nan

#--------------------------------------------------------------------------------------------------------------------------------

#level 3: Пожар в «Зимней вишне»
levels_3 = ['60-1522358800329121', '60-1522358819955510']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Пожар в «Зимней вишне»'

#level 4: МЧС установило очаг возгорания в «Зимней вишне»
ids = [8564, 8565, 8566, 8567, 8568, 8569, 8570, 8571, 8563, 8572, 8573, 8574, 8575, 8576, 8577, 8578, 8579, 8580, 8581, 8582, 
       8583, 8584, 8585, 8586, 8587]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'МЧС установило очаг возгорания в «Зимней вишне»'

#level 4: Появилось новое жуткое видео
ids = [8971, 8972, 8973, 8974]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Появилось новое жуткое видео'

#--------------------------------------------------------------------------------------------------------------------------------

#level 3: Автобус с российскими детьми в Берлине

levels_3 = ['60-1522358367819347', '60-1522358369847076', '60-1522358799030257']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Автобус с российскими детьми в Берлине'

#level 4: Остановили автобус с российскими детьми в Берлине
ids = [8140, 8141, 8142, 8143, 8144, 8145, 8146, 8147, 8148, 8149, 8150, 8151, 8152, 
       8153, 8154, 8155, 8156, 8157, 8158, 8159, 8162, 8163, 8165, 8167, 8139, 8168]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Остановили автобус с российскими детьми в Берлине'

#level 4: Посольство РФ в ФРГ проясняет ситуацию
ids = [8160, 8161, 8164, 8166]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Посольство РФ в ФРГ проясняет ситуацию'

#level 4: СК проверит инцидент
ids = [8169, 8170, 8171, 8552, 8553, 8554, 8555, 8556, 8557, 8558, 8559, 8551, 8560, 8561, 8562]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'СК проверит инцидент'

#level 4: Задержанный в Германии разваливающийся автобус с российскими детьми прошел перед выездом все проверки
ids = [8202, 8203, 8204, 8201]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Задержанный в Германии разваливающийся автобус с российскими детьми прошел перед выездом все проверки'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: 60-1522358386130597 -- Uber временно запретили испытывать беспилотные автомобили
levels_3 = ['60-1522358386130597']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Uber временно запретили испытывать беспилотные автомобили'

#level 4: Аризона
ids = [8243, 8244, 8245, 8246, 8247, 8248, 8249, 8250, 8251, 8252, 8253, 8254, 8257, 8242]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Аризона'

#level 4: Калифорния
ids = [8255, 8256]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Калифорния'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: 60-1522358422314247 -- В несколько военных учреждений Вашингтона прислали пакеты со взрывчаткой
levels_3 = ['60-1522358422314247']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'В несколько военных учреждений Вашингтона прислали пакеты со взрывчаткой'

#level 4: Приступник пойман
ids = [8311, 8313, 8290, 8314, 8315]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Приступник пойман'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: В США неизвестный водитель умышленно наехал на людей, есть погибшие
levels_3 = ['60-1522358394084143', '60-1522358429099396']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'В США неизвестный водитель умышленно наехал на людей, есть погибшие'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: 60-1522358794156024 -- В Техасе преступник расстрелял людей и скрылся
levels_3 = ['60-1522358422314247']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'В Техасе преступник расстрелял людей и скрылся'

#level 4: Приступник пойман
ids = [8394, 8395]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Приступник растрелявший людей пойман'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: 60-1522358806332737 -- Вербовщик ИГ в Петербурге
levels_3 = ['60-1522358806332737']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Вербовщик ИГ в Петербурге'

#level 4: Отказался от показаний
ids = [8716, 8717, 8718, 8719, 8721]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Отказался от показаний'

#level 4: Получил 15 лет колонии
ids = [8723, 8724, 8725, 8726, 8727, 8728, 8729, 8730, 8731, 8732, 8733, 8715, 8734, 8735]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Получил 15 лет колонии'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: 60-1522358810781364 -- Подозреваемый по делу о взрыве газа в Мурманске
levels_3 = ['60-1522358810781364']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Подозреваемый по делу о взрыве газа в Мурманске'

#level 4: Умер в больнице
ids = [8772, 8773, 8774, 8775, 8776, 8777, 8778, 8779, 8780, 8781, 8782, 8783, 8784, 8785, 8786, 8787, 8788, 8789, 8790, 8791, 
       8794, 8795, 8799]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Умер в больнице'

#level 4: Находился под действием наркотиков
ids = [8792, 8793, 8796, 8797, 8798]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Находился под действием наркотиков'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: 60-1522358816110956 -- Задохнулись угарным газом
levels_3 = ['60-1522358816110956']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Задохнулись угарным газом'

#level 4: Три человека найдены мертвыми в квартире в Прикамье
ids = [8895, 8896, 8897, 8898, 8899, 8900, 8901, 8902, 8903, 8904, 8909]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Три человека найдены мертвыми в квартире в Прикамье'

#level 4: Число жертв отравления газом в жилом доме в Прикамье увеличилось до пяти
ids = [8905, 8906, 8907, 8908, 8910, 8911, 8912, 8913, 8914, 8915, 8916]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Число жертв отравления газом в жилом доме в Прикамье увеличилось до пяти'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: 60-1522358818565192 -- В ДЛТ на Большой Конюшенной произошел пожар
levels_3 = ['60-1522358818565192']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'В ДЛТ на Большой Конюшенной произошел пожар'

#level 4: Стала известна причина пожара
ids = [8952, 8951, 8953, 8956, 8958, 8960]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Стала известна причина пожара'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: 60-1522358826016130 -- пожар в Ульяновске
levels_3 = ['60-1522358818565192']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Пожар в Ульяновске'

#level 4: Загорелось двухэтажное здание
ids = [9009, 9010, 9011, 9012, 9013, 9014, 9015, 9016, 9020]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Загорелось двухэтажное здание'

#level 4: Потушили пожар на трикотажной фабрике
ids = [9017, 9018]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Потушили пожар на трикотажной фабрике'

#level 4: Произошел от искры во время сварочных работ
ids = [9021, 9022]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Произошел от искры во время сварочных работ'

### Общество

In [15]:
#level 2: 20-1522357702647817 -- Дополнительные выплаты
levels_3 = ['20-1522357702647817']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'Дополнительные выплаты'

#level 3: Мособлдума приняла закон о единовременной денежной выплате жителям Подмосковья старше 70 лет
ids = [3977, 3979, 3980, 3983]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Мособлдума приняла закон о единовременной денежной выплате жителям Подмосковья старше 70 лет'

#level 3: Дополнительную выплату будут предоставлять подмосковным семьям, воспитывающих детей-инвалидов
ids = [3978, 3981, 3982, 3984, 3985, 3986, 3987]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Дополнительную выплату будут предоставлять подмосковным семьям, воспитывающих детей-инвалидов'

#-------------------------------------------------------------------------------------------------------------------------------

#level 2: 20-1522357709281188 -- Тотальный диктант
levels_3 = ['20-1522357709281188']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'Тотальный диктант'
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = np.nan

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: 20-1522357663375399 Олимпиада по астрономии
levels_3 = ['20-1522357663375399']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Олимпиада по астрономии'

#level 4: Школьник из Тобольска стал призером Всероссийской олимпиады по астрономии
ids = [3679, 3680]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Школьник из Тобольска стал призером Всероссийской олимпиады по астрономии'

#level 4: Собянин отметил успехи московских школьников на Всероссийской олимпиаде по астрономии
ids = [3681, 3678, 3682]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Собянин отметил успехи московских школьников на Всероссийской олимпиаде по астрономии'

**Здоровье**

In [16]:
#level 2: Эпидемия гриппа
levels_3 = ['25-1522357669196515', '25-1522357989248904', '25-1522357990599212', '25-1522358000613528',
            '25-1522358006934196', '25-1522358048443090']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'Эпидемия гриппа'
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = np.nan

#--------------------------------------------------------------------------------------------------------------------------------

#level 3: Волоколамск, Яровое, осмотр детей
levels_3 = ['25-1522358020674120', '25-1522358058612903']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Волоколамск, Яровое, осмотр детей'

#level 4: Пробы воды возьмут во всех школах Волоколамска
ids = [4527, 4529, 4531]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Пробы воды возьмут во всех школах Волоколамска'

#level 4: детей ежедневно осматривают медики в Волоколамске
ids = [4528, 4530, 4532, 4533, 4534, 4582, 4583, 4584]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'детей ежедневно осматривают медики в Волоколамске'

**Транспорт**

In [17]:
#Перенос в Транспорт
levels_3 = ['20-1522357659892123']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_1'] = 'Транспорт'

#level 2: 24-1522357702676177 -- развод мостов в Петербурге
levels_3 = ['24-1522357702676177']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'Развод мостов в Петербурге'
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = np.nan

#-------------------------------------------------------------------------------------------------------------------------------

#level 2: Движение поездов
levels_3 = ['60-1522358846297810']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_0'] = 'Общество'
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_1'] = 'Транспорт'
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'Движение поездов'

#level 3: Сбой на «оранжевой» линии метро
ids = [9172, 9173, 9174, 9177, 9178, 9179, 9175, 9176]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Сбой на «оранжевой» линии метро'

#level 4: движение востановленно
ids = [9175, 9176]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'движение востановленно на «оранжевой» линии метро'

#level 3: Сбой на «салатовой» линии метро
ids = [9180, 9181, 9182, 9183, 9184, 9185, 9186, 9188, 9189, 9192, 9196, 9200, 9201, 
       9190, 9194, 9195, 9197, 9203, 9204, 9187, 9191, 9193, 9198, 9199, 9202]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Сбой на «салатовой» линии метро'

#level 4: движение востановленно
ids = [9190, 9194, 9195, 9197, 9203, 9204, 9199, 9202]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'движение востановленно на «салатовой» линии метро'

**Шоу-бизнес**

In [18]:
#level 3: 26-1522358067261562 -- Владимиру Преснякову исполнилось 50 лет
levels_3 = ['26-1522358067261562']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Владимиру Преснякову исполнилось 50 лет'

#level 4: Кристина Орбакайте поблагодарила Преснякова за сына
ids = [4649, 4650, 4651, 4652, 4653, 4654, 4655]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Кристина Орбакайте поблагодарила Преснякова за сына'

### Спорт

In [19]:
#level 3: 50-1522358063041540 -- Фигуристка Медведева будет вести шоу «Ледниковый период. Дети»
levels_3 = ['50-1522358063041540']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Фигуристка Медведева будет вести шоу «Ледниковый период. Дети»'

#level 4: Татьяна Тарасова: «Мне нравится Медведева в шоу „Ледниковый период. Дети“»
ids = [5795, 5797, 5784]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Татьяна Тарасова: «Мне нравится Медведева в шоу „Ледниковый период. Дети“»'

#level 4: Горшков: Медведева абсолютно точно не планирует завершать карьеру
ids = [5798, 5799, 5806]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Горшков: Медведева абсолютно точно не планирует завершать карьеру'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: 50-1522358439502810 -- Получение премии «Серебряная лань»
levels_3 = ['50-1522358439502810']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Получение премии «Серебряная лань»'

#level 4: Тренер «Локомотива» Сёмин получил премию «Серебряная лань»
ids = [5888, 5889, 5890, 5891, 5893, 5895, 5898, 5900, 5901, 5902, 5905, 5887]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Тренер «Локомотива» Сёмин получил премию «Серебряная лань»'

#level 4: Загитова, Медведева и Ласицкене получили премию «Серебряная лань»
ids = [5892, 5897, 5899, 5904, 5908]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Загитова, Медведева и Ласицкене получили премию «Серебряная лань»'

#level 4: Десять российских спортсменов получили награду «Серебряная лань»
ids = [5894, 5896, 5906, 5907]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Десять российских спортсменов получили награду «Серебряная лань»'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: 50-1522358440108849 -- Невыдача виз российским спортсменам
levels_3 = ['50-1522358440108849', '56-1522358459477367', '10-1522357545039284']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_0'] = 'Спорт'
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_1'] = np.nan
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Невыдача виз российским спортсменам'

#level 4: США отказали в визах российским борцам
ids = [5915, 5917, 5927, 5935, 5946, 5947, 5948, 5949, 5950, 5909]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'США отказали в визах российским борцам'

#level 4: В МИД России назвали дискриминацией невыдачу виз российским спортсменам
ids = [5910, 5911, 5912, 5913, 5914, 5918, 5919, 5926, 5933]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'В МИД России назвали дискриминацией невыдачу виз российским спортсменам'

#level 4: Захарова прокомментировала невыдачу виз США
ids = [5916, 5920, 5930]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Захарова прокомментировала невыдачу виз США'

#level 4: Федерация борьбы США рассчитывает, что россиян допустят до Кубка мира
ids = [5921, 5922, 5923, 5925, 5960, 8018, 8025]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Федерация борьбы США рассчитывает, что россиян допустят до Кубка мира'

#level 4: Госдума: Невыдача виз США российским атлетам – удар по мировому спорту
ids = [5936, 5937, 5938, 5939, 5940, 5941, 5942, 5944]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Госдума: Невыдача виз США российским атлетам – удар по мировому спорту'

#level 4: Выяснилось, почему российские борцы не получили американские визы
ids = [5943, 5945, 5951, 5953, 5954]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Выяснилось, почему российские борцы не получили американские визы'

#level 4: Госдеп: Документы российских борцов на визы США всё ещё обрабатываются
ids = [5957, 5958, 5959]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Госдеп: Документы российских борцов на визы США всё ещё обрабатываются'

#level 4: В Госдепе не стали комментировать ситуацию с визами борцов из России
ids = [5924, 5929]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'В Госдепе не стали комментировать ситуацию с визами борцов из России'

#level 4: Дегтярев: невыдача США виз российским спортсменам нанесла удар по мировому спорту
ids = [5932, 5934]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Дегтярев: невыдача США виз российским спортсменам нанесла удар по мировому спорту'

#level 4: Мамиашвили: американцы совсем уже совесть потеряли
ids = [8015, 8016, 8017, 8019, 8020, 8014, 8023, 8024, 8030]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Мамиашвили: американцы совсем уже совесть потеряли'

# Михаил Мамиашвили: «Отказ в выдаче виз не отразится на отношениях борцов из России и США»
ids = [8016, 8021, 8022, 8026, 8027, 8028, 8029]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Михаил Мамиашвили: «Отказ в выдаче виз не отразится на отношениях борцов из России и США»'

**Шахматы**

In [20]:
levels_3 = ['50-1522358449922075']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_1'] = 'Шахматы'

#level 3: 50-1522358449922075 -- Выступление Карякина на турнире
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Выступление Карякина на турнире'

#level 4: Карякин сыграл вничью с Дин Лижэнем в последнем туре турнира претендентов
ids = [6002, 6003, 6004, 6005, 6006, 6007, 6008, 6009, 6010, 6011, 6012, 6023, 6024, 6035]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Карякин сыграл вничью с Дин Лижэнем в последнем туре турнира претендентов'

#level 4: Каруана стал победителем турнира претендентов
ids = [6013, 6014, 6015, 6016, 6017, 6018, 6020, 6021, 6022, 6026, 6036, 6038, 6040, 6041, 6042, 6048, 6049, 6063, 6069]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Каруана стал победителем турнира претендентов'

#level 4: Карякин доволен своим выступлением на турнире претендентов
ids = [6025, 6027, 6030, 6031]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Карякин доволен своим выступлением на турнире претендентов'

#level 4: Сергей Карякин: «Каруана заслужил победу на турнире претендентов»
ids = [6029, 6034, 6039, 6044]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Сергей Карякин: «Каруана заслужил победу на турнире претендентов»'

#level 4: Магнус Карлсен: «Поздравляю Каруану с заслуженной победой. Удачи в ноябре»
ids = [6028, 6033]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Магнус Карлсен: «Поздравляю Каруану с заслуженной победой. Удачи в ноябре»'

#level 4: Каруана назвал партию черными против Крамника самой волнительной на турнире претендентов
ids = [6052, 6055]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Каруана назвал партию черными против Крамника самой волнительной на турнире претендентов'

#level 4: В Российской шахматной федерации разочарованы результатами турнира претендентов
ids = [6058, 6059, 6060]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'В Российской шахматной федерации разочарованы результатами турнира претендентов'

#level 4: Шахматист Непомнящий: Каруана показал феноменальный уровень на турнире
ids = [6065, 6066]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Шахматист Непомнящий: Каруана показал феноменальный уровень на турнире'

#level 4: Шахматист Карякин поделился планом попадания на следующий турнир претендентов
ids = [6067, 6070, 6071]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Шахматист Карякин поделился планом попадания на следующий турнир претендентов'

#level 4: «Карякин выступил неплохо, но его подвел неудачный старт»
ids = [6057, 6061]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = '«Карякин выступил неплохо, но его подвел неудачный старт»'

#level 4: Матч с Карлсеном
ids = [6032, 6054, 6056, 6062]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Матч с Карлсеном'

#level 4: Карякин прокомментировал свой результат на турнире претендентов
ids = [6050, 6053, 6054]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Карякин прокомментировал свой результат на турнире претендентов'

**Футбол**

In [21]:
articles.loc[articles.hr_level_3.isin(['10050-1522358711595816']), 'hr_level_1'] = 'Футбол'

#level 2: Конфликты
levels_3 = ['51-1522358433037515', '51-1522358440483472', '51-1522358462291419', '51-1522358469593545',
            '51-1522358485428234', '51-1522358489312927', '51-1522358491391422', '51-1522358501951149']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'Конфликты'

#-------------------------------------------------------------------------------------------------------------------------------

#level 2: Травмы и пропуск игр
levels_3 = ['51-1522358437307952', '51-1522358441317895', '51-1522358443171734', '51-1522358446708422',
            '51-1522358454322744', '51-1522358459509866', '51-1522358460751327', '51-1522358473897643',
            '51-1522358475139062', '51-1522358486816609', '51-1522358501972592', '51-1522358504580515',
            '51-1522358519969435']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'Травмы и пропуск игр'

#-------------------------------------------------------------------------------------------------------------------------------

#level 2: Стадионы
levels_3 = ['51-1522358433406623', '51-1522358444642263', '51-1522358470964313', '51-1522358473865345',
            '51-1522358477993432', '51-1522358478436407']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'Стадионы'

#-------------------------------------------------------------------------------------------------------------------------------

#level 2: Трансфер игроков и тренеров
levels_3 = ['51-1522358432878641', '51-1522358435108016', '51-1522358438177154', '51-1522358441110012',
            '51-1522358446952877', '51-1522358447679979', '51-1522358458285351', '51-1522358462320815',
            '51-1522358462958414', '51-1522358466887549', '51-1522358480672737', '51-1522358484851253',
            '51-1522358487387135', '51-1522358489517010', '51-1522358494539790', '51-1522358499262430',
            '51-1522358499828508', '51-1522358500411175', '51-1522358503787802', '51-1522358508183932',
            '51-1522358508984149', '51-1522358511868672', '51-1522358513108289', '51-1522358526248827',
            '51-1522358528524208']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'Трансфер игроков и тренеров'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: 51-1522358431986411 -- ФИФА утвердила списки арбитров
levels_3 = ['51-1522358431986411']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'ФИФА утвердила списки арбитров. Карасев стал судьей чемпионата мира'

#level 4: ФИФА опубликовала список судей ЧМ-2018
ids = [6106, 6107, 6115, 6113, 6135, 6139, 6141, 6147]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'ФИФА опубликовала список судей ЧМ-2018'

#level 4: Российский арбитр Карасёв будет обслуживать матчи ЧМ-2018
ids = [6098, 6099, 6102, 6104, 6105, 6110, 6112, 6118, 6120, 6123, 6125, 6129, 6133, 6149, 6097, 6153]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Российский арбитр Карасёв будет обслуживать матчи ЧМ-2018'

#level 4: Сергей Карасев - о работе на ЧМ-2018: "Спасибо за поздравления!"
ids = [6100, 6154, 6155, 6144, 6126]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Сергей Карасев - о работе на ЧМ-2018: "Спасибо за поздравления!"'

#level 4: Судьи из Великобритании впервые с 1938 года не будут работать на чемпионате мира
ids = [6101, 6108, 6121, 6122, 6131, 6134, 6136, 6140, 6143, 6148, 6150, 6156]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Судьи из Великобритании впервые с 1938 года не будут работать на чемпионате мира'

#level 4: Комментарии по поводу русских судей на ЧМ 
ids = [6103, 6109, 6111, 6114, 6116, 6117, 6119, 6124, 6127, 6128, 6130, 6132, 6137, 6138, 6142]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Комментарии по поводу русских судей на ЧМ '

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: 51-1522358432878641 -- Смолов переходит в «Вест Хэм» до ЧМ-2018
levels_3 = ['51-1522358432878641']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Переход в «Вест Хэм» до ЧМ-2018'

#level 4: Смолов намерен оформить переход в «Вест Хэм» до ЧМ-2018
ids = [6158, 6159, 6160, 6161, 6162, 6163, 6164, 6165, 6157, 6166, 6167, 6168, 6169, 6170, 6176, 6179, 6180]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Смолов намерен оформить переход в «Вест Хэм» до ЧМ-2018'

#level 4: В ФК «Краснодар» назвали информацию о переходе Смолова в «Вест Хэм Юнайтед» вбросом
ids = [6171, 6174, 6175, 6178, 6181, 6182, 6183, 6184, 6186, 6188]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'В ФК «Краснодар» назвали информацию о переходе Смолова в «Вест Хэм Юнайтед» вбросом'

#level 4: В «Вест Хэме» уверены в переходе Смолова за 15 миллионов фунтов
ids = [6172, 6173, 6177, 6187]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'В «Вест Хэме» уверены в переходе Смолова за 15 миллионов фунтов'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: 51-1522358460751327 -- Тевес получил травму, играя в футбол в тюрьме
levels_3 = ['51-1522358460751327']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Тевес получил травму, играя в футбол в тюрьме'

#level 4: Тевес: я не такой идиот, чтобы пойти в тюрьму и получить там травму
ids = [6398, 6399, 6400]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Тевес: я не такой идиот, чтобы пойти в тюрьму и получить там травму'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: 51-1522358475803635 -- Расистские выкрики в матче Россия – Франция
levels_3 = ['51-1522358475803635']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Расистские выкрики в матче Россия – Франция'

#level 4: ФИФА попросили начать расследование расистских выкриков в матче Россия – Франция
ids = [6479, 6481, 6483, 6486, 6489, 6493, 6494, 6497, 6498, 6499, 6492, 6497, 6498, 6499, 6500, 6511, 6533]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'ФИФА попросили начать расследование расистских выкриков в матче Россия – Франция'

#level 4: Игроки сборной Франции не сталкивались в России с проявлением расизма
ids = [6480, 6487, 6502, 6503, 6507, 6508, 6516, 6520, 6522, 6526, 6527, 6539]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Игроки сборной Франции не сталкивались в России с проявлением расизма'

#level 4: РФС опроверг слухи о расистских выкриках во время футбольного матча Россия – Франция
ids = [6484, 6512, ]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'РФС опроверг слухи о расистских выкриках во время футбольного матча Россия – Франция'

#level 4: РФС проверит случаи проявления расизма на матче сборных России и Франции
ids = [6482, 6485, 6488, 6490, 6491, 6495, 6496, 6501, 6504, 6505, 6506, 6509, 6510, 6515, 6536]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'РФС проверит случаи проявления расизма на матче сборных России и Франции'

#level 4: ФИФА занялась поисками доказательств случаев расизма на матче Россия - Франция
ids = [6513, 6514, 6517, 6518, 6519, 6523, 6524, 6528, 6529, 6478, 6530, 6537, 6538, 6540]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'ФИФА занялась поисками доказательств случаев расизма на матче Россия - Франция'

#level 4: Посольство Франции не слышало расистских выкриков
ids = [6531, 6532, 6534, 6535]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Посольство Франции не слышало расистских выкриков'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: Аргентина проиграла без Месси
levels_3 = ['51-1522358528745958', '51-1522358530042159']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Аргентина проиграла без Месси'

#level 4: Месси пропустит матч с Испанией
ids = [6854, 6855, 6856, 6857, 6858, 6859, 6860, 6861, 6862, 6863, 6864, 6865, 6866, 6867, 6868, 6869, 6870, 6871, 6872, 6873, 
       6874, 6875, 6876, 6877, 6878, 6879, 6880, 6881, 6882, 6883, 6884]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Месси пропустит матч с Испанией'

#level 4: Все увидели, что собой представляет Аргентина без Месси
ids = [6885, 6886, 6887, 6888, 6889, 6890, 6891, 6892]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Все увидели, что собой представляет Аргентина без Месси'

**Автоспорт**

In [22]:
articles.loc[articles.hr_level_3.isin(['50-1522358436086574']), 'hr_level_1'] = 'Автоспорт'

#--------------------------------------------------------------------------------------------------------------------------------

#level 2: команды Формулы 1
levels_3 = ['10050-1522358686061870', '10050-1522358689567551', '10050-1522358690226207', '10050-1522358690787850',
            '10050-1522358692644513', '10050-1522358696238521', '10050-1522358698034111']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'команды Формулы 1'

#level 3: новый пилот развития «Хааса»
ids = [515, 516, 517, 518]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'новый пилот развития «Хааса»'

#level 3: В Бахрейне гонщики „Феррари“ будут очень быстры
ids = [520, 522, 523]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'В Бахрейне гонщики „Феррари“ будут очень быстры'

#level 3: Хэмилтон выступал без поддержки Боттаса
ids = [519, 521]
articles.loc[articles.id.isin([519, 521]), 'hr_level_3'] = 'Хэмилтон выступал без поддержки Боттаса'

#level 3: отношения «Хааса» и «Феррари»
ids = [524, 525, 526, 527]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Отношения «Хааса» и «Феррари»'

#level 3: Монтойя выступит в гонке «24 часа Ле Мана»
ids = [528, 529, 530]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Монтойя выступит в гонке «24 часа Ле Мана»'

#level 3: Проблемы с двигателем „Хонда“
ids = [531, 532]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Проблемы с двигателем „Хонда“'

#level 3: «Торо Россо» борется с «Уильямсом» и «Форс Индия»
ids = [533]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = '«Торо Россо» борется с «Уильямсом» и «Форс Индия»'

#level 3: Запрет квалификационных режимов работы моторов «Мерседес»
ids = [534, 535, 536]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Запрет квалификационных режимов работы моторов «Мерседес»'

#level 3: Ошибка механика «Хааса» на пит-стопе
ids = [537, 538, 539, 540]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Ошибка механика «Хааса» на пит-стопе'

**Баскетбол**

In [23]:
#level 3: 53-1522358466196271 -- «Нижний Новгород» победил «Умана Рейер», но вылетел из Кубка Европы по баскетболу
levels_3 = ['53-1522358466196271']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = '«Нижний Новгород» победил «Умана Рейер», но вылетел из Кубка Европы по баскетболу'

#level 4: Клуб «Нижний Новгород» вылетел из Кубка Европы
articles.loc[articles.id.isin([7481, 7482, 7483, 7487]), 'hr_level_4'] = 'Клуб «Нижний Новгород» вылетел из Кубка Европы'

#level 4: Лукич про игру с «Умана Рейер»
articles.loc[articles.id.isin([7480, 7485]), 'hr_level_4'] = 'Лукич про игру с «Умана Рейер»'

#level 4: Губанов про игру с «Умана Рейер»
articles.loc[articles.id.isin([7484, 7486]), 'hr_level_4'] = 'Губанов про игру с «Умана Рейер»'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: 53-1522358600371673 -- Матч «Химки» — «Фенербахче»
levels_3 = ['53-1522358600371673']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Матч «Химки» — «Фенербахче»'

#level 4: анонс Матча «Химки» — «Фенербахче»
ids = [7488, 7489, 7490, 7492, 7493]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'анонс Матча «Химки» — «Фенербахче»'

#level 4: Георгиос Барцокас: нужно преодолеть проблемы с травмированными игроками
ids = [7490, 7507, 7512]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Георгиос Барцокас: нужно преодолеть проблемы с травмированными игроками'

#level 4: «Химки» проиграли «Фенербахче»
ids = [7491, 7496, 7497, 7498, 7499, 7500, 7501, 7502, 7503, 7508, 7513, 7514]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = '«Химки» проиграли «Фенербахче»'

#level 4: Швед установил новый рекорд Евролиги
ids = [7494, 7495]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Швед установил новый рекорд Евролиги'

#level 4: Павел Астахов: «Химки» достойно сыграли с «Фенербахче»
ids = [7505, 7509]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Павел Астахов: «Химки» достойно сыграли с «Фенербахче»'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: «Лейкерс» вырвали победу над «Далласом»
articles.loc[articles.id.isin([7526, 7528, 7529]), 'hr_level_3'] = '«Лейкерс» вырвали победу над «Далласом»'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: Айзея Томас пропустит концовку сезона из-за операции на бедре
articles.loc[articles.id.isin([7527, 7548, 7549, 7550, 7551, 7552, 7553]), 'hr_level_3'] = 'Айзея Томас пропустит концовку сезона из-за операции на бедре'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: 53-1522358610520029 -- Матч «Милуоки» - «Голден Стэйт»
levels_3 = ['53-1522358610520029']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Матч «Милуоки» - «Голден Стэйт»'

#level 4: Дюрант примет участие в матче с «Милуоки»
ids = [7555, 7556]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Дюрант примет участие в матче с «Милуоки»'

#level 4: «Милуоки» нанес «Голден Стэйт» третье поражение подряд
ids = [7557, 7558]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = '«Милуоки» нанес «Голден Стэйт» третье поражение подряд'

#level 4: Дюрант повторил рекорд по количеству удалений за сезон
ids = [7559, 7560]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Дюрант повторил рекорд по количеству удалений за сезон'

#level 4: Дюрант - ницензурная брань
ids = [7561, 7562, 7563, 7564]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Дюрант - ницензурная брань'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: 53-1522358605630849 -- Матч «Бостон» - «Юта»
levels_3 = [' 53-1522358605630849']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Матч «Бостон» - «Юта»'

#level 4: «Бостон» вырвал победу у «Юты» в матче НБА
articles.loc[articles.id.isin([7537, 7539, 7540]), 'hr_level_4'] = '«Бостон» вырвал победу у «Юты» в матче НБА'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: «Индиана» победила «Голден Стэйт»
articles.loc[articles.id.isin([7554, 7572, 7573, 7574, 7575]), 'hr_level_3'] = '«Индиана» победила «Голден Стэйт»'

#-------------------------------------------------------------------------------------------------------------------------------

#level 2: Единая лига ВТБ
levels_3 = ['53-1522358613218070', '53-1522358625928802']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'Единая лига ВТБ'
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = np.nan

#level 3: Казанский УНИКС вырвал победу у «Химок»
ids = [7578, 7592, 7593, 7594, 7595, 7596, 7597, 7598, 7600]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Казанский УНИКС вырвал победу у «Химок»'

#level 3: ЦСКА дома победил «Енисей»
ids = [7588, 7590, 7591]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'ЦСКА дома победил «Енисей»'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: Леброн Джеймс набрал более 2000 очков за сезон
ids = [7604, 7606, 7601]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Леброн Джеймс набрал более 2000 очков за сезон'

#-------------------------------------------------------------------------------------------------------------------------------

#level 2: Выход в плей-офф НБА
levels_3 = ['53-1522358631808935']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'Выход в плей-офф НБА'
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = np.nan

#level 3: «Индиана» в овертайме обыграла «Майами»
ids = [7610, 7611, 7612, 7616]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = '«Индиана» в овертайме обыграла «Майами»'

#level 3: «Филадельфия» вышла в плей-офф НБА
ids = [7613, 7614, 7615]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = '«Филадельфия» вышла в плей-офф НБА'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: 53-1522358637073240 -- матч «Оклахома-Сити» - «Портленд»
levels_3 = ['53-1522358637073240 ']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'матч «Оклахома-Сити» - «Портленд»'

#level 4: «Портленд» победил «Оклахому»
ids = [7634, 7635, 7636]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = '«Портленд» победил «Оклахому»'

#level 4: В матче «Оклахома-Сити» - «Портленд» произошла массовая потасовка
ids = [7637, 7638]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'В матче «Оклахома-Сити» - «Портленд» произошла массовая потасовка'

**Теннис**

In [24]:
#level 2: Miami Open
levels_3 = ['54-1522358643371631', '54-1522358644025319', '54-1522358644719564', '54-1522358645511978',
            '54-1522358646102676', '54-1522358648737892', '54-1522358650528918', '54-1522358651742108',
            '54-1522358653365172', '54-1522358653869253', '54-1522358654066542', '54-1522358655938663',
            '54-1522358657544645', '54-1522358658164071', '54-1522358659548040', '54-1522358660978999',
            '54-1522358661764930', '54-1522358663280200', '54-1522358663849354', '54-1522358665101010',
            '54-1522358665985131', '54-1522358667689860', '54-1522358671117272', '54-1522358672033905',
            '54-1522358674191195', '54-1522358646805613']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'Miami Open'

levels_3 = ['54-1522358643371631']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = np.nan

#level 3: Хуан Мартин Дель Потро вышел в четвертьфинал
ids = [7649, 7650, 7651, 7652, 7653]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Хуан Мартин Дель Потро вышел в четвертьфинал'

#level 3: Дель Потро вышел в полуфинал турнира в Майами
ids = [7665, 7666, 7667, 7668, 7664, 7669, 7670]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Дель Потро вышел в полуфинал турнира в Майами'

#level 3: Встреча Порто с Раоничем
ids = [7656, 7659, 7657, 7660]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Встреча Порто с Раоничем'

#level 3: Краинович снялся с турнира в Марракеше
ids = [7661, 7663]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Краинович снялся с турнира в Марракеше'

#level 3: Хуан Мартин Дель Потро выиграл 14 матчей подряд
ids = [7654, 7655, 7658, 7662]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Хуан Мартин Дель Потро выиграл 14 матчей подряд'

#level 3: Азаренко пробилась в полуфинал турнира в Майами
ids = [7767, 7768, 7769, 7770, 7771, 7774, 7775, 7776, 7781]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Азаренко пробилась в полуфинал турнира в Майами'

#level 3: Матч Стивенс и Кербер
levels_3 = ['54-1522358646805613', '54-1522358650528918']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Матч Стивенс и Кербер'

ids = [7763, 7764, 7765, 7766]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Матч Стивенс и Кербер'

#level 3: Матч Бердыха и Тиафо
ids = [7851, 7858, 7846, 7847, 7849, 7850, 7851]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Матч Бердыха и Тиафо'

#level 3: Хачанов уступил Андерсону
ids = [7838, 7839, 7840, 7841, 7842, 7843, 7844, 7845, 7848, 7837, 7854, 7855, 7856, 7857]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Хачанов уступил Андерсону'

#level 3: Каррено-Буста вышел в четвертьфинал турнира в Майами
ids = [7852, 7853]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Каррено-Буста вышел в четвертьфинал турнира в Майами'

#level 3: Шаповалов обыграл Куэрри в Майами
ids = [7872, 7873, 7874]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Шаповалов обыграл Куэрри в Майами'

#level 3: Чорич одолел Сока в третьем круге «Мастерса» в Майами
ids = [7875, 7876]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Чорич одолел Сока в третьем круге «Мастерса» в Майами'

#level 3: Шаповалов уступил Чоричу в четвёртом круге «Мастерса» в Майами
ids = [7880, 7877, 7878, 7879, 7871, 7881, 7882, 7883]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Шаповалов уступил Чоричу в четвёртом круге «Мастерса» в Майами'

#levels 3: Уильямс против Конта
levels_3 = ['54-1522358663849354', '54-1522358676614367']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Уильямс против Конта'

#level 3: Встреча Коллинз с Уильямс
levels_3 = ['54-1522358644025319']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Встреча Коллинз с Уильямс'

#level 4: Коллинз: с нетерпением жду матча с В. Уильямс, я восхищаюсь этой теннисисткой
ids = [7672, 7673, 7681, 7685, 7686]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Коллинз: с нетерпением жду матча с В. Уильямс, я восхищаюсь этой теннисисткой'

#level 4: Винус Уильямс вылетела в четвертьфинале турнира в Майами
ids = [7674, 7675, 7676, 7677, 7678, 7679, 7680, 7671, 7683]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Винус Уильямс вылетела в четвертьфинале турнира в Майами'

#level 4: Винус Уильямс: Мне просто не повезло
ids = [7682, 7684]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Винус Уильямс: Мне просто не повезло'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: Встреча Остапенко с Свитолиной
levels_3 = ['54-1522358644719564']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Встреча Остапенко с Свитолиной'

#7701 - содержит информацию и о других матчах
articles.loc[articles.id.isin([7701]), 'hr_level_3'] = np.nan

#level 4: Остапенко обыграла Свитолину и вышла в полуфинал турнира в Майами
ids = [7700, 7702, 7703, 7704, 7705, 7706, 7707]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Остапенко обыграла Свитолину и вышла в полуфинал турнира в Майами'

#level 4: Елена Остапенко: Я победила, и это главное
ids = [7699, 7708, 7712, 7713]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Елена Остапенко: Я победила, и это главное'

#level 4: Свитолина: в матче с Остапенко я временами выпадала из игры
ids = [7709, 7710, 7711, 7714]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Свитолина: в матче с Остапенко я временами выпадала из игры'

#-------------------------------------------------------------------------------------------------------------------------------

#level 2: Кубок Дэвиса
levels_3 = ['54-1522358657630439', '54-1522358660374317', '54-1522358664060062']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'Кубок Дэвиса'

#-------------------------------------------------------------------------------------------------------------------------------

#level 2: турнир ITF
levels_3 = ['54-1522358449394924']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'турнир ITF'
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = np.nan

#level 3: Калинская обыграла Звонареву в первом раунде турнира ITF
ids = [7640, 7643 , 7644, 7646]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Матч между Калинской и Звонарёвой'

#level 3: Анна Блинкова пробилась в полуфинал турнира ITF
ids = [7647, 7648]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Анна Блинкова пробилась в полуфинал турнира ITF'

#-------------------------------------------------------------------------------------------------------------------------------

levels_3 = ['54-1522358646805613']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = np.nan

#level 3: Турнир Азаренко и Агнешка Радванская в США
ids = [7752, 7753, 7754, 7755, 7756, 7757, 7758, 7760]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Турнир Азаренко и Агнешка Радванская в США'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: матч Азаренко с Плишковой
ids = [7759, 7761, 7783, 7784]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'матч Азаренко с Плишковой'

#level 4: Плишкова: я могла бы лучше подавать
ids = [7783, 7784]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Плишкова: я могла бы лучше подавать'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: Азаренко вернётся в топ-100 рейтинга WTA
ids = [7762, 7772, 7773, 7777, 7778, 7779, 7751, 7780, 7782]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Азаренко вернётся в топ-100 рейтинга WTA'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: Шарапова в Мадриде
levels_3 = ['54-1522358644681927', '54-1522358650525420']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Шарапова в Мадриде'

**Единоборства**

In [25]:
#level 3: 56-1522358434847527 -- Поветкин и Прайс
levels_3 = ['56-1522358434847527']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Поветкин и Прайс'

#level 4: Прайс: мне всё равно, как я выиграю у Поветкина
ids = [7981, 7982, 7983, 7984, 7985, 7991, 7994, 7995]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Прайс: мне всё равно, как я выиграю у Поветкина'

#level 4: Дэвид Прайс: Не буду переживать по поводу допинг-проб Поветкина
ids = [7986, 7990]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Дэвид Прайс: Не буду переживать по поводу допинг-проб Поветкина'

#level 4: Поветкин и Прайс провели дуэль взглядов
ids = [7993, 7996]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Поветкин и Прайс провели дуэль взглядов'

#level 3: Поветкин и Джошуа
ids = [7988, 7989, 8003, 8004, 8007, 7997, 7998, 7999, 8002, 8005, 8050, 8051]
articles.loc[articles.id.isin(ids), 'hr_level_3'] = 'Поветкин и Джошуа'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: 56-1522358458879590 -- допинговое разбирательство с Альвареса
levels_3 = ['56-1522358458879590']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'допинговое разбирательство с Альвареса'

#level 4: Альваресу грозит годовое отстранение от боёв
ids = [8009, 8010, 8011]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Альваресу грозит годовое отстранение от боёв'

#level 4: Заседание комиссии по допинговому делу Альвареса перенесено
ids = [8012, 8008, 8013]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Заседание комиссии по допинговому делу Альвареса перенесено'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: 56-1522358734767560

#level 4: Абель Санчес: «Если Усик будет драться также, как с Бриедисом, бой будет коротким»
ids = [8032, 8033, 8034]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Абель Санчес: «Если Усик будет драться также, как с Бриедисом, бой будет коротким»'

#level 4: Нурмагомедов - Фергюсону: «Не понял твоего английского. Ты говоришь, как тупица»
ids = [8039, 8040, 8041, 8037, 8042, 8043, 8044]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Нурмагомедов - Фергюсону: «Не понял твоего английского. Ты говоришь, как тупица»'

#-------------------------------------------------------------------------------------------------------------------------------

#Перенос в тему про Мейвезера
articles.loc[articles.id.isin([8070]), 'hr_level_3'] = '56-1522358747854019'

**Хоккей**

In [26]:
#level 3: 52-1522358433638082 -- Шипачёв не вошёл в состав СКА на первый матч с ЦСКА в финале Запада
levels_3 = ['52-1522358433638082']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Шипачёв не вошёл в состав СКА на первый матч с ЦСКА в финале Запада'

#level 4: Шипачёв не вошёл в состав СКА
ids = [6907, 6908, 6909, 6910, 6911, 6912, 6913]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Шипачёв не вошёл в состав СКА'

#level 4: Вадим Шипачев: Не знаю, почему не играю
ids = [6914, 6918, 6919, 6920, 6921]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'Вадим Шипачев: Не знаю, почему не играю'

#level 4: А. Медведев — об отсутствии Шипачёва
ids = [6915, 6916]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'А. Медведев — об отсутствии Шипачёва'

#--------------------------------------------------------------------------------------------------------------------------------

#level 3: «Ак Барс» — «Трактор»
levels_3 = ['52-1522358464867876', '52-1522358533377535', '52-1522358550334864']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = '«Ак Барс» — «Трактор»'

#level 3: КХЛ исключила «Ладу» и «Югру»
levels_3 = ['52-1522358532262913', '52-1522358539602871', '52-1522358552801506', '52-1522358554651727', 
            '52-1522358558581500', '52-1522358564576895', '52-1522358568435514', '52-1522358577339066']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'КХЛ исключила «Ладу» и «Югру»'

**Биатлон**

In [27]:
levels_3 = ['50-1522358437857288', '50-1522358445897039']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_1'] = 'Биатлон'

**Волейбол**

In [28]:
levels_3 = ['50-1522358433895381']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_1'] = 'Волейбол'

### Политика

In [29]:
#level 2: Высылка российских дипломатов
levels_3 = ['10-1522357532388524', '10-1522357543573478', '10-1522359441377649', '10-1522359441934261',
            '10-1522357527807416', '10-1522359470089768', '10-1522357557881127', '10-1522357576435293',
            '10-1522357587496964', '10-1522357589546208', '10-1522359456537208', '10-1522359466390301']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'Высылка российских дипломатов'

#level 2: Дело Скрипаля
levels_3 = ['10-1522357535673002', '10-1522357537520689', '10-1522357549945336', '10-1522357554029439',
            '10-1522358384371986', '10-1522357566396112', '10-1522358388926880', '10-1522358405369729',
            '10-1522357581620680', '20-1522358425683059', '60-1522358792221929', '60-1522358797577072', 
            '60-1522358807985171', '60-1522358829634639']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_0'] = 'Политика'
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_1'] = np.nan
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'Дело Скрипаля'

#level 3: Отставка Тулеева
levels_3 = ['10-1522357534982183', '10-1522357555928981', '10-1522359450029403']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Отставка Тулеева'

#level 3: Арест активов РФ в США
levels_3 = ['10-1522357530452393', '10-1522357540360155', '10-1522357549077089']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Арест активов РФ в США'

#level 3: Германия выдала полный комплект разрешений на строительство Nord Stream 2
levels_3 = ['10-1522358411919017', '10-1522358427150663']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Германия выдала полный комплект разрешений на строительство Nord Stream 2'

**Армия и оружие**

In [30]:
#level 2: Конфликт в Восточной Гуте
levels_3 = ['11-1522357541019990', '11-1522357548772748', '11-1522357553109061', '11-1522357596340007',
            '11-1522357619193535', '11-1522357625094719']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_2'] = 'Конфликт в Восточной Гуте'

#level 3: Гуманитарные паузы
levels_3 = ['11-1522357553109061', '11-1522357619193535', '11-1522357625094719']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Гуманитарные паузы'

#level 4: ЧВК «Вагнер» контролируют выход боевиков из Восточной Гуты
ids = [3270, 3271, 3272, 3273, 3274]
articles.loc[articles.id.isin(ids), 'hr_level_4'] = 'ЧВК «Вагнер» контролируют выход боевиков из Восточной Гуты'

#-------------------------------------------------------------------------------------------------------------------------------

#level 3: Patriot в Польше
levels_3 = ['11-1522357603921985', '11-1522357601313651']
articles.loc[articles.hr_level_3.isin(levels_3), 'hr_level_3'] = 'Patriot в Польше'


In [31]:
levels_visualization(articles, ['hr_level_0', 'hr_level_1', 'hr_level_2', 'hr_level_3', 'hr_level_4'])

In [32]:
articles.to_csv('../data/interim/articles_new.csv', index=False)