In [1]:
import pymorphy2
import nltk
import ujson as json
import matplotlib.pyplot as plt
import numpy as np
import itertools
import gzip

from datetime import datetime

from collections import Counter

In [2]:
class Document:
    def __init__(self, init_dict):
        self.title = init_dict.get('title', '')
        self.description = init_dict.get('description', '')
        self.url = init_dict.get('url', '')
        self.site = init_dict.get('site', '')
        self.ts = datetime.fromtimestamp(init_dict['ts']) if 'ts' in init_dict else -1
    
    def __str__(self):
        res = ''
        res += 'url : %s\n' % self.url
        res += 'date : %s\n' % self.ts
        res += 'title : %s\n' % self.title
        res += 'description : %s\n' % self.description
        res += 'site : %s\n' % self.site
        return res

In [3]:
fin = gzip.open('dataset_mai.jsonl.gz')
for line in itertools.islice(fin, 10):
    data = json.loads(line.strip())
    print(Document(data))

url : http://bloknot-volzhsky.ru/news/volzhane-mogut-podat-zayavlenie-na-letnie-putevki-
date : 2019-11-30 18:26:10
title : Волжане могут подать заявление на летние путевки для детей
description : С понедельника заявления начинают принимать в МФЦ
site : bloknot-volzhsky.ru

url : https://trikky.ru/test-na-znanie-russkogo-yazyka-423354.html
date : 2019-11-30 18:26:48
title : 💗Тест на знание русского языка💗
description : Тест со сложными и легкими вопросами. Для кого-то будет легко набрать все 100 баллов, а кому-то будет немного тяжело. В любом случае попробовать стоит.1. Что изучает фразеология? способы образования слов устойчивые сочетания слов части речи2. На месте каких цифр в словах пишется н? В простенке между занавеше(1)ыми окнами были установле(2)ы часы, а рядом с ними […]
site : trikky.ru

url : https://topwar.ru/165315-chernomorskij-flot-popolnilsja-150-tonnym-plavkranom-proekta-02690.html
date : 2019-11-30 18:26:43
title : Черноморский флот пополнился 150-тонным плавкраном про

In [4]:
fin = gzip.open('dataset_mai.jsonl.gz')
dataset = []
dataset_test = []
for line in itertools.islice(fin, 10000):
    data = json.loads(line.strip())
    dataset.append(Document(data))
    
for line in itertools.islice(fin, 5000):
    data = json.loads(line.strip())
    dataset_test.append(Document(data))

In [5]:
test_doc = dataset[11]
print(test_doc)

url : https://trikky.ru/kakoy-ty-napitok-423256.html
date : 2019-11-30 18:26:48
title : Какой ты напиток?
description : Какой ты напиток?Зелёненький,свеженький мохито,или взрывной лимонад?А может быть,Кока Кола?Сейчас  и узнаем!1. Какой вкус в напитках тебе больше всего нравится? Яркие цвета - вот что самое главное! Эта многослойность напитков заставляет завораживаться... Сладость,я такая сладкоежка! Я обожаю газировку,такая взрывная,как шипучка!2. Какие типы цветов напитков тебе больше нравятся? Холодные(голубые,синие,фиолетовые разных оттенков) Чёрный/Белый/Белый в крапинку Зелёные,цвет природы. Яркие […]
site : trikky.ru



### Как поделить текст на слова?

In [6]:
def print_words(a_document, a_split_func):
    print('------TITLE----------')
    for word in a_split_func(test_doc.title):
        print(word)

    print('------DESCRIPTION----------')
    for word in a_split_func(test_doc.description):
        print(word)

In [7]:
### Побить по пробелам?
def split_words_v1(a_text):
    for word in a_text.split():
        yield word

print_words(test_doc, split_words_v1)

------TITLE----------
Какой
ты
напиток?
------DESCRIPTION----------
Какой
ты
напиток?Зелёненький,свеженький
мохито,или
взрывной
лимонад?А
может
быть,Кока
Кола?Сейчас
и
узнаем!1.
Какой
вкус
в
напитках
тебе
больше
всего
нравится?
Яркие
цвета
-
вот
что
самое
главное!
Эта
многослойность
напитков
заставляет
завораживаться...
Сладость,я
такая
сладкоежка!
Я
обожаю
газировку,такая
взрывная,как
шипучка!2.
Какие
типы
цветов
напитков
тебе
больше
нравятся?
Холодные(голубые,синие,фиолетовые
разных
оттенков)
Чёрный/Белый/Белый
в
крапинку
Зелёные,цвет
природы.
Яркие
[…]


In [8]:
### Побить по всем не буквам и цифрам?
def split_words_v2(a_text):
    cur_word = ''
    for letter in a_text:
        if letter.isalnum():
            cur_word += letter
        else:
            if cur_word: yield cur_word
            cur_word = ''
            
    if cur_word: yield cur_word
    
print_words(test_doc, split_words_v2)

------TITLE----------
Какой
ты
напиток
------DESCRIPTION----------
Какой
ты
напиток
Зелёненький
свеженький
мохито
или
взрывной
лимонад
А
может
быть
Кока
Кола
Сейчас
и
узнаем
1
Какой
вкус
в
напитках
тебе
больше
всего
нравится
Яркие
цвета
вот
что
самое
главное
Эта
многослойность
напитков
заставляет
завораживаться
Сладость
я
такая
сладкоежка
Я
обожаю
газировку
такая
взрывная
как
шипучка
2
Какие
типы
цветов
напитков
тебе
больше
нравятся
Холодные
голубые
синие
фиолетовые
разных
оттенков
Чёрный
Белый
Белый
в
крапинку
Зелёные
цвет
природы
Яркие


In [9]:
### Что делать с разными написаниями iphone6 и iphone 6 ? Как сделать чтобы всегда получать одну версию разбиения?
## Можно оставить студентам написать?
test_text = 'Где купить iPhone 6? и почему iPhone6 стоит так дорого?'
print(list(split_words_v1(test_text)))
print(list(split_words_v2(test_text)))

['Где', 'купить', 'iPhone', '6?', 'и', 'почему', 'iPhone6', 'стоит', 'так', 'дорого?']
['Где', 'купить', 'iPhone', '6', 'и', 'почему', 'iPhone6', 'стоит', 'так', 'дорого']


## Реализовать функцию которая единообразно будет разбивать такие строки?

In [10]:
def split_words_v3(a_text):
    cur_word = ''
    prev_is_alpha = False

    for letter in a_text:
        if  (letter.isalpha() and prev_is_alpha or 
            letter.isdigit() and not prev_is_alpha):
            cur_word += letter
        elif (letter.isalpha() and not prev_is_alpha or
             letter.isdigit() and prev_is_alpha):
            if cur_word: yield cur_word
            cur_word = letter
            prev_is_alpha = not prev_is_alpha
        else:
            if cur_word: yield cur_word
            cur_word = ''
            prev_is_alpha = False
    if cur_word: yield cur_word
         
print(list(split_words_v3(test_text)))

['Где', 'купить', 'iPhone', '6', 'и', 'почему', 'iPhone', '6', 'стоит', 'так', 'дорого']


In [11]:
words = list(split_words_v2(test_doc.title + ' ' + test_doc.description))

In [12]:
len(words)

74

In [13]:
uniq_words = Counter(words)
print("NumKeys : ", len(uniq_words))
print(uniq_words.most_common(10))

NumKeys :  63
[('Какой', 3), ('ты', 2), ('напиток', 2), ('в', 2), ('тебе', 2), ('больше', 2), ('Яркие', 2), ('напитков', 2), ('такая', 2), ('Белый', 2)]


## Могут ли быть разные написания одного слова?

In [14]:
def get_norm_word_v1(a_word):
    return a_word.lower()

uniq_words = Counter(get_norm_word_v1(word) for word in words)
print("NumKeys : ", len(uniq_words))
print(uniq_words.most_common(10))
### ('я', 2)

NumKeys :  62
[('какой', 3), ('ты', 2), ('напиток', 2), ('в', 2), ('тебе', 2), ('больше', 2), ('яркие', 2), ('напитков', 2), ('я', 2), ('такая', 2)]


In [15]:
from nltk.stem.snowball import RussianStemmer

In [16]:
stemmer = RussianStemmer()

In [17]:
stemmer.stem('Напитков')

'напитк'

In [18]:
def get_norm_word_v2(a_word):
    return stemmer.stem(a_word)

In [19]:
uniq_words = Counter(get_norm_word_v2(word) for word in words)
print("NumKeys : ", len(uniq_words))
print(uniq_words.most_common(10))
### ('я', 2)

NumKeys :  55
[('как', 5), ('напитк', 3), ('цвет', 3), ('ты', 2), ('напиток', 2), ('взрывн', 2), ('в', 2), ('теб', 2), ('больш', 2), ('нрав', 2)]


In [20]:
for word in words:
    if get_norm_word_v2(word) == 'как':
        print(word)

Какой
Какой
Какой
как
Какие


In [21]:
for word in words:
    if get_norm_word_v2(word) == 'цвет':
        print(word)

цвета
цветов
цвет


In [22]:
morth_analyzer = pymorphy2.MorphAnalyzer()

In [23]:
res = morth_analyzer.parse('Какая') #Какая , Напитков

In [24]:
res

[Parse(word='какая', tag=OpencorporaTag('ADJF,Apro femn,sing,nomn'), normal_form='какой', score=0.987012, methods_stack=((<DictionaryAnalyzer>, 'какая', 1676, 7),)),
 Parse(word='какая', tag=OpencorporaTag('GRND,impf,intr pres'), normal_form='какать', score=0.012987, methods_stack=((<DictionaryAnalyzer>, 'какая', 15, 67),))]

In [25]:
res[0].normal_form

'какой'

In [26]:
MORTH_CACHE = {}
def get_norm_word_v3(a_word):
    if a_word not in MORTH_CACHE: MORTH_CACHE[a_word] = morth_analyzer.parse(a_word)[0].normal_form
    return MORTH_CACHE[a_word]

In [27]:
uniq_words = Counter(get_norm_word_v3(word) for word in words)
print("NumKeys : ", len(uniq_words))
print(uniq_words.most_common(10))
### ('напиток', 2)

NumKeys :  56
[('напиток', 5), ('какой', 4), ('ты', 4), ('взрывной', 2), ('в', 2), ('большой', 2), ('нравиться', 2), ('яркий', 2), ('я', 2), ('такой', 2)]


In [None]:
### v4 - числа преоразовывать к специальному формату YYYY , DD - чтобы уменьшить словарь и склеивались похожие названия отличающиеся только цифрами 

### Пример деревьев решений для предсказания сайта по tf-idf векторам
Получится ли обучить хорошее решение линейной моделью?

In [28]:
def get_doc_words(a_doc, a_split=split_words_v3, a_norm_word=get_norm_word_v3):
    for word in itertools.chain(a_split(a_doc.title), a_split(a_doc.description)):
        yield a_norm_word(word)

In [29]:
class NaiveBayes:
    
    min_class_c = 12
    
    def __init__(self):
        self.word_in_class = Counter()
        self.word_not_in_class = Counter()
        
    def train(self, a_words, a_is_class):
        word_counter = self.word_in_class if a_is_class else self.word_not_in_class
        word_counter.update(a_words)
        
    def predict(self, a_words):
        res = 0
        num_words = 0
        for word in a_words:
            class_freq, not_class_freq = self.word_in_class.get(word, 0), self.word_not_in_class.get(word, 0)
            if class_freq < self.min_class_c or not_class_freq < self.min_class_c: continue
            num_words += 1
            res += np.log(class_freq/not_class_freq)
        return res/num_words if num_words > 0 else 0.0

In [30]:
dataset_sites = Counter(doc.site for doc in dataset)

sport_sites = set(['matchtv.ru', 'euro-football.ru', 'euro.com.ua',
                   'bobsoccer.ru', 'bombardir.ru', 'championat.com',
                   'football24.ru', 'rusfootball.info', 'soccernews.ru'
                  ])

for item in dataset_sites:
    if 'sport' in item: sport_sites.add(item)

In [31]:
for item in dataset_sites.most_common(1000):
    if item[0] not in sport_sites:
        print(item)

('tass.ru', 178)
('vk.com', 163)
('123ru.net', 143)
('gazeta.ru', 136)
('rossaprimavera.ru', 130)
('russian.rt.com', 118)
('daily-inform.ru', 108)
('newsyou.info', 95)
('365news.biz', 95)
('obozrevatel.com', 92)
('tvzvezda.ru', 83)
('moika78.ru', 78)
('life.ru', 73)
('wi-fi.ru', 71)
('riafan.ru', 71)
('rueconomics.ru', 69)
('pikabu.ru', 65)
('novosti-n.org', 63)
('mob-mobile.ru', 63)
('sm-news.ru', 58)
('news.ru', 58)
('mir24.tv', 57)
('nation-news.ru', 57)
('govoritmoskva.ru', 56)
('360tv.ru', 56)
('news-front.info', 53)
('terrikon.com', 53)
('vz.ru', 51)
('aif.ru', 51)
('dizainvfoto.ru', 50)
('argumenti.ru', 49)
('peterburg2.ru', 48)
('ukraina.ru', 46)
('oane.ws', 46)
('rosbalt.ru', 44)
('news.rambler.ru', 43)
('zelenj.ru', 40)
('ferra.ru', 39)
('bmwclub.ru', 39)
('habr.com', 39)
('deita.ru', 38)
('vestikavkaza.ru', 37)
('abnews.ru', 36)
('1rre.ru', 35)
('gazeta.spb.ru', 34)
('profile.ru', 34)
('fontanka.ru', 34)
('yerkramas.org', 33)
('riamo.ru', 33)
('radiosputnik.ria.ru', 32)
('ra

('dnevniki.ykt.ru', 2)
('yuripasholok.livejournal.com', 2)
('proseverouralsk.ru', 2)
('historygreatrussia.ru', 2)
('popcornnews.ru', 2)
('tobegirl.ru', 2)
('brodude.ru', 2)
('teknoblog.ru', 2)
('mycary.ru', 2)
('software-expert.ru', 2)
('jvlife.ru', 2)
('rb.ru', 2)
('realty.ria.ru', 2)
('vmolo.by', 2)
('rubankom.com', 2)
('ngs24.ru', 2)
('theblueprint.ru', 2)
('military.pravda.ru', 2)
('allfest.ru', 2)
('finrussia.ru', 2)
('tayga.info', 2)
('youloveit.ru', 2)
('fanera-info.ru', 2)
('spbvedomosti.ru', 2)
('pasmi.ru', 2)
('chips-journal.ru', 2)
('journal.tinkoff.ru', 2)
('7ya.ru', 2)
('rap.ru', 2)
('ochkov.net', 2)
('daily-motor.ru', 2)
('coinspot.io', 2)
('servernews.ru', 2)
('militaryexp.com', 2)
('ivday.ru', 2)
('paparazzi.ru', 2)
('dnpmag.com', 2)
('kinoart.ru', 2)
('gmbox.ru', 1)
('ura-povara.ru', 1)
('pogoda.mail.ru', 1)
('zapad24.ru', 1)
('3ddd.ru', 1)
('virtus.pro', 1)
('panorama.pravo.ru', 1)
('uchportal.ru', 1)
('agrognom.ru', 1)
('itzine.ru', 1)
('fitnessera.ru', 1)
('ladyspec

In [32]:
sport_dataset = [item for item in dataset if item.site in sport_sites]
not_sport_dataset = [item for item in dataset if item.site not in sport_sites]
print(len(sport_dataset), len(not_sport_dataset))

1087 8913


In [33]:
%%time

bayes_classifier = NaiveBayes()
for item in sport_dataset:
    bayes_classifier.train(get_doc_words(item), a_is_class=True)
    
for item in not_sport_dataset:
    bayes_classifier.train(get_doc_words(item), a_is_class=False)

CPU times: user 1min 9s, sys: 83.2 ms, total: 1min 9s
Wall time: 1min 9s


In [34]:
for item in not_sport_dataset:
    predict = bayes_classifier.predict(get_doc_words(item))
    if predict > np.log(len(sport_dataset)/len(not_sport_dataset)):
        print(predict, item)
#         break
        print('-*-'*13)


-1.9601938853085725 url : https://rusturkey.com/post/207586/grazhdanka-rossii-vypala-s-balkona-7-go-etazha-v-antale
date : 2019-11-30 18:26:11
title : Гражданка России выпала с балкона 7-го этажа в Анталье
description : Жизнь женщины не удалось спасти
site : rusturkey.com

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.837474331018305 url : https://riavrn.ru/news/voronezhskiy-batutist-stal-prizerom-chempionata-mira/
date : 2019-11-30 18:26:38
title : Воронежский батутист стал призером чемпионата мира
description : Сергей Азарян отличился в паре с Михаилом Мельником из Тольятти.
site : riavrn.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.0732243592395294 url : https://tengrinews.kz/events/krupnyiy-pojar-ohvatil-bannyiy-kompleks-u-podnojiya-kok-tobe-385419/
date : 2019-11-30 18:22:16
title : Крупный пожар охватил банный комплекс у подножия Кок-Тобе
description : Крупный пожар охватил банный комплекс "Царское село", расположенный у подножия горы Кок-Тобе в Алматы вечером в субботу, 30 ноября

-0.9765743279060152 url : https://properm.ru/news/sport/177675/
date : 2019-11-30 18:31:17
title : «Молот-Прикамье» обыграл китайский клуб «КРС-БСУ»>
description : Следующий матч пермская команда вновь проведет против соперника из Китая.
site : properm.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.5218253598732354 url : https://russian.rt.com/sport/article/692025-biatlon-singl-mikst-estersund
date : 2019-11-30 18:31:44
title : Российские биатлонисты заняли 12-е место в сингл-миксте на этапе КМ в Эстерсунде
description : В шведском Эстерсунде стартовал новый розыгрыш Кубка мира по биатлону. Золото в сингл-миксте завоевали участники сборной страны — хозяйки соревнований Ханна Эберг и Себастьян Самуэльссон. Серебро досталось немцам Франциске Пройсс и Эрику Лессеру, бронза — норвежцам Марте Ройселанн и Ветле Шосте Критиансену. Россияне Тамара Воронина и Матвей Елисеев финишировали на 12-м месте. RT вёл текстовую онлайн-трансляцию гонки.
site : russian.rt.com

-*--*--*--*--*--*--*--*--*--*

-1.9123874570166697 url : https://pikabu.ru/story/meow_7075819
date : 2019-11-30 18:37:11
title : Meow?
description : https://www.instagram.com/oheekolts/ https://www.artstation.
site : pikabu.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.9878358654999784 url : https://nsn.fm/in-the-world/ssha-nanesli-vozdushnyi-udar-po-obektam-terroristov-na-uge-somali
date : 2019-11-30 18:37:17
title : США нанесли воздушный удар по объектам террористов на юге Сомали
description : Вооруженные силы США нaнесли aвиaудaр по целям террористической оргaнизaции «Аш-Шабаб» нa юге Сомали
site : nsn.fm

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-0.9797901068686389 url : http://terrikon.com/posts/341363
date : 2019-11-30 18:38:39
title : Биатлон: украинцы - четвертые в одиночной смешанной эстафете
description : Украинские биатлонисты были в шаге от пьедестала в стартовой гонке первого этапа Кубка мира
site : terrikon.com

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.0066501764583633 url : https://news.ru/autosport

-1.4753879386932516 url : https://www.f1-world.ru/news/news.php3?idnews=1911301825
date : 2019-11-30 18:46:13
title : Даниилу Квяту не понравилось поведение машины в квалификации
description : По итогам квалификации в Абу-Даби Даниил Квят оказался на 14-й позиции. В гонке россиянин будет стартовать 13-м...
site : f1-world.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.9054013391730793 url : https://bazaar.ru/heroes/parties/yasmina-muratovich-i-mariya-minogarova-na-otkrytii-magazina-ttswtrs/
date : 2019-11-30 18:46:13
title : Ясмина Муратович и Мария Миногарова на открытии магазина TTSWTRS
description : Гости вечеринки на Патриарших прудах
site : bazaar.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.203889171370507 url : http://terrikon.com/posts/341360
date : 2019-11-30 18:47:40
title : Олимпик несет кадровые потери перед матчем с Динамо
description : Последний день осени ознаменовался для команды Висенте Гомеса окончанием подготовки к матчу против "Динамо"
site : terrikon.com

-*--*--

-1.5360976353737685 url : https://www.f1news.ru/news/f1-141430.html
date : 2019-11-30 18:56:40
title : Танабе: В Toro Rosso смогут выбрать шины для старта
description : Пьер Гасли и Даниил Квят рассчитывают побороться за очки в Абу-Даби...
site : f1news.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.882672555323559 url : https://gazeta.spb.ru/2192257-peterburgskij-prazdnik-alye-parusa-priznali-luchshim-prazdnikom-v-mire/
date : 2019-11-30 18:56:12
title : Петербургский праздник «Алые паруса» признали лучшим праздником в мире
description : Главный праздник всех выпускников «Алые паруса», который проводится в Петербурге каждый год, получил главную награду в конкурсе Best Event Awards World. Всего было в Best Event Awards World 23 номинации. Петербургский праздник также наградили в номинациях «Лучшее музыкальное событие» и «Лучшее агентство в сфере организации праздников». Номинантов оценивали по креативности, наличию технологических инноваций, исполнению, общей […]
site : gazeta.spb.ru



-1.920274681516339 url : https://gazeta.a42.ru/lenta/news/68406_stali-izvestny-gonorary-emelyanenko-i-koklyaeva-za-bokserski
date : 2019-11-30 19:02:24
title : Стали известны гонорары Емельяненко и Кокляева за боксерский поединок
description : Миллион рублей
site : gazeta.a42.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.8918603515477135 url : https://pravda-nn.ru/news/nizhegorodskie-sportsmeny-vyigrali-po-tri-zolotye-medali-na-kubke-rossii-po-sambo/
date : 2019-11-30 17:26:43
title : Нижегородские спортсмены выиграли по три золотые медали на Кубке России по самбо
description : В нижегородском театре оперы и балета каждый из регионов объявлял своих фаворитов. В зале собрались члены жюри и деятели в сфере культуры.
site : pravda-nn.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-0.8790297753911065 url : https://overclockers.ru/softnews/show/100556/novye-skrinshoty-fanatskogo-remejka-half-life-opposing-force
date : 2019-11-30 19:02:21
title : Новые скриншоты фанатского ремейка Half-Life: O

-1.9504260267485136 url : https://125region.ru/v-rossii-otreagirovali-na-skandal-s-apple-i-krymom/
date : 2019-11-30 19:11:15
title : В России отреагировали на скандал с Apple и Крымом
description : Член комитета Совета Федерации по международным делам, сенатор от Крыма Сергей Цеков прокомментировал скандал вокруг принадлежности Крыма на картах американской …
site : 125region.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.9616506602329264 url : https://politobzor.net/207107-ischenko-kriticheskaya-otmetka-zhdet-zelenskogo-vesnoy.html
date : 2019-11-30 19:11:10
title : Ищенко: критическая отметка ждет Зеленского весной
description : Политолог Ростислав Ищенко прокомментировал процесс снижения популярности президента Зеленского.
site : politobzor.net

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.9839750828463552 url : https://pikabu.ru/story/poka_eshche_zolotaya_osen_7076300
date : 2019-11-30 19:11:42
title : Пока еще золотая осень
description : Каскад над водопадом Джур-Джур в Крыму. Обычн

-1.8257571670974364 url : https://plainnews.ru/video-channel-549561.html
date : 2019-11-30 19:16:42
title : Видео: Лечение "девочки-Бэтмена": первые итоги - Россия 24
description : Видео: Лечение "девочки-Бэтмена": первые итоги - Россия 24
site : plainnews.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.400418746207382 url : https://russian.rt.com/sport/news/692379-karpin-rostov-dolgi
date : 2019-11-30 19:23:14
title : Карпин заявил, что в «Ростове» начали погашать долги
description : Главный тренер «Ростова» Валерий Карпин прокомментировал ситуацию с задолженностью по заработной плате в клубе.
site : russian.rt.com

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.0263095192829623 url : https://365news.biz/sport/237342-pered-startom-evro-v-peterburge-na-dvorcovoj-ploshhadi-projdet-koncert.html
date : 2019-11-30 19:21:11
title : Перед стартом ЕВРО в Петербурге на Дворцовой площади пройдет концерт
description : ЕВРО-2020. В Санкт-Петербурге перед началом матчей чемпионата Европы по футболу 202

-1.9780604590674562 url : https://www.rosbalt.ru/russia/2019/11/30/1816011.html
date : 2019-11-30 19:27:10
title : В Ростов-на-Дону из Дамаска прибыл сириец с арабским конем для Путина
description : В Ростов-на-Дону прибыл сириец Аднан Азам. Мужчина едет из Дамаска в Москву на арабской кобыле Наязек Шам, чтобы подарить лошадь российскому президенту...
site : rosbalt.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.7746102656651592 url : https://gtrk.tv/novosti/156210-dzheffri-monson-aleksandr-chistov-soshlis-boem-licom-licu
date : 2019-11-30 19:27:07
title : Джеффри Монсон и Александр Чистов сошлись перед боем лицом к лицу
description : Сегодня в столице республики прошло взвешивание участников Международного турнира по джиу-джитсу среди профессионалов. Кубок «Евразии» состоится в Уфе 1 декабря. Его участниками станут спортсмены из России, Бразилии, Польши и Казахстана. Турнир пройдет по правилам Международной Федерации джиу-джитсу в шести весовых категориях.
site : gtrk.tv

-*--*--*--*-

-1.282855932142921 url : http://www.1rre.ru/325436-kto-pobedil-mixail-koklyaev-ili-aleksandr-emelyanenko-opyt-okazalsya-namnogo-silnee-stalnyx-muskulov.html?noredir=true
date : 2019-11-30 19:33:38
title : Кто победил Михаил Кокляев или Александр Емельяненко: бой оказался очень коротким с нокаутом в первом раунде
description : 
site : 1rre.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.9846343007280254 url : https://www.wday.ru/stil-zhizny/vibor-redakcii/obyazatelnyi-traurnyi-kostyum-i-drugie-sekrety-korolevskikh-poezdok/
date : 2019-11-30 19:32:38
title : Обязательный траурный костюм и другие секреты королевских поездок
description : Насчет выезда у британцев целый свод удивительных правил!
site : wday.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.013879266339763 url : https://bazaar.ru/heroes/parties/tatyana-navka-andrey-malahov-i-yuliya-hlynina-na-otkrytii-katka-v-gume/
date : 2019-11-30 19:36:10
title : Татьяна Навка, Андрей Малахов и Юлия Хлынина на открытии катка в ГУМе
descripti

-1.718553184005459 url : https://www.rzn.info/news/2019/11/30/otkrytie-novogodney-stolicy-v-ryazani-nachnetsya-s-parada-dedov-morozov.html
date : 2019-11-30 19:46:46
title : Открытие «Новогодней столицы» в Рязани начнется с парада Дедов Морозов
description : Мероприятие стартует на площади Победы.
site : rzn.info

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.564477740293509 url : https://www.gazeta.ru/sport/2019/11/30/a_12840614.shtml
date : 2019-11-30 19:46:43
title : Уэльс или Финляндия: Россия узнает соперников на Евро-2020. LIVE
description : В Бухаресте проходит жеребьевка финального раунда чемпионата Европы - 2020. Сборная России по футболу уже знает двух соперников по своей группе - команды Бельгии и Дании. Третьим участником квартета станет либо Уэльс, либо Финляндия. "Газета.Ru" ведет текстовую онлайн-трансляцию церемонии.
site : gazeta.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.4826243071810647 url : http://terrikon.com/posts/341368
date : 2019-11-30 19:47:35
title : Меликя

-2.033079162012127 url : https://kazanfirst.ru/news/505509
date : 2019-11-30 19:52:09
title : Путин категорически против замены слова «мама» на «родитель №1»
description : В некоторых странах слова «мама» и «папа» никогда не заменили обозначениями «родитель № 1» и «родитель № 2».
site : kazanfirst.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-0.8076550970750819 url : https://russian.rt.com/sport/news/692392-liverpul-braiton-apl
date : 2019-11-30 19:51:47
title : «Ливерпуль» в меньшинстве удержал победу над «Брайтоном»
description : В матче 14-го тура Английской премьер-лиги (АПЛ) «Ливерпуль» на своём поле победил «Брайтон».
site : russian.rt.com

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.7109279688639247 url : https://ru.hellomagazine.com/deti/deti-znamenitostey/34609-devid-i-kharper-bekkhem-otkryli-sezon-kataniya-na-konkakh.html
date : 2019-11-30 19:52:09
title : Дэвид и Харпер Бекхэм открыли сезон катания на коньках
description : 
site : ru.hellomagazine.com

-*--*--*--*--*--*--*--*-

-2.096941823185036 url : https://veasy.ru/biografiya/aleksandr-treshhev-podrobnosti-zhizni-uspeshnogo-i-samogo-stilnogo-advokata-rossii
date : 2019-11-30 17:02:11
title : Александр Трещев: Подробности жизни успешного и самого стильного адвоката России
description : Сегодня VEASY расскажет об известном российском адвокате Александре Трещеве. Трещев известен многим телезрителям по телепередачам «Пусть говорят», «Федеральный судья» и другие, в качестве эксперта и частого гостя. Родился Александр в Челябинске,... Сообщение Александр Трещев: Подробности жизни успешного и самого стильного адвоката России появились сначала на Veasy.
site : veasy.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-0.8161604577356544 url : https://rossaprimavera.ru/news/e68df6d8
date : 2019-11-30 17:02:13
title : Гостевой прорыв «Уфы»: самарцы получили «черную» пятницу в субботу
description : Гостевой победой «Уфы» закончилась встреча 18-го тура Российской премьер-лиги (РПЛ) с «Крыльями Советов» в Самаре 30 ноября.
si

-1.9736426349550356 url : https://vringe.com/news/129975-dzhoshua-pereotsenyen-ruis-snova-ego-pobyet-bob-arum.htm
date : 2019-11-30 17:06:40
title : Джошуа переоценён, Руис снова его побьёт — Боб Арум
description : Боб Арум, глава компании Top Rank и бывший промоутер мексиканского чемпиона мира в супертяжёлом весе Энди Руиса (33-1, 22 КО), предсказал ещё одну его победу над британцем Энтони Джошуа (22-1, 21 КО). Реванш Руис-Джошуа состоится 7 декабря в Саудовской Аравии. 1 июня Энди остановил британца и отобрал у него титулы WBA/IBF/WBO. Репортаж vRINGe об этом поединке.  «Я думаю, Энди снова победит. Считаю Джошуа переоценённым, — сказал Арум в интервью FightHype. — А вот Руис, напр...
site : vringe.com

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-0.9758183198678059 url : https://chelseablues.ru/news/startovye_sostavy_chelsi_i_vehst_khehma/2019-11-30-55721
date : 2019-11-30 17:07:19
title : Стартовые составы "Челси" и "Вэст Хэма"
description : Представляем Вашему вниманию стартовые соста

-0.613558040861998 url : https://www.gazeta.ru/sport/news/2019/11/30/n_13758710.shtml
date : 2019-11-30 17:17:16
title : "Реал" одолел "Алавес" и вышел в лидеры чемпионата Испании
description : Мадридский "Реал" победил "Алавес" в матче 15-го тура чемпионата Испании
site : gazeta.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.932235997565773 url : https://360tv.ru/news/obschestvo/rosatom-rassekretil-dokumenty-o-rozygryshah-kurchatova/
date : 2019-11-30 17:16:39
title : Росатом рассекретил документы о розыгрышах Курчатова
description : Легендарный научный руководитель советского атомного проекта академик Игорь Курчатов обожал шутить над коллегами. Госкорпорация «Росатом» вспомнила две истории.
site : 360tv.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.0850260446916997 url : https://www.f1news.ru/news/f1-141417.html
date : 2019-11-30 17:17:14
title : Грожан: Я рад, что завтра последняя гонка для этой машины
description : В квалификации в Абу-Даби машину Даниила Квята выпустили из боксов

-1.9248323883708622 url : https://newstula.ru/fn_504147.html
date : 2019-11-30 17:21:11
title : В Туле проходят Всероссийские соревнования по художественной гимнастике
description : На спортивные состязания съехались более 800 спортсменок из 30 субъектов РФ.
site : newstula.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-0.7313418916967517 url : https://sobesednik.ru/sport/20191130-pervyj-zimnij-uikend-i-vojna-dzyuby-so-spartakom-futbolnyj-gid-sobesednikru
date : 2019-11-30 17:21:11
title : Первый зимний уикенд и война Дзюбы со "Спартаком": футбольный гид Sobesednik.ru
description : Возвращение Гризманна на «Ванда Метрополитано», Дзюба против «Спартака»: дайджест главных матчей вых
site : sobesednik.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-0.9727197145578753 url : https://sobesednik.ru/sport/20191130-match-18-go-tura-rpl-perenesen-iz-za-zabolevaniya-desyati-igrokov-sochinskoj-komandy
date : 2019-11-30 17:21:11
title : Матч 18-го тура РПЛ перенесен из-за заболевания десяти игроков сочи

-1.0349925977033831 url : http://terrikon.com/posts/341355
date : 2019-11-30 17:32:39
title : Манчестер Сити не смог обыграть Ньюкасл
description : Неудачной вышла эта неделя для "Манчестер Сити". Сперва клуб Хосепа Гвардиолы не смог на своем поле обыграть "Шахтер" в Лиге чемпионов. А сегодня чемпион АПЛ потерял очки во внутреннем первенстве с "Ньюкаслом".
site : terrikon.com

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.097041835586928 url : https://mir24.tv/news/16388082/ucheniki-iz-rossii-zavoevali-v-kitae-pyat-zolotyh-medalei-na-olimpiade-po-matematike
date : 2019-11-30 17:31:42
title : Ученики из России завоевали в Китае пять золотых медалей на олимпиаде по математике
description : Серебряной награды удостоился Иван Лялинов из Петербурга.
site : mir24.tv

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.2702751651507465 url : https://tass.ru/sport/7234123
date : 2019-11-30 17:31:16
title : "Спартак" прервал четырехматчевую победную серию в КХЛ, проиграв "Амуру"
description : Москвичи не м

-1.8583488210258 url : https://f1report.ru/news/f1-49044.html
date : 2019-11-30 17:36:41
title : Гран-При Абу-Даби 2019: Квалификация
description : Квалификация считается одной из самых важных сессий в Абу-Даби, ведь за десять лет здесь пять раз побеждали с поула - в том числе четыре прошлых года. Последние квалификационные заезды сезона не…
site : f1report.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.6627659459673019 url : https://vringe.com/news/129977-mandin-proigral-legende-muay-tay-vyletal-za-predely-ringa-video.htm
date : 2019-11-30 17:37:09
title : Мандин проиграл легенде муай-тай, вылетал за пределы ринга (+ видео)
description : Brisbane Convention and Exhibition Centre, Брисбен, Австралия. 44-летний экс-чемпион мира австралиец Энтони Мандин (48-9, 28 KO) всё никак не решится уйти из бокса. В очередном «самом последнем» поединке ветеран проиграл 43-летнему соотечественнику Джону Уэйну Парру (11-3, 10 КО в боксе), сделавшему себе имя в муай-тай — является 10-кратным чемпионом 

-1.8357739864837477 url : https://lezgigazet.ru/archives/128683?noredir=true
date : 2019-11-30 17:45:10
title : Депутат Госдумы Юрий Левицкий посетил Дагестанский центр микрохирургии глаза
description : Накануне депутат Государственной Думы Федерального Собрания Российской Федерации Юрий Левицкий посетил Дагестанский центр микрохирургии глаза в Каспийске. Парламентария встретили руководитель клиники Центра, главный офтальмолог Минздрава Республики Дагестан и Минздрава РФ по СКФО, заведующий кафедрой Дагестанского государственного медицинского университета, народный врач республики, профессор Абду
site : lezgigazet.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.9474493976290044 url : https://f1report.ru/news/f1-49046.html
date : 2019-11-30 17:46:10
title : Боттас: Сегодня Хэмилтон был быстрее
description : Пилот Mercedes Валттери Боттас прокомментировал свое второе время в квалификации в Абу-Даби. "Еще вчера мы поняли, что в квалификации у нас будет все в полном порядке с темпом, хотя с

-2.0245361408282267 url : https://www.fxmag.ru/blog-fiYP.htm
date : 2019-11-30 17:53:09
title : Продажа йены. Волновая аналитика на неделю
description : Всем привет! Вашему вниманию представляется аналитика биткоина, нефти, российского рубля, индекса РТС, евро доллара, фунта, франка, японской йены и золота на предстоящую торговую неделю. Аналитика строится на основе волн Эллиотта и паттернов...
site : fxmag.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.7427250296744685 url : http://fratria.ru/news/2019/11/30/pechalnoe_sovpadenie_mkhk_spartak_ustupil_amurskim_tigram/
date : 2019-11-30 17:51:20
title : Печальное совпадение... МХК "Спартак" уступил "Амурским тиграм"
description : Редко такое бывает, чтобы и молодёжные, и основные команды двух клубных систем встречались в один день. Сегодня случилось именно так. В Хабаровске дружина Олега Знарка играла утром с местным «Амуром», а МХК «Спартак» на Малой арене в «Парке Легенд» принимал «Амурских тигров». Увы, на Дальнем Востоке красно-белая

-0.43852654536043023 url : https://russian.rt.com/sport/news/692341-metallurg-salavat-yulaev-khl
date : 2019-11-30 17:58:54
title : «Металлург» прервал серию поражений в КХЛ, обыграв «Салават Юлаев»
description : Магнитогорский «Металлург» над уфимским «Салаватом Юлаевым» в матче регулярного чемпионата Континентальной хоккейной лиги (КХЛ).
site : russian.rt.com

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.8164854529901961 url : https://cskanews.com/media/sport-online-translation/ak-bars-dinamo-moskva-onlajn-translyaciya-tekst-01-12-2019-v-17-00/
date : 2019-11-30 17:59:38
title : Ак Барс — Динамо Москва онлайн трансляция текст 01.12.2019 в 17.00
description : Ак Барс — Динамо Москва онлайн трансляция текст 01.12.2019 в 17.00 - ЦСКАНЬЮС. ..Уважаемые читатели нашего ресурса, в связи с претензиями правообладателей мы переходим на новый формат - Онлайн-обсуждение текущих спортивных мероприятий...Здесь вы можете вступать в дискуссии друг с другом, спорить, делиться в комментариях мне... Ново

-2.020688199080873 url : https://pg12.ru/news/49744
date : 2019-11-30 18:02:47
title : Видео дня: в Йошкар-Оле во дворе школы полыхал «Минивэн»
description : Очевидцы все засняли на видео
site : pg12.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.9625455678815313 url : https://www.film.ru/articles/pol-gringrass-otvechaet-na-vazhnye-voprosy-empire
date : 2019-11-30 18:01:45
title : Интервью с Полом Гринграссом
description : Пол Гринграсс попал в постоянную рубрику Empire.
site : film.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.2685706570745674 url : https://rusbiathlon.ru/news/biathlon/id134632/
date : 2019-11-30 18:03:36
title : Ирина Старых победила в спринте на норвежском этапе Кубка IBU; Екатерина Глазырина – третья
description : Сегодня, 30 ноября, в Шушене (Норвегия) продолжился первый этап Кубка IBU по биатлону. Во вторых спринтерских гонках победили норвежец Фредрик Гьесбак (нет промахов) и россиянка Ирина Старых (точная стрельба). Бронза — у россиянки Екатерины Глазыриной (о

-1.1451516698953401 url : http://www.lipetskmedia.ru/news/view/124203-Mini_futbolisti.html
date : 2019-11-30 18:11:41
title : Мини-футболисты ЛКС отыгрались с 0:5 в матче с лидером (видео)
description : Наша команда сумела прервать победную поступь нижегородского «Оргхима»
site : lipetskmedia.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.0761123941388298 url : https://vk.com/@hockey-kareru-russkoi-zvezdy-nhl-spasali-v-ukrainskom-klube-esli-by
date : 2019-11-30 18:11:12
title : Карьеру русской звезды НХЛ спасали в украинском клубе. Если бы не Майдан (и Знарок), мог даже играть там за сборную
description : Автор: Антон Руднев Он один из лидеров своей команды в НХЛ, но удивительно непопулярен в России. Конечно, его знают и хорошо помнят как минимум в Челябинске и Питере, но новости про пропущенный матч Гусева или о том, что Овечкин пришел на тренировку с сыном, волнуют аудиторию куда больше, чем дубль Дадонова. С появлением во «Флориде» Сергея Бобровского про Дадонова почти не вспоминают

-1.7239987786506856 url : http://www.bagnet.org/news/world/412987/makron-nazval-glavnogo-mirovogo-vraga
date : 2019-11-30 18:21:42
title : Макрон назвал главного мирового врага
description : 
site : bagnet.org

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.7618309193984363 url : https://www.f1news.ru/news/f1-141424.html
date : 2019-11-30 18:21:43
title : В Williams рассчитывают на борьбу с Haas и Alfa Romeo
description : Гонщики Williams традиционно оказались последними по итогам квалификации...
site : f1news.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.6250106657078243 url : https://78.ru/news/2019-11-30/alie_parusa__2019_stali_pobeditelem_konkursa_best_event_awards_world
date : 2019-11-30 18:21:41
title : «Алые паруса — 2019» признали лучшим праздником в мире
description : Праздник выпускников получил главную награду в номинации Iconic Event Award.
site : 78.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.6708610367733328 url : https://vesti.kz/sportsout/273395/
date : 2019-11-30 18:21

-1.4443982470545278 url : https://www.fontanka.ru/2019/11/30/037/
date : 2019-11-30 15:32:42
title : Фанаты «Зенита» устроили файер-шоу на базе клуба накануне игры со «Спартаком»
description : Тренировка футбольного клуба «Зенит» на базе команды в Удельном парке в субботу, 30 ноября, прошла в зажигательной атмосфере. Десятки фанатов пришли на базу и провели впечатляющую акцию с зажженными файерами. Судя по всему, таким образом болельщики поддержали игроков в преддверии матча со «Спартаком», который пройдёт в воскресенье, 1 декабря, на «Газпром Арене». Ранее нападающий «Зенита» Артём Дзю
site : fontanka.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.5512269341768035 url : https://rusbiathlon.ru/news/volleyball/id134623/
date : 2019-11-30 15:32:42
title : Волейболисты «Кузбасса» победили «Нову» в матче чемпионата России
description : Главные новости волейбола в России и мире сегодня, 30 ноября: Волейболисты "Кузбасса" победили "Нову" в матче чемпионата России Кемеровский "Кузбасс" переиг

-1.5247052500811789 url : https://russian.rt.com/sport/news/692248-bolshunov-15-km-ruka
date : 2019-11-30 15:36:13
title : Лыжник Большунов стал пятым в гонке на 15 км на этапе КМ в Руке
description : Россиянин Александр Большунов занял пятое место в индивидуальной гонке на 15 км классическим стилем на этапе Кубка мира в финской Руке.
site : russian.rt.com

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.5201497480711603 url : https://omskzdes.ru/sports/66654.html
date : 2019-11-30 15:36:08
title : "Авангард" не смог повторить победу в Пекине над "Куньлунем"
description : Сегодня омский "Авангард" в Пекине проиграл местному "Куньлунь Ред Стар" в овертайме. Матч закончился со счётом 2:3.
site : omskzdes.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.5877941184564612 url : https://62info.ru/news/sport/46812-ryazanskie-desantnitsy-otprazdnovali-20-letie-pervogo-chempionskogo-titula/
date : 2019-11-30 15:36:40
title : Рязанские «десантницы» отпраздновали 20-летие первого чемпионского титула
des

-1.6615110541440299 url : https://gorobzor.ru/novosti/obschestvo/35828-v-ufe-pochtili-pamyat-pogibshih-v-radiacionnyh-avariyah
date : 2019-11-30 15:43:08
title : В Уфе почтили память погибших в радиационных авариях
description : В Уфе в сквере 50-летия Победы состоялось мероприятие в память о погибших в результате радиационных аварий.
site : gorobzor.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.0913716710549597 url : http://chelny-izvest.ru/news/facts/gruppa-fedora-bondarchuka-v-yanvare-pristupit-k-semkam-seriala-o-komande-kamaz-master
date : 2019-11-30 15:43:08
title : Группа Федора Бондарчука в январе приступит к съемкам сериала о команде «КАМАЗ-мастер»
description : Страна увидит фильм о челнинских гонщиках
site : chelny-izvest.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.2959843846510826 url : https://russian.rt.com/sport/news/692257-valuev-ememelyanenko-koklyaev
date : 2019-11-30 15:42:42
title : Валуев заявил, что был уверен в быстрой победе Емельяненко над Кокляевым
descript

-1.731764328215249 url : https://progorod58.ru/news/62671
date : 2019-11-30 15:46:43
title : Пензенцев просят помочь в поисках 47-летнего Наиля Кузнецова
description : Мужчина не вернулся домой
site : progorod58.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.089840116031074 url : https://www.gazeta.ru/sport/news/2019/11/30/n_13758416.shtml
date : 2019-11-30 15:46:40
title : Стал известен возможный преемник Слуцкого в "Витессе"
description : Стал известен возможный преемник российского тренера Леонида Слуцкого в голландском "Витессе"
site : gazeta.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.089699494641198 url : https://www.znak.com/2019-11-30/zhitel_tyumeni_kotorogo_ne_smogli_vylechit_v_rossii_podderzhal_akciyu_alyansa_vrachey
date : 2019-11-30 15:51:14
title : Житель Тюмени, которого не смогли вылечить в России, поддержал акцию «Альянса врачей»
description : В Тюмени член Либертарианской партии России Станислав Куницкий встал в одиночный пикет у здания Областной клинической больниц

-2.0676682098906953 url : https://ngs55.ru/news/more/66376459/
date : 2019-11-30 15:51:38
title : Владелец аэродрома имени Летова решил остаться в Омской области
description : Сейчас Александр Анисимов переоформляет документы на землю
site : ngs55.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.7506977039075524 url : https://news.ru/economics/tanap-beryot-novye-rubezhi-ne-brat/
date : 2019-11-30 15:56:43
title : TANAP берёт новые рубежи
description : Газопровод, выгодный России, Азербайджану и Турции, прирастает новыми мощностями
site : news.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.081315089524326 url : https://www.passion.ru/news/znamenitosti/zolotistyi-kupalnik-i-lyubimyi-muzh-anastasiya-makeeva-v-dubae-otmetila-godovshinu-svadby-30-11-2019.htm
date : 2019-11-30 15:52:12
title : Золотистый купальник и любимый муж: Анастасия Макеева в Дубае отметила годовщину свадьбы
description : Актриса поделилась несколькими жаркими фотоснимками.
site : passion.ru

-*--*--*--*--*--*--*--*--*--

-1.8836697675609089 url : https://www.fontanka.ru/2019/11/30/040/
date : 2019-11-30 16:03:39
title : «Это официально». Бой Нурмагомедова и Фергюсона за чемпионский пояс состоится в апреле 2020-го
description : Откладывавшаяся несколько раз встреча бойцов из России и США намечена на следующий год. «Это официально. Чемпион UFC в легком весе Хабиб Нурмагомедов и Тони Фергюсон встретятся в главном событии UFC <...> 18 апреля», – сообщает 30 ноября ESPN. Бывший временный чемпион UFC в легком весе Тони Фергюсон встретился с руководством UFC для подписания договора о бое с российским спортсменом. Нурмагомедов
site : fontanka.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.9609207519759262 url : https://progorod33.ru/news/51391
date : 2019-11-30 16:02:42
title : Алана Чочиева победила в поединке шоу "Голос"
description : Наша землячка состязалась с Феликсом Котло из Москвы.
site : progorod33.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.065895019864929 url : https://klops.ru/news/2019-11-30/20

-1.1962507582320256 url : https://www.finam.ru/analysis/marketnews/rynki-prodolzhili-istochat-optimizm-20191130-16000/
date : 2019-11-30 16:06:40
title : Рынки продолжили источать оптимизм
description : Рынки продолжили источать оптимизм
site : finam.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-0.6534456242194713 url : https://riavrn.ru/news/voronezhskie-voleybolisty-pobedili-top-klub-vysshey-ligi-b/
date : 2019-11-30 16:06:40
title : Воронежские волейболисты победили топ-клуб Высшей лиги Б
description : «Кристалл-Черкизово» выиграл у костромского «Волжанина».
site : riavrn.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.9062134160984197 url : https://politsib.ru/news/35555-kabmin-mozet-nakazat-gubernatorov-za-rost-dotacionnosti-respublika-altaj-v-spiske
date : 2019-11-30 16:08:37
title : Кабмин может наказать губернаторов за рост дотационности — Республика Алтай в списке
description : Общий долг регионов перед бюджетом РФ превышает 2 трлн рублей
site : politsib.ru

-*--*--*--*--*--*--*

-1.5867488966339423 url : https://novosti-n.org/ukraine/read/244876.html
date : 2019-11-30 16:16:08
title : В столичных кафе промышляют воры. ВИДЕО
description : Двое неизвестных обчистили посетителя кафе на просп. Бажана, 1т.
site : novosti-n.org

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.8581527465625924 url : https://daily-inform.ru/440579-v-peterburge-startovala-gonka-gto-arenarace
date : 2019-11-30 16:16:48
title : В Петербурге стартовала гонка ГТО Arenarace
description : Гонка ГТО Arenarace стартовала в Северной столице в субботу, 30 ноября.
site : daily-inform.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.9534008207844709 url : https://ukraina.ru/news/20191130/1025872038.html
date : 2019-11-30 16:16:45
title : Украинского адмирала Воронченко наградили национальным орденом Франции
description : 
site : ukraina.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.2381841710084378 url : http://terrikon.com/posts/341343
date : 2019-11-30 16:18:09
title : Суарес: Променял бы Золотую бутс

-1.3906308515715613 url : https://www.gazeta.ru/sport/news/2019/11/30/n_13758554.shtml
date : 2019-11-30 16:22:10
title : Большунов пришел пятым в гонке классическим стилем на этапе КМ
description : Российский лыжник Александр Большунов стал пятым в гонке на 15 км классическим стилем с раздельного старта на первом этапе Кубка мира по лыжным гонкам, сообщает ТАСС
site : gazeta.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.0368667536458847 url : https://vringe.com/news/129970-usik-podderzhal-brekkhus-emelyanenko-stremitsya-pobedit-sebya-lemye-za-nedelyu-do-s-bursakom-sotsset.htm
date : 2019-11-30 16:22:41
title : Усик поддержал Брэкхус, Емельяненко стремится победить себя, Лемьё за неделю до боя с Бурсаком — соцсети
description : Социальные сети представителей мира единоборств как всегда полны полезной (и не очень) информацией. А vRINGe.com их тем временем внимательно отслеживает и традиционно предлагает вашему вниманию подборку самого интересного. Александр Емельяненко нокаутировал Мих

-0.5898157593197412 url : https://inc-news.ru/sport/football/2:13594
date : 2019-11-30 16:31:42
title : РПЛ. «Уфа» победила в Самаре и прервала длительную безвыигрышную серию
description : 18-й тур Российской премьер-лиги открылся в Самаре.
site : inc-news.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.4269052138787768 url : http://terrikon.com/posts/341347
date : 2019-11-30 16:33:38
title : 14-й тур Серии А: смотреть онлайн-видеотрансляцию матчей
description : В Серии А сегодня состоятся три матча. Еврокубковый соперник "Шахтера" по Лиге чемпионов "Аталанта" сыграет с "Брешией" - это начнется в 16:00. В 19:00 начнется матч "Дженоа" - "Торино". А в 21:45 игровой день чемпионата Италии закроют "Фиорентина" и "Лечче".
site : terrikon.com

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-0.8765534249864246 url : https://russian.rt.com/sport/news/692289-sluckii-otstavka-vitess
date : 2019-11-30 16:31:45
title : Слуцкий прокомментировал свою отставку из «Витесса»
description : Российский специалист

-1.9188978285566378 url : https://gamemag.ru/news/141461/edge-340-review-scores-pokemon-sword-shield-star-wars-jedi-fallen-order-planet-zoo
date : 2019-11-30 16:42:14
title : EDGE оценил Star Wars Jedi: Fallen Order, Pokemon Sword & Shield, Call of Duty: Modern Warfare и другие игры
description : Готовящийся компанией Blizzard Entertainment шутер Overwatch 2 стал центральной темой январского номера авторитетного британского профильного журнала EDGE.
site : gamemag.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.3118791379934926 url : https://www.f1-world.ru/news/news.php3?idnews=1911301625
date : 2019-11-30 16:41:44
title : Льюис Хэмилтон выиграл первую часть квалификации
description : Пилот Mercedes Льюис Хэмилтон показал лучшее время в первом сегменте квалификации Гран-При Абу-Даби. Второй результат поставил Александр Албон из Red Bull, третий - второй пилот Mercedes Валттери Боттас...
site : f1-world.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.0116253274174882 url : https://www.vl

-1.4128820721523772 url : https://news.ru/football/cherchesov-razdal-avtografy-polskim-bolelshikam-pered-zherebyovkoj-evro-2020/
date : 2019-11-30 16:52:11
title : Черчесов раздал автографы польским болельщикам перед жеребьёвкой Евро-2020
description : Главный тренер сборной России по футболу Станислав Черчесов раздал автографы польским болельщикам перед жеребьёвкой чемпионата Европы 2020 года, которая пройдёт вечером 30 ноября в Бухаресте.
site : news.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.127426798945546 url : https://wi-fi.ru/news/VXdmL0TTiWpe-sergey-haritonov-o-boe-emelyanenko-koklyaev-eto-tsirk-no-sasha-kvartiru-kupit
date : 2019-11-30 16:52:39
title : Харитонов не оценил бой Емельяненко – Кокляев
description : Тяжеловес Bellator Сергей Харитонов прокомментировал поединок между бойцом ММА Александром Емельяненко и Михаилом Кокляевым по правилам бокса.
site : wi-fi.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.1274958169072795 url : https://www.gazeta.ru/sport/news/2019/11

-0.41021279583005477 url : https://tass.ru/sport/7234317
date : 2019-11-30 13:50:21
title : Мирзоян назвал перенос матча РПЛ "Сочи" - "Оренбург" нормальным явлением
description : По словам главы комитета ветеранов футбола Российского футбольного союза, "Оренбург" проявил профессиональную солидарность
site : tass.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.0060504833114887 url : https://russian.rt.com/russia/news/692187-sk-vzyatka-delo-sledovatel
date : 2019-11-30 13:50:00
title : Следователи задержали первого замначальника Свердловского СК за взятку
description : Следователи задержали первого заместителя руководителя Следственного управления СК России по Свердловской области Михаила Бусылко и адвоката адвокатской палаты Владимирской области за получение взятки.
site : russian.rt.com

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.0970103903055812 url : https://www.tvc.ru/news/show/id/173578/
date : 2019-11-30 13:49:53
title : Неизвестный открыл стрельбу в московской гостинице
descriptio

-2.0090219745055204 url : https://sibdepo.ru/news/v-kemerovskoj-rajone-sudi-otkazalis-ot-vruchennyh-chinovnikami-medalej.html
date : 2019-11-30 13:50:14
title : В Кемеровском районе судьи отказались от врученных чиновниками медалей
description : Медали были выданы в сентябре.
site : sibdepo.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.9185212816300095 url : https://mir24.tv/news/16388037/klassika-kino-na-telekanale-mir-kak-snimali-film-epopeyu-tihii-don
date : 2019-11-30 13:49:54
title : Классика кино на телеканале «МИР»: как снимали фильм-эпопею «Тихий Дон»
description : История о страстной любви тесно переплетена с трагическими событиями Первой мировой и гражданской войны.
site : mir24.tv

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.040986552654676 url : https://f1report.ru/news/f1-49034.html
date : 2019-11-30 13:49:55
title : В Ferrari считают, что Феттель быстрее Леклера
description : В Абу-Даби руководитель команды Ferrari Маттиа Бинотто заявил, что он считает, что четырехкратный

0.0 url : https://on-hit.ru/texts/danil-pluzhnikov-piligrim/
date : 2019-11-30 13:52:54
title : Данил Плужников - Пилигрим Текст песни (слова)
description : Данил Плужников - Пилигрим Текст песни (слова)
site : on-hit.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.6257959277226184 url : https://www.obozrevatel.com/sport/football/vyibor-dlya-ukrainyi-gde-smotret-zherebevku-evro-2020-raspisanie-translyatsij.htm
date : 2019-11-30 13:49:53
title : Выбор для Украины: где смотреть жеребьевку Евро-2020 - расписание трансляций
description : Торжественная церемония пройдет в Бухаресте
site : obozrevatel.com

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.0644320034134742 url : https://smoldaily.ru/smolenskie-futbolisty-obygrali-komandu-iz-brazilii
date : 2019-11-30 13:49:59
title : Смоленские футболисты обыграли команду из Бразилии
description : Команда Смоленской государственной физакадемии на Чемпионате мира в Китае победила команду из Бразилии. Игра закончилась со счётом 1:0 в пользу...
site : s

-1.9409262065582151 url : https://www.soccer.ru/blogs/record/1152572/cherchesov-stanislav-rossiya?from=block1
date : 2019-11-30 14:00:09
title : Жеребьевка Евро-2020. Когда смотреть и чего ждать?
description : Финляндия или Уэльс – выбор для России, но «Соккер.ру» рассматривает весь расклад, ведь могут собрать интересные группы.
site : soccer.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.149763503432552 url : https://www.gazeta.ru/sport/news/2019/11/30/n_13758128.shtml
date : 2019-11-30 13:50:03
title : Лыжница Непряева выиграла бронзу в классике на этапе Кубка мира в Руке
description : Российская лыжница Наталья Непряева выиграла бронзу в классике на этапе Кубка мира в финской Руке
site : gazeta.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.009187872493664 url : http://mediaryazan.ru/news/detail/461599.html
date : 2019-11-30 13:57:54
title : Рязанец объяснил незнакомцу правила дорожного движения с помощью биты
description : В Рязани на улице Братиславской произошёл конфликт между во

-2.036013444676682 url : https://riafan.ru/region/svs/1231160-shtormovoe-preduprezhdenie-obyavili-v-krymu
date : 2019-11-30 14:30:30
title : Штормовое предупреждение объявили в Крыму
description : Жителей и гостей полуострова Крым предупредили о возможном шторме в воскресенье.
site : riafan.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.1957695281016838 url : https://www.bloodandsweat.ru/2019/11/ramzan-kadyrov-pozdravil-aleksandra-emelyanenko-s-pobedoj/
date : 2019-11-30 14:39:11
title : Рамзан Кадыров поздравил Александра Емельяненко с победой
description : Глава Чечни Рамзан Кадыров отметил сегодняшнюю победу Александра Емельяненко (28-7-1 ММА) над Михаилом Кокляевым (0-1 бокс). “Наш друг, боец ММА Александр Емельяненко показал в пятницу вечером зрелищный бой зрителям «ВТБ-арены» в Москве. В поединке с тяжелоатлетом Михаилом Кокляевым он продемонстрировал явное преимущество, нанося чувствительные удары. Бой завершился в первом же раунде. После очере
site : bloodandsweat.ru

-*--*--*-

-1.9996659423837415 url : https://tvkultura.ru/article/show/article_id/353174/
date : 2019-11-30 15:01:48
title : Александр Титель принимает поздравления с юбилеем
description : Художественный руководитель и главный дирижёр оперной труппы Московского академического музыкального театра имени Станиславского и Немировича-Данченко, народный артист России Александр Титель отмечает юбилей. Ему исполняется 70 лет.
site : tvkultura.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.9624443796220852 url : https://pluggedin.ru/open/kogda-vyydet-4-epizod-4-sezona-rik-i-morti-20588
date : 2019-11-30 15:01:42
title : Когда выйдет 4 эпизод 4 сезона «Рик и Морти»
description : После довольно долгого ожидания любимый мультсериал «Рик и Морти» наконец-то вернулся с четвертым сезоном в ноябре.
site : pluggedin.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.3180553060204458 url : https://wi-fi.ru/news/GLvKotjDVPxU-barys-obyavil-o-rastorzhenii-kontrakta-s-tengredi
date : 2019-11-30 15:01:41
title : "Барыс" об

-1.5694639035024052 url : https://www.obozrevatel.com/sport/box/emelyanenko-koklyaev-izdevatelskij-kommentarij-posle-boya.htm
date : 2019-11-30 15:01:42
title : "Растягивал, как мог": Емельяненко с издевкой прокомментировал бой с Кокляевым
description : Встреча продлилась чуть более 2 минут
site : obozrevatel.com

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.2299302758258945 url : https://rossaprimavera.ru/news/8ff91f84
date : 2019-11-30 15:01:41
title : Матч «Сочи» — «Оренбург» перенесли из-за форс-мажора
description : Матч между футбольными клубами «Оренбург» и «Сочи» перенесен на резервную дату в связи с вирусной инфекцией, 30 ноября сообщает пресс-служба Российской премьер-лиги.
site : rossaprimavera.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.962942406570675 url : https://gtrk.tv/novosti/156203-ufe-passazhirskiy-avtobus-stolknulsya-gruzovikom-video
date : 2019-11-30 15:01:42
title : В Уфе пассажирский автобус столкнулся с грузовиком – видео
description : ДТП с участием пассажирск

-1.6107984142101606 url : https://www.gazeta.ru/sport/2019/11/30/a_12840962.shtml
date : 2019-11-30 15:02:41
title : Тони Фергюсон подписал контракт на бой с Хабибом Нурмагомедовым
description : Американец Тони Фергюсон подписал контракт на бой с российским чемпионом UFC в легком весе Хабибом Нурмагомедовым. Поединок должен пройти 18 апреля 2020 года в Бруклине.
site : gazeta.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.1961619362112161 url : https://www.gazeta.ru/sport/news/2019/11/30/n_13758392.shtml
date : 2019-11-30 15:01:42
title : Боец Bellator Харитонов сравнил бой Кокляева и Емельяненко с цирком
description : Российский боец смешанного стиля (ММА) Сергей Харитонов сравнил бой пауэрлифтера Михаила Кокляева и Александра Емельяненко с цирком
site : gazeta.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.0942269841126824 url : https://rueconomics.ru/419580-kosmetolog-prokommentirovala-novuyu-modu-na-guby-dyavola
date : 2019-11-30 15:02:41
title : Косметолог прокомментировала новую 

-1.5571584313717537 url : https://www.f1news.ru/news/f1-119347.html
date : 2019-11-30 15:02:41
title : 15:50 МСК: Прямая трансляция квалификации
description : В этот уик-энд мы проведем прямые трансляции всех пяти сессий Гран При Абу-Даби...
site : f1news.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.6184124417575287 url : https://www.hi-fi.ru/news/dom/detail/novinka-ot-vincent-fonoko/
date : 2019-11-30 15:02:41
title : Новинка от Vincent – фонокорректор PHO-300
description : Немецкий производитель аудиокомпонентов Vincent дополняет линейку Power Line недорогим фонокорректором стоимостью 300 евро.
site : hi-fi.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.874420784492058 url : https://news.ru/others/rossiyane-zavoevali-dve-olimpijskie-licenzii-na-chm-po-pryzhkam-na-batute/
date : 2019-11-30 15:03:07
title : Россияне завоевали две олимпийские лицензии на ЧМ по прыжкам на батуте
description : Российские спортсмены вышли в финалы индивидуальных соревнований на чемпионате мира по прыжкам

-1.8607274177648196 url : https://habr.com/ru/post/478062/
date : 2019-11-30 15:05:52
title : Профессиональное сообщество Facebook Developer Circle: Moscow запускает серию событий по ML & AI
description : Системы машинного обучения и искусственного интеллекта все чаще встречаются в нашем быту, медицине, экономике и финансах, археологии, логистике и т.д. Сферы де...
site : habr.com

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.7274753587530998 url : http://tv.rbc.ru/archive/newssport/5de24ec92ae59651d9dc32a5
date : 2019-11-30 15:04:23
title : Спорт - Спорт. Выпуск за 14:04, 30.11.2019 :: Телеканал РБК
description : Спорт - Спорт. Выпуск за 14:04, 30.11.2019 :: Телеканал РБК
site : tv.rbc.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.9391726885810376 url : https://peterburg2.ru/news/lekciya-muzykalnyy-gamburg-georg-fridrih-gendel-zhdyot-gostey-57226.html
date : 2019-11-30 15:05:12
title : Лекция "Музыкальный Гамбург: Георг Фридрих Гендель" ждёт гостей
description : Мероприятие состоится в

-2.0633629153875725 url : http://tv.rbc.ru/archive/city/5de24c932ae59651d9dc32a3
date : 2019-11-30 15:04:48
title : Город - Город. Выпуск за 13:56, 30.11.2019 :: Телеканал РБК
description : Город - Город. Выпуск за 13:56, 30.11.2019 :: Телеканал РБК
site : tv.rbc.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.0981039211979975 url : https://peterburg2.ru/news/30-noyabrya-v-1530-proydet-ekskursiya-maltiyskiy-orden-i-rossiya-57129.html
date : 2019-11-30 15:04:44
title : 30 ноября в 15:30 пройдет экскурсия "Мальтийский орден и Россия"
description : Мероприятие состоится в музее Приоратский дворец 30 ноября в 15:30.
site : peterburg2.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.9910319813558592 url : https://polit.info/477940-zamglavy-sk-rf-po-sverdlovskoi-oblasti-obvinen-v-poluchenii-vzyatki-v-18-millionov-rublei
date : 2019-11-30 15:02:44
title : Замглавы СК РФ по Свердловской области обвинен в получении взятки в 18 миллионов рублей
description : Первого замглавы УСК РФ по Свердловской 

-1.5528418616609254 url : https://russian.rt.com/sport/news/692077-romanov-braziliya-igra
date : 2019-11-30 15:06:45
title : Романов: бразильцы думали, что сейчас будет тренировочная игра
description : Игрок сборной России по пляжному футболу Кирилл Романов считает, что дисквалификация двух его партнёров расслабила Бразилию перед четвертьфинальным матчем чемпионата мира в Парагвае.
site : russian.rt.com

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.8931276158320232 url : https://udmurt.media/news/obshchestvo/71322/
date : 2019-11-30 15:06:44
title : Коттедж стоимостью 600 тысяч рублей выиграл в лотерею учитель из Удмуртии
description : О победе мужчина узнал по сообщению в телефоне. Когда подтвердил факт выигрыша на сайте — сразу позвонил жене. Напомним, ранее житель Удмуртии выиграл 1 млн рублей в праздничном выпуске «Русское лото». Кроме того, семья из Ижевска выиграла в «Жилищной лотерее» квартиру стоимостью более 1 млн рублей.
site : udmurt.media

-*--*--*--*--*--*--*--*--*--*--*--*-

-1.868340778959189 url : https://newstracker.ru/news/society/30-11-2019/proletevshaya-nad-stavropoliem-ballisticheskaya-raketa-napugala-zhiteley
date : 2019-11-30 15:11:08
title : Пролетевшая над Ставропольем баллистическая ракета напугала жителей
description : Странное свечение было замечено в небе над Ставропольем, сообщают местные жители.
site : newstracker.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.6535918291960283 url : https://aif.ru/sport/novym_antidopingovym_koordinatorom_vfla_naznachen_robert_popov
date : 2019-11-30 15:07:06
title : Новым антидопинговым координатором ВФЛА назначен Роберт Попов
description : Предыдущего координатора отстранил независимый легкоатлетический дисциплинарный орган.
site : aif.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.3402055826401198 url : https://proufu.ru/news/sports/87339-vener_bashkir_galiev_nokautiroval_ermeka_tlauova_na_turnire_aca_102/
date : 2019-11-30 15:11:41
title : Венер «Башкир» Галиев нокаутировал Ермека Тлауова на турнире ACA

-1.906387447859562 url : https://123ru.net/moscow/225905563/
date : 2019-11-30 15:17:13
title : Помогавший подростку спасать девочку от педофила рассказал о бое года
description : Житель Иркутска Глеб Сизых, помогавший подростку Славе Дорошенко спасти девочку от педофила и ставший зрителем боя года между бойцом Александром Емельяненко и пауэрлифтером Михаилом Кокляевым, рассказал о своих впечатлениях. Двух героев на вечер бокса в Москве пригласили сами спортсмены, а Слава стал одним из ключевых зрителей грандиозного шоу. Именно он удостоился права вручить победителю главного противостояния вечера пояс чемпиона. По словам Сизых, турнир ему очень понравился. Спустя неделю после событий, прославивших его и Славу Дорошенко на всю страну, их продолжают узнавать и даже просят при встрече о фотографии. Читать дальше Источник: Блог сайта «РЕН ТВ Новости»
site : 123ru.net

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.081811496424026 url : https://dailystorm.ru/news/pervogo-zamglavy-sverdlovskogo-

-1.6131920938811983 url : https://prognozist.ru/news/football/russia/1963893-rossiya-italiya-po-kakomu-kanalu-translyaciya-1-2-finala-chm-po-plyazhnomu-futbolu.html
date : 2019-11-30 12:02:26
title : Россия - Италия: по какому каналу трансляция 1/2 финала ЧМ по пляжному футболу
description : Сборная России по пляжному футболу очень неожиданно, можно даже сказать сенсационно обыграла Бразилию в четвертьфинале и сегодня поспорит с Италией за место в финале чемпионата мира. В нашей сборной не было сразу двух ключевых футболистов из-за дисквалификации (Макарова и Папоротного), также мы уступали 1-3, Бразилия была действующим чемпионом мира, но все это удалось переломить и одержать волевую победу: Сегодня уже Россия фаворит в матче против Италии, но не надо расслабляться раньше времени: в 4-х последних очных противостояниях у нашей команды всего 1 победа (+1=1-2), поэтому напряжение будет колоссальным. Напомним, что Россия дважды выигрывала ЧМ (2011, 2013). 1/2 финала ЧМ по пляжному футболу

-2.0457523379575973 url : https://magadanmedia.ru/news/758861/
date : 2019-11-30 12:06:10
title : Отпуск в Индии: магаданская путешественница поделилась занятными фактами
description : О стереотипах, индусах, оформлении визы и прочем в интервью с Ольгой Нусуповой
site : magadanmedia.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.598862483141826 url : https://kino.mail.ru/cinema/selection/2872_kidman_strelyaet_blanshett_ischezaet_25_detektivov_so_zvezdami/
date : 2019-11-30 12:06:44
title : Кидман стреляет, Бланшетт исчезает: 25 детективов со звездами
description : Новые детективы со звездами смотреть онлайн
site : kino.mail.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.8069772370720785 url : https://novosti-n.org/ukraine/read/244911.html
date : 2019-11-30 12:06:08
title : Орёл-змееяд убил и съел ядовитую кобру. ФОТО
description : Свидетелем интересных событий стал 48-летний фотограф Говатаман Ганесан (Gowathaman Ganesan) на озере Теннери в округе Канчипурам, Индия.
site : novosti-n.or

-2.1038682652469385 url : https://news-front.info/2019/11/30/andrej-vadzhra-v-pryamom-efire-programmy-obratnyjotschyot-9/
date : 2019-11-30 12:11:30
title : Андрей Ваджра в прямом эфире программы #ОБРАТНЫЙОТСЧЁТ
description : Не пропустите!  30 ноября, в программе #ОБРАТНЫЙОТСЧЁТ примет участие главный редактор портала «Альтернатива» Андрей Ваджра. Начало прямого...
site : news-front.info

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.132403734147112 url : https://russian.rt.com/sport/news/691918-gadzhiev-mat-tolstoi
date : 2019-11-30 12:12:47
title : Гаджиев о поведении болельщиков: Лев Толстой тоже матерился
description : Президент футбольного клуба «Махачкала», бывший главный тренер «Крыльев Советов» и «Анжи» Гаджи Гаджиев считает, что необходимо различать разные виды нецензурной лексики.
site : russian.rt.com

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.9418578454604118 url : https://newkuban.ru/news/30118355/
date : 2019-11-30 12:12:43
title : В Краснодаре налог на коммерческую недвиж

-2.0506585319433928 url : https://www.rusdialog.ru/culture/190669_1575057920
date : 2019-11-30 12:20:22
title : ​Иосиф Пригожин поменял свой внешний вид: новый образ вызвал бурные обсуждения
description : Знаменитый российский продюсер Иосиф Пригожин решил немного преобразиться и поразил фанатов неожиданным имиджем.
site : rusdialog.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.5917153127271486 url : https://profile.ru/news/sport/koklyaev-prokommentiroval-svoe-porazhenie-emelyanenko-200076/
date : 2019-11-30 12:20:30
title : Кокляев прокомментировал свое поражение Емельяненко
description : Стронгмен Михаил Кокляев прокомментировал свое поражение от бойца смешанных единоборств (MMA) Александра Емельяненко. Поединок прошел накануне по правилам бокса и закончился для Михаила нокаутом в первом раунде. По его словам, удары соперника были «крепкими и плотными». Однако он отметил, что Емельяненко, похоже, был не в самой лучшей форме. «Пропускать может. Чувствовал, что я попадал», —
site : pr

-1.977275224770666 url : https://valetudo.ru/mma/news/aleksandr-emelyanenko-puskaj-fedor-na-zemlyu-opustitsya-video
date : 2019-11-30 12:22:40
title : Александр Емельяненко: Пускай Федор на землю опустится! (ВИДЕО)
description : "Я сидел не за то, в чем меня обвиняли": сенсационное возвращение "Иуды" с новым сезоном очумительных историй про комплексы Федора, подставных домработниц и чужие грехи. С неделю назад скандальный российский тяжеловес Александр Емельяненко дал интервью некоей Оксане Кравцовой, быстро пробежавшись по всем известным персоналиям российских ММА, от "глупого Магомеда Исмаилова" до "неправильно борющего
site : valetudo.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.0112524717187994 url : https://radiosputnik.ria.ru/20191130/1561777244.html
date : 2019-11-30 12:24:52
title : Появилось видео с места крушения вертолета на Кубани
description : Видеозапись с места крушения частного вертолета Robinson R66 возле Новороссийска опубликовал портал "Кубанские новости".
site : r

-0.70290335550531 url : https://www.gametech.ru/news/67306/
date : 2019-11-30 12:31:07
title : Разработчики серии Command & Conquer анонсировали онлайновый шутер Earthbreakers
description : 
site : gametech.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.0272305298455544 url : https://potokmedia.ru/news/131427/
date : 2019-11-30 12:26:21
title : В Йошкар-Оле вновь появился зимний фонтан
description : В столице Марий Эл на площади Пресвятой Девы Марии вновь заработал зимний световой фонтан.
site : potokmedia.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.2579417571308509 url : https://fighttime.ru/news/item/19378-ramzan-kadyrov-obratilsya-k-aleksandru-emelyanenko.html
date : 2019-11-30 12:33:37
title : Глава Чеченской республики Рамзан Кадыров обратился к Александру Емельяненко, поздравив бывшего бойца клуба «Ахмат» с досрочной победой над тяжелоатлетом Михаилом Кокляевым.
description : Глава Чеченской республики Рамзан Кадыров обратился к Александру Емельяненко, поздравив бывшего бойца 

-0.985122603341732 url : https://tass.ru/sport/7234185
date : 2019-11-30 12:37:32
title : Заболевшие ангиной футболисты "Сочи" вернутся к оптимальной форме через две недели
description : Ранее РПЛ перенесла матч чемпионата России "Сочи" - "Оренбург" на 2020 год
site : tass.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.083652355394683 url : http://www.penzainform.ru/news/social/2019/11/30/v_moskve_otkrilas_vistavka_o_penzentce-geroe_sotctruda.html
date : 2019-11-30 12:36:40
title : В Москве открылась выставка о пензенце - Герое Соцтруда
description : В московском Музее Победы по проекту «Герои тыла. Неоценимый вклад в Победу» с 26 ноября представлены материалы об уроженце Пензенской области, красноармейце-минере восстановительного железнодорожного батальона, Герое Социалистического Труда Николае Агапове.
site : penzainform.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.0361169534508448 url : https://asn24.ru/news/society/70856/
date : 2019-11-30 12:42:20
title : В двух амурских колледж

-1.0210413742572575 url : https://manutd.one/news/7121-de-hea-ne-dovolen-kachestvom-komandy-manchester-yunayted.html
date : 2019-11-30 12:43:09
title : Де Хеа недоволен качеством команды «Манчестер Юнайтед»
description : Давид де Хеа считает, что нестабильная форма «Манчестер Юнайтед» связана с недостатком качественных игроков в составе.
site : manutd.one

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.054693680412529 url : https://most.tv/news/118240.html
date : 2019-11-30 12:43:10
title : Субботник в парке Молодежный объединил более 200 липчан
description : Свыше 200 липчан пришли в парк Молодежный, чтобы вместе сказать «Сделаем!».
site : most.tv

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.815716295890206 url : https://www.glamour.ru/video/tag/plus-size
date : 2019-11-30 12:44:19
title : plus size | Видео
description : Видеорецепты, видеотренировки, ролики о моде, красоте, макияже, интервью со знаменитостями на glamour.ru
site : glamour.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.4165

-1.2266511445375143 url : https://tengrinews.kz/boxing/toni-fergyuson-podpisal-kontrakt-boy-habibom-nurmagomedovyim-385412/
date : 2019-11-30 12:46:43
title : Тони Фергюсон подписал контракт на бой с Хабибом Нурмагомедовым
description : Бывший временный чемпион UFC в легком весе американец Тони Фергюсон подписал контракт на бой с действующим чемпионом лиги Хабибом
site : tengrinews.kz

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.7066460086338797 url : https://sputnik-ossetia.ru/sports/20191130/9678624/Bitva-titanov-Emelyaneko-nokautiroval-Koklyaeva-v-pervom-zhe-raunde.html
date : 2019-11-30 12:46:44
title : Битва титанов: Емельянеко нокаутировал Кокляева в первом же раунде
description : "Главный бой года" прошедший в пятницу в Москве, продлился совсем недолго и завершился победой Емельяненко через 2 минуты 47 секунд после его начала
site : sputnik-ossetia.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.7744197758000284 url : http://www.lipetskmedia.ru/news/view/124194-Nyesmotrya_na.html


-1.3928256063314743 url : https://tvzvezda.ru/news/sport/content/20191130120-IBMmK.html
date : 2019-11-30 12:54:59
title : Слуцкий уходит в отставку с поста тренера «Витесса»
description : Специалист сообщил о своем уходе после поражения в матче 15-го тура чемпионата Нидерландов с «Херенвеном». Главный тренер «Витесса» Леонид Слуцкий подал в отставку со своего поста. О своем уходе российский специалист заявил журналистам, когда его команда проиграла в матче 15-го тура чемпионата Нидерландов с «Херенвеном» (2:3). Тренер заявил, что думал, что сможет изменить ситуацию в последние недели, но затем потерял надежду. Для подопечных Слуцкого это поражение стало пятым подряд. Леонид Слуцкий начал работать с футбольным клубом «Витесс» летом 2018 года. До этого он тренировал сборную России, английский «Халл Сити» и московский ЦСКА.
site : tvzvezda.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.8434946904649023 url : https://www.pnp.ru/social/vezd-rossiyskikh-bolelshhikov-v-strany-shengena-na-vre

-1.697421194889889 url : https://ukraina.ru/news/20191130/1025870902.html
date : 2019-11-30 13:00:23
title : На Украине издадут сборник интервью Дудаева
description : 
site : ukraina.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.531032464085042 url : https://rueconomics.ru/419536-proigravshii-v-bokse-koklyaev-teper-khochet-bitsya-s-emelyanenko-po-drugim-pravilam
date : 2019-11-30 13:02:08
title : Проигравший в боксе Кокляев теперь хочет биться с Емельяненко по другим правилам
description : Бой между Александром Емельяненко и Михаилом Кокляевым прошел в Москве по правилам профессионального бокса. Победителем в нем стал боец ММА, нокаутировавший тяжелоатлета в первом раунде.
site : rueconomics.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.03723624403505 url : http://automobili.ru/news/auto/crazy-flying-tire-struck-car-athlete-millionaire/
date : 2019-11-30 13:02:44
title : Шальная летающая шина поразила спорткар спортсмена-миллионера
description : McLaren 650S получил серьезные поврежд

-2.027004299753707 url : https://peterburg2.ru/news/lekciya-informacionnaya-bezopasnost-v-sovremennom-mire-sostoitsya-v-sanktpeterburge-57273.html
date : 2019-11-30 13:04:16
title : Лекция "Информационная безопасность в современном мире" состоится в Санкт-Петербурге
description : 30 ноября в 17:00 в Планетарии №1 можно будет посетить лекция "Информационная безопасность в современном мире".
site : peterburg2.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.9196761477162272 url : https://ruinformer.com/page/luchshie-teksty-informera-za-proshedshuju-nedelju
date : 2019-11-30 13:00:11
title : Лучшие тексты «ИНФОРМЕРа» за прошедшую неделю
description : Подборка публикаций за семь дней (ФОТО).
site : ruinformer.com

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.3926092199834201 url : https://www.gazeta.ru/sport/2019/11/30/a_12840860.shtml
date : 2019-11-30 13:02:38
title : «Большую шестёрку» испытают аутсайдеры. Смотрите 14-й тур АПЛ по подписке в подарок
description : 14-й тур английской Премьер

-1.5285846887651804 url : https://vk.com/@rfs_org-kristiyan-bistrovich-sdelaem-vse-chtoby-obygrat-espanol
date : 2019-11-30 13:07:46
title : Кристиян Бистрович: «Сделаем все, чтобы обыграть «Эспаньол»
description : Полузащитник ЦСКА Кристиян Бистрович высказался о настрое команды на последний матч Лиги Европы с «Эспаньолом», а также о подготовке к игре с тульским «Арсеналом» в РПЛ.
site : vk.com

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.3809011336580657 url : https://www.nn.ru/news/more/khk_torpedo_proigral_moskovskomu_dinamo_v_napryazhyonnom_matche/66376339/
date : 2019-11-30 13:07:37
title : ХК «Торпедо» проиграл московскому «Динамо» в напряжённом матче
description : Итог игры определился в овертайме
site : nn.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.9169858614764703 url : https://susanin.news/russia/incidents/20191130-268591/
date : 2019-11-30 13:11:43
title : Заместителя главного следователя Свердловской области заподозрили во взятке
description : Правоохранители также заде

-1.853807218978625 url : https://www.bloodandsweat.ru/2019/11/204763/
date : 2019-11-30 10:13:36
title : Бой Аскар Аскаров – Тим Эллиотт состоится в январе
description : Поединок зрелищных муховесов – Тима Эллиотта (15-9-1), занимающего 8-ю строчку в рейтинге UFC, и бывшего чемпиона ACB Аскара Аскарова (10-0-1) – состоится на первом PPV-турнире 2020 года. Тим Эллиотт был уволен из UFC в 2015 году с рекордом 2-4, однако проигрывал только топовым бойцам, в том числе Али Багаутинову (19-7) в близком бою. За пределами UFC Эллиотт победил троих соперников, включая непл
site : bloodandsweat.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.011617607225405 url : https://www.bmwclub.ru/threads/komplekt-acc-kuplju-x4-f26.1361902/
date : 2019-11-30 10:14:40
title : комплект ACC куплю Х4 F26
description : Рассмотрю покупку комплекта или частями: 1. 66316885585 датчик 2. 66316861350 кронштейн 3. 34516881327 DSC 4.34526887755 ЭБУ ICM 5.51117347964 решетка...
site : bmwclub.ru

-*--*--*--*--*--*--*--*-

-2.0358455021598063 url : https://sibdepo.ru/news/s-nachala-sezona-v-sheregeshe-postradali-desyatki-turistov.html
date : 2019-11-30 10:25:01
title : С начала сезона в Шерегеше пострадали десятки туристов
description : Спасатели выезжали на помощь отдыхающим около 50 раз.
site : sibdepo.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.9075938466058195 url : https://mgorod.kz/nitem/devushka-barbi-roditeli-sdelali-iz-docheri-kuklu/
date : 2019-11-30 10:46:30
title : Девушка-Барби. Родители сделали из дочери куклу
description : https://mgorod.kz/projects/nitem/devushka-barbi-roditeli-sdelali-iz-docheri-kuklu/
site : mgorod.kz

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.06316106940943 url : https://tvzvezda.ru/schedule/programs/content/20193221619-7JHSi.html/201911291622-d51YC.html
date : 2019-11-30 10:29:40
title : Четвертый сезон. Второй полуфинал
description : В четвертом сезоне в интеллектуальном шоу «Морской бой» соревнуются семьи военнослужащих – военные династии. Во втором полуфинале ч

-1.4946791439344576 url : https://chelseablues.ru/news/nikolas_ehtot_match_budet_komfortnym_dlja_sinikh_oni_pobedjat_2_0/2019-11-30-55708
date : 2019-11-30 10:31:48
title : Николас: "Этот матч будет комфортным для "синих", они победят 2:0"
description : Бывший полузащитник "Арсенала" Чарли Николас считает, что "Челси" комфортно обыграет "Вест Хэм" на "Стэмфорд Бридж" в субботу днем.
site : chelseablues.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.6163444908479614 url : https://fighttime.ru/news/item/19375-toni-fergyuson-podpisal-kontrakt-na-boj-s-khabibom-nurmagomedovym.html
date : 2019-11-30 10:51:36
title : Бывший временный чемпион UFC в легком весе, Тони Фергюсон, поставил свою подпись под контрактом на бой с Хабибом Нурмагомедовым и встретится с действующим чемпионом 18 апреля на арене «Барклайс Центр» в Бруклине.
description : Бывший временный чемпион UFC в легком весе, Тони Фергюсон, поставил свою подпись под контрактом на бой с Хабибом Нурмагомедовым и встретится с действующим

-1.9012149638263875 url : https://vringe.com/news/129967-dyablo-i-cherkashin-vzvesilis-rezultaty-video-i-foto.htm
date : 2019-11-30 10:46:27
title : «Дьябло» и Черкашин взвесились: результаты, видео и фото
description : Состоялась процедура официального предматчевого взвешивания главных участников предстоящего вечера бокса на арене Nosalowy Dwór в Закопане (Польша). Боксёры показали следующий вес: Кшиштоф Влодарчик (57-4-1, 39 KO) — 90,8 кг Тейлор Мабика (19-4-1, 10 КО) — 87,4 кг 10-раундовый бой в тяжёлом весе (до 90,7 кг)  Фёдор Черкашин (14-0, 9 KO) — 73,7 кг Матиас Эклунд (11-2-2, 4 КО) —&nbs...
site : vringe.com

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.7606633577868833 url : https://sterlegrad.ru/newsrb/118110-respublikanskiy-festival-konkurs-bashkirskaya-shal-proydet-v-ufe.html
date : 2019-11-30 10:46:26
title : Республиканский фестиваль-конкурс «Башкирская шаль» пройдёт в Уфе
description : С 5 по 8 декабря в Уфе в рамках выставки-фестиваля народных художественных промыслов «У

0.0 url : https://www.gametech.ru/news/67303/
date : 2019-11-30 10:56:09
title : Релизный трейлер пошаговой стратегии Phoenix Point
description : 
site : gametech.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.5822488352427617 url : http://www.orenday.ru/novosti/novostnaya-lenta/301119123243
date : 2019-11-30 10:51:07
title : Оренбуржцев приглашают сыграть в "архивный квиз"
description : Любители интеллектуальных игр могут сразиться за звание лучшего знатока истории Оренбуржья.
site : orenday.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.0612608755836543 url : https://riavrn.ru/news/v-voronezhskoy-oblasti-desyatka-vrezalas-v-derevo-pogib-33-letniy-voditel/
date : 2019-11-30 10:54:42
title : В Воронежской области «десятка» врезалась в дерево: погиб 33-летний водитель
description : ДТП произошло на автодороге М-4 «Дон» – Вишневый – Дубовиково.
site : riavrn.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.2760534828025667 url : https://24molnia.com/bez-rubriki/emelyanenko-otpravil-v-nokau

-2.0994931103116032 url : https://tarantas.news/posts/id6899-0uzudr03anljpk05mzec
date : 2019-11-30 10:57:09
title : Все новые Jaguar Land Rover будут обновлять «по воздуху»
description : Абсолютно все новые модели концерна Jaguar Land Rover получат возможность обновления прошивки комплекса мультимедиа «по воздуху». Расширенная функциональность будет доступна покупателям авто с системами Touch Pro и Touch Pro Duo, а владельцам старых транспортных средств предложат установить модернизированное оборудование на специальных условиях.
site : tarantas.news

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.9361506044568033 url : https://lt.sputniknews.ru/incidents/20191130/10775852/V-Yonavskom-rayone-muzhchinu-na-stroyke-zasypalo-zemley.html
date : 2019-11-30 10:55:15
title : В Йонавском районе мужчину на стройке засыпало землей
description : Когда на место происшествия приехала пожарно-спасательная команда, над горой земли виднелась только голова строителя
site : lt.sputniknews.ru

-*--*--*--*--*-

-2.0603851718618995 url : https://vesti.kz/khl/273387/
date : 2019-11-30 11:01:37
title : "Барыс" объявил о расторжении контракта с легионером
description : Ранее он был выставлен на драфт отказов.
site : vesti.kz

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.3068180249526604 url : https://ruinformer.com/page/sanjok-ottjagival-nokaut-kak-mog-video
date : 2019-11-30 11:01:52
title : «Санёк оттягивал нокаут как мог» (ВИДЕО)
description : Александр Емельяненко отправил в нокаут пауэрлифтера Михаила Кокляева в первом раунде.
site : ruinformer.com

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.9409262065582151 url : https://www.soccer.ru/blogs/record/1152572/cherchesov-stanislav-rossiya
date : 2019-11-30 11:03:06
title : Жеребьевка Евро-2020. Когда смотреть и чего ждать?
description : Финляндия или Уэльс – выбор для России, но «Соккер.ру» рассматривает весь расклад, ведь могут собрать интересные группы.
site : soccer.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-0.8359148011392309 url : https://w

-1.8889288848272616 url : https://vk-smi.ru/obshhestvo/166399
date : 2019-11-30 11:11:42
title : Москвичи обсудили развитие спорта на краудфандинг-платформе мэрии
description : 18000 москвичей участвовали в обсуждении проекта "Город спорта" на сайте мэрии 20-29 ноября. Пользователи предложили около 2000 идей по развитию физкультуры,
site : vk-smi.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.5165147763252527 url : https://privet-rostov.ru/rus/47836-oskorbljat-policejskih-v-seti-stanet-nakladno.html
date : 2019-11-30 11:11:43
title : Оскорблять полицейских в сети станет накладно
description : Оскорблять полицейских в сети станет накладно
site : privet-rostov.ru

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-1.9827479790493305 url : https://vesti.kz/uefa/273385/
date : 2019-11-30 11:11:44
title : Матч с "МЮ" стал юбилейным для двух футболистов "Астаны" в еврокубках
description : Один из них является самым опытным в клубе.
site : vesti.kz

-*--*--*--*--*--*--*--*--*--*--*--*--*-
-2.0921915335

In [35]:
### Попробывать обучить random_forest

In [36]:
%%time
word2id = {}
for item in dataset:
    item.words = list(get_doc_words(item))
    for word in item.words:
        if word not in word2id: word2id[word] = len(word2id)

CPU times: user 1min 7s, sys: 102 ms, total: 1min 7s
Wall time: 1min 7s


In [37]:
id2word = dict( (v,k) for k,v in word2id.items())

In [38]:
len(word2id)

31067

In [39]:
def doc2vector(a_doc):
    res = [0] * len(word2id)
    if not hasattr(a_doc, 'words'): a_doc.words = get_doc_words(a_doc)
    for word in a_doc.words: 
        if word in word2id: #проверка для тестового сета
            res[word2id[word]] += 1 
    return res
        
doc2vector(sport_dataset[13])

[0,
 0,
 0,
 0,
 1,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 1,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 1,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 1,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 1,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 1,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,


In [40]:
from sklearn.ensemble import RandomForestClassifier

In [41]:
# classifier = RandomForestClassifier(n_estimators=3, max_depth=3)
classifier = RandomForestClassifier(n_estimators=3)

In [42]:
X = []
y = []
for item in sport_dataset:
    X.append(doc2vector(item))
    y.append(1)
    
for item in not_sport_dataset:
    X.append(doc2vector(item))
    y.append(0)

In [43]:
classifier.fit(X, y)

RandomForestClassifier(bootstrap=True, class_weight=None, criterion='gini',
                       max_depth=None, max_features='auto', max_leaf_nodes=None,
                       min_impurity_decrease=0.0, min_impurity_split=None,
                       min_samples_leaf=1, min_samples_split=2,
                       min_weight_fraction_leaf=0.0, n_estimators=3,
                       n_jobs=None, oob_score=False, random_state=None,
                       verbose=0, warm_start=False)

In [44]:
for i, weight in sorted(enumerate(classifier.feature_importances_), key=lambda x: x[1], reverse=True):
    print(i, weight, id2word[i])

103 0.05752976823537722 хороший
405 0.04272600996204552 тренер
499 0.025950247529462348 нокаут
89 0.023851775008523837 матч
506 0.012818218041846591 эстафета
149 0.012174710506108957 го
2025 0.010634469964680175 зенит
396 0.008977775611789869 слуцкий
505 0.008322324233218971 смешанный
2151 0.007932911043317262 болельщик
1248 0.007549278226648915 головин
13 0.00750612780563427 в
465 0.0072945715752016 победа
1254 0.007285895236313401 сезон
1748 0.006973160683117709 сыграть
2021 0.006641145147496437 спартак
488 0.005685088452646143 смотреть
10931 0.005576602109152383 витессать
2386 0.005526898959899255 футбол
84 0.005354885345846019 лига
483 0.00509865483231081 боруссия
136 0.004974684912250534 очки
170 0.004700283911858613 по
413 0.004676240617289493 поражение
509 0.004659783979631001 кубок
3255 0.004618187353058068 реал
81 0.004479825065666455 рубин
74 0.004405193026015545 это
360 0.004301830493079012 dota
20 0.004206978880833995 и
416 0.004073683751709275 сборный
1116 0.00396957767269

23060 0.0001007569500397046 дамба
929 0.00010026098447595305 уголок
6375 0.00010026098447595305 неудача
15880 9.973329508397439e-05 хуслютдин
3009 9.945958435919276e-05 неизвестный
22661 9.945958435919268e-05 нагоя
11434 9.707297763242157e-05 прожиточный
376 9.68461316088536e-05 28
11516 9.625054509691515e-05 krauss
2092 9.604575035588796e-05 80
3441 9.604575035588796e-05 принцип
6891 9.583980308369952e-05 улететь
1176 9.481439458209481e-05 среди
2805 9.458608849637607e-05 депутат
7894 9.457136352931464e-05 звать
2779 9.398930721943691e-05 павел
1369 9.363828585103612e-05 возможность
22234 9.35955898278246e-05 согреться
7730 9.282894540191311e-05 видеотрансляция
7870 9.282894540191311e-05 усман
3414 9.2596219885359e-05 чуть
6660 9.228289278190268e-05 grand
20664 9.214637962689904e-05 204
21941 9.207950997550047e-05 триппьер
125 9.151472479069047e-05 практически
1802 9.102666096233835e-05 подвести
5982 9.049026757668197e-05 магнитогорский
833 8.987140266050105e-05 опубликовать
6292 8.97

765 0.0 айдол
766 0.0 заворожить
767 0.0 декольте
768 0.0 jyp
769 0.0 entertainment
770 0.0 исполнить
771 0.0 хит
772 0.0 don
773 0.0 t
774 0.0 leave
775 0.0 me
776 0.0 1994
777 0.0 you
778 0.0 re
780 0.0 2012
781 0.0 who
782 0.0 s
783 0.0 your
784 0.0 участник
785 0.0 акция
786 0.0 июль
787 0.0 самариддин
788 0.0 раджабов
789 0.0 предъявить
791 0.0 суд
792 0.0 вернуть
793 0.0 несуществующий
794 0.0 преступление
795 0.0 фигурант
797 0.0 правозащита
798 0.0 открытка
799 0.0 ссылка
800 0.0 бадамшин
801 0.0 полимер
802 0.0 кишечный
803 0.0 бактерия
804 0.0 повлиять
805 0.0 восстановление
806 0.0 костный
807 0.0 ткань
809 0.0 мгу
810 0.0 ломоносов
811 0.0 исследовать
812 0.0 полиоксиалканоат
813 0.0 синтезировать
814 0.0 микробиота
815 0.0 соединение
816 0.0 способный
817 0.0 активировать
818 0.0 хрящевой
819 0.0 направление
821 0.0 современный
822 0.0 медицина
823 0.0 позволять
824 0.0 изделие
825 0.0 тканевый
826 0.0 инженерия
828 0.0 поддержать
829 0.0 президентский
831 0.0 научный
834 

2476 0.0 реализовать
2478 0.0 приморье
2479 0.0 продолжаться
2480 0.0 поиск
2481 0.0 судный
2482 0.0 обследовать
2483 0.0 восемь
2485 0.0 береговой
2486 0.0 tanks
2487 0.0 танкист
2488 0.0 снегурочка
2489 0.0 карина
2490 0.0 декабрьский
2491 0.0 уничтожение
2493 0.0 вертолёт
2494 0.0 apache
2495 0.0 зрк
2496 0.0 оса
2497 0.0 сбить
2498 0.0 ah
2499 0.0 64
2500 0.0 предположительно
2501 0.0 инцидент
2502 0.0 аравийский
2503 0.0 полуостров
2504 0.0 уничтожить
2505 0.0 летательный
2506 0.0 принадлежать
2507 0.0 хусито
2508 0.0 обойтись
2510 0.0 зафиксировать
2514 0.0 26
2519 0.0 бабурин
2520 0.0 козлый
2522 0.0 каша
2523 0.0 московск
2524 0.0 поесть
2525 0.0 ресторан
2526 0.0 проверить
2527 0.0 соответствовать
2528 0.0 указанный
2529 0.0 меню
2530 0.0 fifpro
2531 0.0 встать
2533 0.0 конфликт
2534 0.0 международный
2536 0.0 ассоциация
2537 0.0 профессиональный
2538 0.0 санкция
2539 0.0 штраф
2540 0.0 выписать
2543 0.0 бутерброд
2544 0.0 балтийский
2545 0.0 шпрот
2546 0.0 приход
2549 0.0 бан

3895 0.0 курорт
3896 0.0 охт
3898 0.0 гастромаркет
3899 0.0 foods
3900 0.0 in
3901 0.0 woods
3902 0.0 смешать
3903 0.0 азиатский
3904 0.0 кухня
3905 0.0 протест
3906 0.0 прошение
3907 0.0 адель
3908 0.0 абдель
3909 0.0 махдить
3910 0.0 генсек
3911 0.0 напористо
3913 0.0 карманный
3914 0.0 котан
3915 0.0 попросить
3916 0.0 сшить
3917 0.0 крякозябра
3918 0.0 сходство
3919 0.0 феноменальный
3920 0.0 митрополит
3921 0.0 сингапурский
3922 0.0 юго
3923 0.0 сергий
3924 0.0 визит
3925 0.0 литургия
3926 0.0 троицкий
3927 0.0 храм
3928 0.0 нуль
3929 0.0 субботний
3930 0.0 патрульный
3931 0.0 достать
3932 0.0 райан
3933 0.0 реабилитироваться
3934 0.0 джедай
3936 0.0 искромётный
3938 0.0 knives
3939 0.0 out
3940 0.0 райана
3941 0.0 режиссёр
3942 0.0 сценарист
3943 0.0 петлить
3944 0.0 актёрский
3945 0.0 шикарный
3946 0.0 дэниэл
3947 0.0 крэйг
3948 0.0 ана
3949 0.0 армас
3950 0.0 крис
3951 0.0 эванс
3952 0.0 дженять
3953 0.0 кертис
3954 0.0 шеннон
3955 0.0 пламмера
3956 0.0 обескураживать
3957 0.0 

5332 0.0 краска
5333 0.0 ансамбль
5334 0.0 захватывать
5335 0.0 пролететь
5336 0.0 скрыться
5337 0.0 красавица
5340 0.0 берег
5341 0.0 сковать
5342 0.0 оба
5343 0.0 ярмарка
5344 0.0 non
5345 0.0 fiction
5346 0.0 гостиный
5347 0.0 ильинка
5348 0.0 стенд
5349 0.0 h
5350 0.0 чудесный
5351 0.0 поэма
5352 0.0 проиллюстрировать
5353 0.0 тува
5354 0.0 янссон
5355 0.0 пятьдесят
5356 0.0 нисколько
5357 0.0 утратить
5358 0.0 свежесть
5359 0.0 очарование
5360 0.0 марина
5361 0.0 бородицкий
5362 0.0 медвежонок
5363 0.0 паддингтон
5364 0.0 польга
5365 0.0 непревзойдённый
5366 0.0 выдумщица
5367 0.0 рассказчица
5368 0.0 покупаться
5369 0.0 ванна
5370 0.0 утопить
5371 0.0 плюшевый
5372 0.0 мишка
5373 0.0 держать
5374 0.0 заветный
5375 0.0 коробочка
5377 0.0 присоединение
5378 0.0 свинарник
5379 0.0 бора
5380 0.0 newsnn
5381 0.0 подводить
5382 0.0 значимый
5383 0.0 освещаться
5384 0.0 щербинка
5385 0.0 отделка
5386 0.0 мебель
5388 0.0 проживание
5389 0.0 доп
5390 0.0 ремонт
5391 0.0 пафос
5392 0.0 зюг

6908 0.0 беда
6909 0.0 грешный
6910 0.0 дневник
6911 0.0 накрутить
6912 0.0 арматура
6913 0.0 спасение
6915 0.0 пёс
6916 0.0 ярославский
6918 0.0 бабкин
6919 0.0 преображение
6920 0.0 уникальный
6921 0.0 challenge
6922 0.0 park
6923 0.0 афимолл
6924 0.0 шпионский
6925 0.0 квеста
6926 0.0 агент
6927 0.0 эмерсон
6928 0.0 шиномонтажный
6929 0.0 станок
6930 0.0 самодельный
6931 0.0 разбортовка
6932 0.0 забортовка
6933 0.0 сезонный
6935 0.0 прокол
6936 0.0 порез
6937 0.0 необходимость
6938 0.0 сто
6939 0.0 швеллер
6940 0.0 отрезать
6941 0.0 подлежащее
6942 0.0 перечень
6943 0.0 кожаный
6944 0.0 лампа
6945 0.0 постельный
6946 0.0 кухонный
6947 0.0 контрафакт
6948 0.0 меховой
6949 0.0 июнь
6950 0.0 молочный
6951 0.0 предлагаться
6952 0.0 велосипед
6953 0.0 минеральный
6954 0.0 двухмерный
6955 0.0 data
6956 0.0 matrix
6957 0.0 пакет
6958 0.0 2024
6959 0.0 единый
6960 0.0 прослеживание
6961 0.0 государственно
6962 0.0 частное
6963 0.0 партнерство
6964 0.0 подделка
6965 0.0 затрата
6966 0.0 коне

8295 0.0 архитектор
8296 0.0 увековечить
8297 0.0 упираться
8299 0.0 кишеть
8300 0.0 штучка
8301 0.0 давний
8302 0.0 подъездный
8303 0.0 постройка
8304 0.0 экономия
8305 0.0 практичность
8306 0.0 сидней
8307 0.0 дубай
8308 0.0 киото
8309 0.0 туристический
8310 0.0 travel
8311 0.0 трейлер
8312 0.0 elden
8313 0.0 ring
8314 0.0 tga
8315 0.0 хардкорный
8316 0.0 ролевый
8317 0.0 game
8318 0.0 from
8319 0.0 software
8320 0.0 накопить
8321 0.0 токио
8322 0.0 потенциально
8323 0.0 sohu
8324 0.0 электростанция
8325 0.0 боезаряд
8326 0.0 плутоний
8327 0.0 соседний
8328 0.0 бдительный
8329 0.0 десятилетие
8330 0.0 восходящий
8331 0.0 солнце
8332 0.0 вызов
8333 0.0 совбез
8334 0.0 боеспособность
8335 0.0 неведение
8337 0.0 заключать
8338 0.0 прерваться
8340 0.0 лабораторный
8341 0.0 хиросима
8342 0.0 нагасаки
8343 0.0 вынудить
8344 0.0 капитулировать
8345 0.0 1945
8346 0.0 нераспространение
8347 0.0 конституция
8348 0.0 запрещать
8349 0.0 споровый
8350 0.0 экспертный
8352 0.0 2006
8353 0.0 заявлят

9594 0.0 шрам
9595 0.0 аллергический
9596 0.0 удел
9597 0.0 уродовать
9598 0.0 недоумение
9599 0.0 воспринимать
9600 0.0 веяние
9601 0.0 безобразие
9602 0.0 мачеха
9603 0.0 новорождённый
9604 0.0 junior
9605 0.0 backend
9606 0.0 разработчка
9607 0.0 api
9608 0.0 умяров
9609 0.0 хайнань
9610 0.0 245
9611 0.0 мексиканский
9612 0.0 почтовый
9613 0.0 отправление
9614 0.0 блюститель
9615 0.0 правопорядок
9616 0.0 курьерский
9617 0.0 тихуан
9618 0.0 калифорния
9619 0.0 мексика
9620 0.0 детёныш
9621 0.0 хищник
9622 0.0 подход
9623 0.0 поклеить
9624 0.0 постелить
9625 0.0 линолеум
9626 0.0 продумать
9627 0.0 мелочь
9628 0.0 эвока
9629 0.0 хай
9630 0.0 технологичный
9631 0.0 интерьер
9632 0.0 высокотехнологичный
9633 0.0 фактура
9634 0.0 неповторимый
9635 0.0 капризный
9636 0.0 ценитель
9637 0.0 хайтек
9638 0.0 спутать
9639 0.0 грабёж
9640 0.0 еу
9641 0.0 вымятнина
9642 0.0 arzamas
9643 0.0 пиратство
9644 0.0 стильный
9645 0.0 отличительный
9646 0.0 уплотнитель
9647 0.0 строй
9648 0.0 отрицател

10906 0.0 плющенко
10908 0.0 филипп
10909 0.0 киркоров
10911 0.0 новоиспечённый
10912 0.0 испуг
10913 0.0 пикетчик
10914 0.0 омичка
10915 0.0 бегун
10917 0.0 одолевша
10918 0.0 старик
10919 0.0 модник
10920 0.0 позавидовать
10921 0.0 ляховичи
10922 0.0 психологически
10923 0.0 давить
10924 0.0 возвращаться
10925 0.0 доблесть
10926 0.0 вечно
10927 0.0 поисковик
10928 0.0 74
10929 0.0 градозащитник
10930 0.0 лишаться
10932 0.0 животноводство
10933 0.0 экспортироваться
10934 0.0 инспектор
10935 0.0 грузинский
10936 0.0 ветеринарный
10937 0.0 рогатый
10938 0.0 скот
10939 0.0 мясной
10940 0.0 брянский
10941 0.0 белгородский
10942 0.0 инсайдерский
10943 0.0 затмить
10944 0.0 брак
10945 0.0 зонирование
10946 0.0 совмещение
10947 0.0 снос
10948 0.0 интерьерный
10949 0.0 разграничить
10950 0.0 отделить
10952 0.0 малое
10953 0.0 организационный
10954 0.0 превзойти
10955 0.0 выдающийся
10956 0.0 похвала
10957 0.0 искусствовед
10958 0.0 сосредотачиваться
10959 0.0 веский
10960 0.0 исключительный
1

12186 0.0 ноэль
12187 0.0 сымитировать
12188 0.0 галле
12189 0.0 разрушать
12190 0.0 эластичный
12191 0.0 ntv
12193 0.0 вологжанин
12194 0.0 попадаться
12195 0.0 удочка
12196 0.0 заразиться
12197 0.0 ротавирусный
12198 0.0 демократ
12199 0.0 слушание
12200 0.0 импичмент
12201 0.0 продление
12202 0.0 джерролд
12203 0.0 надлер
12205 0.0 прибрежный
12206 0.0 порожек
12207 0.0 ламинат
12208 0.0 обустройство
12209 0.0 состыковка
12210 0.0 разнохарактерный
12211 0.0 напольный
12212 0.0 смежный
12213 0.0 подгон
12214 0.0 оборудоваться
12215 0.0 предназначение
12216 0.0 скрытие
12217 0.0 неэстетический
12218 0.0 шов
12219 0.0 придача
12220 0.0 гармонический
12221 0.0 семейно
12222 0.0 удовлетвориться
12223 0.0 саакашвили
12224 0.0 григолый
12225 0.0 вашадзе
12226 0.0 продолжиться
12227 0.0 карвахаль
12229 0.0 эрич
12230 0.0 рукавино
12231 0.0 маевский
12233 0.0 нур
12234 0.0 султан
12235 0.0 шмельков
12236 0.0 разобрать
12237 0.0 астана
12238 0.0 раскрытый
12240 0.0 хосе
12241 0.0 баффало
1224

13558 0.0 wind
13559 0.0 rain
13560 0.0 sworddark
13561 0.0 уличить
13562 0.0 растрата
13563 0.0 явиться
13564 0.0 оглашение
13565 0.0 магасский
13566 0.0 обильный
13567 0.0 облачно
13568 0.0 прояснение
13569 0.0 2000
13570 0.0 прикроватн
13571 0.0 наброситься
13572 0.0 гвардия
13573 0.0 экофорум
13574 0.0 прощение
13575 0.0 йоран
13576 0.0 каллмиро
13577 0.0 известность
13578 0.0 торунн
13579 0.0 смедаль
13580 0.0 nettavisen
13581 0.0 промокод
13582 0.0 аутлето
13583 0.0 estee
13584 0.0 lauder
13585 0.0 companies
13586 0.0 спецпредложение
13587 0.0 2500
13588 0.0 косметичка
13589 0.0 подоплёка
13590 0.0 баварский
13591 0.0 сокольник
13593 0.0 клавиш
13594 0.0 подогрев
13595 0.0 мосгорпарк
13596 0.0 гарипов
13597 0.0 бессменно
13598 0.0 казначей
13599 0.0 прение
13600 0.0 хищение
13601 0.0 прыгать
13602 0.0 оповещать
13603 0.0 sms
13604 0.0 проиграться
13605 0.0 ограбление
13606 0.0 ростовчанка
13607 0.0 текслера
13609 0.0 ургант
13610 0.0 голодный
13611 0.0 исполнительница
13612 0.0 в

14861 0.0 гармония
14862 0.0 милиция
14863 0.0 госпереворот
14864 0.0 650
14865 0.0 автосалон
14866 0.0 нева
14867 0.0 проломить
14868 0.0 сандра
14869 0.0 года
14870 0.0 американ
14871 0.0 паула
14872 0.0 бедный
14873 0.0 миллионер
14874 0.0 отличать
14875 0.0 мышление
14876 0.0 мировоззрение
14877 0.0 olyan
14878 0.0 метраж
14879 0.0 бархат
14880 0.0 расположение
14881 0.0 прибавление
14882 0.0 герцог
14883 0.0 сассекский
14884 0.0 свершиться
14885 0.0 межличностный
14886 0.0 краснодарец
14887 0.0 раздувать
14888 0.0 эрдогана
14889 0.0 грешить
14890 0.0 корреспонденция
14891 0.0 управленческий
14892 0.0 чеховский
14893 0.0 шаффхаузный
14894 0.0 ненавидеть
14895 0.0 коломенский
14896 0.0 кпо
14897 0.0 мячкова
14898 0.0 вол
14899 0.0 мячковый
14900 0.0 скрываться
14901 0.0 демократия
14902 0.0 исполнитель
14903 0.0 фокин
14904 0.0 капанец
14905 0.0 довлатов
14906 0.0 диана
14907 0.0 арбенин
14908 0.0 приоткрыть
14909 0.0 завеса
14910 0.0 нависнуть
14911 0.0 обрушить
14912 0.0 потенциал

16030 0.0 3300
16031 0.0 доминирование
16032 0.0 предматчевый
16033 0.0 поцеловаться
16034 0.0 кольцов
16035 0.0 фокуока
16036 0.0 asahi
16037 0.0 ryokan
16038 0.0 dollar
16039 0.0 реалить
16040 0.0 транслироваться
16041 0.0 постоялец
16042 0.0 бикфалви
16043 0.0 крамарич
16044 0.0 пластинка
16045 0.0 басиния
16046 0.0 шульман
16047 0.0 тепличный
16048 0.0 пустой
16049 0.0 вынуждать
16050 0.0 перетряхивать
16051 0.0 исподний
16052 0.0 стрим
16053 0.0 одиозный
16054 0.0 поп
16055 0.0 лёха
16056 0.0 притеснять
16057 0.0 шушить
16058 0.0 пасить
16059 0.0 starykh
16060 0.0 irina
16062 0.0 pidhrushna
16063 0.0 olena
16064 0.0 ukr
16065 0.0 glazyrina
16066 0.0 ekaterina
16067 0.0 porshneva
16068 0.0 anastasiia
16069 0.0 hoegberg
16070 0.0 elisabeth
16071 0.0 swe
16072 0.0 lien
16073 0.0 ida
16074 0.0 nor
16075 0.0 fruehwirt
16076 0.0 juliane
16077 0.0 ger
16078 0.0 cadurisch
16079 0.0 irene
16080 0.0 sui
16081 0.0 kryvonos
16082 0.0 anna
16083 0.0 slettemark
16084 0.0 ukaleq
16085 0.0 astri


17376 0.0 ухоженность
17377 0.0 пополняться
17378 0.0 злобин
17379 0.0 протектор
17380 0.0 вешний
17381 0.0 topson
17382 0.0 singapore
17383 0.0 comic
17384 0.0 con
17385 0.0 og
17386 0.0 international
17388 0.0 таавитсайнный
17389 0.0 хван
17390 0.0 ёль
17391 0.0 kbs
17392 0.0 вокал
17393 0.0 арияс
17394 0.0 момока
17396 0.0 настать
17397 0.0 останкино
17398 0.0 шенгенский
17399 0.0 лихой
17400 0.0 прибегнуть
17401 0.0 кипеловый
17402 0.0 спортивно
17403 0.0 пиротехнический
17404 0.0 забор
17405 0.0 выстроиться
17406 0.0 напутствовать
17407 0.0 зрс
17408 0.0 бриллиант
17409 0.0 коллектор
17410 0.0 брикс
17411 0.0 жанейро
17412 0.0 инноватор
17413 0.0 улгт
17414 0.0 перенаправлять
17417 0.0 окр
17418 0.0 разрешать
17419 0.0 рулить
17420 0.0 тарасов
17421 0.0 комличенко
17422 0.0 шпионаж
17423 0.0 уилан
17424 0.0 ceo
17425 0.0 wim
17426 0.0 crm
17427 0.0 омниканальный
17428 0.0 фаундёр
17429 0.0 шарлот
17430 0.0 постель
17431 0.0 вайба
17432 0.0 натали
17433 0.0 архивный
17434 0.0 лебед

18748 0.0 хiv
18749 0.0 неизменность
18750 0.0 nix
18751 0.0 нуна
18752 0.0 оффлейнер
18753 0.0 hr
18754 0.0 o
18755 0.0 ne
18756 0.0 миненко
18757 0.0 чешуйчатый
18758 0.0 доработать
18759 0.0 нагрудник
18760 0.0 наплечник
18761 0.0 чешуя
18762 0.0 нержавеющий
18763 0.0 наплечо
18764 0.0 крепиться
18765 0.0 карабин
18766 0.0 фокусироваться
18767 0.0 паромный
18768 0.0 пятнашка
18769 0.0 кадеттен
18770 0.0 взлёт
18771 0.0 техникум
18772 0.0 думский
18773 0.0 скорректировать
18774 0.0 нацелиться
18775 0.0 уругваец
18776 0.0 баскетбольный
18777 0.0 разрушиться
18778 0.0 перекрытие
18779 0.0 поднятие
18780 0.0 инклюзивный
18781 0.0 неудобно
18782 0.0 придумываться
18783 0.0 усреднить
18784 0.0 медуза
18785 0.0 схватить
18786 0.0 matchtv
18787 0.0 закупаться
18788 0.0 уклонение
18789 0.0 причал
18790 0.0 метеорит
18791 0.0 пористый
18792 0.0 водяной
18793 0.0 acfer
18794 0.0 094
18795 0.0 высокопористый
18796 0.0 испарение
18797 0.0 обломок
18798 0.0 advances
18799 0.0 пересказывать
18800 

20039 0.0 scramble
20040 0.0 phantom
20041 0.0 strikes
20042 0.0 кошечка
20043 0.0 анне
20044 0.0 atlus
20045 0.0 обворожительный
20046 0.0 такамаки
20047 0.0 сожалеть
20048 0.0 покойный
20049 0.0 трагичный
20050 0.0 катастрофический
20051 0.0 недосчитаться
20052 0.0 бойко
20053 0.0 поимка
20054 0.0 отёчность
20055 0.0 зуд
20056 0.0 ситкомов
20057 0.0 продолжительный
20058 0.0 ситкома
20059 0.0 печеркин
20060 0.0 emin
20061 0.0 предпоследний
20062 0.0 слушатель
20063 0.0 оцифровать
20064 0.0 безвизовый
20065 0.0 лос
20066 0.0 анджелес
20067 0.0 спорткара
20068 0.0 fairlady
20069 0.0 модифицировать
20070 0.0 выпускаться
20071 0.0 рэшфорд
20072 0.0 дэниел
20073 0.0 маркус
20074 0.0 хохотуй
20075 0.0 морозилка
20076 0.0 редька
20077 0.0 удирать
20078 0.0 cмерть
20079 0.0 апартамент
20080 0.0 сверхвысокий
20081 0.0 масштабирование
20082 0.0 катарин
20083 0.0 синтипоп
20084 0.0 alphaville
20085 0.0 мариан
20086 0.0 голд
20087 0.0 online
20088 0.0 vapid
20089 0.0 peyote
20090 0.0 gasser
2009

21343 0.0 рейх
21344 0.0 бытовать
21345 0.0 генофонд
21346 0.0 неполноценный
21347 0.0 митрофанов
21348 0.0 fire
21349 0.0 дикарь
21350 0.0 блеск
21351 0.0 колесить
21352 0.0 величественный
21353 0.0 невиданный
21354 0.0 всепогодный
21355 0.0 барахлишко
21356 0.0 коммунар
21357 0.0 обменять
21360 0.0 развязка
21361 0.0 934
21362 0.0 ногохвостка
21363 0.0 муравей
21364 0.0 термит
21365 0.0 http
21366 0.0 short
21367 0.0 nplus
21368 0.0 налоговик
21369 0.0 мясищев
21370 0.0 наместник
21371 0.0 лемирт
21372 0.0 707
21373 0.0 997
21374 0.0 независящий
21375 0.0 наказывать
21376 0.0 устояться
21377 0.0 устремление
21378 0.0 нелюди
21379 0.0 эстет
21380 0.0 раритет
21381 0.0 барахолка
21382 0.0 хуршед
21383 0.0 саттор
21384 0.0 поздравительный
21385 0.0 сера
21386 0.0 сантехнический
21387 0.0 умываться
21388 0.0 хэйтер
21389 0.0 гридино
21390 0.0 судогодский
21391 0.0 люли
21392 0.0 starship
21393 0.0 url
21394 0.0 naked
21395 0.0 натощак
21396 0.0 дополнительно
21397 0.0 виллаша
21398 0.0 б

22609 0.0 могилевский
22610 0.0 привіт
22611 0.0 ті
22612 0.0 штык
22613 0.0 строев
22614 0.0 отшибатель
22615 0.0 потомский
22616 0.0 клычкова
22617 0.0 решительный
22618 0.0 лицезреть
22619 0.0 клычковы
22620 0.0 сбегать
22621 0.0 бабочка
22622 0.0 жрица
22623 0.0 сословие
22624 0.0 светильник
22625 0.0 ночник
22626 0.0 вещица
22627 0.0 осветительный
22628 0.0 160
22629 0.0 радиоэлектронный
22630 0.0 навигация
22631 0.0 отъезд
22632 0.0 бару
22633 0.0 одесчин
22634 0.0 чекшиный
22635 0.0 тотьма
22636 0.0 самоходный
22637 0.0 рубка
22638 0.0 некомфортный
22639 0.0 некрасовка
22640 0.0 бирюлево
22641 0.0 ный
22642 0.0 ампутировать
22643 0.0 больно
22645 0.0 автономно
22646 0.0 кофейный
22647 0.0 смузи
22648 0.0 хлопья
22649 0.0 какао
22650 0.0 корица
22651 0.0 овсяный
22652 0.0 калорийность
22653 0.0 жирность
22654 0.0 бодрящий
22655 0.0 растворимый
22656 0.0 балин
22657 0.0 цыганский
22658 0.0 бирюлин
22659 0.0 врезка
22660 0.0 водопро
22662 0.0 гавайский
22663 0.0 пальмовый
22664 0.0

23878 0.0 назарбаев
23879 0.0 поменяться
23880 0.0 унисон
23881 0.0 подпевать
23882 0.0 перешагнуть
23883 0.0 кинчев
23884 0.0 отзываться
23885 0.0 весточка
23886 0.0 чайф
23887 0.0 шахрина
23888 0.0 ностальгический
23889 0.0 депо
23890 0.0 тушино
23891 0.0 рукотворный
23892 0.0 заселение
23893 0.0 воробьев
23894 0.0 бахча
23895 0.0 тщеславный
23896 0.0 салим
23897 0.0 точить
23898 0.0 хитрить
23899 0.0 груша
23900 0.0 соседов
23901 0.0 перегиб
23902 0.0 матвеев
23903 0.0 транспортировать
23904 0.0 следовательно
23905 0.0 мюнхен
23906 0.0 совместимость
23907 0.0 переделка
23908 0.0 канцелярский
23909 0.0 скреплять
23910 0.0 скрепить
23911 0.0 росгвардеец
23912 0.0 вневедомственный
23913 0.0 уфссп
23914 0.0 бекесова
23915 0.0 арсеньев
23916 0.0 богатырь
23917 0.0 средне
23918 0.0 испечь
23919 0.0 тэц
23920 0.0 конструктивный
23921 0.0 артемовский
23922 0.0 авдеев
23923 0.0 моксли
23924 0.0 aew
23926 0.0 фристайл
23927 0.0 клоуд
23928 0.0 футбэг
23929 0.0 лаура
23930 0.0 лдс
23931 0.0 че

25119 0.0 лучо
25120 0.0 здан
25121 0.0 чёртов
25122 0.0 переродиться
25123 0.0 snowпать
25124 0.0 быстрорастущий
25125 0.0 крид
25126 0.0 клава
25127 0.0 st
25128 0.0 zivert
25129 0.0 elvira
25130 0.0 molly
25131 0.0 ternovoy
25132 0.0 artik
25133 0.0 asti
25134 0.0 rsac
25135 0.0 ella
25136 0.0 gayazov
25137 0.0 мерориятие
25138 0.0 dniru
25139 0.0 snowпатм
25140 0.0 обухов
25141 0.0 lgr
25142 0.0 приемлить
25143 0.0 doomd
25144 0.0 флешек
25145 0.0 eternal
25146 0.0 hard
25147 0.0 disk
25148 0.0 sentinel
25149 0.0 ssd
25150 0.0 каждодневно
25151 0.0 lumen
25152 0.0 киберспортивный
25153 0.0 splyce
25154 0.0 mad
25155 0.0 lions
25156 0.0 overactive
25157 0.0 lec
25158 0.0 франшизный
25159 0.0 бобби
25160 0.0 адамс
25161 0.0 виталик
25162 0.0 бутерин
25163 0.0 соучредитель
25164 0.0 криптозащита
25165 0.0 постквантовый
25166 0.0 сброс
25167 0.0 отравлять
25168 0.0 яд
25169 0.0 окись
25170 0.0 этилен
25171 0.0 wildberries
25172 0.0 скрин
25173 0.0 регулярность
25174 0.0 занятой
25175 0

26369 0.0 ругательство
26370 0.0 цзиньпин
26371 0.0 оплевывание
26372 0.0 сынов
26373 0.0 дестабилизировать
26374 0.0 персонально
26375 0.0 высмеивать
26376 0.0 грубость
26377 0.0 макдоналдс
26378 0.0 подливать
26379 0.0 нанимать
26380 0.0 сжигать
26381 0.0 стимулироваться
26382 0.0 обиженный
26383 0.0 возрождаться
26384 0.0 полуколониальный
26385 0.0 типологический
26386 0.0 искусный
26387 0.0 троллинг
26388 0.0 этакий
26389 0.0 слоить
26390 0.0 пиндос
26391 0.0 хамский
26392 0.0 низкопробный
26393 0.0 шовинистический
26394 0.0 барак
26395 0.0 тупо
26396 0.0 похабщина
26397 0.0 различать
26398 0.0 похабник
26399 0.0 скабрёзный
26400 0.0 миросозерцание
26401 0.0 телерадиоканал
26402 0.0 благодушный
26403 0.0 практицизм
26404 0.0 враждебный
26405 0.0 выдрать
26408 0.0 гильотинировать
26409 0.0 усмирять
26410 0.0 надзирать
26411 0.0 ордынка
26412 0.0 dolce
26413 0.0 gabbana
26414 0.0 yana
26415 0.0 rudkovskaya
26416 0.0 rudkovskayaofficial
26417 0.0 няня
26418 0.0 бедроса
26419 0.0 франк

27548 0.0 внешнеэкономический
27549 0.0 просуммировать
27550 0.0 кингисеппский
27551 0.0 спринтер
27552 0.0 сканий
27553 0.0 соцтруд
27554 0.0 минёр
27555 0.0 агапов
27556 0.0 дожить
27557 0.0 трудоспособный
27558 0.0 верняковый
27559 0.0 конопушка
27560 0.0 веснушка
27561 0.0 умилять
27562 0.0 антошка
27563 0.0 лжеполицейский
27564 0.0 непоседливый
27565 0.0 неохотно
27566 0.0 бэкстейдж
27567 0.0 viva
27568 0.0 бордовый
27569 0.0 лео
27570 0.0 подсветить
27571 0.0 стефановский
27572 0.0 осветить
27573 0.0 бант
27574 0.0 ссуза
27575 0.0 безупречно
27576 0.0 элтон
27577 0.0 сим
27578 0.0 нарадоваться
27579 0.0 track
27580 0.0 комаровский
27582 0.0 полярис
27583 0.0 ямало
27584 0.0 многопрофильный
27585 0.0 приветственный
27586 0.0 чигирёв
27587 0.0 завоюр
27588 0.0 субар
27589 0.0 канареечный
27590 0.0 окупанти
27591 0.0 донбасі
27592 0.0 держкордон
27593 0.0 україні
27594 0.0 російський
27595 0.0 ляпас
27596 0.0 проросійські
27597 0.0 бойовик
27598 0.0 донеччині
27599 0.0 відзначиться


28874 0.0 свинцовый
28875 0.0 облёт
28876 0.0 баландино
28877 0.0 локатор
28878 0.0 рлс
28879 0.0 радиозавод
28880 0.0 непрерывность
28881 0.0 аэродромный
28882 0.0 филонец
28883 0.0 пулково
28884 0.0 чрз
28885 0.0 росэлектроника
28886 0.0 нестер
28887 0.0 кфу
28888 0.0 дарвин
28889 0.0 таргет
28890 0.0 таргетировать
28891 0.0 спамить
28892 0.0 тележка
28893 0.0 госпрограмма
28894 0.0 немаркированный
28895 0.0 grotemarktstraat
28896 0.0 кирпиченко
28897 0.0 башкирский
28898 0.0 шестнадцатилетний
28899 0.0 гущина
28900 0.0 свойственно
28901 0.0 окружать
28902 0.0 спонтанно
28903 0.0 майами
28904 0.0 голя
28905 0.0 406060
28906 0.0 поручать
28907 0.0 dior
28908 0.0 круизный
28909 0.0 интерпретация
28910 0.0 намоленість
28911 0.0 евроремонт
28912 0.0 весомый
28913 0.0 кроманьонец
28914 0.0 геноцид
28915 0.0 неандерталец
28916 0.0 homo
28917 0.0 neanderthalensis
28918 0.0 коренастый
28919 0.0 галла
28920 0.0 доко
28921 0.0 футер
28922 0.0 лайкрой
28923 0.0 принтом
28924 0.0 фатина
28925 0.

30205 0.0 кардинал
30206 0.0 лоббировать
30207 0.0 злосчастный
30208 0.0 отсекать
30209 0.0 радикализм
30210 0.0 радушно
30211 0.0 невежество
30212 0.0 межнац
30213 0.0 кэрролл
30214 0.0 дюна
30215 0.0 поспешить
30216 0.0 приспособиться
30217 0.0 выживаемость
30218 0.0 бурковский
30219 0.0 михеев
30220 0.0 алферов
30221 0.0 оренбуржец
30222 0.0 квиза
30223 0.0 мрот
30224 0.0 мотоциклетный
30225 0.0 boxer
30226 0.0 круизер
30227 0.0 оппозитный
30228 0.0 воздуша
30229 0.0 вишнёвый
30230 0.0 дубовиковый
30231 0.0 четырехраундовый
30232 0.0 зав
30233 0.0 malaysia
30234 0.0 airlines
30235 0.0 мясниковский
30236 0.0 экокомплекс
30237 0.0 родство
30238 0.0 докторант
30239 0.0 тартуский
30240 0.0 пеэтера
30241 0.0 аниять
30242 0.0 err
30243 0.0 вулверхэмптон
30245 0.0 джанлука
30246 0.0 марцио
30247 0.0 венеция
30248 0.0 нейробиолог
30249 0.0 поведенческий
30250 0.0 техасский
30251 0.0 прайс
30252 0.0 непереносимый
30253 0.0 офпред
30254 0.0 убогость
30255 0.0 пос
30256 0.0 дооформлять
30257 0

In [45]:
classifier.predict_proba([doc2vector(not_sport_dataset[13])])

array([[1., 0.]])

In [46]:
for item in not_sport_dataset:
    vec = doc2vector(item)
    if classifier.predict([vec]):
        print(item)

url : https://123ru.net/moscow/225922493/
date : 2019-11-30 18:42:20
title : Юлия Оглоблина: «Инкубатор сельских инициатив» стал инновационной платформой для комплексного развития российских сёл
description : Завершает свою работу проект Российского союза сельской молодежи (РССМ) «Инкубатор сельских инициатив». Его целью стало создание, обучение и сопровождение команд развития сельских населенных пунктов. Конкурс на участие в проекте прошли 10 команд из разных уголков России. Под руководством профессионального тьютора и менторов они разрабатывали и реализовывали проекты комплексного развития своих родных территорий. Председатель РССМ, член Центрального штаба ОНФ и зампредседателя комиссии ОП РФ по развитию АПК и сельских территорий Юлия Оглоблина рассказала о проделанной командами работе и планах их работы в следующем году. Читать дальше Источник: «Российский союз сельской молодежи»
site : 123ru.net

url : https://365news.biz/sport/237334-aleksej-melnichuk-s-panarinym-i-kovalchukom-pyt

url : https://russian.rt.com/sport/news/692320-hemilton-kvalifikaciya-abu-dabi
date : 2019-11-30 17:32:41
title : Хэмилтон выиграл квалификацию Гран-при Абу-Даби, Квят — 14-й
description : Британский пилот Mercedes Льюис Хэмилтон одержал победу в квалификации 21-го этапа «Формулы-1» — Гран-при Абу-Даби.
site : russian.rt.com

url : https://wi-fi.ru/news/R5bl1mI391Us-smi-bavariya-i-pszh-proyavlyayut-interes-k-salahu
date : 2019-11-30 17:36:42
title : СМИ: Салахом заинтересовались сразу два клуба
description : "Бавария" и "ПСЖ" рассматривают возможность приобретения нападающего "Ливерпуля" Мохамеда Салаха.
site : wi-fi.ru

url : https://cskanews.com/pfc-cska/news-pfc-cska/milosh-krasich-o-goncharenko-i-sluckom/
date : 2019-11-30 17:38:10
title : Милош Красич о Гончаренко и Слуцком
description : Милош Красич о Гончаренко и Слуцком - Новости ПФК ЦСКА - ЦСКАНЬЮС. ..Бывший футболист ЦСКА Милош Красич поделился мнением о работе главного тренера армейцев Виктора Гончаренко, а также планами на 

url : https://tvzvezda.ru/news/sport/content/201911301424-B7UIh.html
date : 2019-11-30 15:01:40
title : Головин рассказал о феномене Черчесова
description : Игрок сборной России рассказал, в чем секрет Станислава Черчесова при работе с командой. Полузащитник сборной России и французского клуба «Монако» Александр Головин прокомментировал особенности работы главного тренера команды Станислава Черчесова. По его мнению, главный феномен Черчесова заключается в жесткой дисциплине.  «Он от каждого требует показывать на поле максимум: сколько можешь, столько и выкладывайся. Мне кажется, у нас в клубах люди столько не бегают, сколько в сборной», - сказал Головин порталу «Чемпионат». Полузащитник добавил, что Черчесов очень требовательный наставник и с ним «не можешь выйти и недоработать». На должность главного тренера сборной России Станислава Черчесова назначили в 2016 году. В этом году наша сборная под его руководством досрочно вышла в финальную стадию чемпионата Европы-2020, одержав победу н

url : https://ngs55.ru/news/more/66376321/
date : 2019-11-30 13:11:45
title : Братский обмен очками: «Куньлунь» взял реванш у «Авангарда»
description : Матч в Пекине снова завершился не в основное время
site : ngs55.ru

url : http://terrikon.com/posts/341315
date : 2019-11-30 10:29:45
title : Михайленко: Приехали с мыслями о реванше
description : Главный тренер СК «Днепр-1» Дмитрий Михайленко накануне матча против ПФК «Львов» ответил на вопросы клубной пресс-службы
site : terrikon.com

url : https://wi-fi.ru/news/HQmB1xJaC5oV-ovechkin-vyshel-na-tretie-mesto-v-istorii-nhl-po-broskam-za-karieru
date : 2019-11-30 10:49:23
title : Овечкин установил новый ошеломительный рекорд в НХЛ
description : Нападающий "Вашингтона" Александр Овечкин вышел на третье место в истории НХЛ по общему количеству бросков.
site : wi-fi.ru

url : http://terrikon.com/posts/341321
date : 2019-11-30 10:54:10
title : Бавария - Байер: смотреть онлайн-видеотрансляцию Бундеслиги
description : "Бавария" со сменой тренер

In [47]:
#### Тестовые данные
sport_test_dataset = [item for item in dataset_test if item.site in sport_sites]
not_sport_test_dataset = [item for item in dataset_test if item.site not in sport_sites]
print(len(sport_test_dataset), len(not_sport_test_dataset))

391 4609


In [48]:
X_test = []
y_test = []
for item in sport_test_dataset:
    X_test.append(doc2vector(item))
    y_test.append(1)
    
for item in not_sport_test_dataset:
    X_test.append(doc2vector(item))
    y_test.append(0)
    
y_test_pred = classifier.predict(X_test)

In [49]:
import sklearn.metrics

In [50]:
sklearn.metrics.precision_recall_fscore_support(y_test, y_test_pred)

(array([0.95152413, 0.58695652]),
 array([0.97526578, 0.41432225]),
 array([0.96324869, 0.48575712]),
 array([4609,  391]))

In [51]:
sklearn.metrics.confusion_matrix(y_test, y_test_pred)

array([[4495,  114],
       [ 229,  162]])

In [52]:
sklearn.metrics.confusion_matrix?

## Gensim

In [79]:
### https://logic.pdmi.ras.ru/~sergey/slides/N16_DataFestLDA.pdf

In [None]:
from gensim.test.utils import common_texts
from gensim.corpora.dictionary import Dictionary
from gensim.models import ldamulticore
from gensim.models import LdaModel

In [132]:
# Create a corpus from a list of texts
common_dictionary = Dictionary(item.words for item in dataset)

In [133]:
# common_dictionary.filter_extremes()

In [134]:
def show_top_words(a_dictionary, a_top_n=100):
    for i, (id_word, freq) in enumerate(Counter(a_dictionary.dfs).most_common(a_top_n)):
        print(i, a_dictionary[id_word], freq, sep='\t')

In [135]:
show_top_words(common_dictionary)

0	в	7595
1	на	4996
2	и	4793
3	с	3580
4	по	2463
5	не	2273
6	о	2267
7	что	2198
8	из	2004
9	это	1823
10	быть	1762
11	который	1728
12	за	1531
13	год	1527
14	он	1441
15	как	1382
16	для	1362
17	один	1233
18	россия	1182
19	свой	1172
20	к	1119
21	весь	1080
22	от	1076
23	ноябрь	966
24	а	944
25	стать	842
26	они	837
27	российский	820
28	но	815
29	мочь	811
30	у	800
31	тот	794
32	30	791
33	человек	758
34	матч	682
35	время	677
36	новый	668
37	после	657
38	она	653
39	до	648
40	этот	647
41	рассказать	647
42	москва	621
43	два	612
44	1	598
45	самый	578
46	сообщать	556
47	при	554
48	хороший	549
49	мы	542
50	такой	529
51	область	518
52	2	511
53	так	508
54	день	505
55	то	493
56	уже	493
57	мир	493
58	заявить	482
59	декабрь	477
60	под	463
61	главный	454
62	также	453
63	2019	448
64	сообщить	447
65	ещё	431
66	сайт	430
67	место	428
68	большой	427
69	только	421
70	или	414
71	команда	410
72	видео	410
73	александр	410
74	можно	407
75	я	405
76	район	396
77	страна	394
78	пройти	390
79	какой	388
80	2020	388
81	чтобы	

In [136]:
# common_dictionary.filter_n_most_frequent(17)

In [137]:
def filter_short_words(words):
    for word in words:
        if len(word) >= 3: yield word

In [138]:
common_dictionary = Dictionary(filter_short_words(item.words) for item in dataset)

In [139]:
show_top_words(common_dictionary)

0	что	2198
1	это	1823
2	быть	1762
3	который	1728
4	год	1527
5	как	1382
6	для	1362
7	один	1233
8	россия	1182
9	свой	1172
10	весь	1080
11	ноябрь	966
12	стать	842
13	они	837
14	российский	820
15	мочь	811
16	тот	794
17	человек	758
18	матч	682
19	время	677
20	новый	668
21	после	657
22	она	653
23	этот	647
24	рассказать	647
25	москва	621
26	два	612
27	самый	578
28	сообщать	556
29	при	554
30	хороший	549
31	такой	529
32	область	518
33	так	508
34	день	505
35	уже	493
36	мир	493
37	заявить	482
38	декабрь	477
39	под	463
40	главный	454
41	также	453
42	2019	448
43	сообщить	447
44	ещё	431
45	сайт	430
46	место	428
47	большой	427
48	только	421
49	или	414
50	команда	410
51	видео	410
52	александр	410
53	можно	407
54	район	396
55	страна	394
56	пройти	390
57	какой	388
58	2020	388
59	чтобы	386
60	если	383
61	дело	379
62	сегодня	373
63	другой	366
64	работа	360
65	город	358
66	получить	355
67	дом	354
68	слово	350
69	президент	342
70	летний	339
71	назвать	339
72	появиться	339
73	новость	338
74	провести	336
75	п

In [140]:
common_dictionary.filter_n_most_frequent(7)

In [141]:
common_corpus = [common_dictionary.doc2bow(item.words) for item in dataset]

In [146]:
# Train the model on the corpus.
# lda = ldamulticore.LdaMulticore(common_corpus, num_topics=10, workers=1)
lda = LdaModel(common_corpus, num_topics=100, id2word=common_dictionary)

In [147]:
lda.show_topics(50)

[(0,
  '0.009*"москва" + 0.008*"район" + 0.008*"ноябрь" + 0.008*"декабрь" + 0.007*"произойти" + 0.006*"автомобиль" + 0.006*"россия" + 0.006*"один" + 0.005*"дтп" + 0.005*"город"'),
 (1,
  '0.009*"свой" + 0.007*"новый" + 0.006*"летний" + 0.005*"она" + 0.005*"компания" + 0.005*"девочка" + 0.005*"человек" + 0.004*"учёный" + 0.004*"стать" + 0.004*"весь"'),
 (2,
  '0.013*"тренер" + 0.013*"слуцкий" + 0.011*"мир" + 0.009*"российский" + 0.008*"россия" + 0.008*"главный" + 0.008*"этап" + 0.007*"кубок" + 0.007*"уфа" + 0.007*"спартак"'),
 (3,
  '0.008*"полиция" + 0.007*"2020" + 0.006*"один" + 0.006*"два" + 0.005*"ноябрь" + 0.005*"россия" + 0.005*"медведев" + 0.005*"ван" + 0.005*"отделение" + 0.004*"лондонский"'),
 (4,
  '0.011*"украина" + 0.008*"россия" + 0.006*"сша" + 0.006*"ядерный" + 0.005*"мочь" + 0.005*"война" + 0.005*"новый" + 0.005*"украинский" + 0.004*"свой" + 0.004*"область"'),
 (5,
  '0.014*"хороший" + 0.009*"момент" + 0.007*"они" + 0.007*"свой" + 0.007*"видео" + 0.006*"весь" + 0.005*"мат

In [153]:
# Compute Perplexity
print('Perplexity: ', lda.log_perplexity(common_corpus))  # a measure of how good the model is. lower the better.

Perplexity:  -9.66079296235385


In [148]:
doc_lda = lda[common_corpus]

In [149]:
for i,item in itertools.islice(enumerate(doc_lda), 100):
    print(item)
    print(dataset[i])

[(4, 0.82652164), (6, 0.11182616)]
url : http://bloknot-volzhsky.ru/news/volzhane-mogut-podat-zayavlenie-na-letnie-putevki-
date : 2019-11-30 18:26:10
title : Волжане могут подать заявление на летние путевки для детей
description : С понедельника заявления начинают принимать в МФЦ
site : bloknot-volzhsky.ru

[(5, 0.9804564)]
url : https://trikky.ru/test-na-znanie-russkogo-yazyka-423354.html
date : 2019-11-30 18:26:48
title : 💗Тест на знание русского языка💗
description : Тест со сложными и легкими вопросами. Для кого-то будет легко набрать все 100 баллов, а кому-то будет немного тяжело. В любом случае попробовать стоит.1. Что изучает фразеология? способы образования слов устойчивые сочетания слов части речи2. На месте каких цифр в словах пишется н? В простенке между занавеше(1)ыми окнами были установле(2)ы часы, а рядом с ними […]
site : trikky.ru

[(1, 0.9334135)]
url : https://topwar.ru/165315-chernomorskij-flot-popolnilsja-150-tonnym-plavkranom-proekta-02690.html
date : 2019-11-30 18

In [None]:
# # Build the bigram and trigram models
# bigram = gensim.models.Phrases(data_words, min_count=5, threshold=100) # higher threshold fewer phrases.
# trigram = gensim.models.Phrases(bigram[data_words], threshold=100)  

# # Faster way to get a sentence clubbed as a trigram/bigram
# bigram_mod = gensim.models.phrases.Phraser(bigram)
# trigram_mod = gensim.models.phrases.Phraser(trigram)

# # See trigram example
# print(trigram_mod[bigram_mod[data_words[0]]])

In [158]:
import pyLDAvis
import pyLDAvis.gensim
pyLDAvis.enable_notebook()
vis = pyLDAvis.gensim.prepare(lda, common_corpus, common_dictionary)
vis

of pandas will change to not sort by default.

To accept the future behavior, pass 'sort=False'.


  return pd.concat([default_term_info] + list(topic_dfs))


In [159]:
from gensim.models import word2vec

In [182]:
fin = gzip.open('dataset_mai.jsonl.gz')
dataset_w2v = []
for line in itertools.islice(fin, 100000):
    data = json.loads(line.strip())
    dataset_w2v.append(Document(data))

In [183]:
%%time
for item in dataset_w2v: item.words = list(get_doc_words(item))

CPU times: user 12min 50s, sys: 16.4 s, total: 13min 6s
Wall time: 13min 25s


In [184]:
w2v = word2vec.Word2Vec([item.words for item in dataset_w2v], workers=4)

The history saving thread hit an unexpected error (OperationalError('database is locked')).History will not be written to the database.


In [188]:
w2v.most_similar('bmw') #

  """Entry point for launching an IPython kernel.


[('hyundai', 0.8927821516990662),
 ('volkswagen', 0.8895480036735535),
 ('nissan', 0.888046383857727),
 ('toyota', 0.8622678518295288),
 ('benz', 0.8618403673171997),
 ('купе', 0.8612299561500549),
 ('avant', 0.8603546023368835),
 ('mitsubishi', 0.8601386547088623),
 ('rs', 0.859824538230896),
 ('audi', 0.859603762626648)]

In [189]:
w2v['bmw']

  """Entry point for launching an IPython kernel.


array([-0.02018423, -1.0606977 ,  0.21468312, -0.6280541 ,  0.16023648,
       -0.09056458, -0.21388392, -0.3693361 ,  0.5253866 , -0.76814675,
        0.7476715 , -0.30161467, -1.2888315 ,  1.2124308 ,  0.32328054,
        0.08970812,  0.0253071 ,  0.94276446, -0.526752  ,  0.8245327 ,
        0.89138335,  0.589797  ,  0.07530585, -1.3981738 ,  0.0210677 ,
       -1.322176  , -1.159928  , -0.7588753 , -0.48051867, -1.2741979 ,
        0.9480522 , -0.01111534, -1.0424693 , -0.13723288,  0.0294291 ,
       -0.08984844,  0.44023997,  2.120343  ,  1.2159361 , -0.42526478,
       -1.0878861 , -1.0340353 , -0.90502673,  0.33292717,  0.65223384,
       -0.8889226 ,  0.73234475, -0.08602537, -1.2959174 ,  0.35444507,
       -0.9630726 , -1.5606074 , -1.217541  ,  0.83545834, -1.299714  ,
        0.2570357 , -0.0237768 , -0.12570556, -0.18834434,  0.31774476,
        0.05251185,  0.19539082,  1.3707831 ,  0.38835183,  0.45673037,
        1.168465  ,  0.80192167,  0.3609308 ,  0.56230813,  1.06

In [190]:
from scipy.spatial.distance import cosine

In [195]:
cosine(w2v['bmw'], w2v['bmw'])

  """Entry point for launching an IPython kernel.
  """Entry point for launching an IPython kernel.


0.0

In [196]:
cosine(w2v['bmw'], w2v['mercedes'])

  """Entry point for launching an IPython kernel.
  """Entry point for launching an IPython kernel.


0.19826781749725342

## ДЗ - реализовать поиск похожих документов по текстовым векторам и по word2vec векторам

In [186]:
def get_word_match_most_similar_docs(a_doc, a_dataset, a_top_n=20):
    pass

def get_tf_idf_most_similar_doc(a_doc, dataset):
    # для каждого документа строится вектор размерности словаря (аналогично random forest) и добавляется idf
    # далее cosine между документами
    pass

def get_w2v_most_similar_doc(a_doc, dataset):
    # считается средний вектор по всем словам (можно при усреднении учитывать idf)
    pass

In [197]:
doc_id = 13
for sim_func in [get_word_match_most_similar_docs, get_tf_idf_most_similar_doc, get_w2v_most_similar_doc]:
    sim_func(dataset[doc_id], dataset)