# Visualizing a Gensim model

To illustrate how to use [`pyLDAvis`](https://github.com/bmabey/pyLDAvis)'s gensim [helper funtions](https://pyldavis.readthedocs.org/en/latest/modules/API.html#module-pyLDAvis.gensim) we will create a model from the [20 Newsgroup corpus](http://qwone.com/~jason/20Newsgroups/). Minimal preprocessing is done and so the model is not the best. However, the goal of this notebook is to demonstrate the helper functions.

## Downloading the data

## Loading and tokenizing the corpus

In [1]:
from glob import glob
import re
import string
import funcy as fp
from gensim import models
from gensim.corpora import Dictionary, MmCorpus
import nltk
import pandas as pd

In [2]:
# quick and dirty....
from random import random
EMAIL_REGEX = re.compile(r"[a-z0-9\.\+_-]+@[a-z0-9\._-]+\.[a-z]*")
FILTER_REGEX = re.compile(r"[^а-яА-Яa-z'#]")
TOKEN_MAPPINGS = [(FILTER_REGEX, ' ')]


def lemmatize(text_tokens):
    """
    Lemmatizies provided list of tokens
    :param text_tokens: an input tokens list
    :return: a token list
    """
    from nltk.stem import SnowballStemmer
    
    lemmatizer = SnowballStemmer('russian')
    return [lemmatizer.stem(t) for t in text_tokens]


from html.parser import HTMLParser

class MLStripper(HTMLParser):
    def __init__(self):
        self.reset()
        self.strict = False
        self.convert_charrefs= True
        self.fed = []
    def handle_data(self, d):
        self.fed.append(d)
    def get_data(self):
        return ''.join(self.fed)

def strip_tags(html):
    s = MLStripper()
    s.feed(html)
    return s.get_data()

def tokenize_line(line):
    res = line.lower()
    res = strip_tags(res);
    for regexp, replacement in TOKEN_MAPPINGS:
        res = regexp.sub(replacement, res)
    
    
    return res.split()
    
def tokenize(lines, token_size_filter=2):
#     tokens = fp.mapcat(tokenize_line, lines)
    tokens = tokenize_line(lines)
#     tokens = lemmatize(tokens)
    print(tokens)
    return [t for t in tokens if len(t) > token_size_filter]
    

def load_doc(filename):
#     print(filename.split('/')[-2:])
    doc_id = filename.split('/')[-2:]
    with open(filename, errors='ignore') as f:
        doc = f.readlines()
        
    def t(data):
        t = {
            'group': 'events',
            'doc': data,
            'tokens': tokenize(data),
            'id': random()}
        return t;
    
    
    return map(t, doc)
    

# def load_doc(filename):
#     group, doc_id = filename.split('/')[-2:]
# #     print (group, doc_id)
#     with open(filename, errors='ignore') as f:
#         doc = f.readlines()
#     return {'group': group,
#             'doc': doc,
#             'tokens': tokenize(doc),
#             'id': doc_id}

# print(map(load_doc, glob('data/20news-bydate-train/*/*')))
# docs = pd.DataFrame(list(map(load_doc, glob('data/20news-bydate-train/*/*')))).set_index(['id'])
# docs.head()

docs = pd.DataFrame(list(load_doc('data/text.events.csv'))).set_index(['group', 'id'])
docs.head(5)
# lemmatize(['аррондисманов'])

['августа', 'бар', 'bristle', 'nsdl', 'n', 'вход', 'свободный', 'n', 'nзаказ', 'столов']
['лето', 'в', 'минске', 'начинается', 'с', 'августа']
['появился', 'новый', 'мурал', 'от', 'рамона', 'мартинса', 'как', 'вам']
['the', 'topic', 'for', 'the', 'next', 'debate', 'club', 'meeting', 'is', 'that', 'euthanasia', 'is', 'justified', 'and', 'should', 'be', 'legalized', 'in', 'belarus']
['important', 'news', 'n', 'nthe', 'tomorrow', "'s", 'meeting', 'is', 'canceled', 'nsorry', 'guys', 'this', 'time', 'we', 'have', 'to', 'skip', 'the', 'lesson', 'hope', 'to', 'see', 'you', 'next', 'week']
['с', 'марта']
['hi', 'everyone', "i'm", 'really', 'sorry', 'for', 'being', 'late', 'with', 'announcement', 'our', 'meeting', 'will', 'be', 'held', 'today', 'as', 'usual', 'at', 'be', 'ready', 'to', 'use', 'all', 'yourknowledge', 'and', 'creativity', 'see', 'you']
['our', 'next', 'topic', 'in', 'less', 'serious', 'that', 'only', 'husbands', 'and', 'not', 'wives', 'should', 'cook', 'dinner', 'on', 'weekends']

['n', 't', 't', 'tЭффективное', 'продвижение', 'в', 'Инстаграм', 'n', 't', 'n', 't', 't', 'n', 't', 't', 'Маркетинг', 'и', 'prОбучение', 't', 't', 'n', 't', 't', 'n', 't', 't', 'Организатор', 'ampro', 'by', 't', 't', 'n', 't', 'n', 't', 't', 't', 'проверенных', 'методов', 'продвижения', 'принципов', 'идеального', 'контента', 'и', 'его', 'публикации', 'nметодов', 'выжимания', 'заказов', 'из', 'подписчиков', 'множество', 'реальных', 'кейсов', 'вс', 'это', 'и', 'многое', 'nдругое', 'вы', 'узнаете', 'за', 'часа', 'нашего', 'интенсива', 'n', 'n', 't', 't', 't', 'n', 't', 't', 't', 'nНаш', 'интенсив', 'это', 'n', 'n', 'проверенных', 'методов', 'продвижения', 'n', 'принципов', 'идеального', 'контента', 'и', 'его', 'публикации', 'n', 'методов', 'выжимания', 'заказов', 'из', 'подписчиков', 'n', 'часа', 'активной', 'подачи', 'полезной', 'информации', 'n', 'слайдов', 'наглядно', 'иллюстрирующих', 'материал', 'nМножество', 'примеров', 'из', 'реального', 'опыта', 'n', 'nДля', 'кого', 'этот', 'интен

['сентября', 'научная', 'библиотека', 'бнту', 'с', 'до', 'nоткрытие', 'нового', 'сезона', 'клуба', 'настольных', 'игр', 'n', 'вход', 'свободный', 'n', 'nприглашаем', 'всех', 'любителей', 'настольных', 'игр', 'с', 'опаздывать', 'можно', 'до', 'в', 'научную', 'библиотеку', 'бнту', 'nберите', 'с', 'собой', 'хорошее', 'настроение', 'и', 'печеньки', 'можно', 'приносить', 'свои', 'игры', 'n', 'nадрес', 'ул', 'я', 'коласа', 'коворкинг', 'кб']
['n', 't', 't', 'timaguru', 'investment', 'readiness', 'day', 'n', 't', 'n', 't', 't', 'n', 't', 't', 'БизнесМастер', 'класс', 't', 't', 'n', 't', 't', 'n', 't', 't', 'Организатор', 'imaguru', 't', 't', 'n', 't', 'n', 't', 't', 'tКак', 'делать', 'успешные', 'инвестиции', 'в', 'стартапы', 'n', 'n', 't', 't', 't', 'n', 't', 't', 't', 'n', 'n', 'nПриглашаем', 'на', 'серию', 'мастер', 'классов', 'от', 'практикующих', 'инвесторов', 'международного', 'уровня', 'о', 'том', 'как', 'делать', 'успешные', 'инвестиции', 'Мы', 'планируем', 'серию', 'imaguru', 'invest

['n', 'n', 'n', 'n', 'n', 'n', 'Воркшоп', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'Этикетные', 'игры', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'family', 'club', 'n', 'Минск', 'парк', 'Горького', 'n', 'n', 'n', 'ВХОД', 'бесплатно', 'n', 'n', 'СПРАВКИ', 'тут', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'n', 'Школа', 'этикета', 'Юлианы', 'Шевченко', 'и', 'кафе', 'family', 'club', 'приглашают', 'вас', 'сентября', 'в', 'на', 'торжественное', 'открытие', 'серии', 'этикетных', 'игр', 'которые', 'будут', 'проходить', 'на', 'протяжении', 'всего', 'года', 'nИ', 'первая', 'этикетная', 'игра', 'пройдет', 'под', 'девизом', 'Общаемся', 'улыбаемся', 'Маленькие', 'участники', 'в', 'игровой', 'форме', 'научатся', 'правильно', 'знакомиться', 'выучат', 'речевые', 'формулы', 'вежливого', 'общения', 'со', 'сверстниками', 'и', 'взрослыми', 'узнают', 'и'

['n', 't', 't', 'tclimathon', 'minsk', 'n', 't', 'n', 't', 't', 'n', 't', 't', 'СтартапыХакатон', 't', 't', 'n', 't', 't', 'n', 't', 't', 'Организатор', 'imaguru', 'startup', 'hub', 't', 't', 'n', 't', 'n', 't', 't', 'tclimathon', 'это', 'так', 'называемый', 'хакатон', 'по', 'проблемам', 'изменения', 'климата', 'который', 'состоится', 'одновременно', 'в', 'крупных', 'городах', 'мира', 'октября', 'года', 'В', 'Беларуси', 'он', 'продлится', 'в', 'традиционном', 'формате', 'часов', 'n', 'n', 't', 't', 't', 'n', 't', 't', 'tclimathon', 'привлекает', 'новаторов', 'предпринимателей', 'студентов', 'экологов', 'дизайнеров', 'маркетологов', 'программистов', 'и', 'специалистов', 'для', 'создания', 'инновационных', 'решений', 'проблем', 'климата', 'в', 'городах', 'n', 'nВсемирно', 'climathon', 'проходит', 'уже', 'в', 'третий', 'раз', 'С', 'прошлого', 'года', 'количество', 'городов', 'участников', 'возрасло', 'с', 'до', 'За', 'вс', 'это', 'время', 'было', 'создано', 'более', 'проектов', 'и', 'прин

['n', 't', 't', 'tsoft', 'skills', 'gym', 'n', 't', 'n', 't', 't', 'n', 't', 't', 'ДругоеОбучение', 't', 't', 'n', 't', 't', 'n', 't', 't', 'Организатор', 'ties', 't', 't', 'n', 't', 'n', 't', 't', 'tЧто', 'может', 'быть', 'лучше', 'прокачки', 'своих', 'навыков', 'в', 'группе', 'неравнодушных', 'к', 'собственному', 'развитию', 'людей', 'да', 'еще', 'и', 'под', 'присмотром', 'софт', 'скильных', 'тренеров', 'n', 'n', 't', 't', 't', 'n', 't', 't', 'tБольшая', 'часть', 'навыков', 'используемых', 'для', 'достижения', 'целей', 'это', 'также', 'soft', 'skills', 'Чем', 'выше', 'Вы', 'взбираетесь', 'по', 'карьерной', 'лестнице', 'тем', 'большую', 'роль', 'играют', 'социальные', 'навыки', 'в', 'вашей', 'жизни', 'в', 'то', 'время', 'как', 'профессиональные', 'hard', 'skills', 'отходят', 'на', 'второй', 'план', 'nСоциальные', 'навыки', 'это', 'те', 'же', 'мышцы', 'Их', 'развитием', 'и', 'поддержанием', 'формы', 'нужно', 'постоянно', 'заниматься', 'n', 'nsoft', 'skills', 'gym', 'это', 'регулярные',

['n', 't', 'n', 't', 't', 'n', 'n', 'n', 'n', 'n', 't', 't', 'n', 't', 'tТренер', 'n', 't', 't', 'n', 't', 't', 't', 'n', 't', 't', 't', 't', 'n', 't', 't', 't', 't', 't', 'n', 'n', 't', 't', 't', 't', 't', 't', 'n', 't', 't', 't', 't', 't', 't', 't', 'n', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 'n', 't', 't', 't', 't', 't', 't', 't', 'tИлья', 'n', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 't', 'n', 't', 't', 't', 't', 't', 't', 't', 'n', 't', 't', 't', 't', 't', 't', 'n', 'n', 'n', 't', 't', 't', 't', 't', 't', 'n', 't', 't', 't', 't', 't', 't', 'n', 'n', 'n', 't', 't', 't', 't', 't', 'n', 't', 't', 't', 't', 't', 'n', 't', 't', 't', 't', 'n', 't', 't', 't', 'n', 't', 't', 'n', 't', 'n', 't', 't', 't', 'n', 't', 'tПрограмма', 'мастер', 'класса', 'n', 't', 'tКрав', 'мага', 'комплекс', 'мер', 'самозащиты', 'разработанный', 'на', 'о

IOPub data rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_data_rate_limit`.

Current values:
NotebookApp.iopub_data_rate_limit=1000000.0 (bytes/sec)
NotebookApp.rate_limit_window=3.0 (secs)



['n', 'n', 'nМы', 'рады', 'объявить', 'о', 'проведении', 'codetalks', 'в', 'Бресте', 'Во', 'время', 'встречи', 'специалисты', 'Сеавус', 'поделятся', 'знаниями', 'и', 'опытом', 'в', 'нескольких', 'областях', 'n', 'nНа', 'этот', 'раз', 'два', 'наших', 'спикера', 'Юрий', 'и', 'Никола', 'расскажут', 'о', 'реализации', 'чистой', 'архитектуры', 'на', 'основе', 'платформы', 'net', 'и', 'проектировании', 'будущего', 'финансовых', 'систем', 'в', 'области', 'банковского', 'дела', 'и', 'финансов', 'n', 'nПрисоединяйтесь', 'к', 'нашей', 'встрече', 'и', 'поделитесь', 'опытом', 'с', 'нашими', 'специалистами', 'в', 'уютной', 'атмосфере', 'за', 'кружкой', 'пива', 'У', 'Вас', 'будет', 'уникальная', 'возможность', 'обменяться', 'опытом', 'поучиться', 'друг', 'у', 'друга', 'задать', 'любой', 'вопрос', 'по', 'теме', 'выступления', 'n', 'nОтметьте', 'в', 'своем', 'календаре', 'мы', 'ждем', 'Вас', 'во', 'вторник', 'n', 'n', 'nДата', 'вторник', 'nвремя', 'nвход', 'свободный', 'зарегистрируйтесь', 'на', 'сайт

['n', 'В', 'преддверии', 'премьеры', 'спектакля', 'С', 'училища', 'Центра', 'визуальных', 'и', 'исполнительских', 'искусств', 'АРТ', 'Корпорейшн', 'июня', 'в', 'пройдет', 'творческая', 'встреча', 'с', 'режисс', 'ром', 'Александром', 'Марченко', 'Актер', 'постановщик', 'руководитель', 'Центра', 'белорусской', 'драматургии', 'и', 'театральных', 'проектов', 'Центра', 'АРТ', 'Корпорейшн', 'Александр', 'Марченко', 'расскажет', 'о', 'своем', 'новом', 'проекте', 'неудобных', 'спектаклях', 'работе', 'с', 'современной', 'драматургией', 'любимых', 'книгах', 'и', 'ответит', 'на', 'вопросы', 'зрителей', 'nВстреча', 'пройдет', 'в', 'книжном', 'магазине', 'Логв', 'на', 'На', 'месте', 'будет', 'возможность', 'купить', 'билеты', 'на', 'спектакли', 'С', 'училища', 'и', 'Опиум', 'и', 'приобрести', 'любые', 'книги', 'магазина', 'со', 'скидкой', 'в', 'при', 'предъявлении', 'билета', 'Напоминаем', 'что', 'при', 'наличии', 'билета', 'на', 'одно', 'из', 'мероприятий', 'Центра', 'Арт', 'Корпорейшн', 'в', 'кни

['n', 'n', 'n', 'июня', 'garage', 'space', 'и', 'facebook', 'проведут', 'visual', 'hackathon', 'Основная', 'цель', 'хакатона', 'выяснить', 'что', 'могут', 'предложить', 'визуальные', 'технологии', 'в', 'реальном', 'мире', 'помимо', 'игр', 'и', 'развлечений', 'но', 'не', 'исключая', 'их', 'n', 'nПрисоединяйтесь', 'к', 'facebook', 'событию', 'и', 'следите', 'за', 'новостями', 'n', 'n', 'n', 'nКто', 'может', 'участвовать', 'nДизайнеры', 'разработчики', 'ar', 'vr', 'энтузиасты', 'маркетологи', 'креативные', 'и', 'бизнес', 'умы', 'n', 'nВозможные', 'темы', 'проектов', 'nКомпьютерная', 'графика', 'визуальная', 'коммуникации', 'd', 'визуализация', 'vr', 'игры', 'ar', 'визуальные', 'эффекты', 'для', 'видео', 'и', 'визуальные', 'продукты', 'в', 'целом', 'n', 'nПрограмма', 'хакатона', 'nДлительность', 'хакатона', 'часов', 'n', 'n', 'n', 'июня', 'с', 'приветственное', 'слово', 'от', 'организаторов', 'и', 'менторов', 'питчи', 'идей', 'формирование', 'команд', 'старт', 'работ', 'n', 'июня', 'работа

['n', 'n', 'njson', 'Сообщество', 'выходит', 'из', 'онлайна', 'в', 'оффлайн', 'и', 'собирает', 'ламповые', 'пикники', 'на', 'террасе', 'покатепло', 'n', 'nПостироничное', 'название', 'говорит', 'о', 'ребятах', 'многое', 'лайт', 'доклады', 'атмосфера', 'веселья', 'и', 'куча', 'интерактива', 'Приходите', 'посмотреть', 'насколько', 'долго', 'можно', 'говорить', 'о', 'jsonе', 'и', 'какие', 'еще', 'javascript', 'темы', 'вплетают', 'ребята', 'в', 'свои', 'доклады', 'n', 'nПрисоединяйтесь', 'к', 'чату', 'в', 'telegram', 'чтобы', 'следить', 'за', 'расписанием', 'встреч', 'и', 'участвовать', 'в', 'дискуссиях', 'n', 'nРегистрация', 'на', 'мероприятие', 'по', 'ссылке', 'n', 'n', 'n', 'n']
['n', 'Концерт', 'индийской', 'музыки', 'танцы', 'сари', 'шоу', 'августа', 'в', 'Минск', 'ул', 'Чапаева', 'Конференц', 'зал', 'metrov', 'n', 'n', 'n', 'n', 't', 't', 't', 't', 't', 't', 'n']
['августа', 'молодежный', 'образовательный', 'центр', 'фиальта', 'улица', 'ленина', 'комната', 'в', 'nкинопросмотр', 'с', 

['n', 'октября', 'года', 'в', 'Минске', 'пройдет', 'Конференция', 'по', 'экологической', 'дружественности', 'организатором', 'которой', 'выступает', 'Центр', 'экологических', 'решений', 'nИдея', 'мероприятия', 'в', 'том', 'чтобы', 'создать', 'площадку', 'на', 'которой', 'некоммерческие', 'организации', 'общественные', 'инициативы', 'госсекторы', 'и', 'бизнес', 'могли', 'встретиться', 'и', 'обсудить', 'принципы', 'экологической', 'дружественности', 'и', 'перспективы', 'развития', 'зел', 'ного', 'подхода', 'в', 'разных', 'секторах', 'nБолее', 'подробная', 'информация', 'в', 'предварительной', 'программе', 'nПриглашаются', 'представители', 'и', 'представительницы', 'организаций', 'которые', 'интересуются', 'темой', 'nУчастие', 'в', 'мероприятии', 'бесплатное', 'Нужна', 'регистрация', 'по', 'ссылке', 'открыта', 'до', 'октября', 'n']
['n', 'Героиня', 'этого', 'завтрака', 'аромастилист', 'Анастасия', 'Володыгина', 'nНастя', 'расскажет', 'свою', 'историю', 'а', 'вы', 'сможете', 'поделиться', 

['n', 'Вас', 'ждет', 'n', 'серия', 'ярких', 'занятий', 'с', 'педагогом', 'по', 'мнению', 'наших', 'студентов', 'новые', 'актуальные', 'темы', 'ароматные', 'кофе', 'паузы', 'новые', 'друзья', 'и', 'полезные', 'деловые', 'контактыОбещаем', 'что', 'не', 'будут', 'заставлять', 'вас', 'делать', 'домашнее', 'задание', 'не', 'дадут', 'вам', 'скучать', 'и', 'спать', 'на', 'занятиях', 'не', 'будут', 'просить', 'большой', 'оплаты', 'за', 'занятия', 'приветствуется', 'организационный', 'сбор', 'на', 'аренду', 'помещения', 'и', 'кофе', 'паузу', 'в', 'размере', 'руб', 'за', 'встречу', 'Встречи', 'проходят', 'каждое', 'воскресенье', 'в', 'по', 'адресу', 'ст', 'метро', 'Уручье', 'ул', 'Стариновская', 'nВнимание', 'к', 'обучению', 'приглашаются', 'как', 'студенты', 'так', 'и', 'выпускники', 'ВУЗов', 'со', 'знанием', 'языка', 'intermediate', 'и', 'все', 'все', 'желающие', 'выучить', 'подтянуть', 'и', 'не', 'забыть', 'английский', 'язык', 'n']
['n', 'Вас', 'ждет', 'n', 'серия', 'ярких', 'занятий', 'с', 

['n', 'Вас', 'ждет', 'n', 'серия', 'ярких', 'занятий', 'с', 'педагогом', 'по', 'мнению', 'наших', 'студентов', 'новые', 'актуальные', 'темы', 'ароматные', 'кофе', 'паузы', 'новые', 'друзья', 'и', 'полезные', 'деловые', 'контактыОбещаем', 'что', 'не', 'будут', 'заставлять', 'вас', 'делать', 'домашнее', 'задание', 'не', 'дадут', 'вам', 'скучать', 'и', 'спать', 'на', 'занятиях', 'не', 'будут', 'просить', 'большой', 'оплаты', 'за', 'занятия', 'приветствуется', 'организационный', 'сбор', 'на', 'аренду', 'помещения', 'и', 'кофе', 'паузу', 'в', 'размере', 'руб', 'за', 'встречу', 'Встречи', 'проходят', 'каждое', 'воскресенье', 'в', 'по', 'адресу', 'ст', 'метро', 'Уручье', 'ул', 'Стариновская', 'nВнимание', 'к', 'обучению', 'приглашаются', 'как', 'студенты', 'так', 'и', 'выпускники', 'ВУЗов', 'со', 'знанием', 'языка', 'intermediate', 'и', 'все', 'все', 'желающие', 'выучить', 'подтянуть', 'и', 'не', 'забыть', 'английский', 'язык', 'n']
['n', 'Вас', 'ждет', 'n', 'серия', 'ярких', 'занятий', 'с', 

['n', 'n', 'ndetails', 'n', 'n', 'english', 'version', 'below', 'n', 'nНа', 'митапе', 'будут', 'представлены', 'две', 'темы', 'n', 'n', 'Контроль', 'качества', 'кода', 'инструменты', 'и', 'механизмы', 'содержания', 'репозитория', 'в', 'чистоте', 'Евгений', 'Зенько', 'technical', 'lead', 'php', 'colours', 'на', 'русском', 'языке', 'n', 'n', 'Оптимизация', 'бэкэнд', 'и', 'фронтэнд', 'разработки', 'Разделение', 'данных', 'и', 'представления', 'при', 'помощи', 'patternlab', 'и', 'twig', 'в', 'drupal', 'johan', 'voeten', 'lead', 'front', 'end', 'developer', 'colours', 'на', 'английском', 'языке', 'n', 'nРасписание', 'n', 'n', 'n', 'Встреча', 'вступление', 'n', 'Первая', 'тема', 'Контроль', 'качества', 'кода', 'инструменты', 'и', 'механизмы', 'содержания', 'репозитория', 'в', 'чистоте', 'n', 'n', 'nОт', 'автора', 'Во', 'время', 'разговора', 'обсудим', 'такие', 'инструменты', 'как', 'phplint', 'php', 'codesniffer', 'exacat', 'возможность', 'их', 'ежедневного', 'использования', 'в', 'работе', 

['n', 'n', 'n', 'февраля', 'на', 'площадке', 'space', 'состоится', 'goway', 'meetup', 'v', 'nУчастие', 'бесплатное', 'зарегистрируйтесь', 'n', 'n', 'nПрограмма', 'митапа', 'n', 'n', 'n', 'Пишем', 'криптовалюту', 'на', 'go', 'Стас', 'Афанасьев', 'backend', 'developer', 'juno', 'n', 'n', 'nСтас', 'расскажет', 'о', 'том', 'как', 'устроены', 'криптовалюты', 'с', 'чего', 'начать', 'и', 'как', 'написать', 'poc', 'криптовалюты', 'на', 'go', 'с', 'какими', 'трудностями', 'придется', 'столкнуться', 'разработчикам', 'n', 'n', 'n', 'tensorflow', 'and', 'go', 'natalie', 'pistunovich', 'backend', 'developer', 'graymeta', 'co', 'founder', 'go', 'gophercon', 'iceland', 'co', 'leading', 'the', 'berlin', 'chapters', 'of', 'gdg', 'golang', 'and', 'women', 'techmakers', 'n', 'n', 'nin', 'this', 'talk', 'natalie', 'will', 'share', 'her', 'experience', 'consuming', 'the', 'tensorflow', 'go', 'api', 'in', 'order', 'to', 'break', 'a', 'captcha', 'as', 'part', 'of', 'blacklight', 'an', 'online', 'security', '

['n', 'n', 'ndetails', 'n', 'n', 'english', 'version', 'below', 'n', 'nНа', 'митапе', 'будут', 'представлены', 'две', 'темы', 'n', 'n', 'Контроль', 'качества', 'кода', 'инструменты', 'и', 'механизмы', 'содержания', 'репозитория', 'в', 'чистоте', 'Евгений', 'Зенько', 'technical', 'lead', 'php', 'colours', 'на', 'русском', 'языке', 'n', 'n', 'Оптимизация', 'бэкэнд', 'и', 'фронтэнд', 'разработки', 'Разделение', 'данных', 'и', 'представления', 'при', 'помощи', 'patternlab', 'и', 'twig', 'в', 'drupal', 'johan', 'voeten', 'lead', 'front', 'end', 'developer', 'colours', 'на', 'английском', 'языке', 'n', 'nРасписание', 'n', 'n', 'n', 'Встреча', 'вступление', 'n', 'Первая', 'тема', 'Контроль', 'качества', 'кода', 'инструменты', 'и', 'механизмы', 'содержания', 'репозитория', 'в', 'чистоте', 'n', 'n', 'nОт', 'автора', 'Во', 'время', 'разговора', 'обсудим', 'такие', 'инструменты', 'как', 'phplint', 'php', 'codesniffer', 'exacat', 'возможность', 'их', 'ежедневного', 'использования', 'в', 'работе', 

['n', 'n', 'n', 'n', 'nРЕГИСТРАЦИЯ', 'https', 'www', 'eventbrite', 'com', 'e', 'an', 'advanced', 'look', 'at', 'continuous', 'delivery', 'tickets', 'n', 'nПриглашаем', 'всех', 'кто', 'следит', 'за', 'тенденциями', 'в', 'мире', 'devops', 'а', 'именно', 'в', 'области', 'автоматизации', 'инфраструктуры', 'Участие', 'бесплатное', 'по', 'предварительной', 'регистрации', 'спешите', 'подать', 'заявку', 'пока', 'есть', 'свободные', 'места', 'К', 'слову', 'meetup', 'это', 'еще', 'и', 'отличная', 'возможность', 'завести', 'много', 'полезных', 'контактов', 'n', 'n', 'n', 'nПрограмма', 'n', 'n', 'n', 'nАндрей', 'Красницкий', 'altoros', 'n', 'ncontinuous', 'delivery', 'with', 'concourse', 'and', 'cloud', 'foundry', 'n', 'n', 'n', 'nВ', 'open', 'source', 'среде', 'доступно', 'большое', 'количество', 'продуктов', 'для', 'continuous', 'integration', 'но', 'большинство', 'из', 'них', 'достаточно', 'сложны', 'для', 'изучения', 'сложно', 'масштабируются', 'и', 'вызывают', 'трудности', 'с', 'отладкой', 'Ч

['n', 'марта', 'Всемирный', 'день', 'дикой', 'природы', 'И', 'поэтому', 'green', 'volunteer', 'service', 'Зеленая', 'сеть', 'организуют', 'бесплатный', 'кинопросмотр', 'с', 'последующим', 'интересным', 'обсуждением', 'Что', 'фильм', 'Гонка', 'на', 'вымирание', 'Когда', 'суббота', 'е', 'марта', 'Где', 'Комната', 'Ленина', 'Минск', 'Кто', 'Зел', 'ная', 'сеть', 'Зял', 'ная', 'сетка', 'организатор', 'Ахова', 'птушак', 'Бацька', 'шчыны', 'apb', 'birdlife', 'belarus', 'приглашенный', 'эксперт', 'инфоподдержка', 'Мероприятие', 'бесплатное', 'но', 'необходима', 'предварительная', 'регистрация', 'только', 'имя', 'и', 'e', 'mail', 'you', 'are', 'welcome', 'https', 'docs', 'google', 'com', 'forms', 'd', 'e', 'faipqlsclfnd', 'x', 'a', 'i', 'us', 'uwlndwba', 'msby', 'yax', 'evwgw', 'x', 'ot', 'zka', 'viewform', 'n', 'nПоделиться', 'n', 'n', 't', 'n', 't', 'n', 't', 'n', 't', 'n', 't', 'n', 'n', 'n', 'n', 'n', 'n', 't', 't', 't', 't', 't', 't', 'n']
['n', 'krav', 'maga', 'belarus', 'и', 'ОО', 'Радис

['n', 'n', 'nМы', 'рады', 'объявить', 'о', 'проведении', 'codetalks', 'в', 'Бресте', 'Во', 'время', 'встречи', 'специалисты', 'Сеавус', 'поделятся', 'знаниями', 'и', 'опытом', 'в', 'нескольких', 'областях', 'n', 'nНа', 'этот', 'раз', 'два', 'наших', 'спикера', 'Юрий', 'и', 'Никола', 'расскажут', 'о', 'реализации', 'чистой', 'архитектуры', 'на', 'основе', 'платформы', 'net', 'и', 'проектировании', 'будущего', 'финансовых', 'систем', 'в', 'области', 'банковского', 'дела', 'и', 'финансов', 'n', 'nПрисоединяйтесь', 'к', 'нашей', 'встрече', 'и', 'поделитесь', 'опытом', 'с', 'нашими', 'специалистами', 'в', 'уютной', 'атмосфере', 'за', 'кружкой', 'пива', 'У', 'Вас', 'будет', 'уникальная', 'возможность', 'обменяться', 'опытом', 'поучиться', 'друг', 'у', 'друга', 'задать', 'любой', 'вопрос', 'по', 'теме', 'выступления', 'n', 'nОтметьте', 'в', 'своем', 'календаре', 'мы', 'ждем', 'Вас', 'во', 'вторник', 'n', 'n', 'nДата', 'вторник', 'nвремя', 'nвход', 'свободный', 'зарегистрируйтесь', 'на', 'сайт

IOPub data rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_data_rate_limit`.

Current values:
NotebookApp.iopub_data_rate_limit=1000000.0 (bytes/sec)
NotebookApp.rate_limit_window=3.0 (secs)




['n', 'n', 'ndetails', 'n', 'n', 'english', 'version', 'below', 'n', 'nНа', 'митапе', 'будут', 'представлены', 'две', 'темы', 'n', 'n', 'Контроль', 'качества', 'кода', 'инструменты', 'и', 'механизмы', 'содержания', 'репозитория', 'в', 'чистоте', 'Евгений', 'Зенько', 'technical', 'lead', 'php', 'colours', 'на', 'русском', 'языке', 'n', 'n', 'Оптимизация', 'бэкэнд', 'и', 'фронтэнд', 'разработки', 'Разделение', 'данных', 'и', 'представления', 'при', 'помощи', 'patternlab', 'и', 'twig', 'в', 'drupal', 'johan', 'voeten', 'lead', 'front', 'end', 'developer', 'colours', 'на', 'английском', 'языке', 'n', 'nРасписание', 'n', 'n', 'n', 'Встреча', 'вступление', 'n', 'Первая', 'тема', 'Контроль', 'качества', 'кода', 'инструменты', 'и', 'механизмы', 'содержания', 'репозитория', 'в', 'чистоте', 'n', 'n', 'nОт', 'автора', 'Во', 'время', 'разговора', 'обсудим', 'такие', 'инструменты', 'как', 'phplint', 'php', 'codesniffer', 'exacat', 'возможность', 'их', 'ежедневного', 'использования', 'в', 'работе',

['n', 'марта', 'мы', 'дарим', 'всем', 'дамам', 'первый', 'саммит', 'беременных', 'и', 'мам', 'в', 'декрете', 'digital', 'декрет', 'Бесплатно', 'специалистов', 'практиков', 'расскажут', 'как', 'декретницам', 'легально', 'зарабатывать', 'реальные', 'деньги', 'на', 'виртуальных', 'проектах', 'прямо', 'из', 'дома', 'Все', 'о', 'возможностях', 'заработка', 'в', 'декретном', 'отпуске', 'в', 'facebook', 'instagram', 'Вконтакте', 'Одноклассниках', 'и', 'youtube', 'digital', 'Декрет', 'это', 'бесплатный', 'образовательный', 'саммит', 'для', 'тех', 'кто', 'желает', 'в', 'это', 'прекрасное', 'для', 'мамы', 'и', 'малыша', 'время', 'освоить', 'digital', 'профессии', 'smm', 'копирайтинг', 'пикчер', 'instagram', 'и', 'youtube', 'блогер', 'таргетолог', 'комьюнити', 'менеджер', 'Кому', 'это', 'может', 'быть', 'интересно', 'Тем', 'кто', 'понимает', 'что', 'за', 'миром', 'цифровых', 'технологий', 'будущее', 'и', 'готов', 'осваивать', 'новые', 'специальности', 'Тем', 'кто', 'желает', 'потратить', 'время',

['venture', 'day', 'minsk', 'press', 'conference', 'Пресс', 'конференцияСтартапы', 'Организатор', 'imaguru', 'startup', 'hubИмагуру', 'приглашает', 'на', 'пресс', 'конференцию', 'по', 'случаю', 'проведения', 'venture', 'day', 'minsk', 'Имагуру', 'приглашает', 'на', 'пресс', 'конференцию', 'по', 'случаю', 'проведения', 'venture', 'day', 'minsk', 'крупнейшей', 'стартап', 'конференции', 'в', 'Беларуси', 'которая', 'имеет', 'репутацию', 'одного', 'из', 'самых', 'уважаемых', 'в', 'регионе', 'Восточной', 'Европе', 'форума', 'для', 'стартапов', 'венчурных', 'инвесторов', 'и', 'бизнес', 'ангелов', 'venture', 'day', 'minsk', 'пройдет', 'мая', 'в', 'Минске', 'в', 'Национальной', 'библиотеке', 'Беларуси', 'Ожидается', 'что', 'в', 'venture', 'day', 'minsk', 'примут', 'участие', 'венчурные', 'инвесторы', 'из', 'стран', 'мира', 'Среди', 'тем', 'конференции', 'развитие', 'блокчейн', 'технологий', 'в', 'мире', 'и', 'Беларуси', 'лучшие', 'примеры', 'стартапов', 'в', 'сфере', 'искусственного', 'интеллек

['n', 'мая', 'Культ', 'цэнтры', 'Корпус', 'пройдзе', 'цырымон', 'я', 'знагароджання', 'ла', 'рэата', 'Прэм', 'Ц', 'тк', 'С', 'лета', 'дзверы', 'прасторы', 'будуць', 'адчыненыя', 'з', 'й', 'гадз', 'ны', 'Акрамя', 'аф', 'цыйнай', 'частк', 'на', 'мерапрыемстве', 'знойдуцца', 'занятк', 'для', 'вас', 'вашых', 'дзяцей', 'На', 'мпрэзе', 'можна', 'будзе', 'пагартаць', 'набыць', 'нам', 'наваныя', 'на', 'прэм', 'ю', 'кн', 'г', 'а', 'таксама', 'ншыя', 'дз', 'цячыя', 'беларускамо', 'ныя', 'выданн', 'нфармацыя', 'пра', 'ншыя', 'акты', 'насц', 'на', 'цырымон', 'будзе', 'абна', 'ляцца', 'на', 'старонцы', 'падзе', 'facebook', 'Прэм', 'я', 'будзе', 'ручацца', 'дзвюх', 'нам', 'нацыях', 'за', 'найлепшы', 'твор', 'для', 'дзяцей', 'падлетка', 'за', 'найлепшае', 'мастацкае', 'афармленне', 'Кожны', 'пераможца', 'атрымае', 'грашовую', 'знагароду', 'экв', 'валентную', 'Уваход', 'вольны', 'n', 'n', 'n', 'n', 't', 't', 't', 't', 't', 't', 'n']
['n', 'И', 'СНОВА', 'МЫ', 'ОТКРЫТЫ', 'ДЛЯ', 'ВСЕХ', 'И', 'СНОВА', 'ВС

['n', 'мая', 'сцена', 'столичного', 'tnt', 'rock', 'club', 'на', 'один', 'вечер', 'превратится', 'в', 'театральные', 'подмостки', 'По', 'случаю', 'презентации', 'нового', 'сорта', 'вишневого', 'пива', 'от', 'бренда', 'Аливария', 'karol', 'jan', 'ruby', 'минчанам', 'покажут', 'альтернативную', 'версию', 'Вишневого', 'сада', 'Чехова', 'art', 'beer', 'performance', 'karol', 'jan', 'feat', 'anton', 'pavlovich', 'уникальный', 'творческий', 'эксперимент', 'в', 'котором', 'смело', 'соединили', 'классический', 'балет', 'и', 'интерактивный', 'моноспектакль', 'На', 'арт', 'перфомансе', 'не', 'будет', 'ни', 'привычной', 'театральной', 'сцены', 'ни', 'сидений', 'Только', 'минималистичные', 'декорации', 'и', 'непринужденная', 'атмосфера', 'пивного', 'паба', 'В', 'альтернативном', 'театре', 'нет', 'необходимости', 'ждать', 'антракта', 'чтобы', 'побаловать', 'себя', 'чем', 'то', 'вкусненьким', 'Блюдом', 'дня', 'в', 'меню', 'tnt', 'станет', 'главный', 'герой', 'вишневого', 'вечера', 'новый', 'karol', 

['Приглашаем', 'на', 'gdpr', 'day', 'ii', 'в', 'рамках', 'Европейской', 'недели', 'приватности', 'ДискуссияМастер', 'классПрезентация', 'Организатор', 'Сергей', 'Воронкевич', 'провайдер', 'хостинга', 'и', 'облачных', 'решений', 'hoster', 'by', 'правозащитная', 'организация', 'human', 'constanta', 'июня', 'в', 'Минске', 'при', 'поддержке', 'Европейского', 'союза', 'состоится', 'повторное', 'мероприятие', 'gdpr', 'day', 'в', 'рамках', 'Европейской', 'недели', 'приватности', 'Организаторами', 'gdpr', 'day', 'ii', 'выступают', 'бизнес', 'тренер', 'и', 'автор', 'учебного', 'курса', 'gdpr', 'dpp', 'Защита', 'данных', 'по', 'gdpr', 'Сергей', 'Воронкевич', 'Школа', 'бизнеса', 'top', 'skills', 'провайдер', 'хостинга', 'и', 'облачных', 'решений', 'hoster', 'by', 'а', 'также', 'правозащитная', 'организация', 'human', 'constanta', 'За', 'волной', 'сообщений', 'от', 'различных', 'сервисов', 'об', 'обновлении', 'политик', 'приватности', 'последовали', 'первые', 'иски', 'граждан', 'против', 'it', 'ги

['n', 'День', 'здоровья', 'с', 'бесплатными', 'угощениями', 'Осенняя', 'пора', 'самое', 'время', 'уделить', 'внимание', 'здоровью', 'Поэтому', 'ноября', 'с', 'до', 'медицинский', 'магазин', 'Польза', 'вновь', 'организует', 'праздничное', 'мероприятие', 'для', 'всей', 'семьи', 'День', 'здоровья', 'который', 'пройдет', 'по', 'адресу', 'г', 'Минск', 'пр', 'Независимости', 'Б', 'В', 'это', 'день', 'совершенно', 'бесплатно', 'можно', 'будет', 'получить', 'консультацию', 'специалиста', 'по', 'травматологии', 'и', 'ортопедии', 'просканировать', 'стопы', 'на', 'подоскопе', 'приобрести', 'товары', 'по', 'очень', 'привлекательным', 'ценам', 'а', 'также', 'согреться', 'в', 'прохладную', 'погоду', 'бесплатными', 'горячими', 'напитками', 'со', 'сладкими', 'угощениями', 'Если', 'Вы', 'давно', 'хотели', 'заняться', 'своим', 'здоровьем', 'но', 'никак', 'не', 'могли', 'найти', 'время', 'то', 'это', 'Ваш', 'шанс', 'Ждем', 'Вас', 'на', 'праздник', 'Что', 'еще', 'ждет', 'участников', 'мероприятия', 'Скидк

['n', 'n', 'n', 'июня', 'вторник', 'в', 'приглашаем', 'вас', 'на', 'новую', 'встречу', 'ciklum', 'speakers', 'corner', 'angular', 'как', 'мы', 'бежим', 'с', 'первой', 'версии', 'на', 'последнюю', 'Спикер', 'Евгений', 'Дмитриев', 'senior', 'frontend', 'developer', 'team', 'leader', 'ciklum', 'minsk', 'n', 'n', 'n', 'nО', 'преимуществах', 'перехода', 'на', 'новые', 'версии', 'инструментов', 'разработки', 'ПО', 'прозвучало', 'немало', 'докладов', 'и', 'написано', 'немало', 'статей', 'В', 'официальном', 'гайде', 'angular', 'например', 'можно', 'найти', 'лишь', 'небольшую', 'часть', 'всех', 'возможных', 'проблем', 'а', 'блоги', 'как', 'правило', 'пересказывают', 'официальный', 'гайд', 'n', 'nНа', 'примере', 'большой', 'международной', 'платформы', 'по', 'поиску', 'временной', 'работы', 'расскажем', 'об', 'опыте', 'миграции', 'с', 'первой', 'на', 'шестую', 'версию', 'angular', 'Обсудим', 'известные', 'риски', 'и', 'подводные', 'камни', 'n', 'nМероприятие', 'пройдет', 'в', 'минском', 'офисе',

['Обучающий', 'курс', 'Основы', 'ux', 'ui', 'дизайна', '#пользователи', '#дизайн', 'системы', '#прототипирование', 'coding', 'academyДизайнОбучение', 'Организатор', 'imaguru', 'startup', 'hubimaguru', 'coding', 'academy', 'объявляет', 'й', 'набор', 'на', 'обучающий', 'курс', 'Если', 'вы', 'дизайнер', 'но', 'без', 'опыта', 'работы', 'в', 'ui', 'uХ', 'или', 'используете', 'только', 'готовые', 'вайфреймы', 'Если', 'вы', 'разработчик', 'желающий', 'познакомиться', 'с', 'продуктовым', 'дизайном', 'Просто', 'интересуетесь', 'и', 'хотите', 'освоить', 'новые', 'знания', 'Тогда', 'мы', 'ждем', 'вас', 'на', 'обучении', 'ux', 'ui', 'дизайн', 'сейчас', 'одно', 'из', 'самых', 'перспективных', 'направлений', 'Разработка', 'мобильного', 'приложения', 'требует', 'соблюдения', 'баланса', 'между', 'практичностью', 'эстетикой', 'и', 'удобством', 'Именно', 'это', 'является', 'основной', 'функцией', 'ux', 'ui', 'дизайн', 'imaguru', 'coding', 'academy', 'объявляет', 'й', 'набор', 'на', 'обучающий', 'курс', 

['n', 'На', 'Зыбицкой', 'июля', 'пройдет', 'перфоманс', 'лучших', 'youtube', 'музыкантовВ', 'центре', 'Минска', 'вечером', 'июля', 'пройдет', 'музыкальный', 'перфоманс', 'финалистов', 'проекта', 'Смелее', 'На', 'Зыбицкой', 'в', 'частности', 'выступит', 'youtube', 'звезда', 'Лера', 'Яскевич', 'под', 'руководством', 'участника', 'Евровидения', 'uzari', 'Музыканты', 'будут', 'выступать', 'у', 'бара', 'На', 'пляже', 'июля', 'с', 'часов', 'до', 'позднего', 'вечера', 'Послушать', 'перфоманс', 'можно', 'будет', 'бесплатно', 'Публику', 'будут', 'развлекать', 'все', 'финалисты', 'конкурса', 'Смелее', 'вместе', 'со', 'своими', 'звездными', 'наставниками', 'В', 'частности', 'выступит', 'летняя', 'гитаристка', 'Лера', 'Яскевич', 'которой', 'помогает', 'участник', 'Евровидения', 'певец', 'uzari', 'Лера', 'известна', 'кавер', 'версиями', 'песен', 'на', 'русском', 'и', 'английском', 'языках', 'а', 'ролики', 'на', 'ее', 'youtube', 'канале', 'собрали', 'в', 'общей', 'сложности', 'около', 'млн', 'просмо

['n', 'n', 'n', 'nК', 'сожалению', 'мероприятие', 'отменено', 'следите', 'за', 'обновлением', 'анонса', 'в', 'Календаре', 'dev', 'by', 'Также', 'детали', 'можно', 'уточнить', 'у', 'организаторов', 'g', 'cyberevents', 'io', 'n', 'n', 'ncyber', 'academy', 'eos', 'meetup', 'minsk', 'n', 'n', 'n', 'nНачало', 'июля', 'в', 'n', 'nМесто', 'Октябрьская', 'event', 'space', 'n', 'nСпикеры', 'n', 'nСергей', 'Прилуцкий', 'chief', 'research', 'officer', 'smartz', 'mixbytes', 'n', 'n', 'eos', 'implementation', 'in', 'practice', 'n', 'nВадим', 'Маковский', 'chief', 'executive', 'officer', 'multy', 'n', 'n', 'tba', 'n', 'nУчастие', 'бесплатное', 'по', 'предварительной', 'регистрации', 'https', 'goo', 'gl', 'n', 'yupk', 'n', 'nПрямая', 'трансляция', 'будет', 'на', 'youtube', 'канале', 'cyber', 'academy', 'https', 'www', 'youtube', 'com', 'cyberacademy', 'Подпишись', 'n', 'n', 'n', 'nМитапы', 'отличная', 'возможность', 'в', 'неформальной', 'обстановке', 'послушать', 'про', 'блокчейн', 'от', 'экспертов',

IOPub data rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_data_rate_limit`.

Current values:
NotebookApp.iopub_data_rate_limit=1000000.0 (bytes/sec)
NotebookApp.rate_limit_window=3.0 (secs)




['мягкая', 'практика', 'хатха', 'йоги', 'онлайн', 'занятие', 'n', 'августа', 'чт', 'n', 'предлагаю', 'вам', 'поближе', 'познакомиться', 'со', 'своей', 'спиной', 'через', 'мягкую', 'практику', 'форм', 'тела', 'которые', 'в', 'йоге', 'ещ', 'называют', 'асанами', 'будет', 'мало', 'умных', 'слов', 'много', 'простых', 'упражнений', 'и', 'море', 'расслабления', 'занятие', 'выстроено', 'по', 'методике', 'корректного', 'подхода', 'к', 'позвоночнику', 'кпп', 'проводит', 'ирина', 'рудко', 'авторизованный', 'инструктор', 'йоги', 'кпп', 'психолог', 'n', 'занятие', 'подходит', 'для', 'любого', 'уровня', 'подготовки', 'противопоказания', 'активная', 'боль', 'в', 'спине', 'n', 'для', 'практики', 'необходимо', 'комфортное', 'место', 'желательно', 'коврик', 'плед', 'по', 'необходимости', 'и', 'хороший', 'интернет', 'n', 'благодарность', 'взнос', 'от', 'сердца', 'n', 'чтобы', 'получить', 'доступ', 'для', 'участия', 'просто', 'поставьте', 'лайк', 'к', 'этому', 'посту', 'и', 'вам', 'прид', 'т', 'ссылочка

['n', 'СЦ', 'Клевер', 'проводит', 'набор', 'в', 'театральную', 'студию', 'Платяной', 'шкаф', 'детей', 'от', 'лет', 'В', 'программу', 'обучения', 'входит', 'профессиональное', 'обучение', 'актерскому', 'мастерству', 'развитие', 'речи', 'и', 'уверенности', 'в', 'себе', 'хореография', 'постановка', 'спектаклей', 'участие', 'в', 'различных', 'конкурсах', 'и', 'фестивалях', 'и', 'многое', 'другое', 'Наша', 'студия', 'направлена', 'на', 'то', 'чтобы', 'раскрыть', 'творческий', 'потенциал', 'ребенка', 'и', 'выразить', 'его', 'Расписание', 'Пн', 'Пт', 'Запись', 'на', 'просмотр', 'по', 'телефону', 'Группы', 'до', 'человек', 'Просмотр', 'проводится', 'бесплатно', 'По', 'любым', 'вопросам', 'звоните', 'по', 'телефонам', 'n', 'n', 'n', 'n', 't', 't', 't', 't', 't', 't', 'n']
['n', 'СЦ', 'Клевер', 'проводит', 'набор', 'в', 'театральную', 'студию', 'Платяной', 'шкаф', 'детей', 'от', 'лет', 'В', 'программу', 'обучения', 'входит', 'профессиональное', 'обучение', 'актерскому', 'мастерству', 'развитие',

['n', 'сентября', 'в', 'в', 'Пресс', 'клубе', 'ул', 'Хоружей', 'пройд', 'т', 'лекция', 'Почему', 'белорусы', 'перестают', 'ездить', 'на', 'велосипеде', 'осенью', 'а', 'финны', 'продолжают', 'крутить', 'даже', 'зимой', 'Цель', 'лекции', 'вдохновить', 'людей', 'продлевать', 'свой', 'велосипедный', 'сезон', 'Вход', 'на', 'мероприятие', 'бесплатный', 'но', 'необходимо', 'зарегистрироваться', 'заполнив', 'короткую', 'анкету', 'Спикеры', 'лекции', 'Пекки', 'Такхола', 'консультант', 'городской', 'администрации', 'Оулу', 'Финляндия', 'Анастасия', 'Янчевская', 'директор', 'Минского', 'велосипедного', 'общества', 'Павел', 'Горбунов', 'председатель', 'правления', 'Минского', 'велосипедного', 'общества', 'Почему', 'финнам', 'не', 'холодно', 'ездить', 'на', 'велосипеде', 'зимой', 'Нужны', 'ли', 'специальные', 'зимние', 'кол', 'са', 'Влияет', 'ли', 'езда', 'на', 'велосипеде', 'в', 'холодное', 'время', 'года', 'на', 'здоровье', 'Как', 'городские', 'службы', 'в', 'городах', 'Финляндии', 'справляются',

['n', 'n', 'nДумай', 'на', 'два', 'шага', 'вперед', 'развивайся', 'и', 'приходи', 'на', 'митап', 'the', 'rolling', 'scopes', 'в', 'Могилеве', 'n', 'nПрограмма', 'n', 'n', 'Регистрация', 'n', 'reflect', 'and', 'decorators', 'in', 'action', 'Виталий', 'Городков', 'n', 'js', 'machine', 'and', 'community', 'app', 'Артем', 'Морозов', 'и', 'Денис', 'Пасюков', 'n', 'Кофе', 'пауза', 'n', 'conf', 'guide', 'Павел', 'Юхнович', 'n', 'electron', 'desktop', 'development', 'Александр', 'Фомченков', 'n', 'Кофе', 'пауза', 'n', 'kostil', 'js', 'Максим', 'Шастель', 'n', 'n', 'nРегистрация', 'обязательна', 'n', 'nВход', 'свободный', 'n', 'nПриходите', 'будет', 'интересно', 'n', 'n', 'nВремя', 'события', 'Воскресенье', 'Сентябрь', 'до', 'Место', 'Могилев', 'ул', 'Первомайская', 'ресторан', 'Габрово', 'Тип', 'события', 'Внешнее', 'событиеКатегории', 'it', 'мероприятияТэги', 'the', 'rolling', 'scopesjselectrondesktop', 'development', 'kostil', 'jsmogilevmeetupМогилевмитап']
['нас', 'уже', 'club', 'и', 'мы', 

['n', 'Центр', 'Арабеск', 'открывает', 'серию', 'бесплатных', 'курсов', 'иностранного', 'языка', 'с', 'носителями', 'языка', 'В', 'программе', 'языков', 'на', 'ваш', 'выбор', 'nРазговорный', 'английский', 'не', 'с', 'носителем', 'языка', 'nАрабский', 'для', 'начинающих', 'с', 'нуля', 'с', 'носителем', 'языка', 'nТурецкий', 'для', 'начинающих', 'с', 'нуля', 'с', 'носителем', 'языка', 'nИспанский', 'для', 'начинающих', 'с', 'нуля', 'с', 'носителем', 'языка', 'nРусский', 'для', 'иностранцев', 'russian', 'for', 'foreigners', 'с', 'носителем', 'языка', 'nЗанятия', 'с', 'мая', 'по', 'мая', 'Всего', 'занятия', 'по', 'академических', 'часа', 'Даты', 'проведения', 'занятий', 'и', 'мая', 'Время', 'проведения', 'английский', 'язык', 'все', 'остальные', 'языки', 'nЗанятия', 'будут', 'проходить', 'в', 'современных', 'и', 'оборудованных', 'классах', 'учебного', 'и', 'культурного', 'центра', 'Арабеск', 'Преподаватели', 'уникальные', 'носители', 'культуры', 'и', 'языка', 'той', 'страны', 'которую', 'о

['n', 'Вандро', 'к', 'м', 'нулае', 'free', 'walking', 'tours', 'гэта', 'адукацыйна', 'сацыяльны', 'праект', 'прысьвечаны', 'пешым', 'роварным', 'вандро', 'кам', 'па', 'Менску', 'У', 'межах', 'праекту', 'вас', 'чакаюць', 'штодз', 'нныя', 'з', 'тра', 'ня', 'па', 'верасень', 'ц', 'штотыдн', 'выя', 'з', 'кастрычн', 'ка', 'па', 'красав', 'к', 'вандро', 'к', 'а', 'тарск', 'х', 'экскурс', 'кожная', 'зь', 'х', 'адкрые', 'вам', 'новую', 'ц', 'кавую', 'старонку', 'г', 'сторы', 'гораду', 'Вас', 'чакаюць', 'сотн', 'факта', 'ц', 'кавостак', 'гарадзк', 'я', 'г', 'сторы', 'сьмешныя', 'незвычайныя', 'кур', 'зныя', 'выпадк', 'легенды', 'паданьн', 'прыв', 'ды', 'старажытныя', 'некропал', 'г', 'сторыя', 'Беларус', 'на', 'менск', 'х', 'вул', 'цах', 'Тысячы', 'людзей', 'жо', 'наведал', 'экскурс', 'праекту', 'Далучайцеся', 'Праект', 'Вандро', 'к', 'м', 'нулае', 'працуе', 'згодна', 'з', 'прынцыпам', 'free', 'walking', 'tours', 'гэта', 'бясплатныя', 'пешыя', 'роварныя', 'экскурс', 'сацыяльны', 'праект', 'мэта

['n', 'июня', 'г', 'institute', 'of', 'it', 'business', 'administration', 'приглашает', 'на', 'курс', 'certified', 'scrummaster', 'n', 'ncertified', 'scrummaster', 'одна', 'из', 'сертификационных', 'ступеней', 'обучения', 'международной', 'организации', 'scrumalliance', 'nЦель', 'этой', 'программы', 'обучение', 'скрам', 'мастеров', 'процессных', 'лидеров', 'проектов', 'с', 'прохождением', 'теста', 'и', 'сертификацией', 'n', 'nДЛЯ', 'КОГО', 'ЭТОТ', 'КУРС', 'n', 'nПрограмма', 'обучения', 'будет', 'полезна', 'n', 'n', 'nскрам', 'мастерам', 'и', 'членам', 'команд', 'которые', 'уже', 'используют', 'процессный', 'фреймворк', 'scrum', 'nтим', 'и', 'тех', 'лидам', 'разрабочикам', 'всех', 'дисциплин', 'которых', 'затронет', 'внедрение', 'гибких', 'подходов', 'nменеджерам', 'проектов', 'ищущим', 'свою', 'роль', 'в', 'процессных', 'изменениях', 'и', 'новых', 'способах', 'управления', 'nвсем', 'кто', 'видит', 'себя', 'в', 'роли', 'агента', 'изменений', 'и', 'катализатора', 'эффективности', 'процес

['n', 'n', 'n', 'n', 'n', 'мая', 'в', 'Минске', 'пройдет', 'масштабная', 'технологическая', 'конференция', 'emerge', 'которая', 'соберет', 'более', 'представителей', 'it', 'индустрии', 'из', 'США', 'Европы', 'стран', 'Восточной', 'Европы', 'и', 'Центральной', 'Азии', 'В', 'числе', 'спикеров', 'представители', 'microsoft', 'facebook', 'warner', 'music', 'Рыбаков', 'Фонд', 'dell', 'bayer', 'венчурных', 'компаний', 'и', 'акселераторов', 'n', 'nКонференция', 'emerge', 'посвящена', 'новым', 'технологиям', 'и', 'развивающимся', 'рынкам', 'стран', 'Восточной', 'Европы', 'Балтии', 'и', 'Центральной', 'Азии', 'new', 'east', 'n', 'nУзнать', 'инсайды', 'tech', 'индустрии', 'на', 'main', 'stage', 'n', 'nВыступления', 'и', 'дискуссии', 'на', 'главной', 'сцене', 'посвящены', 'тому', 'как', 'технологии', 'меняют', 'нашу', 'жизнь', 'Хостом', 'главной', 'сцены', 'на', 'emerge', 'выступит', 'Сергей', 'Сергиенко', 'руководитель', 'программы', 'engineering', 'excellence', 'в', 'epam', 'rebecca', 'carlson'

IOPub data rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_data_rate_limit`.

Current values:
NotebookApp.iopub_data_rate_limit=1000000.0 (bytes/sec)
NotebookApp.rate_limit_window=3.0 (secs)



['Обучающий', 'курс', 'Управление', 'it', 'проектами', 'coding', 'academyitКурсы', 'Организатор', 'imaguru', 'startup', 'hubВ', 'imaguru', 'coding', 'academy', 'стартует', 'й', 'набор', 'на', 'обучающий', 'курс', 'Управления', 'it', 'проектами', 'Хотите', 'повысить', 'навыки', 'управления', 'it', 'проектами', 'и', 'взаимодействия', 'с', 'людьми', 'Научиться', 'оценивать', 'производительность', 'вашей', 'команды', 'Стать', 'более', 'конкурентоспособным', 'Освоить', 'эффективные', 'методологии', 'управления', 'it', 'проектами', 'Тогда', 'мы', 'ждем', 'вас', 'января', 'в', 'imaguru', 'coding', 'academy', 'Задача', 'курса', 'научить', 'эффективно', 'планировать', 'и', 'оценивать', 'состояние', 'it', 'проекта', 'а', 'также', 'познакомить', 'с', 'основными', 'методологиями', 'управления', 'проектами', 'График', 'обучения', 'января', 'февраля', 'чт', 'пт', 'с', 'до', 'сб', 'с', 'до', 'Курс', 'основан', 'на', 'стандарте', 'project', 'management', 'body', 'of', 'knowledge', 'pmbok', 'pmi', 'Про

Unnamed: 0_level_0,Unnamed: 1_level_0,doc,tokens
group,id,Unnamed: 2_level_1,Unnamed: 3_level_1
events,0.245695,"""31 августа @ Бар """"Bristle"""", 19:30\nSDL\n• В...","[августа, бар, bristle, nsdl, вход, свободный,..."
events,0.345105,"""Лето в Минске начинается с августа!""\n","[лето, минске, начинается, августа]"
events,0.677184,"""Появился новый мурал от Рамона Мартинса. Как ...","[появился, новый, мурал, рамона, мартинса, как..."
events,0.789016,"""The topic for the next debate club meeting is...","[the, topic, for, the, next, debate, club, mee..."
events,0.474759,"""IMPORTANT NEWS!!!\n\nThe tomorrow 's meeting ...","[important, news, nthe, tomorrow, meeting, can..."


## Creating the dictionary, and bag of words corpus

In [3]:

def nltk_stopwords():
    return set(nltk.corpus.stopwords.words('russian'))

def prep_corpus(docs, additional_stopwords=set(), no_below=5, no_above=0.5):
  print('Building dictionary...')
  dictionary = Dictionary(docs)
  stopwords = nltk_stopwords().union(additional_stopwords)
  stopword_ids = map(dictionary.token2id.get, stopwords)
  dictionary.filter_tokens(stopword_ids)
  dictionary.compactify()
  dictionary.filter_extremes(no_below=no_below, no_above=no_above, keep_n=None)
  dictionary.compactify()

  print('Building corpus...')
  corpus = [dictionary.doc2bow(doc) for doc in docs]

  return dictionary, corpus



In [4]:
dictionary, corpus = prep_corpus(docs['tokens'])

Building dictionary...
Building corpus...


In [5]:
MmCorpus.serialize('newsgroups.mm', corpus)
dictionary.save('newsgroups.dict')

## Fitting the LDA model

In [6]:
%%time
lda = models.ldamodel.LdaModel(corpus=corpus, id2word=dictionary, num_topics=50, passes=10)
                                      
lda.save('newsgroups_50_lda.model')

CPU times: user 1min 52s, sys: 1.44 s, total: 1min 53s
Wall time: 1min 16s


## Visualizing the model with pyLDAvis

Okay, the moment we have all been waiting for is finally here!  You'll notice in the visualization that we have a few junk topics that would probably disappear after better preprocessing of the corpus. This is left as an exercises to the reader. :)

In [7]:
import pyLDAvis.gensim as gensimvis
import pyLDAvis

In [71]:
vis_data = gensimvis.prepare(lda, corpus, dictionary)
pyLDAvis.display(vis_data)

of pandas will change to not sort by default.

To accept the future behavior, pass 'sort=False'.


  return pd.concat([default_term_info] + list(topic_dfs))


## Fitting the HDP model

We can both visualize LDA models as well as gensim HDP models with pyLDAvis.

The difference between HDP and LDA is that HDP is a non-parametric method. Which means that we don't need to specify the number of topics. HDP will fit as many topics as it can and find the optimal number of topics by itself.

In [72]:
%%time
# The optional parameter T here indicates that HDP should find no more than 50 topics
# if there exists any.
hdp = models.hdpmodel.HdpModel(corpus, dictionary, T=50)
                                      
hdp.save('newsgroups_hdp.model')

CPU times: user 42 s, sys: 1.07 s, total: 43.1 s
Wall time: 25.7 s


## Visualizing the HDP model with pyLDAvis

As for the LDA model, in order to prepare the visualization you only need to pass it your model, the corpus, and the associated dictionary.

In [73]:
vis_data = gensimvis.prepare(hdp, corpus, dictionary)
pyLDAvis.display(vis_data)

  doc_topic_dists = gamma / gamma.sum(axis=1)[:, None]
  doc_topic_dists = gamma / gamma.sum(axis=1)[:, None]


ValidationError: 
 * Not all rows (distributions) in doc_topic_dists sum to 1.