## Функция для вычисления точечной взаимной информации (PMI) двух случайных событий

![alt text](https://habrastorage.org/storage2/a59/c7f/040/a59c7f04092e9848d51d7e342e289be5.png)

В общем виде реализация формулы может выглядеть так: на вход функция получает два массива из 0 и 1 одинаковой длины - реализации случайных событий. 1 - событие произошло, 0 - не произошло. Основание логарифма не играет роли, для простоты примем его равным 2.
Позитивный знак логарифма будет означать положительны окрас A по сравнению с B, негативный — отрицательный.


In [1]:
import numpy as np
a = np.array([1, 0, 0, 1, 1, 0, 1])
b = np.array([1, 0, 0, 0, 1, 0, 1])
def calculate_pmi(a, b):
    return np.log((str(a + b).count('2') / len(a)) / (((sum(a) / len(a)) * (sum(b) / len(b)))))
calculate_pmi(a, b)

0.5596157879354228

Итак, A и B — слова/биграммы/n-нграммы, P(A), P(B) — априорные вероятности появления термина А и B соответственно в обучающей выборке (отношение количества вхождений к общему количеству слов в корпусе), P(A near B) — вероятность термина A встретиться вместе/рядом с термином B; «рядом» можно конфигурировать вручную, по умолчанию расстояние равно 10 терминам влево и вправо

In [0]:
# например, можно реализовать функцию так
def pmi(word1, word2, unigram_freq, bigram_freq):
  prob_a = unigram_freq[word1] / float(sum(unigram_freq.values()))
  prob_word2 = unigram_freq[word2] / float(sum(unigram_freq.values()))
  prob_word1_word2 = bigram_freq[" ".join([word1, word2])] / float(sum(bigram_freq.values()))
  return math.log(prob_word1_word2/float(prob_word1*prob_word2),2) 

# но проще воспользоваться готовыми библиотеками

#Проведем исследование по поиску устойчивых коллокаций.
Для примера взят отрывок "Саломеи" О.Уайльда. 

In [0]:
s = 'Место действия – обширная терраса во дворце Ирода, расположенная несколько выше пиршественного зала. Солдаты стоят, облокотившись на балюстраду балкона. Направо огромная лестница. Налево, в глубине, старый колодец со стенками из позеленевшей бронзы. Светит луна. Молодой сириец. Как прекрасна сегодня царевна Саломея! Паж Иродиады. Посмотри на луну. До чего луна кажется странной. Она похожа на женщину, встающую из могилы. Она похожа на мертвую женщину. Может показаться, что она сама выискивает мертвых. Молодой сириец. У нее странный вид. Она подобна маленькой царевне, на которой желтое покрывало и ноги которой из серебра. Она подобна царевне, у которой две маленькие белые голубки вместо ног. Кажется, будто она танцует. Паж Иродиады. Она словно мертвая женщина. Она движется так медленно. Шум в пиршественном зале. Первый солдат. Что за шум! Что за дикие звери там воют! Второй солдат. Это евреи. Они всегда так. Они спорят о своей вере. Первый солдат. Почему они спорят о своей вере? Второй солдат. Не могу сказать. Они всегда это делают. Фарисеи, например, утверждают, что ангелы есть, а саддукеи[7] заявляют, что ангелов не существует. Первый солдат. Я нахожу нелепым спорить о таких вещах. Молодой сириец. Как прекрасна сегодня царевна Саломея! Паж Иродиады. Ты на нее постоянно смотришь. Ты смотришь на нее слишком много. Так смотреть на людей опасно. Может случиться что-то ужасное. Молодой сириец. Она очень красива сегодня. Первый солдат. Какой мрачный у тетрарха вид. Второй солдат. Да, у него мрачный вид. Первый солдат. Он на что-то смотрит. Второй солдат. Он на кого-то смотрит. Первый солдат. И на кого же он смотрит? Второй солдат. Этого я не могу сказать. Молодой сириец. Как царевна бледна! Я никогда не видел, чтобы она была так бледна. Она похожа на отражение белой розы в серебряном зеркале. Паж Иродиады. Ты не должен смотреть на нее. Ты слишком много на нее смотришь. Первый солдат. Иродиада наполняет кубок тетрарха. Каппадокиец. Так это и есть царица Иродиада – та, что в черной митре, усеянной жемчугами; та, чьи волосы присыпаны голубой пудрой? Первый солдат. Да, это Иродиада, супруга тетрарха. Второй солдат. Тетрарх очень любит вино. У него вино трех сортов. Одно привезено с острова Самофракия, оно пурпурное, как мантия цезаря. Каппадокиец. Я никогда не видел цезаря. Второй солдат. Другое – с острова Кипр, оно желтое, как золото. Каппадокиец. Я люблю золото. Второй солдат. А третье вино – с острова Сицилия. Это вино красное, как кровь. Нубиец. Боги моей страны очень любят кровь. Два раза в год мы приносим им в жертву юношей и девушек – пятьдесят юношей и сто девушек. Но, видно, им мало, потому что они очень сурово обходятся с нами. Каппадокиец. В моей стране богов больше нет, их выгнали римляне. Некоторые говорят, что они прячутся в горах, но я этому не верю. Целых три ночи провел я в горах, разыскивая их без устали. И не нашел. Наконец я стал звать их по именам, но они не пришли на зов. Я думаю, все они мертвы. Первый солдат. Евреи молятся богу, которого невозможно увидеть. Каппадокиец. Этого я понять не могу. Первый солдат. Можно сказать, они верят только в то, что невозможно увидеть. Каппадокиец. Мне это кажется совершенно нелепым. Голос Иоканаана. После меня придет другой, кто сильнее меня. Я недостоин даже развязывать ремни его сандалий.[8] И когда он придет, возликует пустыня. Она расцветет, как лилея. Глаза незрячих узрят свет дневной, а уши глухих отверзнутся. Новорожденный возложит длань свою на логовище драконов и поведет львов за собой, держа их за гриву. Второй солдат. Заставь его замолчать. Он сам не ведает, что говорит. Первый солдат. Нет, нет, это святой человек. К тому же очень кроткий. Каждый раз, когда я приношу ему поесть, он непременно благодарит меня. Каппадокиец. Кто он такой? Первый солдат. Он пророк. Каппадокиец. Как его звать? Первый солдат. Иоканаан. Каппадокиец. Откуда он? Первый солдат. Из пустыни, где он питался акридами[9] и диким медом. Одежда на нем была из верблюжьего волоса, а вокруг чресел – кожаный пояс. На него было просто ужасно смотреть. За ним следовала огромная толпа. У него даже были ученики. Каппадокиец. О чем это он говорит? Первый солдат. Нам трудно сказать. Иногда он говорит ужасные вещи, но понять, что он хочет сказать, невозможно. Каппадокиец. Его можно увидеть? Первый солдат. Нет. Тетрарх никому этого не позволяет. Молодой сириец. Царевна прикрыла лицо веером. Ее маленькие белые руки порхают, словно голуби, летящие к своей голубятне. Они похожи на белых бабочек. Они совсем как белые бабочки. Паж Иродиады. Но что тебе до этого? Зачем ты на нее смотришь? Ты не должен смотреть на нее. Может случиться нечто ужасное. Каппадокиец (указывая на колодец). Какая странная тюрьма! Второй солдат. Это заброшенный колодец. Каппадокиец. Заброшенный колодец! Сидеть там, должно быть, очень вредно для здоровья. Второй солдат. Вовсе нет. Например, брат тетрарха – его старший брат и первый муж царицы Иродиады – был заключен туда на целых двенадцать лет. И не умер. Под конец этих двенадцати лет его пришлось задушить. Каппадокиец. Задушить? Кто же осмелился это сделать? Второй солдат (указывает на палача, огромного негра). Вон тот, Нааман. Каппадокиец. И он не побоялся? Второй солдат. Конечно, нет! Тетрарх послал ему перстень. Каппадокиец. Какой перстень? Второй солдат. Перстень смерти. Потому он и не побоялся. Каппадокиец. И все же как это ужасно – задушить царя. Первый солдат. Но почему? У царей всего одна шея, как и у других людей. Каппадокиец. Мне кажется, это ужасно. Молодой сириец. Царевна встает! Она выходит из-за стола! У нее очень встревоженный вид. О, она направляется сюда. Да, она идет к нам. Как она бледна! Я никогда не видел, чтобы она была так бледна. Паж Иродиады. Не смотри на нее. Умоляю тебя, не смотри на нее. Молодой сириец. Она как голубка, сбившаяся с пути… Она как нарцисс, колеблемый ветром… Она подобна серебряному цветку. Входит Саломея. Саломея. Я не останусь там. Я не могу оставаться там. Отчего это тетрарх неотрывно смотрит на меня из-под дрожащих век своими маленькими, как у крота, глазками? Странно, что муж моей матери так на меня смотрит. Я не знаю, что это значит… Впрочем, нет, знаю. Молодой сириец. Ты покинула пир, царевна? Саломея. Какой здесь чудесный воздух! Как здесь хорошо дышится! А там, внутри, – там евреи из Иерусалима, которые рвут друг друга на части, споря о своих глупых обрядах, и варвары, которые пьют не переставая, проливая на пол вино, и греки из Смирны[10] с накрашенными глазами, нарумяненными щеками, с завитыми в колечки волосами, и египтяне, молчаливые, хитрые, с длинными ногтями, зелеными, как нефрит, в коричневых плащах, и римляне, грубые, недалекие, говорящие на этом своем вульгарном наречии. Ах, как я ненавижу римлян! Они неотесанны и примитивны, а корчат из себя благородных господ. Молодой сириец. Не желаешь ли присесть, царевна? Паж Иродиады. Зачем ты говоришь с нею? Зачем на нее смотришь? О, случится нечто ужасное! Саломея. Как хорошо смотреть на луну! Она похожа на маленькую монету. Кажется, будто она маленький серебряный цветок. Луна холодна и целомудренна. Я уверена, она девственница, у нее красота девственницы… Да, она непорочна. Она остается неоскверненной. Она никогда не отдавалась мужчинам, как другие богини. Голос Иоканаана. Он пришел, Господь. Он пришел, Сын Человеческий. Кентавры спрятались в реках, а сирены покинули реки и притаились средь листьев в чаще лесов. Саломея. Кто прокричал эти слова? Второй солдат. Пророк, царевна. Саломея. А, это пророк! Тот самый, которого так боится тетрарх? Второй солдат. Об этом мы ничего не знаем, царевна. Ты слышала голос пророка Иоканаана. Молодой сириец. Не угодно ли тебе, чтобы я велел принести твой паланкин, царевна? Ночью так хорошо в саду. Саломея. Он говорит чудовищные вещи о моей матери, ведь правда? Второй солдат. Мы никогда не понимаем того, что он говорит, царевна. Саломея. Да, он говорит о ней ужасные вещи. Входит раб. Раб. Царевна, тетрарх просит тебя вернуться на пир. Саломея. Я не вернусь туда. Молодой сириец. Прости, царевна, но, если ты не вернешься, может случиться несчастье. Саломея. Он старик, этот пророк? Молодой сириец. Царевна, лучше бы тебе вернуться. Позволь мне проводить тебя. Саломея. Этот пророк… он старик? Первый солдат. Нет, царевна, он еще достаточно молод. Второй солдат. Трудно сказать. Некоторые говорят, что это Илия.[11] Саломея. Кто такой Илия? Второй солдат. Древнейший пророк этой страны, царевна. Раб. Какой ответ мне передать тетрарху от царевны? Голос Иоканаана. Не ликуй, земля Палестины, что преломился прут в руке того, кто бичевал тебя. Ибо из отродья змиева явится василиск,[12] и то, что от него родится, станет пожирать всех птиц на земле. Саломея. Какой странный голос! Мне хотелось бы поговорить с пророком. Первый солдат. Боюсь, это невозможно, царевна. Тетрарх не хочет, чтобы хоть кто-нибудь с ним разговаривал. Он даже первосвященнику[13] запретил говорить с ним. Саломея. Я хочу говорить с ним. Первый солдат. Это невозможно, царевна. Саломея. Я буду говорить с ним. Молодой сириец. Не лучше ли возвратиться на пир, царевна? Саломея. Приведите сюда этого пророка. Раб удаляется. Первый солдат. Мы не смеем, царевна. Саломея (подходит к краю колодца и вглядывается в его глубь). Как там темно внизу! До чего же, должно быть, ужасно сидеть в этой черной яме! Она как могила… (Обращаясь к солдатам.) Вы что, не слышали меня? Выведите пророка оттуда. Я хочу его видеть. Второй солдат. Царевна, прошу тебя, не требуй от нас этого. Саломея. Вы заставляете меня ждать. Первый солдат. Царевна, жизнь каждого из нас полностью принадлежит тебе, но мы не можем сделать того, о чем ты просишь. Да и не нас тебе нужно просить об этом. Саломея (смотрит на молодого сирийца). В таком случае… Паж Иродиады. О, что будет! Я уверен, случится несчастье. Саломея (подходит к молодому сирийцу). Нарработ, ты сделаешь это для меня, ведь правда? Ты это сделаешь для меня. Я ведь всегда была к тебе добра. И ты это сделаешь для меня. Я только взгляну на него, на этого странного пророка. О нем так много говорят. Я часто слышала, как о нем говорит тетрарх. Мне кажется, тетрарх боится его. А ты, Нарработ, неужели и ты боишься его? Молодой сириец. Я его не боюсь, царевна, я никого не боюсь. Но тетрарх строжайше запретил снимать крышку с колодца. Саломея. Ты это сделаешь для меня, Нарработ, и завтра, когда меня будут проносить в моем паланкине через ворота, возле которых торгуют идолами, я уроню для тебя маленький цветок, маленький зеленый цветочек. Молодой сириец. Царевна, я не могу, не могу. Саломея (улыбаясь). Ты ведь это сделаешь для меня, Нарработ? Ты же знаешь, что сделаешь. И завтра, когда меня будут проносить в паланкине мимо моста, где покупают идолов, я взгляну на тебя из-за муслиновой занавески, – да, Нарработ, взгляну на тебя и, может быть, улыбнусь тебе. Посмотри на меня, Нарработ, посмотри на меня. Ах, ты ведь знаешь, что сделаешь то, о чем я тебя прошу. Ты хорошо это знаешь… Я знаю, что ты это сделаешь. Молодой сириец (делает знак третьему солдату). Выпусти пророка… Царевна Саломея хочет увидеть его. Саломея. Ах! Паж Иродиады. О, какой у луны странный вид! Можно подумать, будто это рука мертвой женщины, пытающейся закрыть себя саваном. Молодой сириец. Да, у нее странный вид. Она подобна маленькой царевне с глазами из янтаря. Она улыбается сквозь муслиновые облака, словно она маленькая царевна. Из колодца появляется пророк. Саломея смотрит на него и медленно отступает назад. Иоканаан. Где тот, чья чаша со скверной наполнилась до краев? Где тот, кто однажды, в серебряном одеянии, умрет пред лицом всего народа? Велите ему явиться сюда, дабы он внял голосу того, кто взывал в пустынях и во дворцах царей. Саломея. О ком это он говорит? Молодой сириец. Никто этого не может понять, царевна. Иоканаан. Где та, которая, увидев лики мужей, на стенах изображенные, лики халдеев, писанные красками, предалась похоти глаз своих и отправила посланников в Халдею?[14] Саломея. О моей матери – вот о ком он говорит. Молодой сириец. О нет, царевна. Саломея. Да, он говорит о моей матери. Иоканаан. Где та, которая отдавалась военачальникам ассирийским, носящим перевязи на чреслах и многоцветные тиары на головах? Где та, которая отдавалась юношам египетским, облаченным в тончайшее полотно и порфиры, юношам, чьи щиты – из золота, а шлемы – из серебра и чьи тела столь могучи? Велите ей восстать с ложа своего, ложа скверны, ложа кровосмешения, дабы смогла она услышать слова того, кто приуготовляет путь Господень, и покаяться в грехах своих. И пусть даже она никогда не раскается, но, напротив, будет упорствовать в прегрешениях своих, велите ей явиться сюда, ибо лопата Господа уже в руке Его.[15] Саломея. Но лик его ужасен, просто ужасен! Молодой сириец. Не оставайся здесь, царевна, умоляю тебя. Саломея. А самое ужасное – это его глаза. Они точно черные дыры, выжженные факелами в тирском гобелене. Точно черные пещеры, где обитают драконы. Точно черные пещеры Египта, где устраивают себе логовища драконы. Точно черные озера, взбудораженные фантасмагорическими лунами… Ты думаешь, он еще что-то скажет? Молодой сириец. Не оставайся здесь, царевна. Умоляю тебя, не оставайся. Саломея. До чего же он изможден! Он похож на хрупкую фигурку из слоновой кости. Или на изваяние из серебра. Я уверена, что он непорочен, как месяц на небосклоне. Он подобен лунному лучу, серебристому лунному лучу. Его плоть, должно быть, холодна, как слоновая кость… Я хочу увидеть его поближе. Молодой сириец. Нет, нет, царевна. Саломея. Но я должна посмотреть на него поближе. Молодой сириец. Царевна! Царевна! Иоканаан. Кто эта женщина, что воззрилась на меня? Я не хочу, чтобы она на меня смотрела. Зачем она на меня смотрит этими своими золотыми глазами из-под позолоченных век? Я не знаю, кто она. И не желаю знать, кто она. Пусть она уходит. Если я и буду говорить, то не с ней. Саломея. Я Саломея, дочь Иродиады, царевна иудейская. Иоканаан. Не подходи, дочь вавилонова![16] Не приближайся к избраннику Господню. Мать твоя пропитала всю землю вином своих нечестивостей, и молва о грехах ее достигла ушей Господних. Саломея. Не умолкай, Иоканаан. Твой голос пьянит меня точно вино. Молодой сириец. Царевна! Царевна! Царевна! Саломея. Говори еще! Говори еще, Иоканаан, и надоумь меня, что мне делать. Иоканаан. Не приближайся ко мне, дочь содомова! Спрячь лицо свое под покрывалом, посыпь голову свою пеплом и поспеши в пустыню искать Сына Человеческого. Саломея. Кто он, Сын Человеческий? Он так же красив, как и ты, Иоканаан? Иоканаан. Прочь от меня! Я слышу, как во дворце хлопает крыльями Ангел Смерти. Молодой сириец. Царевна, умоляю тебя, возвращайся на пир! Иоканаан. Ангел Господень, зачем ты здесь с мечом своим? Кого ты ищешь в этом нечестивом дворце? Не пришел еще Его день – того, кто умрет в серебряном одеянии. Саломея. Иоканаан! Иоканаан. Кто это говорит? Саломея. Иоканаан! Я влюблена в твое тело! Тело твое бело, как лилии на никогда не кошенном поле. Тело твое бело, как снег, покрывающий горы, – как снег, лежащий в горах Иудеи и нисходящий в долины. Розы в саду царицы аравийской не столь белы, как твое тело. Ни розы в саду царицы аравийской, ни стопы утренней зари, легко ступающей по листве, ни лоно луны, покоящейся на глади морской, – ничто на свете не сравнится с белизной твоего тела. Позволь мне коснуться твоего тела! Иоканаан. Не подходи, дочь вавилонова! Зло в этот мир пришло через женщину. Не заговаривай со мной. Я не стану слушать тебя. Я буду слушать лишь слова Господни. Саломея. Тело твое отвратительно. Оно точно тело прокаженного. Оно будто оштукатуренная стена, по которой проползли ядовитые змеи, – будто оштукатуренная стена, на которой устроили гнездо свое скорпионы. Оно словно выбеленный склеп, полный скверны. Оно ужасно, тело твое! В твои волосы – вот во что я влюблена, Иоканаан. Твои волосы подобны гроздьям винограда, гроздьям черного винограда, свисающим с гибких лоз в виноградниках Эдома,[17] страны эдомитов. Твои волосы подобны кедрам ливанским, огромным кедрам ливанским, что дают тень львам и разбойникам, ищущим укрытия средь бела дня. Долгие черные ночи, когда луна прячет лик свой, когда звезды мерцают от страха, не так черны, как твои волосы. Безмолвие, таящееся в лесах, не так черно, как они. Нет ничего на свете чернее твоих волос… Позволь мне коснуться волос твоих. Иоканаан. Не подходи, дочь содомова! Не прикасайся ко мне! Не оскверняй храм Господень! Саломея. Твои волосы отвратительны. Они покрыты грязью и пылью. Они точно терновый венец, возложенный на чело твое. Точно клубок черных змей, извивающихся вокруг шеи твоей. Мне не нравятся твои волосы… Уста твои – вот чего я желаю, Иоканаан. Уста твои подобны алой ленте на башне из слоновой кости. Они подобны плоду граната, разрезанному ножом из слоновой кости. Цветы граната, что цветут в садах Тира,[18] – они краснее, чем алые розы, но не так красны, как твои уста. Раскаленные раскаты труб, возвещающие прибытие царей и наводящие ужас на врагов, не так красны, как твои уста. Они краснее, чем ступни у тех, кто давит виноград в давильнях. Они краснее, чем лапки у голубей, обитающих в храмах, где их кормят священники. Они краснее, чем ноги у того, кто возвращается из леса, где он убил льва и видел золотистых тигров. Твои уста подобны ветке коралла, найденной рыбаками в сумерках моря и сохраняемой ими для царей!.. Они подобны киновари, добываемой моавитянами в копях Моава[19] и отбираемой у них царями. Они подобны боевому луку персидского царя, покрытому киноварью и украшенному с обоих концов кораллами. Нет ничего на свете краснее уст твоих… Позволь мне поцеловать тебя в уста. Иоканаан. Никогда, дочь вавилонова! Дочь содомова, никогда! Саломея. Я поцелую тебя в уста, Иоканаан. Я поцелую тебя. Молодой сириец. Царевна, царевна, ты благоухаешь словно миррисовые сады, ты голубица из голубиц. Так не смотри же на этого человека, не смотри на него! Не говори ему таких слов. Мне невыносимо их слышать… Царевна, царевна, не говори больше этих слов. Саломея. Я поцелую тебя в уста, Иоканаан. Молодой сириец. А-а-а! (Убивает себя и падает между Саломеей и Иоканааном.) Паж Иродиады. Молодой сириец убил себя! Молодой начальник стражи убил себя! Убил себя тот, кто был моим другом! Я подарил ему коробочки с благовониями и серьги, сделанные из серебра, и теперь он убивает себя! Ах, не предсказывал ли он, что случится несчастье? Я и сам это предсказывал, и так оно и случилось. Что ж, я знал, что луна выискивает мертвых, но не думал, что это он, кого она ищет. Ах, почему я не спрятал его от луны? Если бы я спрятал его в пещере, она бы не высмотрела его. Первый солдат. Царевна, молодой начальник стражи только что покончил с собой. Саломея. Позволь мне поцеловать тебя в уста, Иоканаан. Иоканаан. Ужели тебе не страшно, дочь Иродиады? Разве не говорил я тебе, что слышал, как во дворце хлопает крыльями Ангел Смерти, и разве ты не видишь, что Ангел Смерти уже явился? Саломея. Позволь мне поцеловать тебя в уста. Иоканаан. Знай же, порождение прелюбодеяния, есть лишь один человек, который может спасти тебя. Это тот, о ком я уже говорил тебе. Иди и ищи Его. Он в лодке на море Галилейском, и Он говорит со своими учениками. Опустись на колени на берегу морском и позови Его по имени. И когда он придет к тебе – а он приходит ко всем, кто зовет Его, – пади к ногам Его и проси об отпущении грехов своих. Саломея. Позволь мне поцеловать тебя в уста. Иоканаан. Будь же ты проклята, дочь матери – кровосмесительницы, будь проклята! Саломея. Я поцелую тебя в уста, Иоканаан. Иоканаан. Я не хочу тебя видеть, и я не буду больше смотреть на тебя. Ибо ты проклята, Саломея, ты проклята. (Спускается в колодец). Саломея. Я все же поцелую тебя в уста, Иоканаан, я тебя поцелую. Первый солдат. Нам нужно перенести тело в другое место. Тетрарх видеть не может трупов, за исключением трупов тех людей, которых убил он сам. Паж Иродиады. Он был мне братом, даже ближе брата. Я подарил ему коробочки с благовониями и агатовый перстень, который он никогда не снимал с пальца на руке своей. По вечерам мы гуляли с ним по берегу реки среди миндальных деревьев, и он рассказывал мне о своей стране. Говорил он всегда очень тихо. Звук его голоса походил на звук флейты, на звук голоса того, кто играет на флейте. И он так любил смотреть на свое отражение в реке. Я часто упрекал его за это. Второй солдат. Ты прав, нужно спрятать тело. Тетрарх не должен его видеть. Первый солдат. Тетрарх сюда не придет. Он никогда не выходит на террасу: он слишком боится пророка. Входят Ирод, Иродиада и весь двор. Ирод. Где Саломея? Где царевна? Почему она не вернулась на пир, как я ей велел?.. А, вот она! Иродиада. Ты не должен смотреть на нее. Ты постоянно на нее смотришь. Ирод. У луны сегодня такой странный вид. Не правда ли, странный? Она похожа на помешанную – на помешанную, которая всюду ищет себе любовников. И она нагая. Она совершенно нагая. Облака пытаются прикрыть ее наготу, но она им не позволяет. Она выставляет себя на небосклоне нагой. Она бредет сквозь ряды облаков шатаясь, точно пьяная женщина… Я уверен, она ищет любовников. Ведь правда – она шатается, точно пьяная женщина? Она похожа на помешанную, ведь правда? Иродиада. Нет, луна похожа на луну – и ни на что больше. Давай лучше вернемся во дворец… Тебе здесь нечего делать. Ирод. Я остаюсь здесь! Манассия, постели нам ковры. Пусть зажгут факелы, принесут столы из слоновой кости и столы из яшмы. Какой здесь чудесный воздух! Я выпью еще вина с моими гостями. Послам цезаря нужно оказать всевозможные почести. Иродиада. Не из-за них ты здесь остаешься. Ирод. Да, воздух здесь восхитительный. Идем, Иродиада, нас ждут гости… Ох… я поскользнулся в луже крови! Это дурной знак. Это очень дурной знак. Откуда здесь кровь?.. А этот труп… откуда здесь взялся труп и зачем он здесь? Не думаете же вы, что я, подобно царю египетскому, не мыслю себе пира, на котором не смогу показать хотя бы один труп?.. Чей это труп? Я не хочу его видеть. Первый солдат. Это наш начальник, повелитель. Он тот юный сириец, которого ты всего три дня назад поставил начальником стражи. Ирод. Я не давал приказания его убивать. Второй солдат. Он сам себя убил, повелитель. Ирод. Но почему? Я ведь назначил его начальником. Второй солдат. Мы этого не знаем, повелитель. Но он сам себя убил. Ирод. Мне это кажется непонятным. Я считал, что только римские философы убивают себя. Не правда ли, Тигеллин, философы в Риме убивают себя? Тигеллин. Да, некоторые из них убивают себя, повелитель. Они называют себя стоиками.[20] Стоики эти – народ нецивилизованный. Я лично нахожу их людьми совершенно нелепыми. Ирод. Я тоже. Нелепо убивать себя. Тигеллин. В Риме все над ними смеются. Император даже написал на них сатиру. И теперь ее можно услышать на каждом углу. Ирод. О, он написал сатиру на них! Да-а, цезарь удивительный человек. Он, кажется, все умеет… Странно, что молодой сириец покончил с собой. Мне жаль, что он покончил с собой. Очень жаль. Потому что на него было приятно смотреть. Он был очень хорош собой. У него были томные глаза. Помню, я однажды заметил, как томно он смотрит на Саломею. И я подумал тогда, что он слишком засматривается на нее. Иродиада. Есть и другие, кто слишком засматривается на нее. Ирод. Отец его был царем, но я изгнал его из царства, которым он правил. А царицу, его мать, ты сделала своей рабыней, Иродиада. Так что он был здесь как бы моим гостем. Потому я и сделал его начальником моей стражи. Мне жаль, что он умер… Эй, почему вы оставили здесь этот труп? Я не хочу на него смотреть – унесите его отсюда. Тело уносят. Здесь холодно. Дует ветер. Ведь правда, дует ветер? Иродиада. Нет никакого ветра. Ирод. А я тебе говорю – дует ветер… И я слышу в воздухе звуки, напоминающие хлопанье крыльев – гигантских крыльев. Ты разве не слышишь? Иродиада. Я ничего не слышу. Ирод. Теперь и я не слышу, но только что слышал. Я уверен, что это завывал ветер. Пронесся и улетел. Хотя нет, опять слышу. Ты разве не слышишь? Очень похоже на хлопанье крыльев. Иродиада. А я тебе говорю – все вокруг тихо. Уж не болен ли ты? Давай возвратимся во дворец. Ирод. Я-то не болен. А вот твоя дочь больна. У нее очень болезненный вид. Я никогда не видел ее такой бледной. Иродиада. Говорю тебе – не смотри на нее. Ирод. Налейте-ка мне вина. (Ему приносят вино.) Саломея, подойди и выпей со мной немного вина. У меня замечательное вино. Сам цезарь прислал его мне. Омочи в нем свои маленькие красные губы, и тогда я осушу весь кубок. Саломея. Мне не хочется пить, тетрарх. Ирод. Ты слышишь, как она отвечает мне, твоя распрекрасная дочь? Иродиада. И правильно делает. Почему ты никогда не сводишь с нее глаз? Ирод. Принесите мне спелых фруктов. (Ему приносят фрукты.) Саломея, подойди и поешь фруктов со мной. Мне так нравится видеть на фруктах следы твоих маленьких зубов. Откуси от этого плода хоть кусочек, и тогда я съем остальное. Саломея. Мне не хочется есть, тетрарх. Ирод (Иродиаде). Видишь, как ты воспитала свою распрекрасную дочь. Иродиада. Моя дочь и я царского рода, а вот твой отец был погонщиком верблюдов! К тому же грабителем и разбойником! Ирод. Ты лжешь! Иродиада. Ты прекрасно знаешь, что это правда. Ирод. Саломея, подойди и сядь рядом со мной. Я обещаю отдать тебе трон твоей матери. Саломея. Я не устала, тетрарх. Иродиада. Сам видишь, как она относится к тебе. Ирод. Принесите мне… Чего мне еще хотелось? Забыл… Ах, да, вспомнил! Голос Иоканаана. Внемлите! Час пробил! То, что я предвещал, свершилось – так говорит Господь Бог. Внемлите! День, о котором я говорил, наступил. Иродиада. Вели ему замолчать. Я не хочу его слышать. Этот человек вечно изрыгает слова, оскорбляющие меня. Ирод. Он ничего не сказал о тебе плохого. К тому же он великий пророк. Иродиада. Я не верю в пророков. Разве кто-нибудь может сказать, что произойдет в будущем? Никто этого знать не может. Да и кроме того, он вечно оскорбляет меня… Но мне кажется, ты боишься его… Да, я точно знаю, что ты боишься его. Ирод. Не боюсь я его. Я никого не боюсь. Иродиада. А я тебе говорю – ты боишься его. Если же не боишься, почему не выдашь его евреям, которые уже шесть месяцев так настойчиво просят тебя об этом? Один из евреев. И вправду, повелитель, ты бы лучше передал его в наши руки. Ирод. Довольно об этом. Я уже дал вам ответ. Я не передам его в ваши руки. Это святой человек. Это человек, который видел Бога. Еврей. Такого просто не может быть. Никто не видел Бога с тех пор, как его видел пророк Илия. Он был последним, кто видел Господа. В наши дни Господь не являет себя. Он остается незримым. Потому-то на нашу землю и пришли великие беды. Другой еврей. Воистину, никому не ведомо, Господа ли видел пророк Илия. Возможно, он видел лишь тень Его. Третий еврей. Бог никогда не бывает незримым. Он являет себя везде и во всем. Господь присутствует и в добрых деяниях, и в злых. Четвертый еврей. Этого никогда не следует говорить. Такие мысли крайне опасны. Они исходят из школ александрийских, и внушают их люди, обучающие там своих учеников философии греков. А ведь греки – язычники. Они даже не совершают обряда обрезания. Пятый еврей. Никто не может сказать, что движет Господом, ибо неисповедимы пути Господни. Возможно, то, что мы зовем злом, на самом деле добро, а то, что мы зовем добром, – зло. Нам не дано знать о делах Господних. Мы все сущее должны принимать с покорностью, ибо безгранична сила Господня. Он сокрушает сильного столь же легко, сколь слабого, и не щадит никого. Первый еврей. Слова твои истинны: Господь Бог грозен. Он сокрушает сильных и слабых с такой же легкостью, с какой человек дробит зерно в ступе… Но Иоканаан никогда не видел Бога. Никто не видел Бога с тех пор, как его видел пророк Илия. Иродиада. Вели им замолчать. Они утомляют меня. Ирод. Но я слышал, будто Иоканаан и есть этот ваш пророк Илия.'

In [0]:
import re
prog = re.compile('[А-Яа-я]+')
t1 = prog.findall(s.lower())

In [5]:
!pip install pymorphy2



In [0]:
import pymorphy2

morph = pymorphy2.MorphAnalyzer()
t2 = [morph.parse(tok)[0].normal_form for tok in t1]

In [8]:
t2

['место',
 'действие',
 'обширный',
 'терраса',
 'в',
 'дворец',
 'ирод',
 'расположить',
 'несколько',
 'выше',
 'пиршественный',
 'зал',
 'солдат',
 'стоять',
 'облокотиться',
 'на',
 'балюстрада',
 'балкон',
 'направо',
 'огромный',
 'лестница',
 'налево',
 'в',
 'глубина',
 'старый',
 'колодец',
 'с',
 'стенка',
 'из',
 'позеленеть',
 'бронза',
 'светить',
 'луна',
 'молодая',
 'сириец',
 'как',
 'прекрасный',
 'сегодня',
 'царевна',
 'саломея',
 'паж',
 'иродиада',
 'посмотреть',
 'на',
 'луна',
 'до',
 'что',
 'луна',
 'кажется',
 'странный',
 'она',
 'похожий',
 'на',
 'женщина',
 'вставать',
 'из',
 'могила',
 'она',
 'похожий',
 'на',
 'мёртвый',
 'женщина',
 'мочь',
 'показаться',
 'что',
 'она',
 'сам',
 'выискивать',
 'мёртвый',
 'молодая',
 'сириец',
 'у',
 'нея',
 'странный',
 'вид',
 'она',
 'подобный',
 'маленькая',
 'царевна',
 'на',
 'который',
 'жёлтый',
 'покрывало',
 'и',
 'нога',
 'который',
 'из',
 'серебро',
 'она',
 'подобный',
 'царевна',
 'у',
 'который',
 'д

In [9]:
t3 = nltk.FreqDist(t2)
t3.most_common(20)

[('я', 167),
 ('он', 148),
 ('не', 134),
 ('на', 100),
 ('и', 99),
 ('ты', 96),
 ('в', 80),
 ('что', 62),
 ('она', 62),
 ('это', 62),
 ('саломея', 60),
 ('солдат', 52),
 ('царевна', 48),
 ('как', 44),
 ('с', 43),
 ('они', 42),
 ('иродиада', 37),
 ('сириец', 33),
 ('один', 33),
 ('твой', 33)]

In [12]:
bg = list(nltk.bigrams(t1))
bgfd = nltk.FreqDist(bg)
bgfd.most_common(18)

[(('молодой', 'сириец'), 30),
 (('первый', 'солдат'), 26),
 (('второй', 'солдат'), 23),
 (('я', 'не'), 20),
 (('на', 'нее'), 14),
 (('никогда', 'не'), 14),
 (('царевна', 'саломея'), 12),
 (('паж', 'иродиады'), 11),
 (('саломея', 'я'), 10),
 (('он', 'говорит'), 9),
 (('сириец', 'царевна'), 8),
 (('тебя', 'в'), 8),
 (('в', 'уста'), 8),
 (('уста', 'иоканаан'), 8),
 (('похожа', 'на'), 7),
 (('смотреть', 'на'), 7),
 (('не', 'видел'), 7),
 (('на', 'него'), 7)]

In [0]:
from nltk.collocations import *
N_best = 100
bm = nltk.collocations.BigramAssocMeasures()
f = BigramCollocationFinder.from_words(t2)
f.apply_freq_filter(5)

In [0]:
raw_freq_ranking = [' '.join(i) for i in
f.nbest(bm.raw_freq, N_best)]
tscore_ranking = [' '.join(i) for i in
f.nbest(bm.student_t, N_best)]
pmi_ranking = [' '.join(i) for i in
f.nbest(bm.pmi, N_best)]
llr_ranking = [' '. join(i) for i in
f.nbest(bm.likelihood_ratio, N_best)]
chi2_ranking = [' '.join(i) for i in
f.nbest(bm.chi_sq, N_best)]

In [0]:
import pandas as pd
tbl = pd.DataFrame(columns=['raw_freq_ranking', 'tscore_ranking', 'pmi_ranking', 'llr_ranking', 'chi2_ranking'])

In [0]:
tbl.raw_freq_ranking = raw_freq_ranking
tbl.tscore_ranking = tscore_ranking
tbl.pmi_ranking = pmi_ranking
tbl.llr_ranking = llr_ranking
tbl.chi2_ranking = chi2_ranking

In [17]:
tbl.head(15)

Unnamed: 0,raw_freq_ranking,tscore_ranking,pmi_ranking,llr_ranking,chi2_ranking
0,молодая сириец,молодая сириец,слоновый костя,молодая сириец,слоновый костя
1,один солдат,один солдат,ведь правда,один солдат,молодая сириец
2,я не,два солдат,убивать себя,два солдат,два солдат
3,два солдат,я не,молодая сириец,паж иродиада,один солдат
4,смотреть на,смотреть на,паж иродиада,никогда не,ведь правда
5,на нея,на нея,твой волос,на нея,паж иродиада
6,никогда не,никогда не,уста иоканаана,смотреть на,убивать себя
7,не мочь,не мочь,два солдат,слоновый костя,уста иоканаана
8,саломея я,паж иродиада,один солдат,похожий на,твой волос
9,царевна саломея,царевна саломея,где тот,уста иоканаана,тот кто


In [0]:
# правка нормализации не входила в планы