# Лекция NLP 3

## Расстояние между словами

* Расстояние Левенштейна
* Задача динамического программирования
* Алгоритм поиска расстояния Левинштайна (The minimum edit distance algorithm was named by Wagner and Fischer )

## Расстояние Левенштейна

Часто требуется понять, насколько близкими являются два не совпадающих слова (строки). Это может потребоваться для:
* поиска ошибок и опечаток в слове
* поиска словоформ слова
* для сравнения предложений и текстов
* в других областях (в биоинформатике для сравнения генов, хромосом и белков)

__Расстояние Левенштейна__ (редакционное расстояние, дистанция редактирования) - __минимальное__ количество операций необходимых для превращения одной строки в другую. Рассматриваются следующие операции:
* вставка одного символа
* удаление одного символа 
* замена одного символа на другим.

<center> 
__Пример выполнения операций вставки, удаления и замены для слова "intention" :__

<img src="levinst1.png" alt="Пример выполнения операций вставки, удаления и замены" style="width: 650px;"/>


__Пример преобразования слова "intention" в "execution" с помощью операций вставки, удаления и замены:__

<img src="levinst2.png" alt="Пример закона Ципфа" style="width: 400px;"/>
</center>

В общем случае __стоимость различных операций__ может быть различной. Цена операций могут зависеть от вида операции (вставка, удаление, замена) и/или от участвующих в ней символов, отражая разную вероятность этих событий.

Если к списку разрешённых операций добавить __транспозицию__ (два соседних символа меняются местами), получается __расстояние Дамерау - Левенштейна__. Дамерау показал, что 80 % ошибок при наборе текста человеком являются транспозициями. Кроме того, это расстояние используется и в биоинформатике. Для поиска расстояния Левинштайна и расстояния Дамрау - Левинштайна существуют эффективные алгоритм, требующий $O(MN)$ операций ($M$ и $N$ это длины первой и второй строки соответственно).

\qquad\operatorname{D}(i,j) = \begin{cases}   \max(i,j) & \text{ if } \min(i,j)=0, \\   \min \begin{cases}           \operatorname{D}(i-1,j) + 1 \\           \operatorname{D}(i,j-1) + 1 \\           \operatorname{D}(i-1,j-1) + \operatorname{m}(S_1[i], S_2[j])        \end{cases} & \text{ otherwise.} \end{cases}

Здесь и далее считается, что элементы строк нумеруются с первого, как принято в математике.

Пусть $S_1$ и $S_2$ - две строки (длиной $M$ и $N$ соответственно) над некоторым алфавитом, тогда расстояние Левенштейна $\operatorname{d}(S_1,S_2) можно подсчитать по следующей рекуррентной формуле:

$$\ \operatorname{d}(S_1, S_2) = \operatorname{D}(M,N)$$

$$\qquad\operatorname{D}(i,j) = \begin{cases}
  \max(i,j) & \text{ if } \min(i,j)=0, \\
  \min \begin{cases}
          \operatorname{D}(i-1,j) + 1 \\
          \operatorname{D}(i,j-1) + 1 \\
          \operatorname{D}(i-1,j-1) + \operatorname{m}(S_1[i], S_2[j])
       \end{cases} & \text{ otherwise.}
\end{cases}$$

Цена операции замены зависит от заменяемых символов:

$$\operatorname{m}(s_1, s_2) = \begin{cases}
0 \text{ , if } s_1 = s_2 \\
2 \text{ , if } s_1 \neq s_2 \\
\end{cases}$$

Очевидно, что для расстояния Левинштайна справедливы следующие утверждения:
* $\operatorname{d}(S_1,S_2) \geqslant \bigl| |S_1| - |S_2| \bigr|$
* $\operatorname{d}(S_1,S_2) \leqslant \max\bigl( |S_1| , |S_2| \bigr)$
* $\operatorname{d}(S_1,S_2) = 0 \Leftrightarrow S_1 = S_2$

__Редакционным предписанием__ называется последовательность действий, необходимых для получения из первой строки второй кратчайшим образом. Обычно действия обозначаются так: D (англ. delete) — удалить, I (англ. insert) — вставить, R (replace) — заменить, M (match) — совпадение.

По сути редакционное предписание это кратчайшие пути на графе с весами, в котором существует 3 вида ориентированных ребер (D, I, M), а вершинами являются строки (слова). В общем случае для конкретной пары слов может существовать несколько редакционных предписаний (кратчайших путей на графе).

### Динамическое программирование

__Динамическое программирование__ - способ решения сложных задач путём разбиения их на более простые подзадачи. Он применим к _задачам с оптимальной подструктурой_, выглядящим как _набор перекрывающихся подзадач_, сложность которых чуть меньше исходной. В этом случае время вычислений, по сравнению с «наивными» методами, можно значительно сократить.

__Идея динамического программирования:__

_Оптимальная подструктура_ в динамическом программировании означает, что оптимальное решение подзадач меньшего размера может быть использовано для решения исходной задачи. 

В общем случае мы можем решить задачу, в которой присутствует оптимальная подструктура, проделывая следующие три шага.

1. Разбиение задачи на подзадачи меньшего размера.
2. Нахождение оптимального решения подзадач рекурсивно, проделывая такой же трехшаговый алгоритм.
3. Использование полученного решения подзадач для конструирования решения исходной задачи.

Часто многие из рассматриваемых подзадач одинаковы. Подход динамического программирования состоит в том, чтобы _решить каждую подзадачу только один раз_, сократив тем самым количество вычислений. Это особенно полезно в случаях, когда число повторяющихся подзадач экспоненциально велико.

* Метод динамического программирования __сверху-вниз__ (top-down approach) - это простое _запоминание результатов решения тех подзадач_, которые могут повторно встретиться в дальнейшем. 
* Динамическое программирование __снизу-вверх__ (bottom-up approach) включает в себя переформулирование сложной задачи в виде рекурсивной последовательности более простых подзадач.

### Алгоритм Вагнера - Фишера

Используя рекурсивное определение расстояния Левинштайна $\operatorname{D}(i,j)$ через расстояния для слов меньшей длины: $\operatorname{D}(i-1,j) \text{ , } \operatorname{D}(i,j-1) \text{ , } \operatorname{D}(i-1,j-1)$ мы применим принцип динамического программирования снизу-вверх, комбинируя решения подзадач, для решения более сложной задачи. 

1. Для получения базового решения когда конечная строка длины 0 или исходная строка длинны 0:
    * $\operatorname{D}(i, 0) = i $ - используется $i$ операций удаления (на схеме операция вставки обозначается, как: "$\uparrow$")
    * $\operatorname{D}(0, j) = j$ - используется $j$ операций вставки (на схеме операция вставки обозначается, как: "$\leftarrow$")
2. После расчета $\operatorname{D}(i, j)$ для малых $i$ и $j$ мы рассчитываем значения расстояния для бОльших $i$ и $j$ на основе рекурсивной формулы: 

$$\qquad\operatorname{D}(i,j) =  \min \begin{cases}
          \operatorname{D}(i-1,j) + 1 \text{, операция удаления, на схеме обозначается как: } \uparrow\\
          \operatorname{D}(i,j-1) + 1 \text{, операция вставки, на схеме обозначается как: } \leftarrow\\
          \operatorname{D}(i-1,j-1) + \operatorname{m}(S_1[i], S_2[j]) \text{, операция замены, на схеме обозначается как: } \nwarrow
       \end{cases}$$

<center> 
__Пример поиска расстояния Левинштейна для слов "intention" и "execution" с помощью алгоритма Вагнера - Фишера:__

<img src="levinst3.png" alt="Пример поиска расстояния Левинштейна для слов intention и execution" style="width: 750px;"/>
</center>

<center> 
__Алгоритм Вагнера - Фишера для поиска расстояния Левинштейна:__

<img src="levinst4.png" alt="Алгоритм Вагнера - Фишера для поиска расстояния Левинштейна" style="width: 600px;"/>
</center>

In [2]:
from nltk.metrics import *

In [4]:
edit_distance('intention', 'execution', substitution_cost=2)

8

In [8]:
# результат при substitution_cost=1
edit_distance('intention', 'execution')

5

In [5]:
edit_distance('пирвет', 'привет', substitution_cost=2)

2

In [9]:
# расстояние Домрау-Левинштайна:
edit_distance('пирвет', 'привет', substitution_cost=2, transpositions=True)

1

С точки зрения приложений определение расстояния Левенштейна между словами или строками обладает следующими недостатками:
* При перестановке местами слов или частей слов получаются сравнительно большие расстояния.
* Расстояния между совершенно разными короткими словами оказываются небольшими, в то время как расстояния между очень похожими длинными словами оказываются значительными.

Другие метрики в NLTK: http://www.nltk.org/howto/metrics.html

## Задача определения частей речи (POS-tagging)

* Постановка задачи
* Формулировка
* Алгоритм Витерби

<center> 
__Пример тегов частей речи в pymorphy2__
</center>

<table border="1" class="docutils">
<colgroup>
<col width="14%">
<col width="40%">
<col width="46%">
</colgroup>
<thead valign="bottom">
<tr class="row-odd"><th class="head">Граммема</th>
<th class="head">Значение</th>
<th class="head">Примеры</th>
</tr>
</thead>
<tbody valign="top">
<tr class="row-even"><td>NOUN</td>
<td>имя существительное</td>
<td>хомяк</td>
</tr>
<tr class="row-odd"><td>ADJF</td>
<td>имя прилагательное (полное)</td>
<td>хороший</td>
</tr>
<tr class="row-even"><td>ADJS</td>
<td>имя прилагательное (краткое)</td>
<td>хорош</td>
</tr>
<tr class="row-odd"><td>COMP</td>
<td>компаратив</td>
<td>лучше, получше, выше</td>
</tr>
<tr class="row-even"><td>VERB</td>
<td>глагол (личная форма)</td>
<td>говорю, говорит, говорил</td>
</tr>
<tr class="row-odd"><td>INFN</td>
<td>глагол (инфинитив)</td>
<td>говорить, сказать</td>
</tr>
<tr class="row-even"><td>PRTF</td>
<td>причастие (полное)</td>
<td>прочитавший, прочитанная</td>
</tr>
<tr class="row-odd"><td>PRTS</td>
<td>причастие (краткое)</td>
<td>прочитана</td>
</tr>
<tr class="row-even"><td>GRND</td>
<td>деепричастие</td>
<td>прочитав, рассказывая</td>
</tr>
<tr class="row-odd"><td>NUMR</td>
<td>числительное</td>
<td>три, пятьдесят</td>
</tr>
<tr class="row-even"><td>ADVB</td>
<td>наречие</td>
<td>круто</td>
</tr>
<tr class="row-odd"><td>NPRO</td>
<td>местоимение-существительное</td>
<td>он</td>
</tr>
<tr class="row-even"><td>PRED</td>
<td>предикатив</td>
<td>некогда</td>
</tr>
<tr class="row-odd"><td>PREP</td>
<td>предлог</td>
<td>в</td>
</tr>
<tr class="row-even"><td>CONJ</td>
<td>союз</td>
<td>и</td>
</tr>
<tr class="row-odd"><td>PRCL</td>
<td>частица</td>
<td>бы, же, лишь</td>
</tr>
<tr class="row-even"><td>INTJ</td>
<td>междометие</td>
<td>ой</td>
</tr>
</tbody>
</table>

Граммемы Opencorpora: http://opencorpora.org/dict.php?act=gram

<center> 
__Пример тегов частей речи в MyStam__
<br/>

<table>

<tr class="row doc-c-table__tr"> <td class="entry doc-c-table__td">A</td> <td class="entry doc-c-table__td">прилагательное</td> </tr> <tr class="row doc-c-table__tr"> <td class="entry doc-c-table__td">ADV</td> <td class="entry doc-c-table__td">наречие</td> </tr> <tr class="row doc-c-table__tr"> <td class="entry doc-c-table__td">ADVPRO</td> <td class="entry doc-c-table__td">местоименное наречие</td> </tr> <tr class="row doc-c-table__tr"> <td class="entry doc-c-table__td">ANUM</td> <td class="entry doc-c-table__td">числительное-прилагательное</td> </tr> <tr class="row doc-c-table__tr"> <td class="entry doc-c-table__td">APRO</td> <td class="entry doc-c-table__td">местоимение-прилагательное</td> </tr> <tr class="row doc-c-table__tr"> <td class="entry doc-c-table__td">COM</td> <td class="entry doc-c-table__td">часть композита - сложного слова</td> </tr> <tr class="row doc-c-table__tr"> <td class="entry doc-c-table__td">CONJ</td> <td class="entry doc-c-table__td">союз</td> </tr> <tr class="row doc-c-table__tr"> <td class="entry doc-c-table__td">INTJ</td> <td class="entry doc-c-table__td">междометие</td> </tr> <tr class="row doc-c-table__tr"> <td class="entry doc-c-table__td">NUM</td> <td class="entry doc-c-table__td">числительное</td> </tr> <tr class="row doc-c-table__tr"> <td class="entry doc-c-table__td">PART</td> <td class="entry doc-c-table__td">частица</td> </tr> <tr class="row doc-c-table__tr"> <td class="entry doc-c-table__td">PR</td> <td class="entry doc-c-table__td">предлог</td> </tr> <tr class="row doc-c-table__tr"> <td class="entry doc-c-table__td">S</td> <td class="entry doc-c-table__td">существительное</td> </tr> <tr class="row doc-c-table__tr"> <td class="entry doc-c-table__td">SPRO</td> <td class="entry doc-c-table__td">местоимение-существительное</td> </tr> <tr class="row doc-c-table__tr"> <td class="entry doc-c-table__td">V</td> <td class="entry doc-c-table__td">глагол</td> </tr> 
</table>    
</center>

Эффективное определение части речи __по виду самого слова неэффективно__ из-за лексико-морфологической омонимии, которая очень часто встречается в т.ч. в русском языке. 

__Лексико-морфологическая омонимия__ – совпадение словоформ двух разных лексем. Пример омонима: 
* дуло - глагол несовершенного вида, изъявительного наклонения, в единственном числе среднем роде, в прошедшем времени
* дуло - существительное среднего рода в единственном числе, именительном падеже.

Обычно контекст предложения позволяет разрешнить неоднозначность, пример: _Из окна сильно дуло._

In [10]:
import pymorphy2

morph = pymorphy2.MorphAnalyzer()

In [11]:
p = morph.parse('дуло')
p

[Parse(word='дуло', tag=OpencorporaTag('VERB,impf,tran neut,sing,past,indc'), normal_form='дуть', score=0.5, methods_stack=((<DictionaryAnalyzer>, 'дуло', 1211, 9),)),
 Parse(word='дуло', tag=OpencorporaTag('NOUN,inan,neut sing,nomn'), normal_form='дуло', score=0.25, methods_stack=((<DictionaryAnalyzer>, 'дуло', 54, 0),)),
 Parse(word='дуло', tag=OpencorporaTag('NOUN,inan,neut sing,accs'), normal_form='дуло', score=0.25, methods_stack=((<DictionaryAnalyzer>, 'дуло', 54, 3),))]

### Постановка задачи POS-tagging и скрытые марковские модели

$$\hat{t}_1^n = \underset{t_1^n}{\arg\max} \ P(t_1^n \mid w_1^n) \text{ ,}$$
где $w_1^n$ - последовательность слов с 1-го по n-e (обычно предложение, часто с символами начала и конца предложения); $t_1^n$ - последовательность тегов для слов.

Формула Байеса: 
$$P(A \mid B) = \frac{P(B \mid A)\, P(A)}{P(B)}$$

Применим формулу Байеса:
$$\hat{t}_1^n =  \underset{t_1^n}{\arg\max} \ \frac{P(w_1^n \mid t_1^n) \, P(t_1^n)}{P(w_1^n)}   \text{ ,}$$

Т.к. набор слов в предложении $w_1^n$ не меняется при поиске $\arg\max$:
$$\hat{t}_1^n =  \underset{t_1^n}{\arg\max} \ P(w_1^n \mid t_1^n) \, P(t_1^n) \text{ ,}$$


Цепь Маркова - последовательность случайных событий с конечным (или счётным) числом исходов, для которых предполагается что будущее событие зависит только от текущего события и не зависит от более ранних событий.

Например, у нас имеется имеется дискретная последовательность (цепь) дискретных случайных величин, значение каждой из случайных величин принадлежит множеству заданных состояний системы. Это множество, может быть множеством слов, тэгов частей речи, или, например, символов, кодирующих состояния погоды. В цепи Маркова делается очень сильное предположение, что на вероятность появления следующего звена цепи влияет только предшествующее звено и не влияют все более ранние события.

$$P(X_{n} = i_{n} \mid X_{n-1},\ldots,  X_1) = P(X_{n} = i_{n} \mid X_{n-1})$$

Таким образом, в простейшем случае условное распределение последующего состояния цепи Маркова зависит только от текущего состояния и не зависит от всех предыдущих состояний (в отличие от цепей Маркова высших порядков).

Например мы рассматриваем последовательность дней и погоду в каждый из дней определяем как "холодную", "теплую" или "жаркую". Тогда в предположении случайной марковской цепи вероятностяь определенного типа погоды в следующий день будет определяться только типом погоды в предшествующий день.

<center> 
__Пример марковской модели для трех состояний погоды__

<img src="hmm1.png" alt="Пример марковской модели для трех состояний погоды" style="width: 400px;"/>
</center>

Для задачи POS-tagging марковское предположение выливается в:

$$P(t_1^n) = P(t_n \ldots t_1)=P(t_n \mid t_{n-1} \ldots t_1)P(t_{n-1} \ldots t_1) = \prod_{i=1}^n P(t_i \mid t_{i-1} \ldots t_1) \approx \prod_{i=1}^n P(t_i \mid t_{i-1}) \text{ ,}$$

т.е. мы допускаем, что вероятность появления тэга следующего слова зависит только от тега предыдущего слва.

Цепи Маркова полезны когда мы хотим вычислить вероятность __последовательности наблюдаемых событий__. Но во многих случаях __события, которые нас интересют, скрыты__: мы не наблюдаем их напрямую. Например, мы в явном виде не наблюдаем части речи в предложении, вместо этого мы наблюдаем в нем слова. На основании последовательности наблюдений (слов) нам нужо вывести последовательность интересующих нас скрытых событий (тэгов частей речи). Мы называем эти события скрытими, т.к. в явном виде не наблюдаем их. Решить такую задачу позволяет __скрытая марковская модель__ (hidden Markov model (HMM))

Скрытая марковская модель определяется:
* Набором скрытых состояний. В нашем случае множеством тегов частей речи $\left \{ T_k \right \}$, $k \in 1,\ldots, N_T$.
* Матрицей вероятностей переходов $A$ вероятность перехода из скрытого состояния $k$ в скрытое состояние $l$. В нашем случае: $P(t_i=T_l \mid t_{i-1}=T_k)=a_{kl}$, для $\sum_{l=1}^{N_T} a_{kl} = 1\text{ для }\forall k$.
* Вероятностями порождения наблюдений при определенных скрытых состояниях. В нашем случае наблюдения это слова из словаря $\left \{ W_l \right \}$, $l \in 1,\ldots, N_W$., тогда вероятность порождения слова $W_l$ для тега $T_k$: $P(w_i=W_l \mid t_i=T_k)=b_{kl}$, для $\sum_{l=1}^{N_W} b_{kl} = 1\text{ для }\forall k$.
* Начальным распределением вероятностей для скрытых состоянияй: $\left \{ \pi_k \right \}$, $k \in 1,\ldots, N_T$.

<center> 
__Пример скрытой марковской модели порождения текста для трех частей речи__
<br/>VB - глагол в основной форме, MD - модальный глагол, NN - существительное в ед. числе

<img src="hmm2.png" alt="Пример марковской модели для трех состояний погоды" style="width: 550px;"/>
</center>

Постановка задачи POS-tagging:

$$\hat{t}_1^n =  \underset{t_1^n}{\arg\max} \ P(w_1^n \mid t_1^n) \, P(t_1^n) \text{ ,}$$

в которой $_1^n$ - последовательность слов, а $t_1^n$ - последовательность тегов с 1-го по n-ый с учетом предположений скрытой марковской модели будет преобразована. 

Марковское допущение (вероятность появления тега заисит только от предыдущего тега и не зависит от других предыдущих тегов):

$$P(t_1^n) \approx \prod_{i=1}^n P(t_i \mid t_{i-1}) \text{ ,}$$

допущение скрытой модели (вероятность появления слова зависит только от собственного тега и не зависит от соседних слов и соседних тегов):

$$P(w_i^n \mid t_1^n) \approx \prod_{i=1}^n P(w_i \mid t_i) \text{ ,}$$


таким образом:

$$\hat{t}_1^n =  \underset{t_1^n}{\arg\max} \ P(w_1^n \mid t_1^n) \, P(t_1^n) \approx \underset{t_1^n}{\arg\max} \ \prod_{i=1}^n  P(w_i \mid t_i) P(p_i \mid p_{i-1}) \text{ ,}$$

Т.е. нам нужно выбрать наиболее вероятную цепочку тегов (скрытых состояний) для наблюдаемой цепочки слов. Например:


<center> 
__Пример скрытой марковской модели для предложения "Из окна сильно дуло"__

<img src="hmm3.png" alt="Пример скрытой марковской модели для предложения" style="width: 400px;"/>
</center>

Простой перебор цепочек тегов (скрытых состояний) для поиска наиболее вероятной цепочки дает __экспоненциальный рост сложности__ задачи при увеличении длины предложения.

Для поиска решения нам нужно знать коэффициенты матрицы вероятностей переходов между тегами (скрытыми состояниями) и вероятности порождения слов (наблюдений) при определенных тегах (скрытых состояниях). Для этого нам необходимо воспользоваться корпусом с размеченными тегами. Тогда:

Вероятности переходов между тегами :

$$P(t_i \mid t_{i-1}) = \frac {C(t_{i-1}, t_i)} {C(t_{i-1})}$$

Вероятности порождения слов при определенных тегах:

$$P(w_i \mid t_i) = \frac {C(t_i, w_i)} {C(t_i)}$$



Алгоритм Витерби адаптирует принцип динамического программирования для поиска наиболее вероятной цепочки скрытых состояний в скрытой марковской модели. Он позволяет искать наиболее вероятную цепочку за линейной веремя относительно длины предложения.

<center> 
<br/>
__Алгоритм Витерби__

<img src="hmm4.png" alt="Алгоритм Витерби" style="width: 550px;"/>
</center>

Поиск параметра максимизирующего произведение удобно переформулировать в виде поиска параметра максимизирующего сумму логарифмов:

$$\hat{t}_1^n = \underset{t_1^n}{\arg\max} \ \prod_{i=1}^n  P(w_i \mid t_i) P(p_i \mid p_{i-1}) = \underset{t_1^n}{\arg\max} \ \sum_{i=1}^n  \left ( \log P(w_i \mid t_i) + \log P(p_i \mid p_{i-1}) \right )$$

Рассмотрим пример применения алгоритма Витерби для предложения: "The bear is on the move"

<center> 
<br/>
__Пример исходных данных для Алгоритма Витерби__

<img src="hmm5.png" alt="Шаг Алгоритма Витерби" style="width: 400px;"/>
</center>

<center> 
__0й Шаг Алгоритма Витерби (пример)__
<br/> заполнение начальных значений    

<img src="hmm6.png" alt="Шаг Алгоритма Витерби" style="width: 400px;"/>
</center>

<center> 
__1й Шаг Алгоритма Витерби для первого тега (пример)__
<br/> выбор для первого слова $\max$ и $\arg\max$ для одного из тегов

<img src="hmm7.png" alt="Шаг Алгоритма Витерби" style="width: 400px;"/>
</center>

<center> 
__1й Шаг Алгоритма Витерби (пример)__
<br/> выбор для первого слова $\max$ и $\arg\max$ для всех тегов 

<img src="hmm8.png" alt="Шаг Алгоритма Витерби" style="width: 400px;"/>
</center>

<center> 
__Результат прямого прохода Алгоритма Витерби (пример)__
<br/> найдена вероятность для самой вероятной цепочки  

<img src="hmm9.png" alt="Шаг Алгоритма Витерби" style="width: 400px;"/>
</center>

<center> 
__Результат Алгоритма Витерби (пример)__
<br/> выведена самая вероятная цепочка

<img src="hmm10.png" alt="Шаг Алгоритма Витерби" style="width: 400px;"/>
</center>





The Hidden Markov Model
A Markov chain is useful when we need to compute a probability for a sequence
of observable events. In many cases, however, the events we are interested in are
hidden hidden: we don’t observe them directly. For example we don’t normally observe
part-of-speech tags in a text. Rather, we see words, and must infer the tags from the
word sequence. We call the tags hidden because they are not observed.
MarkovHidden A hidden Markov model (HMM) allows us to talk about both observed events

model

(like words that we see in the input) and hidden events (like part-of-speech tags) that
we think of as causal factors in our probabilistic model. An HMM is speciﬁed by
the following components: