# 『言語処理のための機械学習入門』
>自然言語処理シリーズ １  
著：高村大也、監修：奥村学  
出版：コロナ社  
発行年月日：2010/08/05  
ISBN：978-4-339-02751-8  

 - [コロナ社公式ページ](http://www.coronasha.co.jp/np/isbn/9784339027518/)
 - [この書籍に関する著者のページ](http://www.lr.pi.titech.ac.jp/~takamura/ml4nl.html)

初版第10刷を使用して学習していきます。

---
## 第１章　必要な数学的知識

### 1.1　準備と本書における約束事
確率変数は $X$ など大文字で表し、その値は $x$ など小文字で表す。  
データとして与えられた事例は $x^{(1)}, x^{(2)}, \ldots $ のように上付の添字とともに表す。

文書 $d$ における単語 $w$ の出現回数を $n(w,d)$ または $n_{w,d}$ と書き、  
クラス $c$ に属する文書群における単語 $w$ の出現回数を $n(w,c)$ または $n_{w,c}$ と表す。  

また、クラス $c$ に属する文書のうち $w$ が出現するような文書の数を $N(w,c)$ または $N_{w,c}$ と記し、  
クラス $c$ に属する文書数を $N(c)$ または $N_{c}$ と書く。

$\delta(w,d)$ や $\delta_{w,d}$ は、文書 $d$ において単語 $w$ が出現したとき１，そうでないとき０と約束する。  
$\delta(w,s)$ や $\delta_{w,s}$ なども同様である。

文脈から明らかである場合は適宜省略される。

---
### 1.2　最適化問題
最適化問題の単純な例を一つ挙げる。

【例題 1.1】　次の最大化問題を解け。ただし $a$ は定数である。

\begin{align*}
&\text{max.} \hspace{5pt} -x_{1}x_{2} \\
&\text{s.t.} \hspace{5pt} x_{1} - x_{2} -a = 0
\end{align*}

【解答】

　制約から $x_{2}=x_{1}-a$ とすると $-x_{1}x_{2}=-x_{1}^{2} + ax_{1}$ である。  
　これを偏微分して０とおくと

\begin{align*}
\frac{\partial (-x_{1}^{2} + ax_{1})}{\partial x_{1}} = -2x_{1} + a = 0 \\
\therefore x_{1}=\frac{a}{2} ,\hspace{5pt} x_{2} = -\frac{a}{2}
\end{align*}

最適化したい関数をこの最適化問題の目的関数（objective function）、  
最適値を与える変数値を最適解（optimal solution）という。

一般に、最適化問題は次のように書かれる。

\begin{align*}
\hline
&\text{max.} \hspace{5pt} &f(x) \\
&\text{s.t.} & g(x) \leq 0 \\
& & h(x) = 0. \\
\hline
\end{align*}

ここで $f(x)$ が目的関数、$g(x) \leq 0, h(x)=0$ が制約である。  
特に $g(x)\leq0$ を不等式制約（inequality constraint）、$h(x)=0$ を等式制約（equality constraint）と呼ぶ。

また、制約を満たす解のことを実行可能解（feasible solution）、  
実行可能解の集合を実行可能領域（feasible region）という。

加減乗除や初等関数の合成関数による解の表し方を閉形式（closed-form）といい、  
閉形式の解が得られる問題を解析的に解ける（analytically solvable）問題という。

==

本節では以降、凸計画問題（convex programming problem）と呼ばれる問題を取り扱う。  
凸計画問題の解法の基本は、目的関数の値が改善する方向に進んでいくというものである。

---
#### 1.2.1　凸集合と凸関数
