# Syntax Parsing - Context Free Grammar
## 方敏
## 驰声研发

# Outline
## 1. 前言
## 2. CFG定义
## 3. CFG剖析
## 4. 关于PCFG

# 1. 前言
## 1.1 英语句子结构
### 1.1.1 名词短语
<img src="NP1.png">
<img src="NP-verb.png">
<img src="wrong_NP-verb.png">

### 1.1.2 前置短语
<img src="prepositional_phrase.png">
<img src="wrong_prepositional_phrase.png">

## 1.2 Context-Free Grammar, CFG
- -> 一种用数学公式、符号描述句子成分（单词）之间关系的理论
- -> Phrase-Structure Grammar
- -> 其思想是在成分结构基础上构建语法，由Chomsky（1956）正式提出。Backus（1959）也独立地进行了相同的工作。

# 2. CFG 定义
## 2.1 Definition
<img src="CFG_definition.png" style="width:550px;height:200px">
<img src="CFG_deriveing.png" style="width:550px;height:200px">

## 2.2 Example a
<img src="CFG_lexicon.png" style="width:450px;height:150px;float:middle">
<img src="CFG_grammar-phrase.png" style="width:400px;height:200px;float:middle" >
<img src="CFG_example1.png" style="width:400px;height:200px;float:middle">

## 2.2 Example b
<img src="sentence1.png" style="width:550px;height:160px">
<img src="sentence2.png" style="width:550px;height:160px">
<img src="sentence3.png" style="width:550px;height:170px">

## 2.3 作用与意义
### 2.3.1 作用
    -> For generating sentences
    -> For structure to a given sentence
### 2.3.2 用途
    -> 自然语言理解模型
    -> 语法检查模型
    -> 语音理解模型

## 2.4 Treebanks
### 语料来源
- Brown
- Switchboard（DARPA）
- ATIS（关于机票预定的口语语料）
- Wall Street Journal corpora of English

### Example
<img src="treeBank/example1_p1.png" style="width:600px;height:300px">
<img src="treeBank/example1_p2.png" style="width:500px;height:250px">

# 3. CFG 剖析
## 3.0 把单词的符号串映射到剖析树的问题称为“剖析parse”--搜索
## 3.1 自顶向下剖析
## 3.2 自底向上剖析
## 3.3 自顶向下、深度优先、从左向右剖析
## 3.4 以上算法存在的问题
## 3.5 Cocke-Kasami-Younger(CKY) algorithm


## 3.1 自顶向下剖析
Example： Book that flight
<img src="parse_top-down/english_micro-gramar-lexicon_dict.png" style="width:400px;height:200px">
<img src="parse_top-down/right_parse_book-that-flight.png" style="width:300px;height:280px">

<img src="parse_top-down/english_micro-gramar-lexicon_dict.png" style="width:400px;height:200px">
<img src="parse_top-down/example1_top-to-down_parse.png" style="width:500px;height:300px" >

## 3.2 自底向上剖析
Example： Book that flight
<img src="parse_down-top/example2_down-to-top_parse.png" style="width:500px;height:500px">

## 3.3 自顶向下、深度优先、从左向右剖析
Example：Does this flight include a meal?
<img src="parse_top-down/english_micro-gramar-lexicon_dict.png" style="width:400px;height:200px">

<img src="parse_top-down_deep-first/parse-s1.png" style="width:400px;height:400px">
<img src="parse_top-down_deep-first/parse-s2.png" style="width:400px;height:200px">

<img src="parse_top-down_deep-first/parse-s3.png" style="width:400px;height:500px">

<img src="parse_top-down/english_micro-gramar-lexicon_dict.png" style="width:400px;height:200px">
<img src="parse_top-down_deep-first/parse-s4_prune.png" style="width:250px;height:100px">

## 3.4 以上算法存在的问题
- --> 相比自底向上，自顶向下策略不会去搜索那些在以S为根的树中找不到位置的子树
- --> 自顶向下策略会孳生与输入不一致的根为S的树。
- --> 左递归
<img src="left-recursive.png" style="width:450px;height:150px;float:middle">

- --> 歧义
<img src="ambiguity_example1.png" style="width:450px;height:250px;float:middle">

- --> 子树的重复剖析
<img src="subtree_repeat-recursive_problem.png" style="width:450px;height:600px;float:middle">

## 3.5 Cocke-Kasami-Younger(CKY) algorithm
### 要点：
- 句子位置标记$_0 Book_1 that_2 flight_3$
- 算法中所有变量放在一个$(n+1)*(n+1)$上三角矩阵中
- $n$表示句子长度
- 矩阵中元素$cell[i,j]$表示从i到j之间的单词所属的“非终结符”

### 算法伪代码：
<img src="CKY/CKY_algorithm.png" style="width:600px;height:230px;float:middle">

<img src="CKY/CKY_algorithm_explaning.png" style="width:530px;height:570px;float:middle">

### Example: Book the flight throuth Houston
<img src="CKY/simple-example1.png" style="width:700px;height:375px;float:middle">

<img src="CKY/simple-example2_p1.png" style="width:700px;height:375px;float:middle">

<img src="CKY/simple-example2_p2.png" style="width:700px;height:350px;float:middle">

<img src="CKY/simple-example2_p3.png" style="width:400px;height:400px;float:middle">

# 4. 关于PCFG
## 4.1 Definition
- PCFG
<img src="PCFG/definition.png" style="width:450px;height:150px">
- CFG
<img src="CFG_definition.png" style="width:450px;height:150px">

### Dict Example
<img src="PCFG/dict_example1.png" style="width:450px;height:400px">

## 4.2 Example
<img src="PCFG/PCFG_example1_p1.png" style="width:500px;height:500px">
<img src="PCFG/PCFG_example1_p2.png" style="width:450px;height:50px">

# END
## Thank you !!!