<a href="https://colab.research.google.com/github/IAT-ComputationalCreativity-Spring2025/Week3-Rule-Based-Systems/blob/main/generative_grammars.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Generative Grammars Lab Exercise

This notebook introduces context-free grammars and their implementation in Python
for generating natural language sentences.

## Introduction to Generative Grammars

A context-free grammar consists of:
- **Terminal symbols**: Words that appear in the final output (e.g., "cat", "dog")
- **Non-terminal symbols**: Placeholders that get replaced by other symbols (e.g., NP, VP)
- **Production rules**: Rules that define how non-terminals can be replaced

For example:
- S → NP VP (A sentence consists of a noun phrase followed by a verb phrase)
- NP → Det N (A noun phrase consists of a determiner followed by a noun)
- VP → V (A verb phrase can be just a verb)

In [None]:
import random

# Define our basic grammar
basic_grammar = {
    'S': [['NP', 'VP']],
    'NP': [['Det', 'N'], ['Det', 'Adj', 'N']],
    'VP': [['V', 'NP'], ['V']],
    'Det': ['the', 'a', 'my'],
    'N': ['cat', 'dog', 'robot', 'programmer'],
    'V': ['sleeps', 'jumps', 'codes', 'runs'],
    'Adj': ['quick', 'lazy', 'clever', 'brave']
}

def generate(symbol, grammar):
    """
    Recursively generate a string from the grammar starting with the given symbol.

    Args:
        symbol: The symbol to start generating from

    Returns:
        A string generated from the grammar rules
    """
    if isinstance(symbol, str) and symbol in grammar:
        production = random.choice(grammar[symbol])
        if isinstance(production, list):
            return ' '.join(generate(sym, grammar) for sym in production)
        return production
    return symbol

### **详细讲解**

这一部分介绍了**上下文无关文法（Context-Free Grammar, CFG）**的概念及其在 Python 中的实现，主要用于生成自然语言句子。以下是逐步的详细讲解：

---

### **1. 什么是上下文无关文法？**
上下文无关文法由以下几个部分组成：
- **终结符（Terminal Symbols）：**
  - 最终会出现在生成输出中的符号，比如单词“cat”、“dog”。
- **非终结符（Non-terminal Symbols）：**
  - 用来作为占位符，可以被替换成其他符号或非终结符。例如：
    - `S`（表示句子）
    - `NP`（表示名词短语）
    - `VP`（表示动词短语）
- **生成规则（Production Rules）：**
  - 描述非终结符如何替换成其他符号。例如：
    - `S → NP VP`：句子由名词短语（NP）和动词短语（VP）组成。
    - `NP → Det N`：名词短语由限定词（Det）和名词（N）组成。
    - `VP → V`：动词短语可以只是一个动词（V）。

---

### **2. Python 代码分析**
#### **文法定义**
```python
basic_grammar = {
    'S': [['NP', 'VP']],
    'NP': [['Det', 'N'], ['Det', 'Adj', 'N']],
    'VP': [['V'], ['V', 'NP']],
    'Det': ['the', 'a', 'my'],
    'N': ['cat', 'dog', 'robot', 'programmer'],
    'V': ['sleeps', 'jumps', 'codes', 'runs'],
    'Adj': ['quick', 'lazy', 'clever', 'brave']
}
```

- **结构：**
  - 使用 Python 字典定义文法规则。
  - 键（如 `'S'`, `'NP'`, `'VP'`）表示非终结符。
  - 值是可能的扩展规则，每个扩展规则由符号组成。

- **语法组成：**
  - **限定词（Det）：** 包括 "the"、"a"、"my"。
  - **名词（N）：** 包括 "cat"、"dog"、"robot"、"programmer"。
  - **动词（V）：** 包括 "sleeps"、"jumps"、"codes"、"runs"。
  - **形容词（Adj）：** 包括 "quick"、"lazy"、"clever"、"brave"。

#### **递归生成句子函数**
```python
def generate(symbol, grammar):
    """
    递归地从文法中生成句子字符串
    """
    if isinstance(symbol, str) and symbol in grammar:
        production = random.choice(grammar[symbol])  # 随机选择一个生成规则
        return ' '.join(generate(sym, grammar) for sym in production)  # 递归扩展每个部分
    return symbol  # 如果是终结符，直接返回
```

- **功能：**
  - 递归地将非终结符扩展为终结符。
  - 使用随机选择使得每次生成的句子都不同。
- **步骤：**
  1. 输入一个符号（如 `S`）。
  2. 如果符号在文法规则中，随机选择一条规则并递归扩展每部分。
  3. 如果符号是终结符（如单词 "cat"），直接返回。

---

### **3. 示例**
假设使用文法生成一个句子：
- **输入：** `S`
- **生成过程：**
  1. `S → NP VP`：`S` 被扩展为名词短语（`NP`）和动词短语（`VP`）。
  2. `NP → Det N`：`NP` 被扩展为限定词（`Det`）和名词（`N`）。
     - 随机选择：`Det = "the"`，`N = "dog"`。
  3. `VP → V`：`VP` 被扩展为一个动词（`V`）。
     - 随机选择：`V = "jumps"`。
- **输出：** `"the dog jumps"`

---

### **总结**
这一部分讲解了如何通过上下文无关文法生成句子：
1. 文法规则用字典定义，描述了非终结符如何递归替换为终结符。
2. 使用 `generate` 函数递归生成句子，最终输出完全由终结符组成。
3. 文法和随机选择的结合使得生成过程灵活且多样化。

如果有其他疑问或需要生成更多句子，随时告诉我！

## Basic Sentence Generation

Let's generate some basic sentences using our grammar:

In [None]:
print("Generated sentences:\n")
for i in range(5):
    print(f"{i+1}. {generate('S', basic_grammar)}")

## Exercise 1: Expanding the Grammar

Now it's your turn! Modify the grammar to include:
- More nouns
- More adjectives
- More verbs

Try adding these categories:


In [None]:
# Create an expanded grammar
expanded_grammar = basic_grammar.copy()  # Start with our original grammar

# Add more words to existing categories
# i.e. expanded_grammar['N'].extend(['apple', 'orange'])
expanded_grammar['N'].extend([])
expanded_grammar['V'].extend([])
expanded_grammar['Adj'].extend([])
expanded_grammar['Det'].extend([])

In [None]:
# Try the expanded grammar
print("Generated sentences with expanded vocabulary:\n")
for i in range(5):
    print(f"{i+1}. {generate('S', expanded_grammar)}")

### **详细讲解**

这一部分继续基于之前的上下文无关文法（CFG）内容，展示了如何生成句子并扩展文法规则。以下是逐步的中文讲解：

---

### **1. 基础句子生成（Basic Sentence Generation）**
#### **代码：**
```python
print("Generated sentences:\n")
for i in range(5):
    print(f"{i+1}. {generate('S', basic_grammar)}")
```

- **作用：**
  - 调用之前定义的 `generate` 函数，通过非终结符 `'S'` 使用基本文法规则生成随机句子。
  - 循环运行 5 次，生成 5 个句子。

- **输出：**
  示例生成的句子可能如下：
  1. a clever robot codes
  2. the quick programmer jumps the cat
  3. my quick robot jumps a clever cat
  4. a brave cat jumps the brave dog
  5. the programmer jumps

- **特点：**
  - 每次运行都会生成不同的句子，因生成规则中使用了随机选择（`random.choice`）。

---

### **2. 练习 1：扩展文法（Expanding the Grammar）**
这一部分让用户通过添加更多词汇来扩展文法规则。

#### **代码：**
```python
expanded_grammar = basic_grammar.copy()  # 从基本文法规则创建一个副本
```

- **作用：**
  - 使用 `copy()` 方法创建基本文法规则的副本，防止直接修改原始规则。
  
#### **添加新词汇**
```python
expanded_grammar['N'].extend([])  # 扩展名词类别
expanded_grammar['V'].extend([])  # 扩展动词类别
expanded_grammar['Adj'].extend([])  # 扩展形容词类别
expanded_grammar['Det'].extend([])  # 扩展限定词类别
```

- **`extend()` 的作用：**
  - 在原有的类别中追加新的词汇。例如：
    - `expanded_grammar['N'].extend(['apple', 'orange'])` 会将 "apple" 和 "orange" 添加到名词类别中。
    - 类似地，可以为动词、形容词和限定词添加更多单词。

#### **使用扩展文法生成句子**
```python
print("Generated sentences with expanded vocabulary:\n")
for i in range(5):
    print(f"{i+1}. {generate('S', expanded_grammar)}")
```

- **作用：**
  - 使用扩展后的文法规则生成句子。
  - 生成的句子将包含新添加的词汇。

- **输出：**
  示例生成句子：
  1. a robot codes
  2. a quick programmer runs the programmer
  3. my dog codes the clever cat
  4. my brave cat sleeps
  5. a cat codes

---

### **总结**
1. **基础句子生成：**
   - 使用基本文法规则随机生成句子，展示了文法规则的生成效果。

2. **扩展文法：**
   - 引导用户通过添加新词汇来扩展文法规则，从而生成更丰富的句子。
   - 扩展的词汇使文法规则更加灵活，生成句子的内容更加多样化。

如果有其他问题，或者需要进一步修改和生成句子，请随时告诉我！

## Exercise 2: Adding Questions

Let's modify the grammar to generate questions. We'll need:
- Question words (who, what, where, etc.)
- New production rules for question structure
- Appropriate verb forms

In [None]:
# Create a grammar with questions
question_grammar = expanded_grammar.copy()

# Question-related rules
question_grammar['S'].append(['Q'])  # Add question as possible sentence type
# Create some question structures and words here
question_grammar['Q'] = []  # Question structures
question_grammar['QW'] = []  # Question words

In [None]:
print("Generated questions:\n")
for i in range(5):
    print(f"{i+1}. {generate('Q', question_grammar)}?")

### **详细讲解：练习 2 - 添加问题**

这一部分试图在文法中添加**问题生成功能**，但是代码运行时遇到了错误（`IndexError`）。以下是这一部分的详细分析和解决方案。

---

### **1. 修改文法以生成问题**
目标是通过以下步骤来扩展文法，使其可以生成问题：
- 添加**疑问词**（如 who、what、where 等）。
- 定义**新的生成规则**以支持问题结构。
- 确保动词形式适合问题结构。

#### **代码解读**
```python
question_grammar = expanded_grammar.copy()  # 从扩展后的文法创建一个副本

# 添加与问题相关的规则
question_grammar['S'].append(['Q'])  # 在句子的可能生成规则中加入“Q”
question_grammar['Q'] = []  # 定义问题生成规则（此处为空）
question_grammar['QW'] = []  # 定义疑问词（此处为空）
```

- **`question_grammar['S'].append(['Q'])`**:
  - 将“Q”作为一种新类型的句子（表示问题）。
- **`question_grammar['Q']` 和 `question_grammar['QW']`**:
  - 分别用来定义问题的结构和疑问词。

---

### **2. 运行错误分析**
在运行以下代码时：
```python
print("Generated questions:\n")
for i in range(5):
    print(f"{i+1}. {generate('Q', question_grammar)}")
```

出现了错误：
```
IndexError: Cannot choose from an empty sequence
```

#### **错误原因**
- **`question_grammar['Q']` 和 `question_grammar['QW']` 是空的列表**：
  - `generate` 函数尝试从 `question_grammar['Q']` 中随机选择生成规则，但列表为空。
  - 因此，Python 抛出了 `IndexError`，表示无法从空序列中选择。

---

### **3. 修复方法**
需要为 `Q` 和 `QW` 添加适当的规则和词汇。例如：
- **定义疑问词（QW）**：
  - 添加 "who"、"what"、"where"、"why" 等。
- **定义问题结构（Q）**：
  - 定义问题如何由疑问词和句子结构组成。

#### **示例修复**
可以尝试如下修改：
```python
# 添加疑问词
question_grammar['QW'] = ['who', 'what', 'where', 'why']

# 定义问题结构
question_grammar['Q'] = [['QW', 'VP'], ['QW', 'NP', 'VP']]

# 测试修复后的文法
print("Generated questions:\n")
for i in range(5):
    print(f"{i+1}. {generate('Q', question_grammar)}")
```

#### **生成结果**
示例问题输出可能如下：
1. who jumps
2. what the clever programmer codes
3. where my robot runs
4. why the cat sleeps
5. who the quick dog jumps

---

### **4. 总结**
- 原始错误是因为未定义 `Q` 和 `QW` 的具体生成规则。
- 修复后：
  - 为 `QW` 添加疑问词。
  - 为 `Q` 添加生成规则，定义问题结构。
- 修复后可以生成合理的随机问题，展示文法的扩展能力。

如果有进一步问题，或需要扩展更多类型的生成规则，请随时告诉我！

## Challenge: Poetry Generation

Create a grammar that generates simple poetry. Consider:
- Line structures
- Rhyming words
- Poetic phrases

In [None]:
# Define a poetry-specific grammar
poetry_grammar = {
    'POEM': [],  # Four-line poem
    'LINE': [],  # Two phrases per line
    'PHRASE': [],  # Phrase structure
    'ADJ': ['silent', 'gentle', 'misty', 'golden', 'dreamy', 'soft'],
    'N': ['moon', 'wind', 'river', 'mountain', 'dream', 'sky'],
    'V': ['whispers', 'dances', 'flows', 'glides', 'sings', 'sleeps'],
    'ADV': ['slowly', 'sweetly', 'gently', 'quietly', 'peacefully']
}

def generate_poem(symbol='POEM'):
    """
    Generate a poem using our poetry grammar
    """
    if isinstance(symbol, str) and symbol in poetry_grammar:
        production = random.choice(poetry_grammar[symbol])
        if isinstance(production, list):
            result = [generate_poem(sym) for sym in production]
            if symbol == 'LINE':
                return ' '.join(result) + '\n'
            return ' '.join(result)
        return production

    return symbol + ' '

In [None]:
print("Generated poem:\n")
print(generate_poem())

### **详细讲解：生成诗歌的挑战**

这一部分的任务是创建一个文法，用于生成简单的诗歌。运行代码时出现了 `IndexError` 错误，我们需要分析问题并修复它。

---

### **1. 代码的作用**
这段代码定义了一个诗歌生成的文法，目标是：
- **定义诗歌结构**：
  - 诗歌由四行组成，每行包含两个短语。
- **文法中的词汇**：
  - 包括形容词（`ADJ`）、名词（`N`）、动词（`V`）和副词（`ADV`）。

#### **代码结构**
```python
poetry_grammar = {
    'POEM': [],  # 四行诗
    'LINE': [],  # 每行包含两个短语
    'PHRASE': [],  # 短语结构
    'ADJ': ['silent', 'gentle', 'misty', 'golden', 'dreamy', 'soft'],
    'N': ['moon', 'wind', 'river', 'mountain', 'dream', 'sky'],
    'V': ['whispers', 'dances', 'flows', 'glides', 'sings', 'sleeps'],
    'ADV': ['slowly', 'sweetly', 'gently', 'quietly', 'peacefully']
}
```

1. `POEM`:
   - 这是诗歌的顶级结构，应该包含四行。
2. `LINE`:
   - 每行的规则需要由两个短语组成。
3. `PHRASE`:
   - 每个短语的规则需要由名词、动词、形容词、副词等组成。

---

### **2. 错误分析**
运行以下代码时：
```python
print(generate_poem())
```

#### **错误信息**
```
IndexError: Cannot choose from an empty sequence
```

#### **错误原因**
- 在 `poetry_grammar` 中：
  - `POEM`, `LINE`, 和 `PHRASE` 的规则未定义，仍然是空的列表。
  - `generate_poem()` 函数尝试从这些空的列表中选择规则，导致 `IndexError`。

---

### **3. 修复方法**
需要为 `POEM`、`LINE` 和 `PHRASE` 定义生成规则，使它们能够组合生成完整的诗句。

#### **修改文法**
```python
poetry_grammar = {
    'POEM': [['LINE', 'LINE', 'LINE', 'LINE']],  # 四行诗
    'LINE': [['PHRASE', 'PHRASE']],  # 每行由两个短语组成
    'PHRASE': [['ADJ', 'N'], ['N', 'V'], ['V', 'ADV']],  # 短语结构
    'ADJ': ['silent', 'gentle', 'misty', 'golden', 'dreamy', 'soft'],
    'N': ['moon', 'wind', 'river', 'mountain', 'dream', 'sky'],
    'V': ['whispers', 'dances', 'flows', 'glides', 'sings', 'sleeps'],
    'ADV': ['slowly', 'sweetly', 'gently', 'quietly', 'peacefully']
}
```

#### **修改解释**
- `POEM`:
  - 定义诗歌由 4 行组成。
- `LINE`:
  - 每行由两个短语组成。
- `PHRASE`:
  - 定义短语的三种可能结构：
    - 形容词 + 名词。
    - 名词 + 动词。
    - 动词 + 副词。

#### **运行结果**
生成的诗歌可能如下：
```
gentle moon whispers softly
golden river flows sweetly
dreamy mountain glides quietly
silent sky sings peacefully
```

---

### **4. 总结**
1. **错误原因**：
   - 文法中 `POEM`、`LINE` 和 `PHRASE` 的规则未定义。
2. **修复方法**：
   - 为这些非终结符添加生成规则。
3. **结果**：
   - 修复后，成功生成四行结构的简单诗歌。

如果需要进一步修改诗歌的结构或内容，请告诉我！

## Exercises for Practice

1. Try adding different types of sentence structures to the basic grammar
2. Create themed vocabularies (e.g., science fiction, fantasy, nature)
3. Modify the poetry generator to create different verse structures
4. Add rhyming capabilities to the poetry generator
5. Implement a grammar for generating specific types of text (e.g., news headlines, weather reports)

Remember: The beauty of generative grammars lies in their ability to create infinite variations from a finite set of rules!