# AI Paradigm and Data Driven

<img src="Paradigm.png", width=600, height=600>

- **Paradigm**指的是**范式**。通俗的讲就是解决问题的套路，或者说一种思维方式。

# Some Utilities for NLP

<img src="Utilities.png", width=600, height=600>

- 从这节课后，我们重点会学习**Machine Learning(Deep Learning) Based**

# The Problem of Search

- Heuristic Function
- Search Problem, Search Tree

## Search Problem

<img src="Search.png", width=800, height=800>

- 对于任一个搜索问题，我们可以把问题抽象一下：
    - The start state(输入状态)
    - The goal state(输出状态)
    - The successors(每一个输出后都有一个继承者)
    - The stategy that determines the order in which we search(扩展的时候优先扩展那些我们认为重要的点)

### Best First Search

<img src="Breadth.png", width=600, height=600>
- **每一步进行一次sort，重点是如何设计一种排序方法sort，让它变成一种best first search。**
- **a heuristic is an approximate measure of how close you are to the target.(启发式是对你离目标有多近的一种近似测量。)**

### A* Search

<img src="Astar.png", width=600, height=400>

## Dynamic Pragramming

- 动态规划的背景：在进行搜索的时候我们往往会发现一个问题就是搜索的时候空间太大，需要搜索的点太多了，这些点都要存在计算机内存里。有一种可能情况就是某个点在第一层搜过，但在下一层又出现一次。现实场景中常常会出现这样的情况：某个站点刚被考虑过，然后在下一条路上又遇到这个站点了。解决这种问题的方法就叫做动态规划。这个方法是有Bellman提出。

### Rob Cutting Problem

<img src="Introduction.png", width=600, height=800>


- 不同钢筋的长度对应价格是不同的。比如有一根4米长钢筋，直接卖9块钱，截成1和3米也是9块钱，但是如果截成2和2米，就是10块钱了，这样就多赚了一块钱。现在问题来了，如果有了67米的钢筋，该怎么截？

<img src="Introduction1.png", width=600, height=600>

- 最简单的方法就是把拆解的可能性都穷举一遍。***4->0,1,2,3(依次拆分)***。下面进行代码实现。

In [1]:
original_price = [1, 5, 8, 9, 10, 17, 17, 20, 24, 30]  # 定价

In [10]:
# 为了避免超出字典额度后报错，引用模块collections
from collections import defaultdict

In [11]:
price = defaultdict(int)  # 如果超出额度，则返回0

In [12]:
for i, p in enumerate(original_price):
    price[i + 1] = p

In [13]:
price  # 相当于是1米长的1块钱；2米长的5块钱；......；10米长的30块钱。

defaultdict(int,
            {1: 1,
             2: 5,
             3: 8,
             4: 9,
             5: 10,
             6: 17,
             7: 17,
             8: 20,
             9: 24,
             10: 30})

In [14]:
price[11]

0

In [23]:
# get the max splitting by enumerate
def r(n):
    return max(
        [price[n]] + [r(i) + r(n-i) for i in range(1, n)]
    )

In [29]:
import time

In [33]:
start = time.time()
print(r(15))
end = time.time()
print(end - start)

43
3.9376842975616455


- 会发现，随着n的增大，r()函数运行的会越来越慢。这是为什么呢？

<img src="Time.png", width=600, height=600>

- 可以看到这个时间复杂度会是一个接近$n!$的东西。比如其中的T(2)就被运行了很多次。

#### Decorators

- Python是一种面向函数的语言，也就是面向对象。这里所谓的面向对象特性重要的是这个对象可以作为一个函数的输入、函数的输出，作为一个运算单元。在Python里也就是说所有的函数都可以作为运算单元。我们来举个例子：

In [39]:
def example(f, arg):
    return f(arg)

In [40]:
def add_ten(num):
    return num + 10

In [41]:
# 接下来我们把这个add_ten()函数作为一个参数传入到example()，再给它加100,也就是arg的参数
example(add_ten, 100)

110

- 那么这样做有什么好处呢？可以看出操作空间大了很多，可以直接对函数进行操作。

In [42]:
def mul_ten(num):
    return num * 10

In [44]:
operations = [add_ten, mul_ten]
# 这里开始遍历函数
for f in operations:
    print(example(f, 100))  # 100加10；100乘10

110
1000


 - 假如我们现在想得到这个r(n)函数被调用了多少次，我们定义一个新的函数get_call_times()。

In [35]:
called_time = defaultdict(int)

In [36]:
def get_call_times(f):
    result = f()
    print("function: {} called once!".format(f.__name__))
    called_time[f.__name__] += 1
    return result

In [48]:
def some_function_1():
    print("I am function 1")

In [49]:
get_call_times(some_function_1)

I am function 1
function: some_function_1 called once!


In [50]:
# 打印一下我们刚刚调用了多少次some_function_1()
called_time

defaultdict(int, {'some_function_1': 2})

- 我们现在想搞清楚r(1), r(2), ... , r(n)分别被调用了多少次，我们可以这样写：

In [51]:
call_time_with_arg = defaultdict(int)

In [52]:
def r(n):
    fname = r.__name__
    
    call_time_with_arg[(fname, n)] += 1
    
    return max(
        [price[n]] + [r(i) + r(n - i) for i in range(1, n)]
    )

In [54]:
# 我们对r(1), r(2), ... , r(n)分别运行了多少次进行数数
from collections import Counter

In [56]:
Counter(call_time_with_arg).most_common()  # 排序

[(('r', 1), 3188646),
 (('r', 2), 1062882),
 (('r', 3), 354294),
 (('r', 4), 118098),
 (('r', 5), 39366),
 (('r', 6), 13122),
 (('r', 7), 4374),
 (('r', 8), 1458),
 (('r', 9), 486),
 (('r', 10), 162),
 (('r', 11), 54),
 (('r', 12), 18),
 (('r', 13), 6),
 (('r', 14), 2),
 (('r', 15), 1)]

In [57]:
# 装饰器
called_time_with_arg = defaultdict(int)

In [69]:
# 引出装饰器
def get_call_time(f):
    """@parameter f is a function"""

    def wrap(n):
        result = f(n)
        called_time_with_arg[(f.__name__, n)] += 1  # 记住是f.__name__，其中__name__是一种属性
        return result  # 返回的值是传入的函数f的执行结果
    
    return wrap

In [70]:
add_ten_with_call_time = get_call_time(add_ten)  # get_call_time()输入一个add_ten()的时候，它返回get_call_time()一个内部的函数

In [71]:
add_ten_with_call_time  # 可以看到返回的结果是一个函数：warp()

<function __main__.get_call_time.<locals>.wrap>

In [81]:
# 然后wrap()又接收了一个参数n
add_ten_with_call_time(10)

20

In [74]:
del call_time_with_arg

In [82]:
called_time_with_arg  # 返回add_ten()的执行次数

defaultdict(int, {('add_ten', 10): 8})

- 我们如果把函数写成这个样子的时候
<img src="Function.png", width=600, height=600>
- 其实这样方便给它赋予一个新的函数add_ten_with_call_time()，然后这个新的函数运行的时候，我们既可以保持原来这个函数的作用，还可以加一些新的功能，就是这个新的函数add_ten_with_call_time()。
- Python里面提供了这样一个功能，就叫**装饰器**。

In [132]:
# 装饰器
def get_call_time(f):
    """@parameter f is a function"""

    def wrap(n):
        """Hah! I am wrap!"""
        print("I can count")  # 新加的一行
        result = f(n)
        called_time_with_arg[(f.__name__, n)] += 1  # 记住是f.__name__，其中__name__是一种属性
        return result  # 返回的值是传入的函数f的执行结果
    
    return wrap

In [94]:
def add_ten(n):
    return n + 10

In [95]:
add_ten(10)

20

In [96]:
add_ten = get_call_time(add_ten)

In [97]:
add_ten(10)  # 可以发现打印结果多了一行"I can count"

I can count


20

- 那么这行代码**add_ten = get_call_time(add_ten)**在Python里面有个比较简单的写法：

In [99]:
@get_call_time
def add_ten_with_decorators(n):  # 为了以示区别，用add_ten_with_decorators代替add_ten
    return n + 10

In [100]:
add_ten_with_decorators(10)

I can count


20

- 也就是说加了这个"@"符号后，在Python内部就相当于执行了一下add_ten = get_call_time(add_ten)这行代码。
<img src="Decorators.png", width=450, height=450>

- 那么我们现在就对r()函数用get_call_time()函数进行一下**装饰**。

In [163]:
called_time_with_arg = defaultdict(int)

In [146]:
def get_call_time_new(f):
    """@parameter f is a function"""
    @wraps(f)
    def wrap(n):
        result = f(n)
        called_time_with_arg[(f.__name__, n)] += 1  # 记住是f.__name__，其中__name__是一种属性
        return result  # 返回的值是传入的函数f的执行结果
    
    return wrap

In [134]:
@get_call_time_new
def r(n):    
    return max(
        [price[n]] + [r(i) + r(n - i) for i in range(1, n)]
    )

In [135]:
r

<function __main__.get_call_time_new.<locals>.wrap>

In [108]:
r(15)

43

In [109]:
called_time_with_arg

defaultdict(int,
            {('r', 1): 3214890,
             ('r', 2): 1071630,
             ('r', 3): 357210,
             ('r', 4): 119070,
             ('r', 5): 39690,
             ('r', 6): 13230,
             ('r', 7): 4410,
             ('r', 8): 1470,
             ('r', 9): 490,
             ('r', 10): 164,
             ('r', 11): 54,
             ('r', 12): 18,
             ('r', 13): 6,
             ('r', 14): 2,
             ('r', 15): 1})

- 有的时候装饰器会发生混乱，位次Python里提供了以下这个模块来解决这个问题：

In [111]:
def r(n):
    """
    Args: n is the iron length
    Return: the max revenue
    """
    return max(
        [price[n]] + [r(i) + r(n - i) for i in range(1, n)]
    )

In [112]:
help(r)  # 可以看出help(r)的时候能正常显示r()函数的功能

Help on function r in module __main__:

r(n)
    Args: n is the iron length
    Return: the max revenue



In [136]:
# 但是当我们加了装饰器以后，help(r)的显示的就是装饰器的内部函数wrap()的功能解释（失去了函数原来的命名意义）
@get_call_time
def r(n):
    """
    Args: n is the iron length
    Return: the max revenue
    """
    return max(
        [price[n]] + [r(i) + r(n - i) for i in range(1, n)]
    )

In [137]:
help(r)

Help on function wrap in module __main__:

wrap(n)
    Hah! I am wrap!



In [117]:
# Python提供了一个模块来解决这个问题
from functools import wraps

In [150]:
@get_call_time_new
def r(n):
    """
    Args: n is the iron length
    Return: the max revenue
    """
    return max(
        [price[n]] + [r(i) + r(n - i) for i in range(1, n)]
    )

In [151]:
# 这个时候help(r)就能正常显示函数介绍
help(r)

Help on function r in module __main__:

r(n)
    Args: n is the iron length
    Return: the max revenue



- **下面我们利用装饰器对r(n)函数进行优化，减小其时间复杂度。**

In [182]:
# 定义memo()装饰器
def memo(f):
    memo.already_computed = {}  # 已经计算过的（保存缓存）
    
    def _wrap(arg):
        result = None
        
        if arg in memo.already_computed:
            result = memo.already_computed[arg]
        else:
            result = f(arg)
            memo.already_computed[arg] = result
        
        return result

    return _wrap
        

In [169]:
# 使用装饰器
@memo
def r(n):
    """
    Args: n is the iron length
    Return: the max revenue
    """
    return max(
        [price[n]] + [r(i) + r(n - i) for i in range(1, n)]
    )

In [166]:
r(15)  # 运行时间大幅减少

43

- 现在我们虽然知道了某根固定长度的钢板的最大售出价是什么，但是我们不知道具体怎么切分。

In [171]:
solution = {}

In [185]:
@memo
def r(n):
    """
    Args: n is the iron length
    Return: the max revenue
    """
    max_price, max_split = max(
        [(price[n], 0)] + [(r(i) + r(n - i), i) for i in range(1, n)], key=lambda x: x[0]
    )  # 意思是我们对[(price[n], 0)]进行排序，然后排序的规则是key=lamda x: x[0]
    
    solution[n] = (n - max_split, max_split)
    
    return max_price  # 记得加函数返回值

In [186]:
r(10)

30

In [187]:
solution

{1: (1, 0),
 2: (2, 0),
 3: (3, 0),
 4: (2, 2),
 5: (3, 2),
 6: (6, 0),
 7: (6, 1),
 8: (6, 2),
 9: (6, 3),
 10: (10, 0),
 11: (10, 1),
 12: (10, 2),
 13: (10, 3),
 14: (12, 2),
 15: (13, 2),
 16: (10, 6),
 17: (16, 1),
 18: (16, 2),
 19: (16, 3),
 20: (10, 10),
 21: (20, 1),
 22: (20, 2),
 23: (20, 3),
 24: (22, 2),
 25: (23, 2),
 26: (20, 6),
 27: (26, 1),
 28: (26, 2),
 29: (26, 3),
 30: (20, 10),
 31: (30, 1),
 32: (30, 2),
 33: (30, 3),
 34: (32, 2),
 35: (33, 2),
 36: (30, 6),
 37: (36, 1),
 38: (36, 2)}

In [188]:
r(38)

112

In [189]:
solution

{1: (1, 0),
 2: (2, 0),
 3: (3, 0),
 4: (2, 2),
 5: (3, 2),
 6: (6, 0),
 7: (6, 1),
 8: (6, 2),
 9: (6, 3),
 10: (10, 0),
 11: (10, 1),
 12: (10, 2),
 13: (10, 3),
 14: (12, 2),
 15: (13, 2),
 16: (10, 6),
 17: (16, 1),
 18: (16, 2),
 19: (16, 3),
 20: (10, 10),
 21: (20, 1),
 22: (20, 2),
 23: (20, 3),
 24: (22, 2),
 25: (23, 2),
 26: (20, 6),
 27: (26, 1),
 28: (26, 2),
 29: (26, 3),
 30: (20, 10),
 31: (30, 1),
 32: (30, 2),
 33: (30, 3),
 34: (32, 2),
 35: (33, 2),
 36: (30, 6),
 37: (36, 1),
 38: (36, 2)}

- 通过查表结果表示：38 = 36, 2 --> 36 = 30, 6 --> 20, 10 ......

- 现在还有一个工作就是如何直接得出长度为n的钢板长度的切分方式？

In [183]:
def parse_solution(n):
    left_split, right_split = solution[n]
    
    if right_split == 0:
        return [left_split]
    
    return parse_solution(left_split) + parse_solution(right_split)  # 递归。把左边和右边的结果连起来

In [184]:
parse_solution(38)

[10, 10, 10, 6, 2]

- **一般来说，动态规划问题有如下3个特点：**
    - ***Overlapping Subproblems***
    - *Overlapping computing saved in table*
    - *Parse solution*

### Edit-Distance Problem

<img src="Edit Distance.png", width=600, height=400>

- 边界距离的问题就是：两个单词的相似度怎么判断？
- 首先从书写上我们有一个判断方式：
    - Insertion
    - Deletion
    - Substitution
- **用边界距离判断词语相似度的时候有个不好的问题就是：它长得像未必意思就是一样的。**

<img src="Similar.png", width=600, height=400>

- 可以用于机器翻译和语音识别。

<img src="Search Graph.png", width=600, height=400>

- Looks like but not means same
- Talk: What's the advantages and disadvantages of Edit Distance?

### Key Characteristics for Dynamic Programming

### The Trvael Salesman Problem