# 优化

优化技术擅长处理：受多种变量的影响，存在许多可能解的问题，以及结果因这些变量的组合而产生很大变化的问题。

优化技术具体应用：
    * 物理学：研究分子运动
    * 生物学：预测蛋白质的结构
    * 计算机科学：测定算法的最坏可能运行时间
    * NASA：设计具有正确操作特性的天线
    
优化算法通过尝试许多不同题解并给这些题解打分以确定其质量的方式来找到一个问题的最优解的。

优化算法的使用场景：存在大量可能的题解以至于我们无法对它们进行一一尝试的情况。
    * 此时最简单低效的求解方法为：尝试随机猜测
    * 另一方法：对题解可能有改进的方式来对其进行智能化地修正

--- 

## 组团旅游

为来自不同地方去往同一地点的人们（Glass一家）安排一次旅游。

In [1]:
# optimization.py
import time
import random
import math

# 家庭成员来自全国各地，并且希望在纽约会面。
# 他们将在同一天到达，同一天离开
# 每天有许多航班从任何一位家庭成员的所在地飞往纽约
# 飞机起飞时间、价格、航行时间不尽同。

# 家庭成员名字及其所在城市
people = [
    ('Seymour','BOS'),
    ('Franny','DAL'),
    ('Zooey','CAK'),
    ('Walt','MIA'),
    ('Buddy','ORD'),
    ('Les','OMA')
]

# NewYork的LaGuardia机场
destination = 'LGA'

[航班信息.txt](./集体智慧编程PCI_Code/PCI_Code Folder/chapter5/schedule.txt)为起点、终点、起飞时间、到达时间、价格

![](./images/航班信息表.png)

In [2]:
# optimization.py

import pandas as pd

# 航班信息

scheduleInfo = pd.read_csv('./集体智慧编程PCI_Code/PCI_Code Folder/chapter5/schedule.txt',header=None)
scheduleInfo

Unnamed: 0,0,1,2,3,4
0,LGA,OMA,6:19,8:13,239
1,OMA,LGA,6:11,8:31,249
2,LGA,OMA,8:04,10:59,136
3,OMA,LGA,7:39,10:24,219
4,LGA,OMA,9:31,11:43,210
5,OMA,LGA,9:15,12:03,99
6,LGA,OMA,11:07,13:24,171
7,OMA,LGA,11:08,13:07,175
8,LGA,OMA,12:31,14:02,234
9,OMA,LGA,12:18,14:56,172


## 描述题解

当处理问题是，选择一个题解的简单表示方法是非常重要的。有一种非常通用的表达方法是数字序列。在本例中，一个数字代表某人选择乘坐的航班--0代表这天第一次航班，1代表第二次。因为每个人都需要往返，所以列表的长度是人数的两倍。
eg:
```
[1,4,3,2,7,3,6,3,2,4,5,3]
```
代表第一个人搭乘第二（1+1）次航班飞往NewYork，并搭载第五（4+1）次航班返回。

## 成本函数

**成本函数**是用优化算法解决问题的关键，它通常是确定的。任何优化算法的目标，就是要寻找一组能够使成本函数的返回结果达到最小化的输入，因此成本函数需要返回一个值表示方案的好坏。唯一的要求是函数返回的值越大，表示该方案越差。

我们考察一些在组团旅游的例子中能够被度量的变量：

* 价格：所有航班的总票价，或者是考虑财务因素之后的加权平均。
* 旅行时间：每个人在飞机上花费的总时间
* 等待时间：在机场等待其他成员到达的时间
* 出发时间：太早起飞的航班也许会产生额外的成本，因为这要求旅行者减少睡眠时间
* 汽车租用时间：如果集体租用一辆车，那么他们需要在一天的早于起租时刻还车，否则将多付一天的租金

我们将这些变量组合在一起形成一个值。例如在此例中：在飞机上每节省1分钟价值1美元（我们可以乘坐贵60美元但是在飞机上节省1小时的飞机）；在机场等待每节省1分钟等价0.5美元。

In [3]:
# optimization.py

testAnswer = [1,4,3,2,7,3,6,3,2,4,5,3]

def getminutes(t):
    x = time.strptime(t,'%H:%M')
    return x[3]*60+x[4]


# 成本函数：考察了总的旅行成本、不同家庭成员在机场的等待时间、租用时间以后归还的汽车追加50美元罚款
def scheduleCost (r):
    totalPrice = 0
    latestArrival = 0
    earliestdep = 24*60
    
    for d in range(len(r)//2):
        # 得到往返航班和返程航班
        origin = people[d][1]
        out = scheduleInfo[(scheduleInfo[0]==origin)& (scheduleInfo[1]=='LGA')].iloc[int(r[d*2]),:].values
        ret = scheduleInfo[(scheduleInfo[0]=='LGA')& (scheduleInfo[1]==origin)].iloc[int(r[2*d+1]),:].values
        
        # 总价格往返航班之和
        totalPrice += out[4]
        totalPrice += ret[4]
        # 记录最晚到达时间和最早离开时间
        if latestArrival<getminutes(out[3]): latestArrival = getminutes(out[3])
        if earliestdep>getminutes(ret[2]):earliestdep = getminutes(ret[2])
    
    # 每个人都必须在机场等待直到最后一个人到达
    # 他们也必须在相同时间到达，并等候他们的返程航班
    totalWait = 0
    for d in range(len(r)//2):
        origin = people[d][1]
        out = scheduleInfo[(scheduleInfo[0]==origin)& (scheduleInfo[1]=='LGA')].iloc[int(r[d*2]),:].values
        ret = scheduleInfo[(scheduleInfo[0]=='LGA')& (scheduleInfo[1]==origin)].iloc[int(r[2*d+1]),:].values
        totalWait += latestArrival-getminutes(out[3])
        totalWait += getminutes(ret[2])-earliestdep
                                                                                         
    # 是否需要多付一天租车钱                                                                                     
    if latestArrival<earliestdep: totalPrice+=50
    return totalPrice+totalWait

scheduleCost(testAnswer)

4585

In [4]:
# optimization.py

testAnswer = [1,4,3,2,7,3,6,3,2,4,5,3]

# 将列表化的题解化为直观的表格
def printSchedule(costf,r):
    print(str(costf(r))+' '+str(r))
    for d in range(len(r)//2):
        name = people[d][0]
        origin = people[d][1]
        out = scheduleInfo[(scheduleInfo[0]==origin)& (scheduleInfo[1]=='LGA')].iloc[int(r[d*2]),:].values
        ret = scheduleInfo[(scheduleInfo[0]=='LGA')& (scheduleInfo[1]==origin)].iloc[int(r[2*d+1]),:].values
        # 这里格式化输出
        print('%10s%10s %5s-%5s $%3s %5s-%5s $%3s' % (name,origin,out[2],out[3],out[4],ret[2],ret[3],ret[4]))
        
printSchedule(scheduleCost,testAnswer)

4585 [1, 4, 3, 2, 7, 3, 6, 3, 2, 4, 5, 3]
   Seymour       BOS  8:04-10:11 $ 95 12:08-14:05 $142
    Franny       DAL 10:30-14:57 $290  9:49-13:51 $229
     Zooey       CAK 17:08-19:08 $262 10:32-13:16 $139
      Walt       MIA 15:34-18:11 $326 11:08-14:38 $262
     Buddy       ORD  9:42-11:32 $169 12:08-14:47 $231
       Les       OMA 13:37-15:08 $250 11:07-13:24 $171


## 随机搜索

**随机搜索**不是一种非常好的算法，但是它却使我们很容易领会所有算法的真正意图，并且它也是我们评估其他算法优劣的基线


In [5]:
# optimization.py

# 参数：Domain是二元组（2-tuples）组成的列表。它制定了每个变量的最小、最大取值。
#     此例中由于航班数据集中每人都有 10个-10个 往-去 航班，因此列表中的domin是[(0,9),(0,9)...一共十二（六个人）个(0,9)]
# 参数：costf

def randomOptimize(domain,costf):
    best = float('inf')
    bestr = None
    
    for i in range(1000):
        # 创建一个随机解
        r = [random.randint(domain[i][0],domain[i][1]) for i in range(len(domain))]
        # 得到成本
        cost = costf(r)
        if cost < best:
            best = cost
            bestr = r  
    return bestr

domain = [(0,9)]*(len(people)*2)
print(domain)

printSchedule(scheduleCost,randomOptimize(domain,scheduleCost))

[(0, 9), (0, 9), (0, 9), (0, 9), (0, 9), (0, 9), (0, 9), (0, 9), (0, 9), (0, 9), (0, 9), (0, 9)]
4330 [6, 8, 0, 8, 3, 8, 5, 7, 1, 9, 6, 9]
   Seymour       BOS 15:27-17:18 $151 18:24-20:49 $124
    Franny       DAL  6:12-10:22 $230 18:44-22:42 $351
     Zooey       CAK 10:53-13:36 $189 18:17-21:04 $259
      Walt       MIA 14:01-17:24 $338 16:50-19:26 $304
     Buddy       ORD  8:25-10:34 $157 19:32-21:25 $160
       Les       OMA 15:03-16:42 $135 20:05-21:44 $172


上述结果不算很好，因为有人在到达后需要等待很长时间直到另一人到达。

## 爬山法

爬山法以一个随机解开始，然后在其邻近的阶级中寻找更好的题解。这类似于从斜坡上向下走，直到地势平坦或者坡度开始向上倾斜。


In [6]:
# optimization.py

def hillClimb(domain,costf):
    # 创建一个随机解
    sol = [random.randint(domain[i][0],domain[i][1]) for i in range(len(domain))]
    
    # 主循环:
    while 1:
        # 创建相邻的列表
        neighbors=[]
        for j in range(len(domain)):
            # 在每个方向上对于原始值偏离一点
            if sol[j]>domain[j][0] and sol[j]<domain[j][1]:
                neighbors.append(sol[0:j]+[sol[j]+1]+sol[j+1:])
                neighbors.append(sol[0:j]+[sol[j]-1]+sol[j+1:])
            # 在相邻中寻找最优解
        current = costf(sol)
        best = current
        for j in range(len(neighbors)):
            # print(neighbors[j]) # 调试用
            cost=costf(neighbors[j])
            if cost<best:
                best=cost
                sol=neighbors[j]
        # 如果没有更好的解，则退出循环
        if best==current:
            break
    return sol
printSchedule(scheduleCost,hillClimb(domain,scheduleCost))

3127 [4, 3, 3, 3, 4, 9, 3, 4, 4, 3, 4, 6]
   Seymour       BOS 12:34-15:02 $109 10:33-12:03 $ 74
    Franny       DAL 10:30-14:57 $290 10:51-14:16 $256
     Zooey       CAK 12:08-14:59 $149 19:46-21:45 $214
      Walt       MIA 11:28-14:40 $248 12:37-15:05 $170
     Buddy       ORD 12:44-14:17 $134 10:33-13:11 $132
       Les       OMA 12:18-14:56 $172 15:07-17:21 $129


该函数运行的比较快，通常比随机搜索的结果好。但它有可能会陷入局部最优解。（如图）
![爬山法局部最优解](./images/爬山法局部最优解.png)
用随机重复爬山法解决这一问题：让爬山法以多个随机生成的初始解为起点运行多次，借此希望有一个接近全局最优解。

避免陷入局部最小值的其他方法：
* 模拟退火算法
* 遗传算法

## 模拟退火算法

**模拟退火算法**是受物理学领域启发而来的一种优化算法。退货时至将合金加热后再慢慢冷却的过程。大量的原子因为受到激发而向周围跳跃，然后又逐渐稳定到一个低能阶的状态，所以这些原子能够找到一个低能阶的配置。

退火算法以一个问题的随季节开始，它用一个变量来表示温度，这一温度开始时非常高，尔后逐渐变低。每一次迭代期间，算法会随机选中题解中的某个数字，然后朝某个方向变化。

算法最为关键的部分在于：如果新的成本值更低，则新的题解就会成为当前题解，这和爬山法非常相似。不过，如果成本值更高的话，则新的题解仍将可能成为当前题解。这是避免局部最小值问题的一种尝试。

某些情况下，在得到一个更优的解之前转向一个更差的解是有必要的。模拟退火算法之所以管用，不仅仅因为它会接受更优的解，还因为它在退火过程的开始阶段会接受表现较差的解。随着退火过程的不断进行，算法越来越不可能接受较差的解，直到最后，它将会只接受更优的解。更高成本的题解的接受概率：$p = e^{(-(highcost-lowcost)/temperature)}$

因为温度（接受较差解的意愿）开始非常之高，指数将总是接近于0，所以概率几乎为1。随着温度的递减，高成本和低成本之间的差异越来越重要--差异越大，概率越低，因此该算法只倾向于较差的解而不会是非常差的解。


In [7]:
# optimization.py

def annealingOptimize(domain,costf,T=10000.0,cool=0.95,step=1):
    # 随机初始化值
    vec = [float(random.randint(domain[i][0],domain[i][1])) for i in range(len(domain))]
    
    while T>0.1:
        # 选择一个索引值
        i = random.randint(0,len(domain)-1)
        # 选择一个改变索引值的方向,在-1到1之间随机取一个步长
        dir = random.randint(-step,step)
        # 创建一个代表题解的新列表，改变其中一个值
        vecb = vec[:]
        vecb[i] += dir
        # 解的每个值的范围应该在domain[i][0]到domain[i][1]之间
        if vecb[i]<domain[i][0] :
            vecb[i] = domain[i][0]
        elif vecb[i]>domain[i][1]:
            vecb[i] = domain[i][0]
        
        ea = costf(vec) # 当前的成本
        eb = costf(vecb) # 新的成本
        
        # 它是更好的吗？或者是趋向最优解的可能的临界解吗
        # 如果介意0-1之间的某个随机值小于概率值就认为是better
        if(eb<ea or random.random()<pow(math.e,-(eb-ea)/T)):
            vec = vecb
            
        # 降低温度
        T = T*cool
    return vec
printSchedule(scheduleCost,annealingOptimize(domain,scheduleCost))

3876 [7.0, 1.0, 0, 2.0, 1, 1, 3, 1.0, 6.0, 2.0, 6.0, 6.0]
   Seymour       BOS 17:11-18:30 $108  8:23-10:28 $149
    Franny       DAL  6:12-10:22 $230  9:49-13:51 $229
     Zooey       CAK  8:27-10:45 $139  8:19-11:16 $122
      Walt       MIA 11:28-14:40 $248  8:23-11:07 $143
     Buddy       ORD 15:58-18:40 $173  9:11-10:42 $172
       Les       OMA 15:03-16:42 $135 15:07-17:21 $129


## 遗传算法

**遗传算法**受自然科学的启发。这类算法的运行过程是先随机生成**一组**解，我们称之为**种群（population）**。在优化过程中的每一步，算法会计算**整个种群的成本函数**，从而得到一个有关题解的有序列表。

![题解及成本的有序列表](./images/题解及成本的有序列表.png)

在对题解进行排序后，一个新的种群--我们称之为下一代--被创建出来了。首先，我们将当前种群中位于最顶端的题解加入其所在的新种群中。我们称这一过程为**精英选拔法(slitism)**。新种群中的余下部分室友修改最优解后形成的全新解组成的。

修改题解的两种方法：
1. **变异(mutation)**:对一个既有解进行微小的、简单的、随机的改变。在本例中，变异只需从题解中选择一个数字，然后对其进行递增或递减。
![](./images/变异.png)
2. **交叉(crossover)、配对（breeding）**：取最优解中的两个解，然后将它们按某种方式进行组合。在本例中，从一个解中随机取出一个数字作为新题解中的某个元素，而剩余元素来自另一个题解。
![](./images/交叉.png)
一个新的种群是通过对最优解进行随机的变异和配对处理构造出来的。它的大小通常与就得种群相同。尔后这一过程一直重复进行--新的种群经过排序，有一个种群被构造出来。达到指定的迭代次数，或者连续经过数代后题解都没有得到改善，整个过程就结束了。

In [8]:
# optimization.py

# popsize:种群大小
# mutprob:变异率
def geneticoptimize(domain,costf,popsize=50,step=1,mutprob=0.2,elite=0.2,maxiter=100):
    # 变异操作
    def mutate(vec):
        i=random.randint(0,len(domain)-1)
        if random.random()<0.5 and vec[i]>domain[i][0]:
            return vec[0:i]+[vec[i]-step]+vec[i+1:] 
        elif vec[i]<domain[i][1]:
            return vec[0:i]+[vec[i]+step]+vec[i+1:]
        else:
            return vec
    # 交叉操作
    def crossover(r1,r2):
        i=random.randint(1,len(domain)-2)
        return r1[0:i]+r2[i:]
    
    # 初始化种群
    pop = []
    for i in range(popsize):
        vec = [random.randint(domain[i][0],domain[i][1]) for i in range(len(domain))]
        pop.append(vec)
    # 每一代中有多少优胜者
    topelite = int(popsize*elite)
    
    # 主循环,循环maxiter代
    for i in range(maxiter):
        scores = [(costf(v),v) for v in pop]
        scores.sort()
        ranked = [v for (s,v) in scores]
        
        # 只留下优胜者
        pop = ranked[0:topelite]
        
        # 对优胜者进行变异和交叉
        while len(pop)<popsize:
            if random.random()<mutprob:
                # 变异
                c = random.randint(0,topelite)
                pop.append(mutate(ranked[c]))
            else:
                # 交叉
                c1 = random.randint(0,topelite)
                c2 = random.randint(0,topelite)
                pop.append(crossover(ranked[c1],ranked[c2]))
    return scores[0][1]

printSchedule(scheduleCost,geneticoptimize(domain,scheduleCost))

4018 [5, 1, 3, 7, 1, 5, 3, 4, 5, 1, 6, 1]
   Seymour       BOS 13:40-15:37 $138  8:23-10:28 $149
    Franny       DAL 10:30-14:57 $290 17:14-20:59 $277
     Zooey       CAK  8:27-10:45 $139 13:37-15:33 $142
      Walt       MIA 11:28-14:40 $248 12:37-15:05 $170
     Buddy       ORD 14:22-16:32 $126  7:50-10:08 $164
       Les       OMA 15:03-16:42 $135  8:04-10:59 $136


一种优化算法是否管用取决于问题本身。模拟退火算法、遗传算法、以及大多书优化方法都以来以最优解应该接近其他的优解。优化不起作用的例子：
![优化不起作用的例子](./images/优化不起作用的例子.png)
在这种例子中，大多数算法都会陷入左边某个局部最优解。

## 设计偏好的优化

问题：根据学生的首选和次选，为其分配宿舍。

In [9]:
# 本例有5个房间，由10个学生来竞争住所，每个学生有一个首选和一个次选。

import random
import math

# 宿舍名字，每个宿舍有两个可用隔间
dorms=['Zeus','Athena','Hercules','Bacchus','Pluto']

# 代表学生的首选和次选
prefs=[('Toby', ('Bacchus', 'Hercules')),
       ('Steve', ('Zeus', 'Pluto')),
       ('Karen', ('Athena', 'Zeus')),
       ('Sarah', ('Zeus', 'Pluto')),
       ('Dave', ('Athena', 'Bacchus')), 
       ('Jeff', ('Hercules', 'Pluto')), 
       ('Fred', ('Pluto', 'Athena')), 
       ('Suzie', ('Bacchus', 'Hercules')), 
       ('Laura', ('Bacchus', 'Hercules')), 
       ('James', ('Hercules', 'Athena'))]


每个人都不可能满足自己的首选，Bacchus仅有两个隔间，有三个人首选。将这三人中的任何一个安置于他们的次选宿舍中，都意味着没有足够的空间留给选择它的人。

如果和航班问题一样构造数学序列，每个数字对应于一名学生。这种表示方法无法体现每间宿舍仅限两人的约束条件。一个全0序列代表所有学生都安置在Zeus宿舍，这不是一个有效的解。

可以通过让成本函数返回个很高的数值，代表无效解。但是这将使优化算法很难找到次优的解，因为算法无法确定返回结果是否接近于其他优解，甚或是有效的解。一般而言，我们最好不要让时钟周期浪费在无效解的搜索上。

解决这种问题的更好方法是寻找一种能让每个解都有效的题解表示方法：假设每间宿舍都两个空位，5间宿舍有10个空位--第一个学生可选10个空位中的任一，第二个学生可选9个空位中的任一......以此类推。

In [10]:
domain=[(0,(len(dorms)*2)-i-1) for i in range(0,len(dorms)*2)]
domain

[(0, 9),
 (0, 8),
 (0, 7),
 (0, 6),
 (0, 5),
 (0, 4),
 (0, 3),
 (0, 2),
 (0, 1),
 (0, 0)]

In [11]:
# 打印题解
def printsolution(vec):
    slots=[]
    # Create two slots for each dorm
    for i in range(len(dorms)): slots+=[i,i]
    # slots为[0, 0, 1, 1, 2, 2, 3, 3, 4, 4]
    
    # 遍历每一名学生的安置情况
    for i in range(len(vec)):
        x=int(vec[i])

        # 从剩余空位中选择
        dorm=dorms[slots[x]]
        # 输出学生及其被分配的宿舍
        print(prefs[i][0],dorm)
        # 删除空位
        del slots[x]

In [12]:
def dormcost(vec):
    cost=0
    # Create list a of slots
    slots=[0,0,1,1,2,2,3,3,4,4]

    # 遍历每一名学生
    for i in range(len(vec)):
        x=int(vec[i])
        dorm=dorms[slots[x]]
        pref=prefs[i][1]
        # 首选成本为0、次选成本为1
        if pref[0]==dorm: cost+=0
        elif pref[1]==dorm: cost+=1
        else: cost+=3
        # 不在选择之列成本为3

        # 删除空位
        del slots[x]
    
    return cost

构造成本函数的法则：尽可能让最优解的成本为0

In [13]:
printsolution(randomOptimize(domain,dormcost))

Toby Hercules
Steve Zeus
Karen Zeus
Sarah Pluto
Dave Athena
Jeff Hercules
Fred Pluto
Suzie Bacchus
Laura Bacchus
James Athena
