In [1]:
import pandas as pd
from IPython.display import HTML
import warnings
warnings.simplefilter('ignore')

%matplotlib notebook

HTML('''<script>
code_show=true; 
function code_toggle() {
 if (code_show){
 $('div.input').hide();
 } else {
 $('div.input').show();
 }
 code_show = !code_show
} 
$( document ).ready(code_toggle);
</script>
<form action="javascript:code_toggle()"><input type="submit" value="Нажмите чтобы отобразить/скрыть код."></form>''')


# Задача о распределении средств
<br>&#8195;&#8195;Метод динамического программирования дает возможность находить последовательные оптимальные решения в задачах, разделенных на этапы.
    
<br>&#8195;&#8195;Изложим схему применения этого метода на следующей модели. Рассмотрим некоторую управляемую систему, которая может находиться в одном из нескольких состояний. На каждом этапе в результате применения управляющего воздействия (управления) система может изменить свое состояние или остаться в прежнем состоянии. Эффективность процесса управления характеризуется целевой функцией прибыли, зависящей от состояния системы и применяемого управления.
    
<br>&#8195;&#8195;0 этап. В начальный момент времени система находится в исходном состоянии $x_0$.
    
<br>&#8195;&#8195;1 этап. В результате применения управления $y_1$ система переходит из состояния $x_0$ в состояние<br>
            <center>$x_1$=$g_1$($x_0$,$y_1$)</center>при этом получается прибыль<br><center>$h_1$($x_0$,$y_1$)</center><br>
        
<br>&#8195;&#8195;2 этап. В результате применения управления $y_2$ система переходит из состояния $x_1$ в состояние<br>
            <center>$x_2$=$g_2$($x_1$,$y_2$)</center><br>
    при этом получается прибыль<br>
            <center>$h_2$($x_1$,$y_2$)</center><br>
    и так далее.
    
<br>&#8195;&#8195;За N этапов получается последовательность состояний $x_0$, $x_1$, $x_2$, ..., $x_n$ и последовательность управлений $y_1$, $y_2$, ..., $y_n$, где<br>
            <center>$x_{n+1}$=$g_n$($x_n$,$y_{n+1}$), ${\qquad}$ n=${\overline{0,N}}$</center><br>
    а общая прибыль на каждом этапе вычисляется по формуле<br>
            <center>$J_n$($x_0$, $y_1$, ...,$y_n$)=$h_1$($x_0$, $y_1$)+$h_2$($x_1$, $y_2$)+...+$h_n$($x_{n-1}$, $y_n$), ${\qquad}$ n=${\overline{1,N}}$</center><br>
    
<br>&#8195;&#8195;Нашей целью является отыскание такой последовательности оптимальных управлений \{$y_1^*$, $y_2^*$, ..., $y_N^*$\},чтобы функция прибыли $J_n$ достигла максимума<br>
            <center>$J_n$($x_0$, $y_1^*$, ..., $y_N^*$)=max $J_n$($x_0$, $y_1$, ...,$y_n$)</center>
<br>&#8195;&#8195;Принцип оптимальности Беллмана утверждает, что на последовательности оптимальных управлений \{$y_1^*$, $y_2^*$, ..., $y_N^*$\} должна достигать максимума каждая из функций<br>
            <center>$f_n$($x_{n-1}$, $y_n$, $y_n
            {n+1}$, ..., $y_N$)=$h_n$($x_{n-1}$, $y_n$)+$h_{n+1}$($x_n$, $y_{n+1}$)+...+$h_N$($x_{N-1}$, $y_N$), ${\qquad}$ n=${\overline{1,N}}$</center>
<br>&#8195;&#8195;Если ввести обозначения<br>
            <center>$\varphi_n(x_{n-1})$=max $f_n$($x_{n-1}$, $y_n$, $y_n
            {n+1}$, ..., $y_N$) ${\qquad}$ n=${\overline{1,N}}$</center>
<br>то из принципа оптимальности Беллмана вытекает, что функции $\varphi_n(x_{n-1})$ должны удовлетворять следующим функциональным уравнениям Беллмана:<br>
            <center>$\varphi_n(x_{n-1})$=max[ $\varphi_{n+1}(g_n(x_{n-1},y_n))+h_n(x_{n-1},y_n)$] ${\qquad}$ n=${\overline{1,N}}$</center>
    
<br>&#8195;&#8195;Решение уравнений Беллмана позволяет найти последовательность оптимальных управлений и оптимальное значение функции прибыли.
    
<br>&#8195;&#8195;Замечание. Для того, чтобы методом динамического программирования находить не максимум функции прибыли, как было изложено выше, а минимум функции затрат достаточно лишь заменить во всех соответствующих формулах настоящего параграфа максимум на минимум.

## Пример решения задачи о распределении средств
<br>&#8195;&#8195;Составить план распределения суммы в 6 миллионов долларов между четырьмя предприятиями $\text{П}_1$, $\text{П}_2$, $\text{П}_3$,$\text{П}_4$ приносящий наибольшую прибыль, если в каждое из предприятий может быть вложено 1 - 6 миллионов долларов, а прибыль каждого из предприятий задана в Таблице:

In [2]:
table = [[0, 0, 0, 0],
[2.0, 2.1, 1.7, 1.9],
[2.5, 2.9, 2.4, 2.3],
[3.8, 3.6, 3.7, 3.6],
[4.8, 4.7, 4.4, 4.3],
[5.8, 5.4, 5.7, 5.9],
[6.3, 6.5, 6.6, 6.4]]

def finder(u,n):
    for i in range(len(tmp[n])):
        if((tmp[n][i][0]==u)and(tmp[n][i][4]!=0)):
            return tmp[n][i][4]
    return 0

def finder2(u,n):
    for i in range(len(tmp[n])):
        if((tmp[n][i][0]==u)and(tmp[n][i][6]!=0)):
            return tmp[n][i][6]
    return 0

def finder3(u,n):
    for i in range(len(tmp[n])):
        if((tmp[n][i][0]==u)and(tmp[n][i][6]!=0)):
            return tmp[n][i][7]
    return 0

In [3]:
df = pd.DataFrame(table,columns=['Пр1','Пр2','Пр3','Пр4'])
sum = 0
for i in range(len(table)+1):
    sum+=i
n = 4 
tmp = [[[] for i in range(sum)] for j in range(n)]
df.index.name = 'Размер инвестиций'
df

Unnamed: 0_level_0,Пр1,Пр2,Пр3,Пр4
Размер инвестиций,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
0,0.0,0.0,0.0,0.0
1,2.0,2.1,1.7,1.9
2,2.5,2.9,2.4,2.3
3,3.8,3.6,3.7,3.6
4,4.8,4.7,4.4,4.3
5,5.8,5.4,5.7,5.9
6,6.3,6.5,6.6,6.4


<br>&#8195;&#8195;Разобьем процесс выделения средств предприятиям на 4 этапа: на первом этапе выделяется $y_1$ средств предприятию $\text{П}_1$, на втором – $y_2$ средств предприятию $\text{П}_2$, на третьем – $y_3$ средств предприятию $\text{П}_3$,на четвертом – $y_4$ средств предприятию $\text{П}_4$.
    
<br>&#8195;&#8195;Будем считать состоянием системы $x_i$(i=0,1,2,3,4) ту сумму средств, которая осталась нераспределенной после i-го этапа. Поскольку необходимо распределить все 4 миллиона долларов, то $x_0$=6. Тогда<br>    
           <center>$x_n$=$x_{n-1}$-$y_n$, ${\qquad}$ n=1,2,3,4.</center><br>

In [4]:
print("Шаг 1")
fu = table[0][n-1]
en = 1
u = 0
en1 = 1
fe = 0
un = 0

t = 0
for i in range(len(table)):
    for u in range(i+1):
        fu = table[u][n-1]
        fe = fu
        tmp[n-1][t].append(i)
        tmp[n-1][t].append(u)
        tmp[n-1][t].append(i-u)
        tmp[n-1][t].append(fu)
        if(tmp[n-1][t][2] == 0):
            tmp[n-1][t].append(fe)
            tmp[n-1][t].append(u)
        else:
            tmp[n-1][t].append(0)
            tmp[n-1][t].append(0)
        t +=1
tst = pd.DataFrame(tmp[n-1],columns=['e3','u4','e4 = e3 - u4','f4(u4)','F*4(e4)','u4(e4)'])
tst.style.hide_index()

Шаг 1


e3,u4,e4 = e3 - u4,f4(u4),F*4(e4),u4(e4)
0,0,0,0.0,0.0,0
1,0,1,0.0,0.0,0
1,1,0,1.9,1.9,1
2,0,2,0.0,0.0,0
2,1,1,1.9,0.0,0
2,2,0,2.3,2.3,2
3,0,3,0.0,0.0,0
3,1,2,1.9,0.0,0
3,2,1,2.3,0.0,0
3,3,0,3.6,3.6,3


In [5]:
print("Шаг 2")
n = 3 
fu = 0
en = 1
u = 0
en1 = 1
fe = 0
un = 0
t = 0
for i in range(len(table)):
    for u in range(i+1):
        fu = table[u][n-1]
        fe = fu
        tmp[n-1][t].append(i)
        tmp[n-1][t].append(u)
        tmp[n-1][t].append(i-u)
        tmp[n-1][t].append(fu)
        tmp[n-1][t].append(finder(i-u,n))
        tmp[n-1][t].append(finder(i-u,n)+fu)
        t +=1
    maxx = tmp[n-1][t-1][5]
    im = t-1
    for x in range(t-1-u,t-1):
        if(tmp[n-1][x][5]>maxx):
            maxx=tmp[n-1][x][5]
            im = x
    tmp[n-1][im].append(maxx)
    tmp[n-1][im].append(tmp[n-1][im][1])
    for x in range(t-1-u,t):
        if(x!=im):
            tmp[n-1][x].append(0)
            tmp[n-1][x].append(0)
tst = pd.DataFrame(tmp[n-1],columns=['e2','u3','e3 = e2 - u3','f3(u3)','F*3(e2)','F2(u3,e2)','F*3(e3)','u3(e3)'])
tst.style.hide_index()

Шаг 2


e2,u3,e3 = e2 - u3,f3(u3),F*3(e2),"F2(u3,e2)",F*3(e3),u3(e3)
0,0,0,0.0,0.0,0.0,0.0,0
1,0,1,0.0,1.9,1.9,1.9,0
1,1,0,1.7,0.0,1.7,0.0,0
2,0,2,0.0,2.3,2.3,0.0,0
2,1,1,1.7,1.9,3.6,3.6,1
2,2,0,2.4,0.0,2.4,0.0,0
3,0,3,0.0,3.6,3.6,0.0,0
3,1,2,1.7,2.3,4.0,0.0,0
3,2,1,2.4,1.9,4.3,4.3,2
3,3,0,3.7,0.0,3.7,0.0,0


In [6]:
print("Шаг 3")
n = 2
fu = 0
en = 1
u = 0
en1 = 1
fe = 0
un = 0
t = 0
for i in range(len(table)):
    for u in range(i+1):
        fu = table[u][n-1]
        fe = fu
        tmp[n-1][t].append(i)
        tmp[n-1][t].append(u)
        tmp[n-1][t].append(i-u)
        tmp[n-1][t].append(fu)
        tmp[n-1][t].append(finder2(i-u,n))
        tmp[n-1][t].append(finder2(i-u,n)+fu)
        t +=1
    maxx = tmp[n-1][t-1][5]
    im = t-1
    for x in range(t-1-u,t-1):
        if(tmp[n-1][x][5]>maxx):
            maxx=tmp[n-1][x][5]
            im = x
    tmp[n-1][im].append(maxx)
    tmp[n-1][im].append(tmp[n-1][im][1])
    for x in range(t-1-u,t):
        if(x!=im):
            tmp[n-1][x].append(0)
            tmp[n-1][x].append(0)
tst = pd.DataFrame(tmp[n-1],columns=['e1','u2','e2 = e1 - u2','f2(u2)','F*2(e1)','F1(u2,e1)','F*2(e2)','u2(e2)'])
tst.style.hide_index()

Шаг 3


e1,u2,e2 = e1 - u2,f2(u2),F*2(e1),"F1(u2,e1)",F*2(e2),u2(e2)
0,0,0,0.0,0.0,0.0,0.0,0
1,0,1,0.0,1.9,1.9,0.0,0
1,1,0,2.1,0.0,2.1,2.1,1
2,0,2,0.0,3.6,3.6,0.0,0
2,1,1,2.1,1.9,4.0,4.0,1
2,2,0,2.9,0.0,2.9,0.0,0
3,0,3,0.0,4.3,4.3,0.0,0
3,1,2,2.1,3.6,5.7,5.7,1
3,2,1,2.9,1.9,4.8,0.0,0
3,3,0,3.6,0.0,3.6,0.0,0


In [7]:
print("Шаг 4")
n = 1 
fu = 0
en = 1
u = 0
en1 = 1
fe = 0
un = 0
t = 0
for i in range(len(table)):
    for u in range(i+1):
        fu = table[u][n-1]
        fe = fu
        tmp[n-1][t].append(i)
        tmp[n-1][t].append(u)
        tmp[n-1][t].append(i-u)
        tmp[n-1][t].append(fu)
        tmp[n-1][t].append(finder2(i-u,n))
        tmp[n-1][t].append(finder2(i-u,n)+fu)
        t +=1
    maxx = tmp[n-1][t-1][5]
    im = t-1
    for x in range(t-1-u,t-1):
        if(tmp[n-1][x][5]>maxx):
            maxx=tmp[n-1][x][5]
            im = x
    tmp[n-1][im].append(maxx)
    tmp[n-1][im].append(tmp[n-1][im][1])
    for x in range(t-1-u,t):
        if(x!=im):
            tmp[n-1][x].append(0)
            tmp[n-1][x].append(0)
tst = pd.DataFrame(tmp[n-1],columns=['e0','u1','e1 = e0 - u1','f1(u1)','F*1(e0)','F0(u1,e0)','F*1(e1)','u1(e1)'])
tst.style.hide_index()

Шаг 4


e0,u1,e1 = e0 - u1,f1(u1),F*1(e0),"F0(u1,e0)",F*1(e1),u1(e1)
0,0,0,0.0,0.0,0.0,0.0,0
1,0,1,0.0,2.1,2.1,2.1,0
1,1,0,2.0,0.0,2.0,0.0,0
2,0,2,0.0,4.0,4.0,0.0,0
2,1,1,2.0,2.1,4.1,4.1,1
2,2,0,2.5,0.0,2.5,0.0,0
3,0,3,0.0,5.7,5.7,0.0,0
3,1,2,2.0,4.0,6.0,6.0,1
3,2,1,2.5,2.1,4.6,0.0,0
3,3,0,3.8,0.0,3.8,0.0,0


In [8]:
print("Первому предприятию: "+str(tmp[n-1][im][7]))
ost = len(table)-1 - tmp[n-1][im][7]
tp = finder3(ost,n)
print("Второму предприятию: "+str(tp))
ost-=tp
tp = finder3(ost,n+1)
print("Третьему предприятию: "+str(tp))
ost-=tp
print("Четвертому предприятию: "+str(ost))

Первому предприятию: 1
Второму предприятию: 1
Третьему предприятию: 3
Четвертому предприятию: 1
