In [7]:
__version__ = '0.3'
__author__  = "Robert Matern (r.matern@stud.uni-hannover.de)"
__date__    = ''
__url__     = ''
__copyright__ = "(C) 2015 Robert Matern"

In [8]:
# import pandas as pd
import numpy as np

#Dynamisches Programm

Die normale Modellformulierung des Auftragsannahmeproblems im Revenue Management von Instandhaltungsprozessen:

$$V(\textbf{c}, t) = \sum_{j \in \mathcal{J}}p_{j}(t)\max[V(\textbf{c}, t-1), r_{j} + V(\textbf{c}-\textbf{a}_j, t-1)] + p_{0}(t)V(\textbf{c}, t-1) $$

$$= V(\textbf{c}, t-1) + \sum_{j \in \mathcal{J}}p_{j}(t) \max[r_j - V(\textbf{c}, t-1) + V(\textbf{c}-\textbf{a}_j, t-1), 0]$$

## Algorithmus

In [9]:
solutions = {}

def DP(solutions, conditions, products, resources, capacities, consumtions, times):
    '''Berechnung des maximal möglichen Erwartungswertes eines Auftragsannahmeproblems.'''
    
    # Leere Wert für den Erwartungswert des aktuellen Systemzustands.
    value = 0
    
    #Aktueller Systemzustand wird generiert.
    capacity = capacities[1:]
    time = times[0]
    condition = np.append(capacity, times[0])
    
    #Aktueller Systemzustand wird in dem 'np.array' aller möglichen Systemzustände gesucht.
    state = np.where((conditions == condition).all(axis=1))[0][0]
    
    # Memofunktion: Das DP wird nur fortgeführt, sofern es nicht schon berechnet wurde.
    if state not in solutions:
                
        # Sofern es sich nicht um einen Endknoten des Entscheidungsbaums handelt,
        # werden folgende Schritte eingeleitet:
        if times[0]!=0:
            # Das DP(t-1) ohne Akeptanz wird gelöst und im Wert 'reject' gespeichert.
            capacity = capacities[1:]
            time = times[1]
            condition = np.append(capacity, times[0])
            state_reject = np.where((conditions == condition).all(axis=1))[0][0]
            if state_reject not in solutions:
                reject = DP(solutions, conditions, products, resources, capacities, consumtions, times[1:])
            else:
                reject = solutions[state_reject][1]
            # Für das DP(t-1) mit Akzeptanz wird ein Numpy-Array in der Länge der Anzahl an Produkten erstellt.
            accept = np.zeros(shape=(len(products[1:])), dtype=np.float16)
            # For-Schleife über alle Produkte, sofern die Kapazitäten keinen negativen Werte annehmen.
            for j in products[1:]:
                change = capacities-consumtions[j]
                if np.all((change) >= 0):
                    # Initialisierung des DP(t-1) mit Akeptanz jeweils für ein Produkt j.
                    capacity = change[1:]
                    time = times[1]
                    condition = np.append(capacity, times[0])
                    state_accept = np.where((conditions == condition).all(axis=1))[0][0]
                    if state_accept not in solutions:
                        accept_j = DP(solutions, conditions, products, resources, change, consumtions, times[1:])
                        accept[j-1] = probs[j][times[0]]*max(revenues[j]-reject+accept_j, 0)
                    else:
                        accept[j-1] = solutions[state_accept][1]
                else:    
                    # Erwartungswert für ein Produkt j enspricht
                    # der Grenzbedingung V(c,t)=-∞, falls n[j] < 0.
                    accept[j-1] = 0
                            
            # Summierung des DP(t-1) ohne Akzeptanz sowie den Numpy-Array DP(t-1) mit Akzeptanz.
            value = np.around(reject + np.sum(accept), decimals=2)
            # Für den aktuellen Systemzustand wird der Ertragswert in das Dict "solutions" gespeichert.
            solutions[state] = [conditions[state], value]

        # Sofern es sich um einen Endknoten des Entscheidungsbaums handelt, werden folgende Schritte eingeleitet:
        else:
            # Erwartungswert enspricht der Grenzbedingung V(c,0)=0, für n >= 0.
            value = 0
            # Ein Endzustand wird mit einem Erwartungswert 0 in das Dict "solutions" gespeichert.
            solutions[state] = [conditions[state], value]
            return value        
            
    # Memofunktion: Sofern das Ergebnis breits berechnet wurde, wird der Wert aus dem Dict "solutions" verwendet.
    else:
        value = solutions[state][1]
                
    return value

## Erstellung der Struktur als NetworkX-Graph

In [12]:
import networkx as nx

def Structure(solutions, products, consumtions, revenues, probs):
    graph=nx.MultiDiGraph()

    for key in solutions.iterkeys():
        graph.add_node(key, label=solutions[key][0], value=solutions[key][1],
                   capacity=solutions[key][0][:-1], time=solutions[key][0][-1])
    graph.add_node("end")

    for i in solutions.iterkeys():
        if solutions[i][0][-1] == 0: # Ist der Zeitpunkt 0, dann verbinde diese Lösung mit dem 'end'-Knoten.
            graph.add_edge(i, "end", weight=0, revenue=0, adoption=0)
        else:
            for s in solutions.iterkeys():
                for j in products:
                    capa = []
                    capa = solutions[i][0][:-1] - consumtions[j][1:]
                    if np.array_equal(capa, solutions[s][0][:-1]) and solutions[i][0][-1]-1 == solutions[s][0][-1]:
                        if  j == 0:
                            graph.add_edge(i, s, key=0, weight=solutions[s][1], revenue=revenues[j], goal=solutions[s][0])
                        if  j != 0 and probs[j][solutions[s][0][-1]]>0:
                            graph.add_edge(i, s, key=j, weight=solutions[s][1], revenue=revenues[j], goal=solutions[s][0])
    return graph

## Ermittlung der besten Politik (Dijkstra Algorithmus)

In [11]:
def Best_Politic(graph, times, start=None):
    list = nx.topological_sort(graph)
    if start == None:
        pol = nx.dijkstra_path(graph, list[0], "end")
    else:
        pol = nx.dijkstra_path(graph, start, "end")
    
    return pol