# Renault car sequencing II -- greedy

Version 14/05/22

https://www.roadef.org/challenge/2005/en/

Wir importieren ein paar Pakete. (Nicht alle brauchen wir hier.) 
<ul>
    <li><code>numpy</code>: wissenschaftliche Bibliothek, im wesentlichen für die array-Klasse</li>
    <li><code>matplotlib</code>: Visualisierungsfunktionen</li>
    <li><code>math</code>: mathematische Funktionen</li>
</ul>

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import math
import random
import time

plt.style.use("seaborn")  ## plots sehen so ein bisschen schöner aus

Als nächstes werden die Instanzdaten gelesen und eine Bibliothek (<code>rnlt</code>, kurz für *Renault*) mit Hilfscode (data handling und Visualisierung) importiert. Weiterhin werden die Instanzdaten und <code>rnlt</code> automatisch heruntergeladen -- dies funktioniert so wie es dort steht unter Google Colab und unter Linux (evtl auch iOs). Wenn Sie den Code auf einem Windows-Rechner lokal ausführen wollen, dann laden Sie die Instanzdaten unter (https://www.roadef.org/challenge/2005/files/Instances_set_A.zip)(https://www.roadef.org/challenge/2005/files/Instances_set_A.zip) herunter, dann entpacken Sie die Daten und speichern Sie die Daten und <code>rnlt.py</code> im gleichen Ordner wie dieses juypter-Notebook. Weiterhin müssen Sie die ersten drei Zeilen auskommentieren.

In [None]:
!wget -q https://www.roadef.org/challenge/2005/files/Instances_set_A.zip
!unzip -q Instances_set_A.zip
!wget -q https://raw.githubusercontent.com/henningbruhn/mobp/main/sequencing_aufgabe/rnlt.py

# Pfad zu den gespeicherten Instanzen -- ersetzen Sie das evtl durch den entsprechenden Pfad bei Ihnen
#path="RENAULT/Instances_set_A/"   
path="Instances/"

import rnlt

Wir laden wieder alle Instanzen in das dictionary <code>data_dict</code> ein.

In [None]:
data_dict=rnlt.read_in_all_instances(path)

## Zielfunktion, Kosten

Bewertet werden soll eine Reihung der Fahrzeuge, und zwar nach den von Renault vorgegebenen Regeln. Als Reihung wird einfach eine Liste
der Fahrzeuge erwartet.

In [None]:
sample_instance=data_dict['048_39_1_EP_RAF_ENP']

Hier ist eine einfache Methode, die überprüft, ob auch tatsächlich alle Fahrzeug zugeordnet wurden. (Man kein leicht niedrige Kosten erreichen, in dem ein Teil der Fahrzeuge einfach weggelassen wird...)

In [None]:
### wir testen die Methode gleich anhand der Reihung von Renault
renault_schedule=sample_instance['renault_schedule']
rnlt.check_for_completeness(renault_schedule,sample_instance)

Die Zielfunktion ist ein wenig komplizierter. Wichtig ist im Folgenden <code>compute_objective</code>, die eigentliche Zielfunktion.

In [None]:
rnlt.compute_objective(renault_schedule,sample_instance)

Wir können uns auch die einzelnen Komponenten, die in die Zielfunktion einfließen, aufschlüsseln lassen:

In [None]:
rnlt.compute_scores(renault_schedule,sample_instance)

## Visualisierung

Visualisierung ist wichtig. Sie hilft zu verstehen, was die Algorithmen machen und wo angesetzt werden kann, um sie zu verbessern.
Mit <code>plot_options_and_colours</code> können Sie sich anzeigen lassen, wo Farbwechsel und p/q-Verletzungen auftreten. Wir machen das gleich einmal mit der Reihung, die Renault errechnet hat.

In [None]:
rnlt.plot_options_and_colours(renault_schedule,sample_instance)

Wir vergleichen die Renault-Lösung mit einer zufälligen Reihenfolge. Hier hift die Funktion <code>random.permutation</code> aus dem <code>numpy</code>-Paket.

In [None]:
rnd_schedule=np.random.permutation(sample_instance['current_day'])
rnlt.plot_options_and_colours(rnd_schedule,sample_instance)

Wir vergleichen auch die Zielfunktionswerte. Natürlich ist die Renault-Lösung deutlich besser als die Zufallsreihung.

In [None]:
rnlt.compute_objective(renault_schedule,sample_instance),rnlt.compute_objective(rnd_schedule,sample_instance)

## 2. Aufgabe: Zufallsreihungen

Bei manchen Problemen reicht es, eine Reihe von Zufallslösungen zu erzeugen und die beste auszuwählen. Implementieren Sie diese Methode und testen Sie Sie anhand der <code>sample_instance</code>.

In [None]:
def best_random_schedule(instance,tries=10):
    best_schedule=None
    best_cost=np.inf
    for _ in range(tries):
        ### fügen Sie Ihren Code hier ein ###
        ### Ende Einfügung ###
    return best_schedule,best_cost

tries=100
rnd_sch,best_cost=best_random_schedule(sample_instance,tries=tries)
print("Niedrigste Kosten nach {} Versuchen: {}".format(tries,best_cost))

Wenn Sie Zeit haben, modifizieren Sie die Funktion <code>best_random_schedule</code>, so dass sie zusätzlich die niedrigsten Kosten in der jeweiligen Iteration zurück gegeben werden. So können wir beurteilen, nach welcher Zeit eine weitere Verbesserung gefunden wird. In dem Visualisierungscode unten wird die Kurve mit der Renault-Lösung verglichen. Besteht Hoffnung, dass eine gute Lösung gefunden wird, wenn einfach für, sagen wir, 10mins Zufallslösungen gesucht werden? 

In [None]:
def best_random_schedule(instance,tries=10):
### Fügen Sie Ihren Code hier ein ###
### Ende Einfügung ###
    return best_schedule,best_cost, records 

sch,cost,records=best_random_schedule(sample_instance,tries=500)
plt.plot(records,label="Zufallslösung")
renault_cost=rnlt.compute_objective(renault_schedule,sample_instance)
plt.plot([renault_cost]*len(records),"r",linewidth=2,label="Renault")
plt.legend()

Wenn Sie die Zeit haben, vergleichen Sie die jeweilige Renault-Lösung mit den Zufallslösungen bei allen Instanzen. 

In [None]:
### Fügen Sie Ihren Code hier ein ###

## 3. Aufgabe: Greedy

Wie könnte ein Greedy-Algorithmus hier aussehen? Vervollständigen Sie die Skizze unten und vergleichen Sie die Ergebnisse mit denen der Zufallsreihungen und dem Renault-Algorithmus. Visualisieren Sie einzelne Lösungen des Greedy-Algorithmus. Was fällt auf? 

In [None]:
def penalty_increase(next_car,partial_schedule,instance):
    """Um wie viel erhöhen sich die Kosten, wenn next_car als nächstes gereiht wird?"""
    ### Fügen Sie Ihren Code hier ein ###
    ### Ende Einfügung ###
    return cost_increase

def pick_next_greedily(partial_schedule,remaining_cars,instance):
    """finde nächstes Auto für Reihung, das Kosten nur gering erhöht"""
    best_car=None
    best_penalty_increase=np.inf
    for car in remaining_cars:
        ## um wie viel erhöhen sich die Kosten, wenn car als nächstes ausgesucht wird?
        increase=penalty_increase(car,partial_schedule,instance)
        ## wenn besser als bisher bestes, nimm car stattdessen
        if increase<best_penalty_increase:
            best_penalty_increase=increase
            best_car=car
    return best_car

def greedy(instance):
    current_day=instance['current_day']
    remaining_cars=list(np.random.permutation(current_day))
    first_car=remaining_cars.pop() ## erstes Auto, das gereiht werden muss
    partial_schedule=[first_car] ## wir starten mit einer Reihung von einem Auto
    while len(remaining_cars)>0: ## solange noch Autos gereiht werden müssen...
        next_car=pick_next_greedily(partial_schedule,remaining_cars,instance)
        partial_schedule.append(next_car)
        remaining_cars.remove(next_car)
    return partial_schedule

## wir erfassen auch die Laufzeit:
start=time.time()
greedy_schedule=greedy(sample_instance)
end=time.time()
rnlt.check_for_completeness(greedy_schedule,sample_instance)
greedy_cost=rnlt.compute_objective(greedy_schedule,sample_instance)
print("Kosten der greedy-Lösung: {}".format(greedy_cost))
print("Laufzeit: {:.1f}s".format(end-start))
rnlt.plot_options_and_colours(greedy_schedule,sample_instance)

Der greedy ist sehr langsam: das liegt im Wesentlichen daran, dass in jedem Schritt jedes noch zu reihende Auto als Kandidaten für den nächsten Platz in Erwägung gezogen wird. Wie kann der Code von <code>pick_next_greedily</code> geändert werden, so dass der Algorithmus schneller ist? (Der Rest des Codes bleibt besser unverändert.)

In [None]:
def pick_next_greedily(partial_schedule,remaining_cars,instance,tries=50):
    """finde nächstes Auto für Reihung, das Kosten nur gering erhöht"""
    best_car=None
    best_penalty_increase=np.inf
    ### Fügen Sie Ihren Code hier ein ###
    ### Ende Einfügung ###
    return best_car

## wir erfassen auch die Laufzeit:
start=time.time()
greedy_schedule=greedy(sample_instance)
end=time.time()
rnlt.check_for_completeness(greedy_schedule,sample_instance)
greedy_cost=rnlt.compute_objective(greedy_schedule,sample_instance)
print("Kosten der greedy-Lösung: {}".format(greedy_cost))
print("Laufzeit: {:.1f}s".format(end-start))
rnlt.plot_options_and_colours(greedy_schedule,sample_instance)

Um einen besseren Überblick zu erhalten, berechnen wir noch die Resultate bei allen Instanzen. Diese sollten mit denen der Zufallslösungen oben verglichen werden.

In [None]:
### Fügen Sie Ihren Code hier ein ###

Wir sehen: greedy ist immer noch recht weit von der Renault-Lösung entfernt.