# Renault car sequencing I -- Exploration

Version 14/05/22

Herkunft von Problem und Daten:
https://www.roadef.org/challenge/2005/en/


Wir importieren ein paar Pakete. (Nicht alle brauchen wir hier.) 
<ul>
    <li><code>numpy</code>: wissenschaftliche Bibliothek, im wesentlichen für die array-Klasse</li>
    <li><code>matplotlib</code>: Visualisierungsfunktionen</li>
    <li><code>math</code>: mathematische Funktionen</li>
</ul>

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import math

plt.style.use("seaborn")  ## plots sehen so ein bisschen schöner aus

Als nächstes werden die Instanzdaten gelesen und eine Bibliothek (<code>rnlt</code>, kurz für *Renault*) mit Hilfscode (data handling und Visualisierung) importiert. Weiterhin werden die Instanzdaten und <code>rnlt</code> automatisch heruntergeladen -- dies funktioniert so wie es dort steht unter Google Colab und unter Linux (evtl auch iOs). Wenn Sie den Code auf einem Windows-Rechner lokal ausführen wollen, dann laden Sie die Instanzdaten unter (https://www.roadef.org/challenge/2005/files/Instances_set_A.zip)(https://www.roadef.org/challenge/2005/files/Instances_set_A.zip) herunter, dann entpacken Sie die Daten und speichern Sie die Daten und <code>rnlt.py</code> im gleichen Ordner wie dieses juypter-Notebook. Weiterhin müssen Sie die ersten drei Zeilen auskommentieren.

In [None]:
!wget -q https://www.roadef.org/challenge/2005/files/Instances_set_A.zip
!unzip -q Instances_set_A.zip
!wget -q https://raw.githubusercontent.com/henningbruhn/mobp/main/sequencing_aufgabe/rnlt.py

# Pfad zu den gespeicherten Instanzen -- ersetzen Sie das evtl durch den entsprechenden Pfad bei Ihnen
#path="RENAULT/Instances_set_A/"   
path="Instances/"

import rnlt

## Methoden zum Einlesen aller Instanzen

Die Daten bestehen aus eine Reihe von Instanzen. Jede Instanz umfasst die Produktion an einem Tag in einer Fertigungsstätte. Renault verfügt über mehrere Fertigungsstätten. Entsprechend können sich die Instanzen unterscheiden.
Alle Instanzen unter path werden mit der Hilfsfunktion <code>read_in_all_instances</code> aus <code>rnlt</code> in das dictionary <code>data_dict</code> eingelesen. 

In [None]:
data_dict=rnlt.read_in_all_instances(path)

Wir gucken uns nun eine Instanz an. Jede Instanz ist wiederum ein dictionary und hält verschiedene Daten bereit. Mit <code>dictionary.keys()</code> erhalten wir eine Liste der im dictionary abgespeicherten Schlüsselwörter.

In [None]:
sample_instance=data_dict['064_38_2_EP_RAF_ENP_ch1']
sample_instance.keys()

Gucken wir uns die verschiedenen Einträge an. <code>'name'</code> ist, wenig überraschend, der Name der Instanz.

In [None]:
sample_instance['name']

Der Eintrag <code>'current_day'</code> enthält die Fahrzeuge, die gereiht werden müssen.

In [None]:
sample_instance['current_day'][:10]  ## nur die ersten 10 Einträge

Was wir sehen: die Id-Nummern der Fahrzeuge. In der Liste sind aber tatsächlich die Fahrzeuge gespeichert, und zwar als Objekte. Betrachten wir ein Fahrzeug.

In [None]:
car=sample_instance['current_day'][42]
print("Fahrzeug Id-Nr {} hat Farbe {}".format(car.ident,car.colour))
print("Es sollen folgende Optionen verbaut werden: {}".format(car.options))

Dh jeder Eintrag <code>car</code> in der Liste <code>sample_instance['current_day']</code> hat die Eigenschaften
<ul>
    <li><code>car.ident</code>: die Id-Nr</li>
    <li><code>car.colour</code>: die Farbe</li>
    <li><code>car.options</code>: die zu verbauenden Optionen</li>
</ul>

Mit <code>print</code> können diese Eigenschaft direkt ausgegeben werden.

In [None]:
print(sample_instance['current_day'][6])

Weiterhin enthält die Instanz Information zu den $p/q$-Bedinungen, abgespeichert als dictionary. Die Einträge sind jeweils als <code>(p,q)</code> abgelegt.

In [None]:
sample_instance['ratios']

Renault hat jeweils bereits eine Reihung algorithmisch ermittelt. Zum Vergleich können wir sie heranziehen. Wir wollen natürlich besser sein.

In [None]:
sample_instance['renault_schedule'][:10]  ## wir zeigen nur die ersten 10 Einträge an

Es folgen zwei weitere Parameter: das paint_batch_limit und die Gewichtung der Ziele

In [None]:
sample_instance['paint_batch_limit']

In [None]:
sample_instance['weights']

Dies ist so zu lesen: Größte Priorität bei der Optimierung wird den high-priority Optionen zugewiesen, dann folgt die Zahl der Farbwechsel und schließlich die low-priority Optionen. 

Um das Ziel der Optimierung besser für den/die Anwender/in zu verdeutlichen, gibt's auch noch eine Methode:

In [None]:
rnlt.prio_string(sample_instance)

## 1. Aufgabe: Exploration der Instanzen

Bevor der erste Algorithmus formuliert wird, sollten die Daten gesichtet werden. Manchmal ergibt sich die eine oder andere Überraschung: ein Aspekt des Problems ist anders als vom Anwender dargestellt, andere Aspekte erweisen sich als unwichtig, da sie kaum vorkommen usw. Wichtig ist es auch, eine Idee vom Umfang des Problems zu erhalten. Wie groß sind überhaupt die Instanzen?

Überlegen Sie sich, welche Daten Sie über die Instanzen erheben wollen. Betrachten Sie einzelne Instanzen und aber auch die Gesamtheit der Instanzen. Welche Daten können Ihnen Einblicke in das Problem verschaffen? Beispielhaft listen wir als erstes die Instanzgrößen auf, dh, wie viele Fahrzeuge jeweils produziert werden sollen:

In [None]:
sizes=[len(instance['current_day']) for instance in data_dict.values()]
sorted(sizes)

Und jetzt Sie! Lassen Sie sich das <code>paint_batch_limit</code> über alle Instanzen ausgeben. Gucken Sie welche Optimierungsziele vorgeschrieben werden. Nehmen Sie sich eine, zwei Instanzen und zählen Sie wie oft jede Farbe und jedes Extra vorkommt. Gibt es weitere Kennzahlen, die nützlich wären?

In [None]:
### Fügen Sie Ihren Code hier ein ###