#### BWINF 43 - Runde 1 - A3

[Video](https://youtu.be/qH5gu44_6pc)

<img src='wandertag.png' width='300'>

#### Die Eingabedaten

Jede Datei enthält Streckenwünsche und ist so aufgebaut:

- Zeile 1: Anzahl n der Personen mit Streckenwünschen.
- In den folgenden n Zeilen ist jeweils die kürzeste und längste gewünschte Strecke aus Sicht einer Person angegeben (in Metern). Die angegebenen minimalen und maximalen Streckenlängen sind inklusive, also gilt [x_1, x_2].


Hier ist eine Beispieleingabe:

    3
    500 1000
    100 200
    100 600

In diesem Beispiel gibt es insgesamt drei Streckenwünsche. Person 1 möchte gern mindestens 500m und maximal 1000m laufen. 
Sollte die angebotene Strecke genau 500m oder 1000m betragen, würde sie auch mitkommen.
Analog wünscht sich Person 2 eine Strecke zwischen 100m und 200m und Person 3 zwischen 100m und 600m.

Für die Dateien wandern6.txt und wandern7.txt benötigt dein Programm eventuell mehr Zeit als für die anderen Eingaben. Versuche, diese Zeit zu minimieren.

In [137]:
nr  = '6'
f = open('./beispieldaten/wandern'+nr+'.txt')
n = int(f.readline())
data = []
for i in range(n):
    x, y = f.readline().split()
    data.append((int(x),int(y)))
f.close()
print(f'Beispiel: {nr}')
print(f'Anzahl Personen: {n}')
print('Streckenwünsche:')
for x, y in data[:30]:
    print(f'{x:5} - {y:5}')


Beispiel: 6
Anzahl Personen: 500
Streckenwünsche:
24681 - 43540
95355 - 99444
63183 - 91205
96398 - 98512
65938 - 84141
10268 - 31971
88368 - 96778
56522 - 97709
96891 - 97965
34346 - 44231
57648 - 62529
63918 - 97622
68622 - 97178
95456 - 99700
98883 - 99898
94606 - 95504
11604 - 27587
79591 - 82710
 7512 - 49511
66881 - 76287
92256 - 94842
83031 - 86534
94544 - 95571
81957 - 83696
  849 - 10406
20949 - 76346
34389 - 41731
60765 - 95914
62808 - 64097
72943 - 81363


#### Überlegungen

Kritische Streckenlängen sind die Intervallbeginne und die Intervallenden+1. Wenn eine solche Zahl gewählt wird, kann sich die Teilnehmerzahl ändern. Entweder nach oben gehen oder nach unten gehen. 

Wie auch immer eine optimale Lösung für das Problem aussieht, es gibt dazu auch eine optimale Lösung mit drei kritischen Zahlen.

In [138]:
import math
kritisch = sorted({x[0] for x in data} | {x[1]+1 for x in data}) 
print(f'Anzahl kritischer Längen: {len(kritisch)}')
print(f'Anzahl 3er-Kombinationen mit kritischen Längen: {math.comb(len(kritisch),3)}')
print('Die sortierte Menge der kritischen Längen (höchstens 30):')
print(kritisch[:30])

Anzahl kritischer Längen: 993
Anzahl 3er-Kombinationen mit kritischen Längen: 162698416
Die sortierte Menge der kritischen Längen (höchstens 30):
[76, 395, 492, 849, 1159, 1218, 1219, 1239, 1249, 1896, 1917, 2013, 2182, 2307, 2634, 2923, 3791, 3990, 4060, 4793, 4815, 4864, 5102, 5152, 5619, 5994, 6246, 6517, 6542, 6673]


#### Brute Force 
Für die kleinen Eingabedaten machen wir ein brute-force, um die Lösungen für andere Verfahren zu vergleichen.

In [113]:
def evaluate(x,y,z):
    zaehl = 0
    for von,bis in data:
        if von <= x <= bis or von <= y <= bis or von <= z <= bis:
            zaehl+=1
    return zaehl

In [94]:
%%time
import itertools as it
best = 0
bestVal = None
for x,y,z in it.combinations(kritisch,3):
    val = evaluate(x,y,z)
    if bestVal is None or val > bestVal:
        bestVal = val
        best = x,y,z

print(f'Die drei Streckenlängen:',best)
print(f'Anzahl Teilnehmer: {bestVal} von {n}.')

Die drei Streckenlängen: (22, 51, 64)
Anzahl Teilnehmer: 6 von 7.
CPU times: total: 0 ns
Wall time: 1 ms


Wir ordnen jeder kritischen Zahl zu, wie sich bei ihr die Teilnehmerzahl ändert.

In [139]:
diff = {x:0 for x in kritisch}
for von, bis in data:
    diff[von]+=1
    diff[bis+1]-=1
 

Wir erzeugen uns eine Liste *anz* mit der Anzahl der Teilnehmer für jede kritische Länge.


In [140]:
anz = []
val = 0
for x in kritisch:
    val += diff[x]
    anz.append(val)
 

Wir überprüfen nur 3er Kombinationen von kritischen Längen, die in der Liste anz ein lokales Maximum haben.

In [141]:
maxkritisch = []
for i in range(1,len(kritisch)-1):
    if anz[i-1] <= anz[i] >= anz[i+1]:
        maxkritisch.append(kritisch[i])

if anz[0] >= anz[1]:
    maxkritisch.append(kritisch[0])
if anz[-1] >= anz[-2]:
    maxkritisch.append(kritisch[-1])

print(f'Anzahl maxkritischer Längen: {len(maxkritisch)}')
print(f'Anzahl 3er-Kombinationen mit maxkritischen Längen: {math.comb(len(maxkritisch),3)}')
print('Die sortierte Menge der maxkritischer Längen (höchstens 30):')
print(maxkritisch[:30])

Anzahl maxkritischer Längen: 191
Anzahl 3er-Kombinationen mit maxkritischen Längen: 1143135
Die sortierte Menge der maxkritischer Längen (höchstens 30):
[2634, 6673, 8845, 8976, 10268, 11322, 11604, 16208, 17360, 18707, 19480, 21072, 21182, 22633, 23784, 24521, 25577, 26628, 27519, 31426, 31817, 32010, 32536, 33480, 33967, 34479, 36072, 36765, 37493, 37994]


#### Brute force

Diesmal nur für die maxkritischen 3er-Kombinationen

In [142]:
%%time
import itertools as it
best = 0
bestVal = None
for x,y,z in it.combinations(maxkritisch,3):
    val = evaluate(x,y,z)
    if bestVal is None or val > bestVal:
        bestVal = val
        best = x,y,z

print(f'Die drei Streckenlängen:',best)
print(f'Anzahl Teilnehmer: {bestVal} von {n}.')

Die drei Streckenlängen: (42834, 74810, 92920)
Anzahl Teilnehmer: 330 von 500.
CPU times: total: 50.1 s
Wall time: 50.4 s


#### Das gesamte Programm

In [151]:
%%time
import math
import itertools as it

def evaluate(x,y,z):
    zaehl = 0
    for von,bis in data:
        if von <= x <= bis or von <= y <= bis or von <= z <= bis:
            zaehl+=1
    return zaehl
    
nr  = '7'
f = open('./beispieldaten/wandern'+nr+'.txt')
n = int(f.readline())
data = []
for i in range(n):
    x, y = f.readline().strip().split()
    data.append((int(x),int(y)))
f.close()

print(f'Beispiel: {nr}')
print(f'Anzahl Personen: {n}')

kritisch = sorted({x[0] for x in data} | {x[1]+1 for x in data}) 
print(f'Anzahl kritischer Längen: {len(kritisch)}')

# Differenzen bei den kritischen Längen
diff = {x:0 for x in kritisch}
for von, bis in data:
    diff[von]+=1
    diff[bis+1]-=1

# Anzahl Teilnehmer bei den kritischen Längen
anz = []
val = 0
for x in kritisch:
    val += diff[x]
    anz.append(val)
 
maxkritisch = []
for i in range(1,len(kritisch)-1):
    if anz[i-1] <= anz[i] >= anz[i+1]:
        maxkritisch.append(kritisch[i])

if anz[0] >= anz[1]:
    maxkritisch.append(kritisch[0])
if anz[-1] >= anz[-2]:
    maxkritisch.append(kritisch[-1])

print(f'Anzahl maxkritischer Längen: {len(maxkritisch)}')
print(f'Anzahl 3er-Kombinationen mit maxkritischen Längen: {math.comb(len(maxkritisch),3)}')

# brute force nach der besten Lösung suchen
best = 0
bestVal = None
for x,y,z in it.combinations(maxkritisch,3):
    val = evaluate(x,y,z)
    if bestVal is None or val > bestVal:
        bestVal = val
        best = x,y,z

print(f'Die drei Streckenlängen:',best)
print(f'Anzahl Teilnehmer: {bestVal} von {n}.')


Beispiel: 7
Anzahl Personen: 800
Anzahl kritischer Längen: 1585
Anzahl maxkritischer Längen: 330
Anzahl 3er-Kombinationen mit maxkritischen Längen: 5935160
Die drei Streckenlängen: (39520, 76088, 91584)
Anzahl Teilnehmer: 551 von 800.
CPU times: total: 7min 9s
Wall time: 7min 11s


In [169]:
print(maxkritisch[:100])
    

[5697, 7754, 9677, 10223, 10971, 11459, 12989, 13544, 14383, 15498, 16983, 17155, 19172, 20228, 21051, 21189, 21635, 22208, 22365, 23434, 23713, 23871, 24125, 24287, 24682, 25068, 26355, 26418, 26628, 27005, 27546, 27943, 28564, 28919, 29170, 30463, 30506, 31027, 31432, 32529, 32856, 33126, 33458, 33831, 34078, 34434, 34558, 35075, 35471, 36025, 36337, 36666, 36806, 37063, 37415, 38265, 38317, 38769, 39255, 39520, 39581, 39687, 40201, 40350, 40646, 41190, 41351, 41786, 41987, 42694, 43396, 43416, 43892, 44260, 44463, 45071, 45668, 46106, 47141, 47258, 47670, 47900, 48045, 48123, 48333, 48879, 49336, 49739, 50074, 50384, 50599, 51154, 51511, 51551, 51957, 52515, 52572, 52872, 53004, 53279]


In [None]:
m = dict()
for i in range(len(kritisch)):
    m[kritisch[i]] = anz[i]

for x in maxkritisch:
    print(x,m[x])

In [173]:
maxmaxkritisch = []
for i in range(1,len(maxkritisch)-1):
    vorher = m[maxkritisch[i-1]]
    current = m[maxkritisch[i]]
    nachher = m[maxkritisch[i+1]]
        
    if vorher <= current >= nachher:
        maxmaxkritisch.append(maxkritisch[i])

len(maxmaxkritisch)

120

Zur Verbesserung der Laufzeit wählen wir für die Fälle, wo wir mehr als 1 Million maxkritische Längen haben, nur solche maxkritischen Längen aus, die wiederum lokale Maxima in der Reihe der maxkritischen Teilnehmerzahlen aufweisen.

In [174]:
%%time
# brute force nach der besten Lösung suchen
best = 0
bestVal = None
for x,y,z in it.combinations(maxmaxkritisch,3):
    val = evaluate(x,y,z)
    if bestVal is None or val > bestVal:
        bestVal = val
        best = x,y,z

print(f'Die drei Streckenlängen:',best)
print(f'Anzahl Teilnehmer: {bestVal} von {n}.')

Die drei Streckenlängen: (39520, 76088, 91584)
Anzahl Teilnehmer: 551 von 800.
CPU times: total: 20 s
Wall time: 20.1 s
