<a href="http://datamics.com/de/courses/"><img src=../DATA/bg_datamics_top.png></a>

<em text-align:center>© Datamics</em>
# Finde das fehlende Element - LÖSUNG

## Problem

Man betrachte ein Array von nicht-negativen ganzen Zahlen. Ein zweites Array wird gebildet, indem die Elemente des ersten Arrays gemischt und ein zufälliges Element gelöscht werden. Ermittele anhand dieser beiden Arrays, welches Element im zweiten Array fehlt. 

Hier ist eine beispielhafte Eingabe, das erste Array wird gemischt und die Zahl 5 wird entfernt, um das zweite Array zu erstellen.

Eingabe:
    
    Finder([1,2,3,4,5,6,7],[3,7,2,1,4,6]))

Ausgabe:

    5 ist die fehlende Zahl


## Lösung

Die naive Lösung ist, jedes Element im zweiten Array durchzugehen und zu überprüfen, ob es im ersten Array erscheint. Beachte bitte, dass es doppelte Einträge in den Arrays geben kann, daher sollten wir besonders darauf achten. Die Komplexität dieses Ansatzes ist O(N^2), da wir zwei for-Schleifen brauchen würden.

Eine effizientere Lösung ist die Sortierung des ersten Arrays, so dass wir bei der Überprüfung, ob ein Element im ersten Array im zweiten erscheint, eine binäre Suche durchführen können (wir werden die binäre Suche in einem späteren Abschnitt näher erläutern). Aber wir sollten trotzdem vorsichtig sein mit doppelten Elementen. Die Komplexität ist O(NlogN). 

Wenn wir uns nicht mit dem Sonderfall der doppelten Zahlen befassen wollen, können wir beide Arrays sortieren und gleichzeitig darüber iterieren. Sobald zwei Iteratoren unterschiedliche Werte haben, können wir anhalten. Der Wert des ersten Iterators ist das fehlende Element. Diese Lösung ist auch O(NlogN). Hier ist die Lösung für diesen Ansatz:

In [1]:
def finder(arr1,arr2):
    
    # Sortiere die Arrays
    arr1.sort()
    arr2.sort()
    
    # Vergleiche die Elemente in den sortierten Arrays
    for num1, num2 in zip(arr1,arr2):
        if num1!= num2:
            return num1
    
    # Andernfalls wird das letzte Element zurückgegeben.
    return arr1[-1]

In [2]:
arr1 = [1,2,3,4,5,6,7]
arr2 = [3,7,2,1,4,6]
finder(arr1,arr2)

5

In den meisten Interviews wird von dir erwartet, eine lineare Zeitlösung zu finden. Wir können eine Hash-Tabelle verwenden und die Anzahl der Erscheinungen jedes Elements im zweiten Array speichern. Dann dekrementieren wir für jedes Element im ersten Array seinen Zähler. Einmal ein Element mit null Zählwerten getroffen, ist das das fehlende Element. Hier ist diese Lösung: 

In [3]:
import collections

def finder2(arr1, arr2): 
    
    # Verwendung des Standard-Dict um Schlüsselfehler zu vermeiden 
    d=collections.defaultdict(int) 
    
    # Fügt eine Zähler für jede Instanz in Array 1 hinzu.
    for num in arr2:
        d[num]+=1 
    
    # Überprüfe, ob die Nummer nicht im Dictionary steht.
    for num in arr1: 
        if d[num]==0: 
            return num 
        
        # Andernfalls subtrahiere von Zählerstand.
        else: d[num]-=1 

In [4]:
arr1 = [5,5,7,7]
arr2 = [5,7,7]

finder2(arr1,arr2)

5

Eine mögliche Lösung ist das Berechnen der Summe aller Zahlen in arr1 und arr2 und das Subtrahieren der Summe von arr2 von der Summe von array1. Der Unterschied ist die fehlende Zahl in arr2. Dieser Ansatz könnte jedoch problematisch sein, wenn die Arrays zu lang oder die Zahlen sehr groß sind. Dann kommt es beim Summieren der Zahlen zu einem Überlauf.

Durch einen sehr cleveren Trick können wir ohne Probleme eine lineare Zeit und konstante Raumkomplexität erreichen. Hier ist es: Initialisieren Sie eine Variable auf 0, dann [XOR](https://de.wikipedia.org/wiki/Kontravalenz) jedes Element im ersten und zweiten Array mit dieser Variable. Am Ende ist der Wert der Variable das Ergebnis, dass ein Element in Array2 fehlt.

In [5]:
def finder3(arr1, arr2): 
    result=0 
    
    # Führe ein XOR zwischen den Zahlen in den Arrays durch.
    for num in arr1+arr2: 
        result^=num 
        print (result)
        
    return result 

In [6]:
finder3(arr1,arr2)

5
0
7
0
5
2
5


5

# Teste deine Lösung

In [7]:
"""
FÜHRE DIESE ZELLE AUS, UM DEINE LÖSUNG ZU TESTEN.
"""
# pip install nose
from nose.tools import assert_equal

class TestFinder(object):
    
    def test(self,sol):
        assert_equal(sol([5,5,7,7],[5,7,7]),5)
        assert_equal(sol([1,2,3,4,5,6,7],[3,7,2,1,4,6]),5)
        assert_equal(sol([9,8,7,6,5,4,3,2,1],[9,8,7,5,4,3,2,1]),6)
        print ('ALLE TESTFÄLLE BESTANDEN')

# TEST durchführen
t = TestFinder()
t.test(finder)

ALLE TESTFÄLLE BESTANDEN


## Gut gemacht!