<a href="http://datamics.com/de/courses/"><img src=../DATA/bg_datamics_top.png></a>

<em text-align:center>© Datamics</em>
# Anagramm-Check - LÖSUNG

## Problem

Bei zwei Strings sollte geprüft werden, ob es sich um ein Anagramm handelt. Ein Anagramm ist, wenn die beiden Zeichenketten mit genau den gleichen Buchstaben geschrieben werden können (so kannst du die Buchstaben einfach neu anordnen, um eine andere Phrase oder ein anderes Wort zu erhalten). 

Zum Beispiel:

    "public relations" ist ein Anagramm aus  "crap built on lies."
    
    "clint eastwood" ist ein Anagramm von" "old west action"
    
**Hinweis: Ignoriere Leerzeichen und Großschreibung. "d go" ist also ein Anagramm aus " God " und " Dog " und " o d g ". **

## Lösung

Es gibt zwei Möglichkeiten, über dieses Problem nachzudenken, wenn zwei Strings die gleiche Häufigkeit von Buchstaben/Elementen haben (d.h. jeder Buchstabe zeigt in beiden Strings die gleiche Anzahl von Malen an), dann sind sie Anagramme von einander. Auf einem ähnlichen Weg der Logik, wenn zwei Strings gleich sind, sobald sie sortiert sind, dann sind sie auch Anagramme von einander.

Du könntest diese zweite Lösung ziemlich einfach in Python implementieren:

In [1]:
def anagram(s1,s2):
    
    # Leerzeichen und Großbuchstaben entfernen
    s1 = s1.replace(' ','').lower()
    s2 = s2.replace(' ','').lower()
    
    # Liefert Booleschwert (boolean) für sortierte Übereinstimmung.
    return sorted(s1) == sorted(s2)

In [2]:
anagram('dog','god')

True

In [3]:
anagram('clint eastwood','old west action')

True

In [4]:
anagram('aa','bb')

False

Jetzt ist der obige Sortieransatz einfach, aber eigentlich nicht optimal und in einer Interviewumgebung wirst du wahrscheinlich gebeten, eine manuellere Lösung zu implementieren, bei der du nur die Anzahl der Buchstaben in jeder Zeichenkette zählst, um deine Fähigkeit zu testen, Hash-Tabellen zu verstehen. Lasst uns eine umfassendere Lösung mit Zähl- und Python-Dictionaries entwickeln:

In [5]:
def anagram2(s1,s2):
    
    # Leerzeichen und Großbuchstaben entfernen
    s1 = s1.replace(' ','').lower()
    s2 = s2.replace(' ','').lower()
    
    # Edge Case zur Überprüfung, ob die gleiche Anzahl von Buchstaben vorhanden ist.
    if len(s1) != len(s2):
        return False
    
    # counting dictionary erstellen (Hinweis: DefaultDict aus dem Modul Collections verwenden)
    count = {}
    
    
        
    # Dictionary für die erste Zeichenkette ausfüllen (Anzahl hinzufügen)
    for letter in s1:
        if letter in count:
            count[letter] += 1
        else:
            count[letter] = 1
            
    # Dictionary für zweite Zeichenkette ausfüllen (Anzahl der Subtraktionen)
    for letter in s2:
        if letter in count:
            count[letter] -= 1
        else:
            count[letter] = 1
    
    # Prüfen ob alle Zählungen 0 sind.
    for k in count:
        if count[k] != 0:
            return False

    # Sonst sind es Anagramme.
    return True

In [6]:
anagram2('dog','god')

True

In [7]:
anagram2('clint eastwood','old west action')

True

In [8]:
anagram2('dd','aa')

False

A quick note on the second solution, the use of defaultdict form the collections module would clean up this code quite a bit, and the final for loop could be built into the second for loop, but in the above implementation every step is very clear.

# Testen deine Lösung
Führ bitte die nachfolgende Zelle aus, um deine Lösung zu testen.

In [9]:
"""
BITTE, FÜHRE DIESE ZELLE AUS, UM DEINE LÖSUNG ZU TESTEN.
"""
from nose.tools import assert_equal

class AnagramTest(object):
    
    def test(self,sol):
        assert_equal(sol('go go go','gggooo'),True)
        assert_equal(sol('abc','cba'),True)
        assert_equal(sol('hi man','hi     man'),True)
        assert_equal(sol('aabbcc','aabbc'),False)
        assert_equal(sol('123','1 2'),False)
        print ("ALL TEST CASES PASSED")

# Tests durchführen
t = AnagramTest()
t.test(anagram)

ALL TEST CASES PASSED


In [10]:
t.test(anagram2)

ALL TEST CASES PASSED


# Gut gemacht!