### Welche Sprache: Deutsch oder Englisch?
- Wir bestimmen mit Hilfe eines Dictionaries die H&auml;ufigkeiten der Buchstaben eines Texts.
- Dann testen wir, ob diese H&auml;ufigkeiten n&auml;her bei denen der englischen oder deutschen Sprache sind.
- Die H&auml;ufigkeiten der Buchstaben eines deutschen Texts sind im Dictionary `letter_frequency_de`, diejenigen eines englischen Texts im Dictionary `letter_frequency_en` gespeichert.
- **Mass f&uuml;r die Distanz zweier Dicts mit Buchstabenh&auml;ufigkeiten**  
Die Distanz zwischen 2 Punkten `{'x':1,'y':3}` und `{'x':4,'y':7}` in der Ebene ist nach Pythagoras $\sqrt{(4-1)^2 + (7-3)^2}=5$.  Die Distanz zwischen 2 Punkten `{'x':1,'y':2, 'z':3 }` und `{'x':2,'y':4, 'z':5}` im Raum ist  
$\sqrt{(2-1)^2 + (4-2)^2 + (5-3)^2}=3$.  
Die Distanz zwischen 2  H&auml;ufigkeitsdictionaries $d_1$ und $d_2$ mit 
Keys `[A,...,Z]` ist entsprechend 
$$\sqrt{\Sigma_{k \in [A,\ldots,Z]}(d_1[k]-d_2[k])^2}.$$



In [None]:
# damit imports gefunden werden
# import sys
# if '/home/jovyan/work/NIA22Prog/src' not in sys.path:
#     sys.path.insert(0, '/home/jovyan/work/NIA22Prog/src') 

In [1]:
# importiere Dictionaries mit den Haeufigkeiten der Buchstaben
from data.letterfrequencies import letter_frequency_de, letter_frequency_en
F_DE = letter_frequency_de
F_EN = letter_frequency_en

LETTERS = ''.join(F_DE.keys())
SUBSTITUTIONS = {'Ä': 'AE', 'Ö': 'OE', 'Ü': 'UE'}

def replace_umlaute(text):
    for k,v in SUBSTITUTIONS.items():
        text = text.replace(k, v)
        text = text.replace(k.lower(), v.lower())
    return text

def count_letters(text):
    '''Wie oft kommt ein Buchstabe (gross oder klein)
       in text vor
      
       gibt dict der Form {'A': 2,...,'Z': 0} zurueck 
    '''
    d = {}
    for ch in text:
        k = ch.upper()
        # zaehle nur Buchstaben
        if k in LETTERS:
            d[k] = d.get(k,0) + 1
            
    return d    

def normalize(d):
    '''scale values so that they sum to 1'''
    total = sum(d.values())
    for k in d:
        d[k] = d[k]/total
    return d

def distance(d, e):
    '''returns distance between the dicts d and e'''
    res = 0
    for k in LETTERS:
        res = res + (d.get(k,0) - e.get(k,0))**2
    return res**(1/2)    

def which_lang(text):
    '''returns a pair (<language>, <conficence>)
       <language> is 'Deutsch' or 'English'
    '''
    text_ = replace_umlaute(text)
    count = count_letters(text_)
    freq = normalize(count)
    
    dist_en = distance(freq, F_EN)
    dist_de = distance(freq, F_DE)
  
    if dist_en <= dist_de:
        return '{lang}, {confidence:.2f}'\
               .format(lang = 'English', confidence = dist_de/dist_en)
    else:
        return '{lang}, {confidence:.2f}'\
               .format(lang = 'Deutsch', confidence = dist_en/dist_de)

***
Textbeispiel (Peter und der Wolf, von Sergei Prokofiev)
***

In [None]:
# copy paste some text
text1 = '''
Peter und der Wolf

Eines Morgens öffnete Peter die Gartentür und 
trat hinaus auf die große, grüne Wiese. 
Auf einem Ast eines großen Baumes saß Peters Freund, 
ein kleiner Vogel. "Wie still es ist!" zwitscherte
der Vogel voller Fröhlichkeit. 
Da kam die Ente daher gewatschelt. 
Sie freute sich, dass Peter die Gartentür offen
gelassen hatte und beschloss  in dem tiefen 
Teich auf der Wiese schwimmen zu gehen. 
Als der kleine Vogel die Ente sah, flog er hinunter, 
setzte sich neben sie ins Gras und plusterte 
sich auf. 
"Was bist du für ein Vogel, wenn du nicht fliegen kannst?" 
sagte er. Und die Ente erwiderte: 
"Was bist du für ein Vogel, wenn du nicht schwimmen kannst?" 
und stieg ins Wasser. 
So stritten sie miteinander; die Ente schwamm auf dem Teich 
und der kleine Vogel hüpfte an dem Ufer auf und ab.
'''

text2 = '''
The Story of Peter and the Wolf

Early one morning, Peter opened the gate and
walked out into the big green meadow.
On a branch of a big tree sat a little
bird, Peter's friend. "All is quiet"
chirped the bird happily.
Just then a
duck came waddling
round. She was glad that
Peter had not closed the
gate and decided to take a
nice swim in the deep
pond in the meadow.
Seeing the duck, the little bird flew down upon
on the grass, settled next to her and shrugged
his shoulders. "What kind of bird are you if
you can't fly?" said he. To this the duck replied
"What kind of bird are you if you can't swim?"
and dived into the pond.
They argued and argued, the duck swimming
in the pond and the little bird hopping along
the shore.
'''

In [None]:
which_lang(text1)

In [None]:
which_lang(text2)