## imports

In [27]:
import suggests
import string
from functools import lru_cache
import pandas as pd

## functions

In [4]:


def lev_dist(a, b):
    '''
    This function will calculate the levenshtein distance between two input
    strings a and b
    
    params:
        a (String) : The first string you want to compare
        b (String) : The second string you want to compare
        
    returns:
        This function will return the distnace between string a and b.
        
    example:
        a = 'stamp'
        b = 'stomp'
        lev_dist(a,b)
        >> 1.0
    '''
    
    @lru_cache(None)  # for memorization
    def min_dist(s1, s2):

        if s1 == len(a) or s2 == len(b):
            return len(a) - s1 + len(b) - s2

        # no change required
        if a[s1] == b[s2]:
            return min_dist(s1 + 1, s2 + 1)

        return 1 + min(
            min_dist(s1, s2 + 1),      # insert character
            min_dist(s1 + 1, s2),      # delete character
            min_dist(s1 + 1, s2 + 1),  # replace character
        )

    return min_dist(0, 0)

#source: https://towardsdatascience.com/text-similarity-w-levenshtein-distance-in-python-2f7478986e75

In [18]:
def lev_dist_list(term):
    item = term.split(' ')
    dist = []
    for word in item:
        dist.append(lev_dist('baerbock',word))
    if any(ele < 5 for ele in dist):
        return term
    else:
        return None

## testing

In [2]:
gd = suggests.get_suggests('baerbock', source='google')

2022-04-29 12:04:18,300 | 15354 | INFO | logger | google | baerbock 
2022-04-29 12:04:19,106 | 15354 | INFO | logger | google | baerbock 
2022-04-29 12:04:19,992 | 15354 | INFO | logger | google | baerbock 


In [3]:
gd['suggests']

['baerbock außenministerin',
 'baerbock abgenommen',
 'baerbock assange',
 'baerbock amt',
 'baerbock auto',
 'baerbock außenpolitik',
 'baerbock ard',
 'baerbock an der front',
 'baerbock ansprache',
 'baerbock afghanistan',
 'baerbock beliebtheit',
 'baerbock buch',
 'baerbock bademantel',
 'baerbock bilder',
 'baerbock bei putin',
 'baerbock besuch ukraine',
 'baerbock biografie',
 'baerbock besuch russland',
 'baerbock bild',
 'baerbock beliebt',
 'baerbock china',
 'baerbock cv',
 'baerbock cnn',
 'baerbock cairo',
 'baerbock cartoon',
 'baerbock chemnitz',
 'baerbock clinton',
 'baerbock cdu',
 'baerbock che guevara',
 'baerbock comic']

In [6]:
g['suggests']

['baerbock außenministerin',
 'baerbock abgenommen',
 'baerbock assange',
 'baerbock amt',
 'baerbock auto',
 'baerbock außenpolitik',
 'baerbock ard',
 'baerbock an der front',
 'baerbock ansprache',
 'baerbock afghanistan',
 'baerbock beliebtheit',
 'baerbock buch',
 'baerbock bademantel',
 'baerbock bilder',
 'baerbock bei putin',
 'baerbock besuch ukraine',
 'baerbock biografie',
 'baerbock besuch russland',
 'baerbock bild',
 'baerbock beliebt',
 'baerbock china',
 'baerbock cv',
 'baerbock cnn',
 'baerbock cairo',
 'baerbock cartoon',
 'baerbock chemnitz',
 'baerbock clinton',
 'baerbock cdu',
 'baerbock che guevara',
 'baerbock comic']

In [4]:
bd = suggests.get_suggests('baerbock', source='bing')

2022-04-29 12:04:45,256 | 15354 | INFO | logger | bing | baerbock 
2022-04-29 12:04:46,599 | 15354 | INFO | logger | bing | baerbock 
2022-04-29 12:04:48,071 | 15354 | INFO | logger | bing | baerbock 


In [5]:
bd['suggests']

['baerbock annalena',
 'baerbock alter',
 'baerbock aktuell',
 'baerbock ausbildung',
 'baerbock annalena ehemann',
 'baerbock annalena privat',
 'baerbock afghanistan',
 'baerbock anne will',
 'baerbock buch',
 'baerbock bilder',
 'baerbock bosnien',
 'baerbock bikini',
 'baerbock beine',
 'baerbock blinken',
 'baerbock balkan',
 'baerbock beruf',
 'baerbock china',
 'baerbock cv',
 'baerbock cnn',
 'baerbock corona bonus',
 'baerbock corona',
 'baerbock cartoon',
 'baerbock chancen',
 'baerbock china politik']

In [6]:
b['suggests']

['baerbock annalena',
 'baerbock alter',
 'baerbock aktuell',
 'baerbock ausbildung',
 'baerbock annalena ehemann',
 'baerbock annalena privat',
 'baerbock afghanistan',
 'baerbock anne will',
 'baerbock buch',
 'baerbock bilder',
 'baerbock bikini',
 'baerbock bei putin',
 'baerbock beine',
 'baerbock blinken',
 'baerbock balkan',
 'baerbock beruf',
 'baerbock china',
 'baerbock cv',
 'baerbock corona bonus',
 'baerbock corona',
 'baerbock cartoon',
 'baerbock chancen',
 'baerbock comic',
 'baerbock corona hilfe',
 'baerbock droht russland',
 'baerbock dumme zitate',
 'baerbock dienstwagen',
 'baerbock droht',
 'baerbock droht putin',
 'baerbock doktorarbeit',
 'baerbock dissertation',
 'baerbock donbass',
 'baerbock englisch',
 'baerbock ehemann',
 'baerbock english',
 'baerbock eltern',
 'baerbock englisch video',
 'baerbock email',
 'baerbock englisch youtube',
 'baerbock eiffelturm',
 'baerbock familie',
 'baerbock facebook',
 'baerbock feet',
 'baerbock fotos',
 'baerbock fauxpas

In [23]:
tree = suggests.get_suggests_tree('baerbock', source='google', max_depth=1, save_to='test_tree.json')

2022-04-29 12:49:21,998 | 25517 | INFO | logger | google | baerbock 
2022-04-29 12:49:23,389 | 25517 | INFO | logger | google | baerbock 
2022-04-29 12:49:24,460 | 25517 | INFO | logger | google | baerbock 
2022-04-29 12:49:25,768 | 25517 | INFO | logger | google | baerbock außenministerin 
2022-04-29 12:49:26,942 | 25517 | INFO | logger | google | baerbock außenministerin 
2022-04-29 12:49:28,095 | 25517 | INFO | logger | google | baerbock außenministerin 
2022-04-29 12:49:29,524 | 25517 | INFO | logger | google | baerbock abgenommen 
2022-04-29 12:49:30,880 | 25517 | INFO | logger | google | baerbock abgenommen 
2022-04-29 12:49:31,960 | 25517 | INFO | logger | google | baerbock abgenommen 
2022-04-29 12:49:33,117 | 25517 | INFO | logger | google | baerbock assange 
2022-04-29 12:49:34,278 | 25517 | INFO | logger | google | baerbock assange 
2022-04-29 12:49:35,337 | 25517 | INFO | logger | google | baerbock assange 
2022-04-29 12:49:36,547 | 25517 | INFO | logger | google | baerbock

In [None]:
# export as csv
df = pd.DataFrame(tree)
df.to_csv('test_tree.csv', sep=';')

NameError: name 'tree' is not defined

## trimming with levenshtein distance

In [9]:
b = ['baerbock annalena',
 'baerbock alter',
 'baerbock aktuell',
 'baerbock ausbildung',
 'baerbock annalena ehemann',
 'baerbock annalena privat',
 'baerbock afghanistan',
 'baerbock anne will',
 'baerbock buch',
 'baerbock bilder',
 'baerbock bikini',
 'baerbock bei putin',
 'baerbock beine',
 'baerbock blinken',
 'baerbock balkan',
 'baerbock beruf',
 'baerbock china',
 'baerbock cv',
 'baerbock corona bonus',
 'baerbock corona',
 'baerbock cartoon',
 'baerbock chancen',
 'baerbock comic',
 'baerbock corona hilfe',
 'baerbock droht russland',
 'baerbock dumme zitate',
 'baerbock dienstwagen',
 'baerbock droht',
 'baerbock droht putin',
 'baerbock doktorarbeit',
 'baerbock dissertation',
 'baerbock donbass',
 'baerbock englisch',
 'baerbock ehemann',
 'baerbock english',
 'baerbock eltern',
 'baerbock englisch video',
 'baerbock email',
 'baerbock englisch youtube',
 'baerbock eiffelturm',
 'baerbock familie',
 'baerbock facebook',
 'baerbock feet',
 'baerbock fotos',
 'baerbock fauxpas',
 'baerbock frisur',
 'baerbock pressefreiheit',
 'baerbock fehler',
 'baerbock gruene',
 'baerbock greenpeace',
 'baerbock gehalt',
 'baerbock g7',
 'baerbock germany',
 'baerbock gestern',
 'baerbock gewicht',
 'baerbock gegen putin',
 'baerbock habeck',
 'baerbock helm',
 'baerbock heute',
 'baerbock haustiere',
 'baerbock homepage',
 'baerbock hunde',
 'baerbock herkunft',
 'baerbock high heels',
 'baerbock israel',
 'baerbock in moskau',
 'baerbock in polen',
 'baerbock in russland',
 'baerbock in paris',
 'baerbock interview',
 'baerbock impfpflicht',
 'baerbock in israel',
 'baerbock jung',
 'baerbock jetzt',
 'baerbock junge dame',
 'baerbock jeans',
 'baerbock juristin',
 'baerbock jugendfoto',
 'baerbock jordanien',
 'baerbock junge welt',
 'baerbock kobold',
 'baerbock kinder',
 'baerbock kritik',
 'baerbock kosovo',
 'baerbock kontakt',
 'baerbock kleider',
 'baerbock kleidung',
 'baerbock kiew',
 'baerbock lebenslauf',
 'baerbock lawrow',
 'baerbock live',
 'baerbock lustig',
 'baerbock lindner',
 'baerbock laschet',
 'baerbock lanz',
 'baerbock laschet scholz',
 'baerbock mann',
 'baerbock moskau',
 'baerbock marokko',
 'baerbock merz',
 'baerbock morgan',
 'baerbock mode',
 'baerbock meme',
 'baerbock mantel moskau',
 'baerbock n wort',
 'baerbock nicht neutral',
 'baerbock nord stream 2',
 'baerbock n-wort',
 'baerbock n word',
 'baerbock n',
 'baerbock nato',
 'baerbock news heute',
 'baerbock ostkokaine',
 'baerbock oder habeck',
 'baerbock olympia',
 'baerbock outfit',
 'baerbock oderbruch',
 'baerbock oberweite',
 'baerbock oberstaufen',
 'baerbock ohrringe',
 'baerbock paris',
 'baerbock plagiat',
 'baerbock polen',
 'baerbock putin',
 'baerbock privat',
 'baerbock pressefreiheit',
 'baerbock peinlich',
 'baerbock pressekonferenz',
 'baerbock quellen',
 'baerbock iq',
 'baerbock eqs',
 'baerbock greenpeace',
 'baerbock gehalt',
 'baerbock annalena',
 'baerbock china',
 'baerbock gestern',
 'baerbock russland',
 'baerbock rede',
 'baerbock rede und',
 'baerbock rede englisch',
 'baerbock rede uno',
 'baerbock rede heute',
 'baerbock rede russland',
 'baerbock rede bundestag',
 'baerbock swift',
 'baerbock serbien',
 'baerbock studium',
 'baerbock skandale',
 'baerbock strache',
 'baerbock sprachfehler',
 'baerbock song',
 'baerbock spricht englisch',
 'baerbock twitter',
 'baerbock trampolin',
 'baerbock termine',
 'baerbock taz',
 'baerbock trampolinspringen',
 'baerbock tagesschau',
 'baerbock trampolin video',
 'baerbock triell',
 'baerbock un rede',
 'baerbock ukraine',
 'baerbock usa',
 'baerbock uno',
 'baerbock und',
 'baerbock und habeck',
 'baerbock ukraine-krise',
 'baerbock umfragewerte',
 'baerbock vita',
 'baerbock versprecher',
 'baerbock video',
 'baerbock versagt',
 'baerbock verspricht sich',
 'baerbock vor der uno',
 'baerbock vor un',
 'baerbock vereidigung',
 'baerbock wikipedia',
 'baerbock witwenrente',
 'baerbock witze',
 'baerbock warschau',
 'baerbock welt',
 'baerbock witwenrente abschaffen',
 'baerbock wohnort',
 'baerbock wahlkreis',
 'xbox',
 'xfinity',
 'xpo',
 'xrp',
 'x22',
 'xcel',
 'xom',
 'xmas',
 'baerbock youtube',
 'baerbock yad vashem',
 'baerbock young global leaders',
 'baerbock young leader',
 'annalena baerbock youtube',
 'baerbock wang yi',
 'annalena baerbock englisch youtube',
 'youtube baerbock englisch',
 'baerbock zitate',
 'baerbock zum russischen angriff',
 'baerbock zug',
 'baerbock zu ukraine',
 'baerbock zdf',
 'baerbock zur witwenrente',
 'baerbock zeit',
 'baerbock zustimmung']

In [12]:
len(b)

208

In [19]:
list(map(lev_dist_list, b))

['baerbock annalena',
 'baerbock alter',
 'baerbock aktuell',
 'baerbock ausbildung',
 'baerbock annalena ehemann',
 'baerbock annalena privat',
 'baerbock afghanistan',
 'baerbock anne will',
 'baerbock buch',
 'baerbock bilder',
 'baerbock bikini',
 'baerbock bei putin',
 'baerbock beine',
 'baerbock blinken',
 'baerbock balkan',
 'baerbock beruf',
 'baerbock china',
 'baerbock cv',
 'baerbock corona bonus',
 'baerbock corona',
 'baerbock cartoon',
 'baerbock chancen',
 'baerbock comic',
 'baerbock corona hilfe',
 'baerbock droht russland',
 'baerbock dumme zitate',
 'baerbock dienstwagen',
 'baerbock droht',
 'baerbock droht putin',
 'baerbock doktorarbeit',
 'baerbock dissertation',
 'baerbock donbass',
 'baerbock englisch',
 'baerbock ehemann',
 'baerbock english',
 'baerbock eltern',
 'baerbock englisch video',
 'baerbock email',
 'baerbock englisch youtube',
 'baerbock eiffelturm',
 'baerbock familie',
 'baerbock facebook',
 'baerbock feet',
 'baerbock fotos',
 'baerbock fauxpas

In [15]:
b

['baerbock annalena',
 'baerbock alter',
 'baerbock aktuell',
 'baerbock ausbildung',
 'baerbock annalena ehemann',
 'baerbock annalena privat',
 'baerbock afghanistan',
 'baerbock anne will',
 'baerbock buch',
 'baerbock bilder',
 'baerbock bikini',
 'baerbock bei putin',
 'baerbock beine',
 'baerbock blinken',
 'baerbock balkan',
 'baerbock beruf',
 'baerbock china',
 'baerbock cv',
 'baerbock corona bonus',
 'baerbock corona',
 'baerbock cartoon',
 'baerbock chancen',
 'baerbock comic',
 'baerbock corona hilfe',
 'baerbock droht russland',
 'baerbock dumme zitate',
 'baerbock dienstwagen',
 'baerbock droht',
 'baerbock droht putin',
 'baerbock doktorarbeit',
 'baerbock dissertation',
 'baerbock donbass',
 'baerbock englisch',
 'baerbock ehemann',
 'baerbock english',
 'baerbock eltern',
 'baerbock englisch video',
 'baerbock email',
 'baerbock englisch youtube',
 'baerbock eiffelturm',
 'baerbock familie',
 'baerbock facebook',
 'baerbock feet',
 'baerbock fotos',
 'baerbock fauxpas