In [1]:
import math
import collections

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

%matplotlib inline

In [2]:
words = [line.strip().lower() for line in open('words.txt', 'r')]

In [3]:
words = sorted({line.strip().lower() for line in open('words.txt', 'r')})

In [5]:
words[:4]

['a', 'aa', 'aal', 'aalii']

In [6]:
sorted('aaron')

['a', 'a', 'n', 'o', 'r']

In [7]:
sorted('lives') == sorted('elvis')

True

In [8]:
sorted('tobi') == sorted('dami')

False

In [9]:
'-'.join(sorted('aaron'))

'a-a-n-o-r'

In [10]:
''.join(sorted('aaron'))

'aanor'

In [17]:
def signature(word):
    return ''.join(sorted(word))

In [18]:
def findAnagram(myWord):
    wordSignature = signature(myWord)
    
    for word in words:
        if wordSignature == signature(word):
            print(word)

In [19]:
findAnagram('dictionary')

dictionary
indicatory


In [20]:
%time findAnagram('lives')

elvis
levis
slive
Wall time: 329 ms


In [22]:
wordsBySignature = collections.defaultdict(set)

for word in words:
    wordsBySignature[signature(word)].add(word)

In [23]:
wordsBySignature

defaultdict(set,
            {'a': {'a'},
             'aa': {'aa'},
             'aal': {'aal', 'ala'},
             'aaiil': {'aalii'},
             'aam': {'aam', 'ama'},
             'aain': {'aani'},
             'aaadkrrv': {'aardvark'},
             'aadflorw': {'aardwolf'},
             'aanor': {'aaron'},
             'aacinor': {'aaronic', 'nicarao', 'ocarina'},
             'aaacilnor': {'aaronical'},
             'aaeinort': {'aaronite', 'aeration'},
             'aaciinort': {'aaronitic'},
             'aaru': {'aaru', 'aura'},
             'ab': {'ab', 'ba'},
             'aab': {'aba', 'baa'},
             'aabbdeh': {'ababdeh'},
             'aaabbu': {'ababua'},
             'aabc': {'abac', 'caba'},
             'aaabc': {'abaca'},
             'aaabcet': {'abacate'},
             'aaabcy': {'abacay'},
             'aaabceint': {'abacinate'},
             'aaabciinnot': {'abacination'},
             'aabccissu': {'abaciscus'},
             'aabcist': {'abacist'},
    

In [24]:
anagramBySignature = {sig: wordset for sig, wordset in wordsBySignature.items() if len(wordset) > 1}

In [25]:
anagramBySignature

{'aal': {'aal', 'ala'},
 'aam': {'aam', 'ama'},
 'aacinor': {'aaronic', 'nicarao', 'ocarina'},
 'aaeinort': {'aaronite', 'aeration'},
 'aaru': {'aaru', 'aura'},
 'ab': {'ab', 'ba'},
 'aab': {'aba', 'baa'},
 'aabc': {'abac', 'caba'},
 'aabcort': {'abactor', 'acrobat'},
 'aabft': {'abaft', 'bafta'},
 'aabelno': {'abalone', 'balonea'},
 'aabdennor': {'abandoner', 'reabandon'},
 'aabcin': {'abanic', 'bianca'},
 'aabirs': {'abaris', 'arabis'},
 'aabs': {'abas', 'saba'},
 'aabers': {'abaser', 'abrase'},
 'aabet': {'abate', 'ateba', 'batea', 'beata'},
 'aabert': {'abater', 'artabe', 'eartab', 'trabea'},
 'abb': {'abb', 'bab'},
 'aabb': {'abba', 'baba'},
 'abbey': {'abbey', 'bebay'},
 'abby': {'abby', 'baby'},
 'aabdt': {'abdat', 'batad'},
 'abdeil': {'abdiel', 'baldie'},
 'aaabdgiilmnnoov': {'abdominovaginal', 'vaginoabdominal'},
 'aabcdeiilmnoosv': {'abdominovesical', 'vesicoabdominal'},
 'abe': {'abe', 'bae', 'bea'},
 'abde': {'abed', 'bade', 'bead'},
 'abel': {'abel', 'able', 'albe', 'bale

In [26]:
def fastAnagrams(myWord):
    sig = signature(myWord)
    
    return anagramBySignature[sig]

In [27]:
fastAnagrams('tops')

{'post', 'spot', 'stop', 'tops'}

In [28]:
def fastAnagrams(myWord):
    sig = signature(myWord)
    
    try:
        return anagramBySignature[sig]
    except KeyError:
        return set()

In [29]:
fastAnagrams('Nife')

set()

In [32]:
%time fastAnagrams('stop')

Wall time: 0 ns


{'post', 'spot', 'stop', 'tops'}

In [36]:
sorted(anagramBySignature.keys(), key=len, reverse=True)

['ccddeehlmnooooossttuyy',
 'acddeehiimmnoopprrruuy',
 'aaaaccghiillmnooooptt',
 'acghhhhilmooooopprrtt',
 'aaccddeeemnnoooprttuy',
 'aaabegghilllnoooprssy',
 'aaccghiiilmnoooopsty',
 'acceeeeeghillmnnnoop',
 'aaabeggillllnooorssy',
 'aaaccghiilmnooooptt',
 'aacccghiiilllnooopt',
 'aceeeghiiilmnnnopst',
 'aaegghmooooprssstty',
 'bceiiiilnnoorrtttvy',
 'aacccdeehiiinopprrr',
 'accghhiilloooppssyy',
 'aaccdhmmnoooorrsxy',
 'cdehiiiiinooorrstt',
 'accghhhinoooopprrt',
 'ceeeeehlmmoorrrttt',
 'addeiimmooopsstvyy',
 'aaeeeghlmmnoorrttv',
 'aadeeehhiknorrsttx',
 'aagghiilnnoprrstyy',
 'aaceghlmnooorrttyy',
 'acceghillnoooprsuy',
 'aacdeeehiillmntty',
 'aaaabchiimnoprrst',
 'aaccceeiilloorssu',
 'aceeghiiilmnnopst',
 'bceeegiiimnnorrst',
 'aacccceehhiilmmno',
 'acghhhilmoooprrty',
 'acghhhmoooopprrty',
 'acghhhnoooopprrty',
 'aciiilmnnoosstttu',
 'acdegiilmoooopsuy',
 'aacceeegillmnortt',
 'aceeehiillmnopsty',
 'aacdeehhiknoorstx',
 'adehhmnoooprrtuxy',
 'aaehlmoooprrsttyy',
 'ceehmmmooorstty

In [37]:
[anagramBySignature[sig] for sig in sorted(anagramBySignature.keys(), key=len, reverse=True)]

[{'cholecystoduodenostomy', 'duodenocholecystostomy'},
 {'hydropneumopericardium', 'pneumohydropericardium'},
 {'anatomicopathological', 'pathologicoanatomical'},
 {'chromophotolithograph', 'photochromolithograph'},
 {'duodenopancreatectomy', 'pancreatoduodenectomy'},
 {'glossolabiopharyngeal', 'labioglossopharyngeal'},
 {'anatomicophysiologic', 'physiologicoanatomic'},
 {'encephalomeningocele', 'meningoencephalocele'},
 {'glossolabiolaryngeal', 'labioglossolaryngeal'},
 {'anatomicopathologic', 'pathologicoanatomic'},
 {'clinicopathological', 'pathologicoclinical'},
 {'encephalomeningitis', 'meningoencephalitis'},
 {'esophagogastrostomy', 'gastroesophagostomy'},
 {'incontrovertibility', 'introconvertibility'},
 {'pericardiacophrenic', 'phrenicopericardiac'},
 {'physiopsychological', 'psychophysiological'},
 {'chondromyxosarcoma', 'myxochondrosarcoma'},
 {'chorioidoretinitis', 'retinochorioiditis'},
 {'chronophotographic', 'photochronographic'},
 {'electrothermometer', 'thermoelectromet

In [39]:
sorted(anagramBySignature.values(), key=len, reverse=True)

[{'angor',
  'argon',
  'goran',
  'grano',
  'groan',
  'nagor',
  'orang',
  'organ',
  'rogan',
  'ronga'},
 {'elaps',
  'lapse',
  'lepas',
  'pales',
  'salep',
  'saple',
  'sepal',
  'slape',
  'spale',
  'speal'},
 {'armet',
  'mater',
  'merat',
  'metra',
  'ramet',
  'tamer',
  'terma',
  'trame',
  'trema'},
 {'asteer',
  'easter',
  'eastre',
  'reseat',
  'saeter',
  'seater',
  'staree',
  'teaser',
  'teresa'},
 {'caret',
  'carte',
  'cater',
  'crate',
  'creat',
  'creta',
  'react',
  'recta',
  'trace'},
 {'ester',
  'estre',
  'reest',
  'reset',
  'steer',
  'stere',
  'stree',
  'terse',
  'tsere'},
 {'ante', 'aten', 'etna', 'nate', 'neat', 'taen', 'tane', 'tean'},
 {'arist', 'astir', 'sitar', 'stair', 'stria', 'tarsi', 'tisar', 'trias'},
 {'laster',
  'lastre',
  'rastle',
  'relast',
  'resalt',
  'salter',
  'slater',
  'stelar'},
 {'leapt', 'palet', 'patel', 'pelta', 'petal', 'plate', 'pleat', 'tepal'},
 {'abel', 'able', 'albe', 'bale', 'beal', 'bela', 'blae

In [41]:
for sig in sorted(anagramBySignature.keys(), key=len, reverse=True):
    print(anagramBySignature[sig])

{'cholecystoduodenostomy', 'duodenocholecystostomy'}
{'hydropneumopericardium', 'pneumohydropericardium'}
{'pathologicoanatomical', 'anatomicopathological'}
{'photochromolithograph', 'chromophotolithograph'}
{'pancreatoduodenectomy', 'duodenopancreatectomy'}
{'labioglossopharyngeal', 'glossolabiopharyngeal'}
{'anatomicophysiologic', 'physiologicoanatomic'}
{'meningoencephalocele', 'encephalomeningocele'}
{'glossolabiolaryngeal', 'labioglossolaryngeal'}
{'pathologicoanatomic', 'anatomicopathologic'}
{'clinicopathological', 'pathologicoclinical'}
{'meningoencephalitis', 'encephalomeningitis'}
{'gastroesophagostomy', 'esophagogastrostomy'}
{'incontrovertibility', 'introconvertibility'}
{'pericardiacophrenic', 'phrenicopericardiac'}
{'physiopsychological', 'psychophysiological'}
{'chondromyxosarcoma', 'myxochondrosarcoma'}
{'chorioidoretinitis', 'retinochorioiditis'}
{'chronophotographic', 'photochronographic'}
{'electrothermometer', 'thermoelectrometer'}
{'vasoepididymostomy', 'epididymov

{'denudative', 'undeviated'}
{'pentaploid', 'deoppilant'}
{'positioned', 'deposition'}
{'pterideous', 'depositure'}
{'precedable', 'deprecable'}
{'depressant', 'partedness'}
{'portunidae', 'depuration'}
{'registered', 'deregister'}
{'derivation', 'ordinative'}
{'derogation', 'trogonidae'}
{'shieldable', 'deshabille'}
{'phymatodes', 'desmopathy'}
{'priodontes', 'desorption'}
{'despairing', 'spinigrade'}
{'doctrinate', 'detraction', 'tetarconid'}
{'dextraural', 'extradural'}
{'diagenetic', 'digenetica'}
{'inanimated', 'diamantine'}
{'dystrophia', 'diastrophy'}
{'mastoidale', 'diatomales', 'mastoideal'}
{'diatropism', 'prismatoid'}
{'endopathic', 'dictaphone'}
{'dictionary', 'indicatory'}
{'digitalein', 'diligentia'}
{'digitation', 'goniatitid'}
{'digredient', 'reddingite'}
{'dilacerate', 'lacertidae'}
{'rediminish', 'diminisher'}
{'tripodical', 'dioptrical'}
{'dioscorein', 'dioscorine'}
{'unimparted', 'diparentum'}
{'spadiceous', 'dipsaceous'}
{'discounter', 'rediscount'}
{'discoverer', 

{'despoiler', 'leprosied'}
{'timidness', 'destinism'}
{'tetraodon', 'detonator'}
{'retracted', 'detracter'}
{'tinderous', 'unstoried', 'detrusion'}
{'detrusive', 'servitude', 'divesture'}
{'redevelop', 'developer'}
{'fervidity', 'devitrify'}
{'diabolist', 'idioblast'}
{'icteridae', 'diaeretic'}
{'lacertoid', 'dialector'}
{'trailside', 'dialister'}
{'llandeilo', 'diallelon'}
{'sigmoidal', 'dialogism'}
{'diaspinae', 'diapensia'}
{'diarchial', 'rachidial'}
{'diatomean', 'mantoidea'}
{'erichtoid', 'dichroite', 'theriodic'}
{'digitonin', 'indigotin'}
{'myrianida', 'dimyarian'}
{'gideonite', 'diogenite'}
{'diosmotic', 'sodomitic'}
{'pediatric', 'patricide', 'dipicrate'}
{'dipleural', 'preludial'}
{'lepidotic', 'diploetic'}
{'perdition', 'tropidine', 'direption'}
{'ridgelike', 'dirgelike'}
{'disattire', 'distraite'}
{'discerner', 'rescinder'}
{'discreate', 'sericated'}
{'rediscuss', 'discusser'}
{'hinderest', 'disherent', 'tenderish'}
{'dislocate', 'lactoside'}
{'truandise', 'sturnidae', 'dis

{'altamira', 'matralia'}
{'striatal', 'altarist'}
{'tarletan', 'alterant'}
{'latitude', 'altitude'}
{'selictar', 'altrices'}
{'traulism', 'ultraism', 'altruism', 'muralist'}
{'ultraist', 'altruist'}
{'alurgite', 'ligature'}
{'american', 'amacrine', 'cinerama', 'camerina'}
{'amaethon', 'thomaean'}
{'amanitin', 'maintain'}
{'ambivert', 'verbatim'}
{'ambrette', 'tambreet'}
{'ambrosia', 'saboraim'}
{'barosmin', 'sabromin', 'ambrosin'}
{'nameable', 'amenable'}
{'ametrope', 'metapore'}
{'maharani', 'amiranha'}
{'amitosis', 'omasitis'}
{'melamine', 'ammeline'}
{'amnestic', 'semantic'}
{'mication', 'amniotic'}
{'microtia', 'amoritic'}
{'amorphic', 'amphoric'}
{'atomizer', 'amortize'}
{'pimelate', 'ampelite'}
{'pearmain', 'amperian', 'paramine'}
{'palamite', 'ampliate'}
{'myelonal', 'amylenol'}
{'anacusis', 'ascanius'}
{'anadenia', 'danainae'}
{'anticlea', 'laitance', 'analcite'}
{'analogic', 'calinago'}
{'anamirta', 'araminta'}
{'anandria', 'andriana'}
{'anapsida', 'anaspida'}
{'anarchic', 'ch

{'overkeen', 'overknee'}
{'overlast', 'oversalt'}
{'valerone', 'overlean'}
{'overveil', 'overlive'}
{'overname', 'overmean'}
{'renovate', 'overneat'}
{'passover', 'overpass'}
{'pickover', 'overpick'}
{'overrate', 'overtare'}
{'oversale', 'overseal'}
{'veronese', 'overseen'}
{'overslip', 'slipover'}
{'overstir', 'servitor'}
{'overtime', 'remotive'}
{'trouvere', 'overtrue', 'overture'}
{'overturn', 'turnover'}
{'overwalk', 'walkover'}
{'paeanism', 'spanemia'}
{'shippage', 'pageship'}
{'perugian', 'pagurine'}
{'spinales', 'painless'}
{'palliata', 'palatial'}
{'talapoin', 'palation'}
{'paleness', 'paneless'}
{'salpidae', 'palisade'}
{'platelet', 'pallette'}
{'template', 'palmette'}
{'platerer', 'palterer'}
{'paludina', 'paludian'}
{'panatela', 'plataean'}
{'pedimana', 'pandemia'}
{'repandly', 'panderly'}
{'penalist', 'plastein', 'pantelis', 'panelist'}
{'pannicle', 'pinnacle'}
{'sapphire', 'papisher'}
{'sparidae', 'paradise'}
{'zaparoan', 'parazoan'}
{'seraphic', 'parchesi'}
{'preadorn', '

{'lighten', 'enlight'}
{'meconin', 'ennomic'}
{'enocyte', 'neocyte'}
{'enrough', 'roughen'}
{'ensaint', 'stanine'}
{'ensmall', 'smallen'}
{'enstool', 'olonets'}
{'tornese', 'enstore', 'estrone', 'storeen'}
{'sestina', 'entasis', 'sestian'}
{'entelam', 'leetman'}
{'terrene', 'enterer'}
{'triaene', 'enteria', 'trainee'}
{'enteron', 'tenoner'}
{'lethean', 'entheal'}
{'unsheet', 'enthuse'}
{'nepotic', 'pentoic', 'entopic'}
{'tonetic', 'entotic'}
{'entozoa', 'ozonate'}
{'latiner', 'entrail', 'ratline', 'reliant', 'latrine', 'retinal', 'trenail'}
{'entrain', 'teriann'}
{'tarente', 'entreat', 'tetrane', 'ratteen', 'ternate'}
{'trusten', 'entrust', 'stunter'}
{'veinous', 'niveous', 'envious'}
{'unowned', 'enwound'}
{'enwrite', 'retwine'}
{'neogaea', 'eogaean'}
{'preacid', 'epacrid', 'peracid'}
{'serapic', 'epacris', 'scrapie'}
{'epactal', 'placate'}
{'preachy', 'eparchy'}
{'upshore', 'ephorus', 'orpheus'}
{'epibole', 'epilobe'}
{'epigram', 'primage'}
{'epitela', 'epilate', 'pileate'}
{'epiotic

{'whirret', 'wherrit', 'writher'}
{'whirtle', 'whilter'}
{'wriggle', 'wiggler'}
{'yahwism', 'wishmay'}
{'wrytail', 'wraitly'}
{'abanic', 'bianca'}
{'arabis', 'abaris'}
{'abrase', 'abaser'}
{'trabea', 'eartab', 'artabe', 'abater'}
{'abdiel', 'baldie'}
{'baiera', 'aberia', 'baeria'}
{'bardie', 'abider'}
{'labial', 'abilla'}
{'abkhas', 'kasbah'}
{'arable', 'arbela', 'ablare'}
{'ablaut', 'tabula'}
{'ablest', 'stable', 'tables'}
{'mabolo', 'abloom'}
{'belaud', 'ablude'}
{'aborad', 'aboard', 'abroad'}
{'gaboon', 'abongo'}
{'arbalo', 'aboral'}
{'basuto', 'abouts'}
{'absent', 'basten'}
{'absohm', 'absmho'}
{'abulic', 'baculi'}
{'acedia', 'adicea', 'acadie'}
{'maraca', 'camara', 'acamar'}
{'tanach', 'acanth', 'anchat'}
{'carida', 'acarid', 'cardia'}
{'acetic', 'accite'}
{'accoil', 'calico'}
{'acerin', 'cearin'}
{'enatic', 'actine', 'acetin'}
{'colate', 'acetol', 'locate'}
{'acetum', 'tecuma'}
{'achate', 'chaeta'}
{'teache', 'hecate', 'achete', 'thecae'}
{'cahill', 'chilla', 'achill'}
{'achras',

{'lemony', 'myelon'}
{'lemosi', 'moiles', 'limose'}
{'lendee', 'needle'}
{'relend', 'lender'}
{'yetlin', 'lenity'}
{'orlean', 'loaner', 'lenora', 'reloan'}
{'lintel', 'lentil'}
{'ovenly', 'lenvoy'}
{'lepton', 'pentol'}
{'lesche', 'sleech'}
{'leslie', 'sellie'}
{'selter', 'streel', 'lester'}
{'offlet', 'letoff'}
{'letten', 'nettle'}
{'valent', 'levant'}
{'levier', 'relive', 'revile', 'reveil', 'veiler'}
{'libber', 'ribble'}
{'licker', 'rickle', 'relick'}
{'lidder', 'riddle', 'riddel'}
{'lienal', 'lineal'}
{'lierne', 'reline'}
{'lierre', 'relier'}
{'lining', 'lignin'}
{'reguli', 'ligure'}
{'limbat', 'timbal'}
{'menial', 'limean', 'melian', 'maline'}
{'limner', 'milner', 'merlin'}
{'limosa', 'somali'}
{'limper', 'prelim', 'rimple'}
{'limpsy', 'simply'}
{'rindle', 'linder'}
{'linger', 'ringle'}
{'linker', 'relink'}
{'linnet', 'linten'}
{'linsey', 'lysine'}
{'niello', 'lionel'}
{'liplet', 'pillet'}
{'lipoma', 'ploima', 'pimola'}
{'nipple', 'lippen'}
{'lipper', 'ripple'}
{'pilpai', 'lippia'}

{'debit', 'bidet'}
{'brief', 'bifer', 'fiber'}
{'libby', 'bilby'}
{'bilge', 'gibel'}
{'ibota', 'biota'}
{'birle', 'liber'}
{'briny', 'birny'}
{'inorb', 'robin', 'biron'}
{'ribes', 'birse'}
{'birth', 'brith'}
{'bisti', 'bitis'}
{'biter', 'tribe'}
{'zibet', 'bizet'}
{'blair', 'libra', 'brail'}
{'bleak', 'blake', 'kabel'}
{'sable', 'blase'}
{'limby', 'blimy'}
{'blood', 'boldo'}
{'roble', 'blore'}
{'blowy', 'bowly'}
{'ruble', 'burel', 'brule', 'bluer'}
{'bulse', 'blues'}
{'bobac', 'cabob'}
{'boned', 'boden'}
{'orbed', 'boder'}
{'bodhi', 'dhobi'}
{'boled', 'lobed', 'bodle'}
{'bogan', 'goban'}
{'globe', 'bogle'}
{'bogue', 'bouge'}
{'gumbo', 'bogum'}
{'rohob', 'bohor'}
{'boner', 'borne'}
{'ebony', 'boney'}
{'bosun', 'bonus'}
{'booly', 'looby'}
{'boort', 'robot'}
{'boost', 'boots'}
{'borer', 'rerob', 'rober'}
{'cribo', 'boric', 'orbic'}
{'broon', 'boron'}
{'brose', 'boser', 'sober'}
{'bourn', 'bruno'}
{'bousy', 'byous'}
{'woibe', 'bowie'}
{'rebox', 'boxer'}
{'bragi', 'girba'}
{'brash', 'shrab'

{'withy', 'whity'}
{'winze', 'wizen'}
{'wirer', 'wrier'}
{'wrive', 'wiver'}
{'zemmi', 'zimme'}
{'zinco', 'zonic'}
{'aura', 'aaru'}
{'caba', 'abac'}
{'saba', 'abas'}
{'abba', 'baba'}
{'abby', 'baby'}
{'bade', 'abed', 'bead'}
{'bela', 'able', 'blae', 'albe', 'bale', 'abel', 'beal'}
{'bate', 'beat', 'abet', 'beta'}
{'abir', 'bari', 'rabi'}
{'yalb', 'blay', 'ably'}
{'isba', 'bais', 'bias', 'absi'}
{'tuba', 'tabu', 'abut'}
{'caca', 'acca'}
{'care', 'crea', 'acre', 'acer', 'race'}
{'ache', 'haec', 'each'}
{'chay', 'achy'}
{'caid', 'acid', 'cadi'}
{'saic', 'asci', 'acis'}
{'lace', 'alec', 'acle'}
{'came', 'mace', 'acme'}
{'nace', 'cane', 'acne'}
{'cora', 'caro', 'orca', 'acor'}
{'cast', 'acts', 'scat'}
{'acyl', 'lacy', 'clay'}
{'dada', 'adda', 'adad'}
{'adam', 'dama'}
{'adar', 'raad', 'rada', 'arad'}
{'adat', 'data'}
{'duad', 'dadu', 'addu', 'daud'}
{'dyad', 'addy'}
{'tead', 'adet', 'tade', 'date', 'teda'}
{'adib', 'ibad'}
{'dian', 'andi', 'naid', 'dain', 'adin', 'dani'}
{'adit', 'dita'}
{'am