# Espressioni regolari

Da [re](https://docs.python.org/3/library/re.html) e [Regular Expression HOWTO](https://docs.python.org/3.8/howto/regex.html) — per sperimentare [pythex](https://pythex.org).

In [29]:
import re

r = re.compile(r'(.*)@.*\.([^.]*pec[^.]*)(\..+)?\.(.*)$')
r.match('massimo@dominio.miapec.it').groups()

('massimo', 'miapec', None, 'it')

In [30]:
with open('emails.txt') as inf:
    for line in inf:
        m = r.match(line)
        if m:
            print(line.strip(), m.groups())

cm3lazio@pec.lapostapec.it" ('cm3lazio', 'lapostapec', None, 'it"')
demografici@pec.cassinadepecchi.gov.it" ('demografici', 'cassinadepecchi', '.gov', 'it"')
aire@comune.pec.como.it" ('aire', 'pec', '.como', 'it"')
ufficioprotocollo@comunefarainsabina.pecpa.it" ('ufficioprotocollo', 'pecpa', None, 'it"')
amministrazionegerocarne@pec.personalpec.eu" ('amministrazionegerocarne', 'personalpec', None, 'eu"')
pec@comunemeleti.casellapec.info" ('pec', 'casellapec', None, 'info"')
comunemisterbianco@pec.pec-pa.it" ('comunemisterbianco', 'pec-pa', None, 'it"')
uffprotocollo@comunemontopolidisabina.pecpa.it" ('uffprotocollo', 'pecpa', None, 'it"')
protocollo@palazzolo.viapec.it" ('protocollo', 'viapec', None, 'it"')
protocollo@pec.comune.pecetto.al.it" ('protocollo', 'pecetto', '.al', 'it"')
info@pec.comune.pecetto.to.it" ('info', 'pecetto', '.to', 'it"')
comune@comune.santaluciadelmela.pec.telecompost.it" ('comune', 'pec', '.telecompost', 'it"')
affarigenerali@comune.teramo.pecpa.it" ('affarig

In [51]:
r = re.compile(r'.*\.([^.]+)"$')
tld = []
with open('emails.txt') as inf:
    for line in inf:
        m = r.match(line)
        if m: tld.append(m.group(1))

tld[:10]

['net', 'it', 'it', 'it', 'it', 'it', 'it', 'it', 'it', 'it']

In [55]:
tld2num = dict()

for d in tld:
    try:
        tld2num[d] += 1
    except KeyError:
        tld2num[d] = 0
        
tld2num

{'net': 211,
 'it': 7468,
 'IT': 30,
 'eu': 39,
 'com': 16,
 'org': 17,
 'at': 0,
 'info': 7,
 'biz': 1,
 'NET': 0}

# Collezioni evolute

Da [collections](https://docs.python.org/3/library/collections.html)

In [56]:
from collections import defaultdict

tld2num = defaultdict(lambda: 0)

for d in tld:
    tld2num[d] += 1

tld2num

defaultdict(<function __main__.<lambda>()>,
            {'net': 212,
             'it': 7469,
             'IT': 31,
             'eu': 40,
             'com': 17,
             'org': 18,
             'at': 1,
             'info': 8,
             'biz': 2,
             'NET': 1})

In [64]:
sig2words = defaultdict(list)

with open('zingarelli.txt') as inf:
    for line in inf:
        word = line.strip()
        sig = ''.join(sorted(word))
        sig2words[sig].append(word)
        
for sig, words in sig2words.items():
    if len(words) > 20: print(words)

['ANTIMERO', 'ARTIMONE', 'ENORMITA', 'ENTRIAMO', 'MARONITE', 'MATERINO', 'MATRONEI', 'MERITANO', 'MINARETO', 'MINATORE', 'MINORATE', 'MONETARI', 'MONTERAI', 'NORMIATE', 'RIMENATO', 'RINOMATE', 'RITEMANO', 'TERNIAMO', 'TIMONARE', 'TIMONERA', 'TRAMENIO']
['APRIRESTE', 'ESTIRPARE', 'ESTIRPERA', 'PARERESTI', 'PRESTARIE', 'PRESTERAI', 'RAPERESTI', 'RAPIRESTE', 'RESPIRATE', 'RIPESTARE', 'RIPESTERA', 'RIPRETESA', 'RISAPRETE', 'RISPERATE', 'SPARIRETE', 'SPETRERAI', 'SPIETRARE', 'SPIETRERA', 'SPRETERAI', 'STERPERAI', 'STREPERAI']
['APRISTE', 'ARPISTE', 'ESPATRI', 'ESTIRPA', 'PARESTI', 'PIASTRE', 'PRATESI', 'PRESTAI', 'RAPISTE', 'RIPESTA', 'SERPITA', 'SPARITE', 'SPERATI', 'SPETRAI', 'SPIETRA', 'SPIRATE', 'SPRETAI', 'STERPAI', 'STIPARE', 'STIPERA', 'STRAPIE']
['CANTERI', 'CARENTI', 'CARTINE', 'CENTRAI', 'CERANTI', 'CERNITA', 'CERTANI', 'CETRINA', 'CIANTRE', 'CINTARE', 'CINTERA', 'CITERNA', 'CREANTI', 'CRENATI', 'CRETINA', 'INCERTA', 'NACRITE', 'NARTECI', 'NATRICE', 'NECTRIA', 'RECANTI', 'RECINTA'

In [66]:
from collections import Counter

tld2num = Counter(tld)
tld2num

Counter({'net': 212,
         'it': 7469,
         'IT': 31,
         'eu': 40,
         'com': 17,
         'org': 18,
         'at': 1,
         'info': 8,
         'biz': 2,
         'NET': 1})

In [68]:
from collections import namedtuple

User = namedtuple('User', 'first, last, email')

u = User('Mario', 'Rossi', 'mariorossi@gmail.com')
u.first

'Mario'

# Formati di dati comuni

Da [csv](https://docs.python.org/3/library/csv.html) e [json](https://docs.python.org/3/library/json.html).

# Persistenza dei dati

Da [sqlite3](https://docs.python.org/3/library/sqlite3.html), [zipfile](https://docs.python.org/3/library/zipfile.html) e [tarfile](https://docs.python.org/3/library/tarfile.html).

# Supporto allo sviluppo e debugging

Da [unittest](https://docs.python.org/3/library/unittest.html) e [timeit](https://docs.python.org/3/library/timeit.html).

Una libreria esterna: [tqdm](https://github.com/tqdm/tqdm).