# Dictionaries, Set, Espressioni Regolari, Gestione delle eccezioni, File e Utilità di sistema

Un _dictionary_ è una struttura hash di coppie chiave-valore. Si ottiene attraverso la funzione built-in `dict()` e il letterale è racchiuso tra parentesi graffe `{ }`. Le chiavi hanno forma di stringhe e si utilizza la notazione array `<dictionary>['<chiave>']` per ottenere il valore associato alla singola chiave. Un `dict` è un _iterable_.

E' possibile ottenere un `dict` da un qualunque oggetto iterabile, oppure con la notazione `for ... in` ovvero specificando le chiavi ed i valori come _kwargs_ nella funzione `dict`


In [9]:
phoneNumbers = dict([('anne', 4139), ('guido', 4127), ('jack', 4098)]) # ottiene un dictionary da una lista di tuple
print(phoneNumbers)
initials = {x : x.capitalize()[0] for x in ('mary','jack','dan')} # mappa gli elementi della tupla come chiavi ed i valori sono ottenuti dall'espressione dopo i ':'
print(initials)

ticTacToe = dict (tic=1,tac=2,toe=3)
print(ticTacToe)

topolino = {}

topolino['nome']='Topolino'
topolino['eta']=75
topolino['vive']='Topolinia'
topolino['famoso']=True
topolino['amici']={'Pippo','Pluto','Basettoni'} # questo è un set

print(topolino)

for k in topolino.keys(): # lista delle chiavi
    print(k,end=', ')
print()

for v in topolino.values(): # lista dei valori
    print(v,end=', ')
print()

for key, val in topolino.items(): # lista delle coppie chiave/valore come tuple
    print(key, val,sep=': ',end=', ')
print()

pluto=dict.fromkeys(topolino) # fromkeys crea un dict nuovo con le chiavi impostate a None
pluto['nome']='Pluto'
pluto['eta']=70
pluto['vive']=topolino.get('vive') # restituisce il valore corrispondente alla chiave passata come argomento
pluto['famoso']=True

if pluto['nome'] not in topolino['amici']: # in e not in sono operatori che danno un risultato booleano
    pluto['amici']={'nessuno'} # creo un set con un solo elemento
else:
    pluto['amici']={topolino['nome']} # creo un set con un elemento valutando una espressione

print(pluto)

friends=pluto.pop('amici') # elimina l'item e restituisce il valore

pluto.popitem()  # rimuove l'ultimo item dal dict

del pluto['eta'] # del cancella l'elemento su cui opera

print(friends,pluto)

pluto.clear() # cancella tutti gli item

print(pluto)

del pluto # cancella il nome pluto: da adesso in poi valutare pluto comporta un errore

pluto

{'anne': 4139, 'guido': 4127, 'jack': 4098}
{'mary': 'M', 'jack': 'J', 'dan': 'D'}
{'tic': 1, 'tac': 2, 'toe': 3}
{'nome': 'Topolino', 'eta': 75, 'vive': 'Topolinia', 'famoso': True, 'amici': {'Pippo', 'Pluto', 'Basettoni'}}
nome, eta, vive, famoso, amici, 
Topolino, 75, Topolinia, True, {'Pippo', 'Pluto', 'Basettoni'}, 
nome: Topolino, eta: 75, vive: Topolinia, famoso: True, amici: {'Pippo', 'Pluto', 'Basettoni'}, 
{'nome': 'Pluto', 'eta': 70, 'vive': 'Topolinia', 'famoso': True, 'amici': {'Topolino'}}
{'Topolino'} {'nome': 'Pluto', 'vive': 'Topolinia'}
{}


NameError: name 'pluto' is not defined

## Set

Un set è un insieme di valori _non ripetuti_ racchiusi tra parentesi graffe `{ }` ***senza*** specifica di chiave. E' indicato per creare raggruppamenti di valori per cui sia rilevante giudicare l'appartenenza di un elemento all'insieme utilizzando `in` e `not in`.

In [1]:
a = set('abracadabra')                      # uso della funzione built-in
b = {'a','l','a','c','a','z','a','m'}       # letterale di tipo set

print(a,b)                                  # stampa solo i valori unici

print(a - b)                              # complemento di a rispetto a b

print(a | b)                              # unione

print(a & b)                              # intersezione

print(a ^ b)                              # or esclusivo: a ∪ b - a ∩ b


{'b', 'r', 'd', 'c', 'a'} {'z', 'c', 'm', 'a', 'l'}
{'d', 'r', 'b'}
{'b', 'r', 'z', 'd', 'c', 'm', 'a', 'l'}
{'c', 'a'}
{'d', 'm', 'b', 'l', 'r', 'z'}


## Gestione delle eccezioni Python

Le eccezioni si gestiscono con il costrutto:

```python
try:
    # codice da eseguire
except <espressione>: # blocco opzionale che intercetta l'eccezione calcolata con <espressione> e la gestisce
    # gestione della particolare eccezione intercettata
#
# Può esserci più di un blocco except
#

else: # blocco opzionale
    # codice eseguito se non è stata sollevata alcuna eccezione

finally: # blocco opzionale
    # codice eseguito in coda a tutti i gestori di eccezioni
    # a prescindere che siano state sollevate o meno
```

Lista delle eccezioni più comuni:

<table border="1">
	<caption>Python Built-in Exceptions</caption>
	<tbody>
		<tr>
			<th scope="col">Exception</th>
			<th scope="col">Cause of Error</th>
		</tr>
		<tr>
			<td>AssertionError</td>
			<td>Raised when <code>assert</code> statement fails.</td>
		</tr>
		<tr>
			<td>AttributeError</td>
			<td>Raised when attribute assignment or reference fails.</td>
		</tr>
		<tr>
			<td>EOFError</td>
			<td>Raised when the <code>input()</code> functions hits end-of-file condition.</td>
		</tr>
		<tr>
			<td>FloatingPointError</td>
			<td>Raised when a floating point operation fails.</td>
		</tr>
		<tr>
			<td>GeneratorExit</td>
			<td>Raise when a generator&#39;s <code>close()</code> method is called.</td>
		</tr>
		<tr>
			<td>ImportError</td>
			<td>Raised when the imported module is not found.</td>
		</tr>
		<tr>
			<td>IndexError</td>
			<td>Raised when index of a sequence is out of range.</td>
		</tr>
		<tr>
			<td>KeyError</td>
			<td>Raised when a key is not found in a dictionary.</td>
		</tr>
		<tr>
			<td>KeyboardInterrupt</td>
			<td>Raised when the user hits interrupt key (Ctrl+c or delete).</td>
		</tr>
		<tr>
			<td>MemoryError</td>
			<td>Raised when an operation runs out of memory.</td>
		</tr>
		<tr>
			<td>NameError</td>
			<td>Raised when a variable is not found in local or global scope.</td>
		</tr>
		<tr>
			<td>NotImplementedError</td>
			<td>Raised by abstract methods.</td>
		</tr>
		<tr>
			<td>OSError</td>
			<td>Raised when system operation causes system related error.</td>
		</tr>
		<tr>
			<td>OverflowError</td>
			<td>Raised when result of an arithmetic operation is too large to be represented.</td>
		</tr>
		<tr>
			<td>ReferenceError</td>
			<td>Raised when a weak reference proxy is used to access a garbage collected referent.</td>
		</tr>
		<tr>
			<td>RuntimeError</td>
			<td>Raised when an error does not fall under any other category.</td>
		</tr>
		<tr>
			<td>StopIteration</td>
			<td>Raised by <code>next()</code> function to indicate that there is no further item to be returned by iterator.</td>
		</tr>
		<tr>
			<td>SyntaxError</td>
			<td>Raised by parser when syntax error is encountered.</td>
		</tr>
		<tr>
			<td>IndentationError</td>
			<td>Raised when there is incorrect indentation.</td>
		</tr>
		<tr>
			<td>TabError</td>
			<td>Raised when indentation consists of inconsistent tabs and spaces.</td>
		</tr>
		<tr>
			<td>SystemError</td>
			<td>Raised when interpreter detects internal error.</td>
		</tr>
		<tr>
			<td>SystemExit</td>
			<td>Raised by <code>sys.exit()</code> function.</td>
		</tr>
		<tr>
			<td>TypeError</td>
			<td>Raised when a function or operation is applied to an object of incorrect type.</td>
		</tr>
		<tr>
			<td>UnboundLocalError</td>
			<td>Raised when a reference is made to a local variable in a function or method, but no value has been bound to that variable.</td>
		</tr>
		<tr>
			<td>UnicodeError</td>
			<td>Raised when a Unicode-related encoding or decoding error occurs.</td>
		</tr>
		<tr>
			<td>UnicodeEncodeError</td>
			<td>Raised when a Unicode-related error occurs during encoding.</td>
		</tr>
		<tr>
			<td>UnicodeDecodeError</td>
			<td>Raised when a Unicode-related error occurs during decoding.</td>
		</tr>
		<tr>
			<td>UnicodeTranslateError</td>
			<td>Raised when a Unicode-related error occurs during translating.</td>
		</tr>
		<tr>
			<td>ValueError</td>
			<td>Raised when a function gets argument of correct type but improper value.</td>
		</tr>
		<tr>
			<td>ZeroDivisionError</td>
			<td>Raised when second operand of division or modulo operation is zero.</td>
		</tr>
	</tbody>
</table>

In [None]:
a = iter(['pippo','pluto','paperino'])

while True:
    try:
        print(next(a))
    except StopIteration:
        print('Non ci sono più elementi!!')
        break


In [2]:
def dividi(num,den):
    quoziente = 0
    try:
        quoziente = num/den
    except ZeroDivisionError:
        print('Divisione per 0!!')
        return None
    except TypeError as te: # as consente di utilizzare l'oggetto eccezione nel blocco except
        if isinstance(num,type(0)) or isinstance(num,type(0.0)):
            print('Il denominatore non è un numero')
        elif isinstance(den,type(0)) or isinstance(den,type(0.0)):
            print('Il numeratore non è un numero')
        else:
            print('argomenti non numerici')
        print(f'\n\nEccezione: {type(te).__name__}\nMessaggio: {te.args[0]}')
        return None
    else:
        print(f'Il risultato è {quoziente}')
        return quoziente
    finally:
        # A solo titolo indicativo: qui potrebbero essere eseguite azioni esplicite di garbage collection per dati di grandi dimensioni
        del quoziente

dividi(3,4)

Il risultato è 0.75


0.75

### Costrutto `with`

`with` genera un _runtime context manager_ a partire dalla valutazione di una espressione che fornisce il contesto di esecuzione e che può essere riferita all'interno del blocco tramite l'operatore `as`. I contesti with possono essere multipli. `with` esegue automaticamente i metodi `__enter__()` e `__exit__()` del contesto che quindi dev'essere un oggetto che implementa questi due metodi. Questo è ad esempio il caso dell'esecuzione di `open()`.

```python
with <contesto> as <target> [,<contesto> as <target> ...]:
    # operazioni da eseguire
```

## Espressioni Regolari

Il modulo `re` gestisce le espressioni regolari che hanno un letterale del tipo:

```python
r'[\w.-]+@[\w.-]+'
```

In [18]:
import re

str = 'purple alice-b@google.com monkey dishwasher'
str1 = 'purple alice@google.com, blah monkey bob@abc.com blah dishwasher'

match = re.search(r'[\w.-]+@[\w.-]+', str) # cerca l'espressione regolare

if match:
    print(match.group())       # stampa il gruppo di caratteri che fa parte del **primo** match
else:
    print('Nessuna corrispondenza')
    
match = re.search(r'([\w\.-]+)@([\w\.-]+)', str1) # cerca l'espressione regolare che è suddivisa in gruppi attraverso le parentesi tonde ( )

if match:
    print(match.group())       # stampa il gruppo di caratteri che corrisponde a tutto il primo match
    print(match.group(1))       # stampa il gruppo di caratteri che corrisponde a tutto il primo match
    print(match.group(2))       # stampa il gruppo di caratteri che corrisponde a tutto il primo match
else:
    print('Nessuna corrispondenza')
    
tuples = re.findall(r'([\w\.-]+)@([\w\.-]+)', str1) # cerca tutte le occorrenze dell'espressione regolare

if tuples:

  print(tuples)  ## [('alice', 'google.com'), ('bob', 'abc.com')]
  for tuple in tuples:
    print(tuple[0],tuple[1],sep=': ')  ## username: host
else:
    print('Nessuna corrispondenza')
    


alice-b@google.com
alice@google.com
alice
google.com
[('alice', 'google.com'), ('bob', 'abc.com')]
alice: google.com
bob: abc.com


## File

I file sono oggetti che implementano un'interfaccia verso tre tipologie di flussi: testo, binari e bufferizzati. L'oggetto file si ottiene tramite la funzione `open()`:

```python
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
```

- `file`: è un _path-like_ object e corrisponde al percorso del file nel file system; la gestione del file system si ottiene dai moduli `os` e `os.path

- `mode`: la modalià di apertura del file
    - `'r'` lettura (default)
    - `'w'` scrittura: crea un nuovo file se non esiste e lo tronca se esiste già
    - `'x'` solo creazione: se il file già esiste si genera un errore
    - `'a'` append: scrive in coda senza troncare e crea un nuovo file se non esiste
    - `'t'` text mode (default)
    - `'b'` binary mode
    - `'+'` aggiornamento: lettura/scrittura

Gli argomenti seguenti sono opzionali:
- `buffering`: gestione del buffering
- `encoding`: codifica; `encoding='utf-8'` per file Unicode; l'encoding di default è dipendente dalla piattaforma; Windows usa `'cp1252'` e Linux/UNIX `'utf-8'`
- `errors`: specifica la codifica/decodifica defli errori
- `newline`​: gestione del carattere di newline (valori disponibili: None, `' '`, `'\n'`, `'\r'`, and `'\r\n'`
- `closefd`: dev'essere `True` altrimenti si genera un errore
- `opener`: indica un gestore dell'apertura del file definito dall'utente che _deve_ restituire un descrittore di file aperto.

`open()` restituisce un file object e l'eccezione `FileNotFoundError` in caso di file non trovato.

```python
#
# Alcuni esempi di apertura di un file
#

f = open("test.txt")      # equivalente a 'r' o 'rt'
f = open("test.txt",'w')  # scrive il file in text mode
f = open("img.bmp",'r+b') # legge e scrive il file in binary mode

#
# Operazioni sui file
#

f = open("test.txt",encoding = 'utf-8')

# esecuzione delle operazioni sul file

f.close() # chiusura

#
# Gestione più sicura del file con garanzia di chiusura
#

# Uso di try ... finally
try:
    f = open("test.txt",encoding = 'utf-8')

    # esegue le operazioni e intercetta le eccezioni

finally:
    f.close() # chiude il file sempre a prescindere dal fatto che ci siano state eccezioni

# Uso di with e chiusura implicita del file

with open("test.txt",encoding = 'utf-8') as f:
     # esegue le operazioni e chiude automaticamente alla fine del blocco with
```

In [6]:
with open('./Python programming/hello.py',encoding='utf-8') as f:
    print(f.read(5))    # legge cinque elementi
    print(f.read(8))    # legge 8 elementi
    print(f.tell())     # riporta la posizione del cursore nel file
    f.seek(0)           # si riposiziona a 0
    
    # loop di lettura di tutte le linee            
    line = f.readline()
    while line != '':
        print(line)
        line = f.readline()
    
    f.seek(0) 
    
    # legge tutte le linee in una lista
    print(f.readlines())


#!/us
r/bin/py
13
#!/usr/bin/python -tt

# Copyright 2010 Google Inc.

# Licensed under the Apache License, Version 2.0

# http://www.apache.org/licenses/LICENSE-2.0



# Google's Python Class

# http://code.google.com/edu/languages/google-python-class/



"""A tiny Python program to check that Python is working.

Try running this program from the command line like this:

  python hello.py

  python hello.py Alice

That should print:

  Hello World -or- Hello Alice

Try changing the 'Hello' to 'Howdy' and run again.

Once you have that working, you're ready for class -- you can edit

and run Python code; now you just need to learn Python!

"""



import sys



# Define a main() function that prints a little greeting.

def main():

  # Get the name from the command line, using 'World' as a fallback.

  if len(sys.argv) >= 2:

    name = sys.argv[1]

  else:

    name = 'World'

  print ('Hello', name)



# This is the standard boilerplate that calls the main() function.

if __name__ == 

In [10]:
# Creiamo un piccolo file csv (Comma Separated Values) da una lista di dict
persone = [{'matricola': 1234,'nome': 'Jhon Doe', 'reparto': 'A'},
           {'matricola': 8976,'nome': 'Jack Russell', 'reparto': 'B'},
           {'matricola': 7732,'nome': 'Brian May', 'reparto': 'A'}]

with open('./Data/persone.csv','w',encoding='utf-8') as dataFile:
    
    # Dapprima scriviamo nel file la linea di intestazione
    # che è costituita dalle chiavi di uno qualunque dei dict
    for i,k in enumerate(persone[0].keys()):
        if i == len(persone[0].keys()) -1:
            dataFile.write(k+'\n')      # andiamo a capo dopo l'ultimo campo
        else:
            dataFile.write(k+', ')      # altrimenti mettiamo la virgola
    
    # Stampiamo per ogni riga, terminata dal carattere newline, gli elementi di ogni dict
    for i in range(len(persone)):
        dataFile.write(f'{persone[i]["matricola"]}, {persone[i]["nome"]}, {persone[i]["reparto"]}\n')


### Gestione dei file CSV

Python fornisce un esplicito modulo `csv` per gestire la lettura e la scrittura di file csv che sono uno dei formati più diffusi per esportare dei dati da un database. Di seguito alcuni esempi di lettura.

In [13]:
import csv

##
#
# csv.reader() legge un file csv come una lista di righe
# ciascuna delle quali è una lista di valori
#
with open('./Data/persone.csv', 'r') as csvFile:
    reader = csv.reader(csvFile)
    for row in reader:
        print(row)


['matricola', ' nome', ' reparto']
['1234', ' Jhon Doe', ' A']
['8976', ' Jack Russell', ' B']
['7732', ' Brian May', ' A']


In [1]:
import csv

##
#
# In caso di file csv con una sintassi particolare come linee vuote iniziali
# alcuni campi con le virgolette ovvero delimitatori diversi dalla virgola
# è possibile usare un 'dialetto' csv e registrarlo per leggere correttamente i dati
#
csv.register_dialect('myDialect',
                     delimiter = ';',       # nuovo delimitatore
                     quoting=csv.QUOTE_ALL, # tutti i campi vengono racchiusi da virgolette per omogeneità
                     skipinitialspace=True) # ci sono spazi dopo il delimitatore

with open('./Data/persone1.csv', 'r') as csvFile:
    reader = csv.reader(csvFile, dialect='myDialect')
    
    for row in reader:
        print(row)


['matricola', 'nome', 'reparto']
['1234', 'Jhon Doe', 'A']
['8976', 'Jack Russel', 'B']
['7732', 'Brian May', 'A']


In [5]:
import csv

##
#
# In caso di file csv con una sintassi particolare come linee vuote iniziali
# alcuni campi con le virgolette ovvero delimitatori diversi dalla virgola
# è possibile usare un 'dialetto' csv e registrarlo per leggere correttamente i dati
#
csv.register_dialect('myDialect',
                     delimiter = ';',
                     quoting=csv.QUOTE_ALL,
                     skipinitialspace=True)

with open('./Data/persone1.csv', 'r') as csvFile:
    reader = csv.DictReader(csvFile, dialect='myDialect')
    
    for row in reader:
        print(dict(row))
        

{'matricola': '1234', 'nome': 'Jhon Doe', 'reparto': 'A'}
{'matricola': '8976', 'nome': 'Jack Russel', 'reparto': 'B'}
{'matricola': '7732', 'nome': 'Brian May', 'reparto': 'A'}


Vediamo degli esempi di scrittura e/o inserimento dati.

In [6]:
##
#
# aggiungiamo una riga da una lista di dati a persone.csv
#

import csv

row = [3344, 'ZZ Top', 'D']

with open('./Data/persone.csv', 'a') as csvFile:
    writer = csv.writer(csvFile)
    writer.writerow(row)


In [7]:
##
#
# Scriviamo un nuovo file a partire da una lista di liste, ognuna delle quali sarà una riga
# La prima lista conterrà i nomi dei campi
#

import csv

csvData = [['Quantità', 'Artista', 'Reparto'], ['21', 'Boy George', 'Pop'], ['56', 'Genesis', 'Rock'],['32', 'W.A. Mozart', 'Classica']]

csv.register_dialect('myDialect',
delimiter = ';',
quotechar = '"',                    # il dialetto utilizza anche un proprio carattere per quotare gli elementi
quoting=csv.QUOTE_ALL,
skipinitialspace=True)

with open('./Data/dischi.csv', 'w', encoding='utf-8') as csvFile:
    writer = csv.writer(csvFile, dialect='myDialect')
    writer.writerows(csvData)

print("writing completed")


writing completed


In [11]:
##
#
# Analogo a prima, ma usiamo un DictWriter per scrivere i dati da dict
#
import csv

csvData = [{'Cognome e Nome': 'Mario Rossi', 'Data di nascita': '03/08/1933', 'Luogo di nascita': 'Palermo', 'Provincia': 'PA', 'CF': 'XXXTTT33R44R675E'},
           {'Cognome e Nome': 'Giuseppe Verdi', 'Data di nascita': '12/05/1971', 'Luogo di nascita': 'Monza', 'Provincia': 'MI', 'CF': 'GGGVVV44U66M456P'},
           {'Cognome e Nome': 'Carlo Bianchi', 'Data di nascita': '30/09/2000', 'Luogo di nascita': 'Macerata', 'Provincia': 'MC', 'CF': 'CCCBBB89R12O984F'}]


csv.register_dialect('myDialect',
delimiter = ';',
quotechar = '"',                    # il dialetto utilizza anche un proprio carattere per quotare gli elementi
quoting=csv.QUOTE_ALL,
skipinitialspace=True)

with open('./Data/anagrafica.csv', 'w') as csvfile:
    fieldnames = ['Cognome e Nome', 'Data di nascita', 'Luogo di nascita', 'Provincia', 'CF']
    writer = csv.DictWriter(csvfile, fieldnames=fieldnames, dialect="myDialect")
    writer.writeheader()
    writer.writerows(csvData)

print("writing completed")


writing completed


## Gestione dei file `json`

Il modulo `json` consente di leggere/scrivere informazioni da/a apposite strutture dati Python secondo la eguente tabella di conversione:

<table>
	<thead>
		<tr>
			<th>Python</th>
			<th>JSON Equivalent</th>
		</tr>
	</thead>
	<tbody>
		<tr>
			<td><code>dict</code></td>
			<td>object</td>
		</tr>
		<tr>
			<td><code>list</code>, <code>tuple</code></td>
			<td>array</td>
		</tr>
		<tr>
			<td><code>str</code></td>
			<td>string</td>
		</tr>
		<tr>
			<td><code>int</code>, <code>float</code>, <code>int</code></td>
			<td>number</td>
		</tr>
		<tr>
			<td><code>True</code></td>
			<td>true</td>
		</tr>
		<tr>
			<td><code>False</code></td>
			<td>false</td>
		</tr>
		<tr>
			<td><code>None</code></td>
			<td>null</td>
		</tr>
	</tbody>
</table>


In [7]:
##
#
# Lettura di un file json e stampa normale e formattata
#

import json

with open('./Data/dischi.json',encoding='utf-8') as f:
    data = json.load(f)
    # Output: {'name': 'Bob', 'languages': ['English', 'Fench']}

print(data)

print(json.dumps(data, indent = 4, sort_keys=True))

{'dischi': [{'Artista': 'John Bon Jovi', 'Generi': ['Rock', 'Pop'], 'Quantità': 34}, {'Artista': 'Elton John', 'Generi': ['Pop', 'Funky'], 'Quantità': 12}, {'Artista': 'George Benson', 'Generi': ['Blues', 'Jazz', 'Pop'], 'Quantità': 22}]}
{
    "dischi": [
        {
            "Artista": "John Bon Jovi",
            "Generi": [
                "Rock",
                "Pop"
            ],
            "Quantit\u00e0": 34
        },
        {
            "Artista": "Elton John",
            "Generi": [
                "Pop",
                "Funky"
            ],
            "Quantit\u00e0": 12
        },
        {
            "Artista": "George Benson",
            "Generi": [
                "Blues",
                "Jazz",
                "Pop"
            ],
            "Quantit\u00e0": 22
        }
    ]
}


In [8]:
##
# scrittura di dati organizzati in un dict su file json
#

import json

person_dict = [{'Cognome e Nome': 'Mario Rossi', 'Data di nascita': '03/08/1933', 'Luogo di nascita': 'Palermo', 'Provincia': 'PA', 'CF': 'XXXTTT33R44R675E'},
           {'Cognome e Nome': 'Giuseppe Verdi', 'Data di nascita': '12/05/1971', 'Luogo di nascita': 'Monza', 'Provincia': 'MI', 'CF': 'GGGVVV44U66M456P'},
           {'Cognome e Nome': 'Carlo Bianchi', 'Data di nascita': '30/09/2000', 'Luogo di nascita': 'Macerata', 'Provincia': 'MC', 'CF': 'CCCBBB89R12O984F'}]

with open('./Data/persone.json', 'w', encoding='utf-8') as json_file:
  json.dump(person_dict, json_file)

print("writing completed")

writing completed


In [25]:
##
# 
# File ed espressioni regolari
#

import re
import csv

searchFor = r"[1-9]+"

with open('./Data/persone.csv', 'r', encoding='utf-8') as f:
    strings=re.findall(searchFor,f.read())

strings


['1234', '8976', '7732', '3344']

# Utilità di sistema

## File System -- `os, os.path, shutil`

   - `filenames = os.listdir(dir)`: lista dei soli nomi dei file in `dir` esclusi `.` e `..`
   - `os.path.join(dir, filename)`: crea un percorso da un nome di file e da un nome di cartella
   - `os.path.abspath(path)`: restituisce la forma assoluta di un percorso
   - `os.path.dirname(path), os.path.basename(path)` restituiscono rispettivamente il nome della cartella ed il nome del file da un percorso, ad esempio `dir/foo/bar.htm` restituisce rispettivamente `dir/foo` e `bar.html`
   - `os.path.exists(path)`: verifica se il percorso esiste
   - `os.mkdir(dir_path)`: crea una cartella alla fine del percorso
   - `os.makedirs(dir_path)`: crea tutte le cartelle nel percorso
   - `shutil.copy(source-path, dest-path)`: copia dal percorso sorgente a quello destinazione
   - `shutil.move(source-path, dest-path)`: sposta dal percorso sorgente a quello destinazione
   - `shutil.rmtree(path)`: cancella ricorsivamente tutte le cartelle del percorso
   - `shutil.make_archive(base_name, format, root_dir=None, base_dir=None)`: crea un archivio `base_name` nel formato specificato da `format` (`'zip'`, `'tar'`, ....) che verrà salvato in `root_dir`, mentre l'archiviazione parte da `base_dir`, entrambe di default la cartella corrente
   - `shutil.unpack_archive(filename, extractdir=None, format=None)`: estrae un archivio `filename` nel specificato da formato `format` (`'zip'`, `'tar'`, ....) che verrà estratto in `extractdir`, di default la cartella corrente
  
    
## Running External Processes -- `commands`

- `(status, output) = commands.getstatusoutput(cmd)` -- runs the command, waits for it to exit, and returns its status int and output text as a tuple. The command is run with its standard output and standard error combined into the one output text. The status will be non-zero if the command failed. Since the standard-err of the command is captured, if it fails, we need to print some indication of what happened.
- `output = commands.getoutput(cmd)` -- as above, but without the status int.
- There is also a simple `os.system(cmd)` which runs the command and dumps its output onto your output and returns its error code. This works if you want to run the command but do not need to capture its output into your python data structures.

## HTTP -- `urllib`


   - `urllib.request` for opening and reading URLs
       - `ufile = urllib.request.urlopen(url)` -- returns a file like object for that url 
       - `baseurl = ufile.geturl()` -- gets the "base" url for the request, which may be different from the original because of redirects 

   - `urllib.error` containing the exceptions raised by urllib.request

   - `urllib.parse` for parsing URLs
       - `urllib.parse.urlparse(urlstring, scheme='', allow_fragments=True)` -- parsing of the URL according to the RFC
       - `urllib.parse.urljoin(baseurl, url)` -- given a url that may or may not be full, and the baseurl of the page it comes from, return a full url. Use `geturl()` above to provide the base url.

   - `urllib.robotparser` for parsing robots.txt files


# Esercizi

1. Si scriva un programma `analysis.py` che prende in ingresso una url che punta ad un file di dati, ne fa il download ed eventualmente lo decomprime. Si assume che i dati siano in formato `.csv`. Il programma accetta una query sui campi del data set, con la seguente sintassi:
```
analysis.py <url> --field <numero> <operatore> [<valore>] [and|or --field <numero> <operatore> [<valore>] ...]
```
Si intende che le clausole in `or` vanno eseguite _dopo_ quelle in `and` per cui `a and b or c --> (a and b) or c`. I valori ammessi per `<operatore>` sono: `>, <, >=, <=, ==, !=, regex, min, max` di cui `min` e `max` non hanno valori su cui agire. Il programma dovrà selezionare le righe di dati che soddisfano i criteri specificati e salvarle in un nuovo file che avrà il nome: `<nome file di input senza estensione>_results.csv`.

In [11]:
import commands

help(commands)

ModuleNotFoundError: No module named 'commands'