# Stringhe, liste, tuple, strutture di controllo del flusso e ordinamento

Le stringhe vengono generate con il costruttore built-in `str()` a partire da altri oggetti. Esse sono _immutable_ cioè immodificabili e quindi applicare operazioni alle stringhe produce sempre nuovi oggetti stringa.

Alcuni tra i metodi principali delle stringhe sono riportati nel seguito:

- `s.lower(), s.upper()` restituisce la stringa `s` tutta in minuscolo/maiuscolo
- `s.strip()` restituisce la stringa senza spazi bianchi all'inizio e alla fine
- `s.isalpha()/s.isdigit()/s.isspace()...` verifica se **tutti** i caratteri della stringa sono alfanumerici/numerici/di spaziatura etc.
- `s.startswith('other'), s.endswith('other')` verifica se `s` inizia/finisce con la stringa `other`
- `s.find('other')` cerca `other` in `s` e restituisce l'indice in cui inizia la prima occorrenza o `-1` se non la trova
- `s.replace('old', 'new')` restituisce una stringa in cui tutte le occorrenze  di `old` sono rimpiazzate da ` new`
- `s.split('delim')` restituisce una lista di sottostringhe che risultano separate dalla stringa `delim` che ***non è*** una espressione regolare. ad es. `'aaa,bbb,ccc'.split(',') -> ['aaa', 'bbb', 'ccc']`. Senza argomenti `s.split()` usa gli spazi come delimitatori.
- `s.join(list)` unisce gli elementi di `list` in un'unica stringa concatenata da `s` che fa da delimitatore. Ad esempio `'---'.join(['aaa', 'bbb', 'ccc']) -> aaa---bbb---ccc`

Le stringhe Python 3 sono Unicode, in Python 2 invece no e bisognava esplicitamente crearle premettendo `u` al letterale ovvero con la funzione built-in `unicode` che non è più definita in Python 3.

## Stampa formattata: `print()`

Le stringhe Python 2, ma anche Python 3, possiedono una notazione `%` simile al C/C++ per inserire variabili di tipo diverso all'interno di una _stringa formato_ per l'output formattato:

In [1]:
print('La mamma ha comprato %d chili di %s a %g € al chilo' % (7,'pane',0.35))

print('%+10.5s' % ('precivitevolissimevolmente')) # allineamento a destra in 10 caratteri troncato a 5

print('%06.2f' % (8.9876543))  # allineamento in 6 cifre con due sole posizioni dopo la virgola

La mamma ha comprato 7 chili di pane a 0.35 € al chilo
     preci
008.99


per una review completa della formattazione si consulti la [guida Python 2](https://docs.python.org/2/library/stdtypes.html#string-formatting)

In Python 3 le stringhe usano il metodo `str.format()` per gestire la stessa cosa.

In [52]:
name = 'Jhonny'
age = 23
print('Hello {}! It looks like you\'re {} years old!'.format(name,age))

print('{:>10.5}'.format('precivitevolissimevolmente')) # allineamento a destra in 10 caratteri troncato a 5

print('{:_<10s}'.format('test')) #allineamento a sinistra in 10 caratteri e riempimento con '_'

print('{:06.2f}'.format(8.9876543))  # allineamento in 6 cifre con due sole posizioni dopo la virgola

print('{:=+5d}'.format(23)) # inserimento segno esplicito e allineamento in 5 caratteri senza zeri

Hello Jhonny! It looks like you're 23 years old!
     preci
test______
008.99
+  23


Da Python 3.6 in poi, sono state inserite le f-string che sono una ulteriore evoluzione della notazione '{...}' utilizzata da `format` e consentono l'inserimento diretto delle variabili nell'output formattato. Esse sono anche molto più efficienti computazionalmente.

In [51]:
import os

name = 'Jhonny'
age = 23

print(f'hello, {os.getlogin().capitalize()}!! how are you?') # si possono utilizzare direttamente metodi e variabili 

print(f'Hi {name:*^10s}! You are {age:+6.2f} years old')

hello, Pirrone!! how are you?
Hi **Jhonny**! You are +23.00 years old


La funzione `print()` ha la seuguente sintassi
```
print(oggetto [, oggetto, ...] [,sep='<separatore>'] [,end='<terminatore>])
```
Il separatore di default è lo spazio, mentre il terminatore di default è il newline `\n`.

In [54]:
print('pippo','pluto','topolino',sep=' # ',end='.')
print('paperino','paperoga','gastone')

pippo # pluto # topolino.paperino paperoga gastone


## Liste

Le liste si definiscono il letterale `[elemento, elemento, ...]`. Una lista può contenere elementi di tipo diverso, utilizza la notazione array e lo slicing, ma non è un _immutable_. Le operazioni affliggono la stessa lista. Possiamo calcolarne la lunghezza con `len`.

In [7]:
a=[1,'pippo',True]
b=a # b ed a puntano allo stesso oggetto

a.pop(0) # a viene modificato da pop che rimuove il primo elemento della lista

print(f'{a} \n\n {b}')

['pippo', True] 

 ['pippo', True]


 di seguito vediamo applicati i principali metodi delle liste

In [7]:
list = ['pippo', 'pluto', 'paperino', 'topolino']

list.append('clarabella')         ## appende 'clarabella' alla fine
list.insert(0, 'qui quo qua')        ## inserisce la stringa in posizione 0
list.extend(['gastone', 'nonna papera'])  ## aggiunge una lista alla fine
print(list)  
print(list.index('pluto'))    ## 2

list.remove('pluto')         ## cerca e rimuove l'elemento
disney = list.pop(1)         ## rimuove e erestituisce l'elemento in posizione 1
print(disney,list, sep='; ')  

'''
Utilizzo dello slicing
'''
print(list[1:-1])       # stampa la sottolista cha va dal secondo al penultimo elemento
list[0:2]=['zio paperone'] # sostituisce alla sottolista composta dai primi due elementi di list la lista ['zio paperone']

print(list)

['qui quo qua', 'pippo', 'pluto', 'paperino', 'topolino', 'clarabella', 'gastone', 'nonna papera']
2
pippo; ['qui quo qua', 'paperino', 'topolino', 'clarabella', 'gastone', 'nonna papera']
['paperino', 'topolino', 'clarabella', 'gastone']
['zio paperone', 'topolino', 'clarabella', 'gastone', 'nonna papera']


## Tuple

le tuple sono simili al concetto di `struct` del C/C++, sono degli _immutable_ che racchiudono al loro interno degli elementi, normalmente eterogenei, per altro perfettamente simili alle liste. I singoli elementi di una tupla possono essere modificati. 

La sintassi utilizza le parentesi tonde, ad es. `(1,'pippo',False)`; è la classica struttura dati che viene usata quando è necessario che una funzione restituisca più di un valore.

In [11]:
t=(5, 'Giorgio', 'Giorgio', True, ['a','b','c'])

#
# count() conta le occorrenze dell'elemento passato
# come argomento e index() ritorna la sua prima occorrenza
#

print(t[1:3],len(t),t.count('Giorgio'),t.index('Giorgio'))

#
# t è immutable e quindi per ottenere il riultato dello
# slicing dobbiamo assegnarlo ad un altra tupla
#

a=t[2:5]
a

('Giorgio', 'Giorgio') 5 2 1


('Giorgio', True, ['a', 'b', 'c'])

## Strutture di controllo del flusso

- Selezione:
```python
if condizione:  # si entra nel blocco quando condizione è valutata True
    istruzione
    ...
elif condizione:  # opzionale: anche più di uno per scelte multiple
    istruzione
    ...
else:
    istruzione
    ...
```

In [5]:
x = 18.67

if x <= 15:
    print(f'x è piccolino e vale {x}')
elif x>15 and x<=23.7:
    print(f'il valore {x} assunto da x è intermedio')
else:
    print('x è decisamente grande!!')

il valore 18.67 assunto da x è intermedio


- Iterazione `for`:
```python
for var in nome_oggetto_iterabile: # una stringa, lista, tupla o il risultato di range()
    istruzione
    istruzione
    ...
```

In [1]:
l = []
li = []

for i in range(-10,10,2): # costruzione di una lista da lista vuota tramite for ... in
                          # range(start,stop[,step]) genera un intervallo di valori interi da start a stop-1 con passo step (default: 1)
                          # range(stop) genera un intervallo da 0 a stop-1 con passo 1
    l.append(i)
    li.insert(0,i)

print(l,li)

squares = [el**2 for el in l if el%2==0]  # costruzione di una lista da un oggetto iterabile sotto condizioni con <expr> for ... in [if ...]
print(squares)

for k,v in enumerate(['bim','bum','bam']): # enumerate itera sulla lista e genera gli indici
    print(k,v)

for c in 'abracadabra':
    print(c, end=', ')

[-10, -8, -6, -4, -2, 0, 2, 4, 6, 8] [8, 6, 4, 2, 0, -2, -4, -6, -8, -10]
[100, 64, 36, 16, 4, 0, 4, 16, 36, 64]
0 bim
1 bum
2 bam
a, b, r, a, c, a, d, a, b, r, a, 

- Iterazione `while`:
```python
while condizione: # il blocco è eseguito quando condizione è valutata True
    istruzione
    istruzione
    ...
```

In [1]:
item = 'r'
s = 'Zio Paperone'
pos = s.index(item)
while item in s and pos < len(s):
    print(item,end=' ')
    pos += 1
    if pos < len(s):
        item = s[pos]
    else:
        break # esiste anche continue con il significato solito

r o n e 

## Ordinamento

L'ordinamento degli elementi di un oggetto iterabile si può ottenere attraverso la funzione `sorted(iterable, key=None, reverse=False)` che in automatico restituisce una lista di elementi ordinati in ordine crescente. `key` contiene il riferimento ad una funzione che fa da criterio di selezione per l'ordinamento, mentre `reverse=True` abilita l'ordinamento inverso.

Le liste hanno il loro metodo `sort()` per l'ordinamento _in place_ crescente automatico degli elementi, il quale restituisce `None` che è il letterale che esprime l'oggetto nullo (equivalente di `null` del C/C++)

In [5]:
a = ['pippo','clarabella','paperino']
a.sort()
a

['clarabella', 'paperino', 'pippo']

In [11]:
print(sorted(['pippo','clarabella','paperino'],reverse=True))

def lastCharacterOf(s):
    return s[-1]        # return restituisce il risultato al chiamante

print(sorted(['pippo','clarabella','paperino'],key=lastCharacterOf)) # passiamo a key il solo nome della funzione

###
#
# l'operatore lambda arg: expr definisce le funzioni anonime in Python
#
###
print(sorted(['pippo','clarabella','paperino'],key=lambda s: s[-1]))

print(sorted([('John','A',15),('Anne','C',17),('Bill','B',16)],key=lambda student: student[1],reverse=True))

['pippo', 'paperino', 'clarabella']
['clarabella', 'pippo', 'paperino']
['clarabella', 'pippo', 'paperino']
[('Anne', 'C', 17), ('Bill', 'B', 16), ('John', 'A', 15)]


La funzione `reversed()` genera un ***iteratore*** che elenca la sequenza in ordine inverso. Gli iteratori sono oggetti sui quali si può scorrere utilizzando la funzione `next()` che genera l'eccezione `StopIteration`. La funzione `iter()` genera un iteratore dal suo argomento.

## Esercizi

1. Scrivere un programma Python `tail.py` che accetta due argomenti da linea di comando: `tail.py <stringa> <carattere>|<indice>` e stampa l'ultima parte della stringa a partire dall'ultima occorrenza del carattere ovvero a partire dall'indice specificato, anche negativo. Il programma dovrà effettuare il controllo di consistenza degli argomenti come tipo e numero e fornire un messaggio di utilizzo corretto in caso di errore nel passaggio degli argomenti ovvero di carattere non presente o indice fuori dal range della stringa. Si definisca una funzione `lastIndexOf` che ritorna ***l'ultima*** occorrenza di un carattere in una stringa e si richiami questa funzione dal programma principale.

2. Scrivere un programma Pyhton `linear_merge.py` che accetta due liste con lo stesso tipo di elementi da linea di comando: `linear_merge.py <lista1> <lista2> [-r]` e stampa un'unica lista in cui gli elementi ripetuti di ogni lista sono stati rimossi e le due liste risultanti sono state fuse in un'unica lista ordinata e senza elementi ripetuti. Se l'argomento `-r` è presente l'output dovrà essere ordinato in senso inverso. Il programma dovrà effettuare il controllo di consistenza degli argomenti in tipo e numero e fornire un messaggio di utilizzo corretto in caso di errore. Si realizzino due funzioni `removeDuplicates` e `merge` per realizzare rispettivamente la rimozione di duplicati e la fuzione.
    - _Opzionale_: gestire anche il caso in cui gli elementi delle due liste siano di tipo diverso e ordinarli rispetto alla loro rappresentazione interna di tipo stringa che si ottiene con la funzione `repr()` 


