# Python from Scratch - Esercizi

*Chinellato Diego - TPSIT*

*ITTS V. Volterra*

*A.S. 2022/2023*

Ogni esercizio è accompagnato da una serie di `assert` che verificano se la funzione è corretta. In poche parole, `assert` è un operatore Python (ma è presente in molti linguaggi) che lancia un'eccezione se una certa condizione non viene rispettata:

In [None]:
assert 1 == 1, 'primo assert passato'
assert 1 == 2, 'secondo assert fallito'

AssertionError: ignored

La sintassi è `assert check msg`, dove `check` è l'espressione booleana da valutare e `msg` è il messaggio che viene printato se il check fallisce. Sono estremamente utili, sopratutto per debuggare e testare il codice. Per approffondire: https://realpython.com/python-assert-statement/

## Esercizio 1: find and replace

Find-and-replace è una feature molto comune in text editors, IDEs e software di word processing. In questo esercizio, dovrai implementare questa comune funzione.

Definisci una funzione `find_and_replace(text, old_text, new_text)` che sostituisce tutte le occorrenze di `old_text` in `text` con `new_text`. La funzione deve essere case sensitive (vedi esempi nella cella con assert).

In [None]:
def find_and_replace(text, old_text, new_text):
  return text.replace(old_text, new_text) # ritorno con sostituzione stringhe
  pass

In [None]:
assert find_and_replace('The fox', 'fox', 'dog') == 'The dog'
assert find_and_replace('fox', 'fox', 'dog') == 'dog'
assert find_and_replace('Firefox', 'fox', 'dog') == 'Firedog'
assert find_and_replace('foxfox', 'fox', 'dog') == 'dogdog'
assert find_and_replace('The Fox and fox.', 'fox', 'dog') == 'The Fox and dog.'
assert find_and_replace('THE FOX AND THE DOG', 'fox', 'dog') == 'THE FOX AND THE DOG'

## Esercizio 2: ore, minuti, secondi
Definisci una funzione `get_hours_minutes_seconds(seconds)` che converte il numero di secondi passato come parametro nel numero di ore, minuti e secondi.
Ad esempio, `get_hours_minutes_seconds(90)` deve ritornare '1m 30s'
Per una sfida in più, considera anche il periodo di 24 ore e aggiungi il suffisso "d"; ad esempio, `get_hours_minutes_seconds(90042)` ritorna '1d 1h 42s'.

In [None]:
def get_hours_minutes_seconds(seconds):

    hours = seconds // 3600
    seconds %= 3600
    minutes = seconds // 60
    seconds %= 60

    # Crea una stringa di output vuota con il formato desiderato
    output = ""

    # funzione ore
    if hours > 0:
        if hours == 1 and minutes == 0 and seconds == 0:
          output += '1h'
        else: 
          output += str(hours) + "h "

    #funzione minuti
    if minutes > 0:
        if minutes == 60:
          output += '1h'
        if minutes == 1 and seconds == 0:
          output += '1m'
        else: 
          if minutes > 60:
            output += str(hours) + "h " + str(seconds) + "s"
          else: 
            output += str(minutes) + "m "

    #funzione secondi
    if seconds > 0:
      if seconds == 60:
        output += '1m'
      else:
        output += str(seconds) + "s"

    return output

In [None]:
assert get_hours_minutes_seconds(30) == '30s'
assert get_hours_minutes_seconds(60) == '1m'
assert get_hours_minutes_seconds(90) == '1m 30s'
assert get_hours_minutes_seconds(3600) == '1h'
assert get_hours_minutes_seconds(3601) == '1h 1s'
assert get_hours_minutes_seconds(3661) == '1h 1m 1s'
assert get_hours_minutes_seconds(90042) == '25h 42s'
assert get_hours_minutes_seconds(10) == '10s'

## Esercizio 3: massimi e minimi, somme e prodotti, medie e mediane 
Scrivere le seguenti funzioni che "riducono" un iterabile (lista, tupla, set, ...) a un singolo valore:
* `maximum(t)` e `minimum(t)` che ritornano rispettivamente il valore massimo e minimo presente in `t`
* `somma(t)` e `prod(t)` che ritornano rispettivamente la somma e il prodotto di tutti gli elementi di `t`
* `moda(t)` che ritorna l'elemento più frequente di `t`
* `avg(t)` e `median(t)` che ritornano rispettivamente la media e la mediana di `t`. 
  * Assumendo che `t` contenga `n` elementi, la media è definita come: $\frac{1}{n}∑_{x \in t}x$. 
  * La mediana è invece definita come l'elemento centrale di t, dopo che t è stato ordinato in ordine crescente. Se n è dispari, l'elemento centrale è l'elemento in posizione $\frac{n+1}{2}$, mentre se n è pari l'elemento centrale è la media dei due elementi nelle posizioni $\frac{n}{2}, \frac{n}{2} + 1$ ($\frac{t[\frac{n}{2}] + t[\frac{n}{2} + 1]}{2}$).

In [None]:
def maximum(t):
  t.sort()
  return t[len(t)-1]
  # Ritorna il valore massimo presente in t.

def minimum(t):
  return min(t)
  # Ritorna il valore minimo presente in t.

def somma(t):
  somma = 0
  for i in t: 
    somma = somma + i
  return somma
  # Ritorna la somma dei valori presenti in t avvalendosi di una variabile ausiliaria.

def prod(t):
  prodotto_temp = 1
  for i in t:
    prodotto_temp*=i
  return prodotto_temp
  # Ritorna il prodotto dei valori presenti in t avvalendosi di una variabile ausiliaria.


def moda(t):
    counter_max = 0
    counter = 0
    risultato = 0
    for i in t:
      for j in range(len(t)): # scorro lista t
        if i == t[j]: # se trovo elementi uguali incremento il counter
            counter +=1
      if(counter > counter_max):
        risultato = i # salvo il numero più frequente
        counter_max = counter
      counter = 0
    return risultato 
    # Ritorna l'elemento più "frequente" in t.


def avg(t):
  return somma(t)/len(t) # len(t) numero oggetti lista
  # Ritorna la media di t.


def median(t):
  t = sorted(t) # lista ordinata
  n = len(t) # numero elementi lista t
  if n % 2 == 0: # % == resto
    return (t[n // 2] + t[n // 2 - 1]) / 2
  else:
    return t[n // 2]
    # Ritorna la mediana di t.


In [None]:
t = [1, 2, 3, 4, 5, 7]
assert maximum(t) == 7
assert minimum(t) == 1
assert somma(t) == 22
assert prod(t) == 840
assert round(avg(t), 2) == 3.67
assert median(t) == 3.5

assert moda([1, 2, 3, 1, 2, 1, 1, 1, 2]) == 1
assert moda([1, 2, 3, 3, 3, 1, 2, 1, 2, 3, 3, 3]) == 3

# mescolare t non deve cambiare la mediana
import random
random.seed(42)
t = [3, 7, 10, 4, 1, 9, 6, 2, 8]
for _ in range(5):
  random.shuffle(t)
  assert median(t) == 6

## Esercizio 4: generatore di password
Definisci una funzione `gen_pwd(length)` che genera una password casuale di lunghezza `length`. Per sicurezza, la password deve sempre essere di almeno 8 caratteri (anche nei casi in cui `length < 8`). La password ritornata (stringa) deve contenere almeno una lettera minuscola, una maiuscola, un numero e un carattere speciale. I caratteri speciali sono i seguenti: ~!@#$%^&*()_+.
La soluzione dovrebbe importare il modulo `random` per generare queste password in maniera casuale. 

In [None]:
import string
import random

def gen_pwd(length):
    # definiamo le stringhe che serviranno per la creazione della password
    ascii_uppercase = string.ascii_uppercase
    ascii_lowercase = string.ascii_lowercase
    digits = string.digits
    special = '~!@#$%^&*()_+'
    
    # se length è minore di 8, impostiamo la length a 8
    if length < 8:
        length = 8
    
    # selezioniamo randomicamente una lettera maiuscola, una lettera minuscola, un numero e un carattere speciale
    uppercase_letter = random.choice(ascii_uppercase)
    lowercase_letter = random.choice(ascii_lowercase)
    digit = random.choice(digits)
    special_char = random.choice(special)
    
    # concateniamo in una stringa
    pwd = uppercase_letter + lowercase_letter + digit + special_char
    
    # aggiungiamo altri caratteri casuali alla password, così da arrivare ad 8
    if length > 4:
        for i in range(length - 4):
            pwd += random.choice(ascii_uppercase + ascii_lowercase + digits + special) # costruzione stringa "password"
    
    # mescoliamo i caratteri nella password
    pwd = ''.join(random.sample(pwd, len(pwd)))
    
    return pwd


In [None]:
assert len(gen_pwd(7)) == 8 
assert len(gen_pwd(8)) == 8 
from string import ascii_uppercase, ascii_lowercase, digits
special = '~!@#$%^&*()_+.'
pwd = gen_pwd(8)
assert any(c in pwd for c in ascii_uppercase), 'uppercase letter missing'
assert any(c in pwd for c in ascii_lowercase), 'lowercase letter missing'
assert any(d in pwd for d in digits), 'digit missing'
assert any(s in pwd for s in special), 'special char missing'

## Esercizio 5: Bubble Sort
Il Bubble Sort è un algoritmo di ordinamento, spesso il primo insegnato agli studenti di informatica. Anche se inefficiente e inadatto al software del mondo reale, è un algoritmo molto semplice da capire e implementare. L'idea è iterare ripetutamente il vettore da ordinare, considerando coppie consecutive di elementi; se la coppia non è in ordine (cioè, in posizione $i-1$ c'è un elemento più grande di quello in posizione $i$), i due elementi vengono scambiati. L'algoritmo termina quanto itero il vettore dall'inizio alla fine senza effettuare alcuno swap. Su Wikipedia (https://en.wikipedia.org/wiki/Bubble_sort) trovate una spiegazione più dettagliata e un esempio visivo, oltre al pseudocodice.

Definisci una funzione `bubble_sort(numbers)` che ordina in-place (senza creare una nuova variabile) la lista `numbers` tramite bubble sort e ritorna la lista ordinata. 




In [None]:
def bubble_sort(numbers):
  for i in range(len(numbers)-1,0,-1): # scorriamo l'array dall'ultimo elemento in poi "incrementando di -1"
    for j in range(i):
      if numbers[j] > numbers[j+1]: # Se il valore all'indice j è maggiore del valore successivo, scambiamo i valori
        numbers[j], numbers[j+1] = numbers[j+1], numbers[j] # "scambio valori"
  return numbers

In [None]:
assert bubble_sort([2, 0, 4, 1, 3]) == [0, 1, 2, 3, 4]
assert bubble_sort([2, 2, 2, 2]) == [2, 2, 2, 2]

## Esercizio 6: strette di mano
Definisci una funzione `print_handshakes(people)` che, data una lista di nomi di persone `people` printa "X shakes hands with Y", where X e Y sono tutte le possibili combinazioni di strette di mano tra persone nella lista. Non devono esserci duplicati - se A stringe la mano a B, B non deve stringerla ad A. Ad esempio, `print_handshakes(['Alice', 'Bob', 'Carol', 'David'])` dovrebbe printare:

Alice shakes hands with Bob
Alice shakes hands with Carol
Alice shakes hands with David
Bob shakes hands with Carol
Bob shakes hands with David
Carol shakes hands with David

La funzione deve anche ritornare un intero che rappresenta il numero totale di strette di mano.

In [None]:
def print_handshakes(people):
  counter = 0
  for i in range(len(people)): # "scorriamo la lista" people
    for j in range(i+1, len(people)): # "generazione combinazioni possibili"
      print(f"{people[i]} shakes hands with {people[j]}") #print(f") stampaggio stringa formattata
      counter += 1
  print(counter)
  return counter

In [None]:
assert print_handshakes(['Alice', 'Bob']) == 1
assert print_handshakes(['Alice', 'Bob', 'Carol']) == 3
assert print_handshakes(['Alice', 'Bob', 'Carol', 'David']) == 6

Alice shakes hands with Bob
1
Alice shakes hands with Bob
Alice shakes hands with Carol
Bob shakes hands with Carol
3
Alice shakes hands with Bob
Alice shakes hands with Carol
Alice shakes hands with David
Bob shakes hands with Carol
Bob shakes hands with David
Carol shakes hands with David
6


## Esercizio 7: random shuffle
Definisci una funzione `shuffle(values)` che mescola la lista `values`, ovvero modifica in maniera randomica la posizione di ogni elemento della lista. La funzione non deve ritornare la lista ordinata. La lista mescolata deve contenere gli stessi elementi, ma in un ordine diverso (random).
Nota: l'esercizio chiede di implementare una funzione identical al `random.shuffle()` nativamente incluso in Python. Chiaramente, evita di usare questa funzione dato che renderebbe l'esercizio inutile.

In [None]:
import random

def shuffle(values):
  if len(values)==0: # funzione len() restituisce numero elementi in un oggetto
        pass
  else:
    j = random.randint(0, len(values) - 1) # "randomizziamo" la posizione degli elementi
    for i in range(len(values)): # scorrendo la lista
      values[i], values[j] = values[j], values[i] # scambio posizione elementi
  return values

In [None]:
random.seed(42)
# Perform this test ten times:
for i in range(10):
  testData1 = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
shuffle(testData1)
# Make sure the number of values hasn't changed:
assert len(testData1) == 10
# Make sure the order has changed:
assert testData1 != [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
# Make sure that when re-sorted, all the original values are there:
assert sorted(testData1) == [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
# Make sure an empty list shuffled remains empty:
testData2 = []
shuffle(testData2)
assert testData2 == []

## Esercizio 8: merge di due liste ordinate
Uno degli algoritmi di ordinamento più efficienti è il Merge Sort, che si compone di due fasi: divisione e merge. è un algoritmo discretamente complesso, quindi non lo tratteremo interamente. Ci concentriamo invece sulla seconda parte, ovvero il merge.

Scrivi una funzione `merge_lists(l1, l2)` che prende due liste ordinate `l1, l2` e ritorna una singla lista ordinata contenente gli elementi di queste due liste. Cerca di non usare `sorted()` o `list.sort()` nella soluzione dell'esercizio.

In [None]:
def merge_lists(l1, l2):
  lista_merged = [] # creazione lista_merged vuota
  i = j = 0
  while i < len(l1) and j < len(l2): # confrontiamo gli elementi l1 ed l2
    if l1[i] < l2[j]: # confronti per il sort
      lista_merged.append(l1[i])
      i = i+1
    else:
      lista_merged.append(l2[j])
      j = j + 1  

  lista_merged.extend(l1[i:]) # aggiunta di eventuali elementi rimanenti di l1
  lista_merged.extend(l2[j:]) # aggiunta di eventuali elementi rimanenti di l2 
  return lista_merged                          

In [None]:
assert merge_lists([1, 3, 6], [5, 7, 8, 9]) == [1, 3, 5, 6, 7, 8, 9]
assert merge_lists([1, 2, 3], [4, 5]) == [1, 2, 3, 4, 5]
assert merge_lists([4, 5], [1, 2, 3]) == [1, 2, 3, 4, 5]
assert merge_lists([2, 2, 2], [2, 2, 2]) == [2, 2, 2, 2, 2, 2]
assert merge_lists([1, 2, 3], []) == [1, 2, 3]
assert merge_lists([], [1, 2, 3]) == [1, 2, 3]

## Esercizio 9: file CSV
Un file CSV (Comma Separated Values) è un file di testo in cui ogni riga è un record (simile a una tabella di un DB) e usa la virgola (o altro carattere speciale) per delimitare i valori dei campi all'interno del record. Spesso inoltre presenta una priga riga (header) contenente il nome di ogni colonna. Questo tipo di file è molto usato, specie per contenere dataset (insiemi di dati).

Le due celle di codice che seguono scaricano un famoso file CSV (un dataset contenente dati dei passeggeri del Titanic) e mostrano le prime righe di tale file.

In [None]:
!wget https://raw.githubusercontent.com/datasciencedojo/datasets/master/titanic.csv

--2022-12-20 16:34:38--  https://raw.githubusercontent.com/datasciencedojo/datasets/master/titanic.csv
Resolving raw.githubusercontent.com (raw.githubusercontent.com)... 185.199.111.133, 185.199.108.133, 185.199.110.133, ...
Connecting to raw.githubusercontent.com (raw.githubusercontent.com)|185.199.111.133|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 60302 (59K) [text/plain]
Saving to: ‘titanic.csv’


2022-12-20 16:34:38 (5.13 MB/s) - ‘titanic.csv’ saved [60302/60302]



In [None]:
!head titanic.csv

PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S
2,1,1,"Cumings, Mrs. John Bradley (Florence Briggs Thayer)",female,38,1,0,PC 17599,71.2833,C85,C
3,1,3,"Heikkinen, Miss. Laina",female,26,0,0,STON/O2. 3101282,7.925,,S
4,1,1,"Futrelle, Mrs. Jacques Heath (Lily May Peel)",female,35,1,0,113803,53.1,C123,S
5,0,3,"Allen, Mr. William Henry",male,35,0,0,373450,8.05,,S
6,0,3,"Moran, Mr. James",male,,0,0,330877,8.4583,,Q
7,0,1,"McCarthy, Mr. Timothy J",male,54,0,0,17463,51.8625,E46,S
8,0,3,"Palsson, Master. Gosta Leonard",male,2,3,1,349909,21.075,,S
9,1,3,"Johnson, Mrs. Oscar W (Elisabeth Vilhelmina Berg)",female,27,0,2,347742,11.1333,,S


Ad esempio, la prima colonna è l'ID del passeggero, la seconda indica se è sopravvissuto o meno (notare 0/1 anzichè True/False) e la terza la classe del passeggero. Notare che in generale un record potrebbe avere dei campi mancanti (ad esempio nel primo record il campo "cabin" è mancante, si nota dalle doppie virgole ",,"). 

L'obiettivo è definire una funzione `load_data(file)` che legge il file e ritorna una struttura dati contenente tutti i dati di tutti i passeggeri. I campi mancanti devono avere valore `None`. La scelta della struttura sta a te, ad esempio si potrebbe usare un `dict` che ha come chiavi i nomi delle colonne, oppure una classe definita ad hoc. Idealmente, la struttura dati dovrebbe permettere di accedere a un particolare record in maniera rapida (es. tramite slicing `print(data[50])` o un metodo custom `print(data.get(50))` o come vi pare dovrei riuscire ad ottenere qualunque record in maniera semplice, in questo caso il 50esimo). Sarebbe ottimale avere la possibilità di effettuare slicing "column-wise", ovvero richiedere una singola colonna; ad esempio, `data['Name']` o `data.col['Name']` dovrebbe ritornare un iterabile contenente il nome di tutti i passeggeri.

Fatto questo, computare qualche semplice statistica del dataset usando la vostra struttura dati. Qualche suggerimento: percentuale di uomini/donne a bordo, nome più (o meno) diffuso, costo medio del biglietto, distribuzione delle età (cioè: $x$ persone con 22 anni, $y$ persone con 23 anni, $z$ con 24 anni, ...).