<a href="https://colab.research.google.com/github/lorenzo-arcioni/programmazione-python-base/blob/main/Capitolo2_Numeri_e_Stringhe/3_Stringhe.ipynb" target="_blank"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 🧬 Le Stringhe

In Python, una **stringa** (o *string*) è una sequenza ordinata e immutabile di caratteri Unicode. Questo significa che ogni carattere in una stringa ha una posizione ben definita (indicizzata) e che, una volta creata, una stringa **non può essere modificata direttamente**: tutte le operazioni che sembrano "modificare" una stringa restituiscono in realtà una **nuova stringa**.

Le stringhe sono fondamentali nella programmazione: rappresentano testi, parole, frasi, ma anche dati non testuali come codici, identificativi e persino contenuti di file.

## 🔤 Sintassi di base

Una stringa può essere definita in diversi modi, usando:
- **Apici singoli**: `'ciao'`
- **Apici doppi**: `"ciao"`
- **Triple virgolette** (singole o doppie): `'''ciao'''` oppure `"""ciao"""`, utili per stringhe su più righe (*multilinea*).

Python non distingue tra apici singoli e doppi: entrambi sono equivalenti. Questo consente una maggiore flessibilità, ad esempio per includere virgolette all'interno di una stringa senza dover usare il carattere di escape `\`.

In [2]:
s1 = 'Ciao'
s2 = "Mondo"
print(s1, s2)

Ciao Mondo


## 🔡 Caratteri Speciali nelle Stringhe

In Python, i caratteri speciali sono rappresentati da sequenze di escape, che iniziano con una barra rovesciata (`\`) seguita da un carattere con un significato particolare.

### Principali Sequenze di Escape

- `\n` : Nuova linea (line break)
- `\t` : Tabulazione orizzontale
- `\\` : Backslash letterale
- `\'` : Apostrofo
- `\"` : Virgolette doppie
- `\r` : Ritorno carrello
- `\b` : Backspace
- `\f` : Form feed
- `\ooo` : Valore ottale
- `\xhh` : Valore esadecimale

Queste sequenze sono utili per includere caratteri non stampabili o che altrimenti avrebbero un significato speciale nel codice, come ad esempio le virgolette o il carattere di nuova linea.

In [3]:
# Esempio di utilizzo di caratteri speciali
print("Prima linea\nSeconda linea")  # \n crea una nuova linea
print("Colonna1\tColonna2")          # \t aggiunge una tabulazione
print("Questo è un backslash: \\")   # \\ stampa un backslash
print("Virgolette doppie: \"Test\"") # \" stampa virgolette doppie
print("Apostrofo: \'Test\'")         # \' stampa un apostrofo

Prima linea
Seconda linea
Colonna1	Colonna2
Questo è un backslash: \
Virgolette doppie: "Test"
Apostrofo: 'Test'


### 🧵 Stringhe raw (`r"..."`)

Le **stringhe raw** (grezze) si definiscono anteponendo una `r` o `R` davanti alle virgolette: `r"testo"`.  
Queste stringhe **non interpretano i caratteri di escape**, come `\n`, `\t`, ecc.

Sono molto utili, ad esempio, quando si scrivono **percorsi di file su Windows** o **espressioni regolari**, perché evitano la doppia scrittura delle barre rovesciate (`\\`).

#### Esempi di confronto:

- `"C:\\Users\\Nome"` interpreta `\\` come `\`
- `r"C:\Users\Nome"` lascia la barra singola così com'è

In [4]:
# Stringa normale con caratteri di escape
normale = "Percorso:\nC:\\Users\\Mario"
print(normale)

# Stringa raw: i caratteri di escape non vengono interpretati
raw = r"Percorso:\nC:\Users\Mario"
print(raw)

Percorso:
C:\Users\Mario
Percorso:\nC:\Users\Mario


### 📏 La funzione `len()`

La funzione `len()` restituisce la lunghezza di una stringa, cioè il numero totale di caratteri che contiene.  
Ad esempio,

In [5]:
len("Python")

6

È molto utile per conoscere la dimensione della stringa e per lavorare con indici validi.

## 🔄 Casting a stringa con `str()`

La funzione `str()` permette di **convertire qualsiasi valore di tipo primitivo in una stringa**.

I tipi primitivi più comuni da convertire in stringa sono:

- Numeri interi (`int`)  
- Numeri decimali (`float`)  
- Valori booleani (`bool`)  
- Valore `None`  

Quando si usa `str()` su uno di questi tipi, il risultato è una rappresentazione testuale leggibile del valore.

In [1]:
# Esempi di casting da tipi primitivi a stringa con str()

# Intero
num_int = 42
str_int = str(num_int)
print(f"Intero {num_int} -> stringa '{str_int}'")

# Float
num_float = 3.14159
str_float = str(num_float)
print(f"Float {num_float} -> stringa '{str_float}'")

# Booleano
bool_true = True
bool_false = False
print(f"Booleano {bool_true} -> stringa '{str(bool_true)}'")
print(f"Booleano {bool_false} -> stringa '{str(bool_false)}'")

# None
none_val = None
print(f"None -> stringa '{str(none_val)}'")

Intero 42 -> stringa '42'
Float 3.14159 -> stringa '3.14159'
Booleano True -> stringa 'True'
Booleano False -> stringa 'False'
None -> stringa 'None'


Questa conversione è fondamentale quando si vuole concatenare valori diversi in un output testuale, oppure quando si deve serializzare dati.

**Nota:** La funzione `str()` è diversa da `repr()` che restituisce una stringa più dettagliata e “ufficiale” spesso utilizzata per il debugging.

# 🔢 Indicizzazione e Slicing delle Stringhe

In Python, le **stringhe** sono sequenze ordinate di caratteri. Ogni carattere occupa una posizione numerica chiamata **indice**, che può essere positivo (da sinistra verso destra, partendo da 0) o negativo (da destra verso sinistra, partendo da -1).

## 🎯 Indicizzazione

L'indicizzazione permette di accedere a un singolo carattere di una stringa. La sintassi è:

- $s[i]$ → restituisce il carattere all'indice $i$

Esempio:

In [6]:
s = "Python"

# Indici positivi
print(s[0])  # P
print(s[1])  # y

# Indici negativi
print(s[-1])  # n
print(s[-2])  # o

P
y
n
o


Gli **indici negativi** permettono di accedere ai caratteri partendo dalla fine della stringa: $-1$ corrisponde all’ultimo carattere, $-2$ al penultimo, e così via. Questo è utile per lavorare con la coda di una stringa **senza conoscerne la lunghezza**.

### Attenzione

- Se l'indice non esiste, Python restituisce un errore di tipo `IndexError`.
- Se l'indice non e' intero, Python restituisce un errore di tipo `TypeError`.
- Se la stringa è vuota, Python restituisce un errore di tipo `IndexError`.

In [7]:
# s[35]
# s[3.4]
# ""[0]

## ✂️ Slicing

Lo slicing consente di ottenere **sottostringhe** specificando un intervallo di indici. La sintassi generale è:

- $s[inizio:fine:passo]$

Dove:
- $inizio$ è l'indice da cui si parte (incluso)
- $fine$ è l'indice fino a cui si arriva (escluso)
- $passo$ indica ogni quanti caratteri prendere (default è $1$)

Esempi:

In [8]:
s = "Programmare"

# Slicing
print("######## Slicing con indici positivi ########")

print("\nStringa originale:", s, "\n")

print(s[0:4])  # Prog
print(s[:4])  # Prog
print(s[4:])  # rammare

######## Slicing con indici positivi ########

Stringa originale: Programmare 

Prog
Prog
rammare


In [9]:
# Slicing con indici negativi
print("######## Slicing con indici negativi ########")

print("\nStringa originale:", s, "\n")

print(s[-4:])  # mare
print(s[:-4])  # Program
print(s[-4:-2])  # ma
print(s[-4:-1])  # mar

######## Slicing con indici negativi ########

Stringa originale: Programmare 

mare
Program
ma
mar


In [10]:
# Slicing con passo
print("######## Slicing con passo ########")

print("\nStringa originale:", s, "\n")

print(s[::3])  # Pgmr
print(s[:5:3])  # Pg
print(s[2::3])  # oaa
print(s[2:7:3])  # oa

######## Slicing con passo ########

Stringa originale: Programmare 

Pgmr
Pg
oaa
oa


In [11]:
# Slicing con passo negativo
print("######## Slicing con passo negativo ########")

print("\nStringa originale:", s, "\n")

print(s[::-1])  # eramargorP ## Inverte la stringa
print(s[::-2])  # eamroP
print(s[2:4:-1]) #
print(s[:5:-2]) # eam

######## Slicing con passo negativo ########

Stringa originale: Programmare 

erammargorP
eamroP

eam


### 🧩 Perché `s[2:4:-1]` restituisce una stringa vuota?

Quando si usa uno slicing con passo negativo (ad esempio `-1`), l'indice iniziale deve essere maggiore dell'indice finale per estrarre caratteri andando all'indietro.  
Nel caso di `s[2:4:-1]`, l'indice iniziale (2) è minore dell'indice finale (4), quindi non viene selezionato nessun carattere e la stringa risultante è vuota (`''`).

Infatti, invertendo il 4 con il 2,

In [12]:
print("\nStringa originale:", s, "\n")

print(s[4:2:-1]) # rg


Stringa originale: Programmare 

rg


### 🔄 Perché `s[::-1]` funziona?

Con `s[::-1]` entrambi gli indici `start` e `end` sono omessi:  
- Quando il passo è negativo, Python assume per default `start = len(s) - 1` (l’ultimo carattere)  
- e `end = -len(s) - 1` (virtualmente prima del primo carattere).  

Poiché `start > end` e il passo è -1, Python scorre all’indietro tutta la stringa, restituendo la versione invertita.

### ✅ Suggerimenti

- Usa `len(s)` per ottenere la lunghezza della stringa.
- Lo slicing **non** genera errore se gli indici sono fuori range: restituirà semplicemente la parte disponibile.
- Il `passo` può essere negativo per ottenere la stringa in ordine inverso.

## ➕ Operazioni su stringhe

Le **stringhe** in Python supportano varie operazioni grazie alla loro natura di sequenze.  
Ecco le due operazioni più comuni:

- **Concatenazione (`+`)**  
  Permette di unire due o più stringhe in una nuova stringa.  
  ➤ Esempio: $"Hello" + "\text{ }" + "World"$ produce la stringa $"Hello\text{ }World"$.

- **Ripetizione (`*`)**  
  Permette di ripetere una stringa un certo numero di volte.  
  ➤ Esempio: $"ha" * 3$ produce la stringa $"hahaha"$.

> 🔒 Ricorda: le stringhe sono **immutabili**, quindi ogni operazione restituisce una **nuova** stringa senza modificare l'originale.

In [13]:
a = "Py"
b = "thon"
print(a + b)    # Concatenazione
print(a * 3)    # Ripetizione

Python
PyPyPy


## 🚫 Immutabilità delle stringhe

Le stringhe non possono essere modificate direttamente. Qualsiasi operazione restituisce una **nuova stringa**.


In [14]:
s = "Python"
# s[0] = 'J'  # Questo genera un errore
s = 'J' + s[1:] # Possiamo però crearne un'altra a partire da s
print(s)

Jython


## 🛠️ Metodi delle Stringhe

In Python, le stringhe non solo supportano operazioni da sequenza (come l'indicizzazione e lo slicing), ma offrono anche una vasta gamma di **metodi specifici**.  
Questi metodi consentono di trasformare, cercare, modificare e verificare il contenuto delle stringhe in modo molto efficace.  
Essendo **immutabili**, ogni metodo restituisce una nuova stringa (o altro valore) lasciando inalterata quella originale.

Vediamo una panoramica dei metodi più comuni, suddivisi per categoria.

### 🔠 Modifica del contenuto: `upper()`, `lower()`, `title()`, `capitalize()`

Questi metodi trasformano il contenuto della stringa modificandone il **case** (cioè maiuscole/minuscole):

- `$str.upper()$` → Tutti i caratteri in **maiuscolo**  
- `$str.lower()$` → Tutti i caratteri in **minuscolo**  
- `$str.title()$` → Ogni parola con l'iniziale maiuscola  
- `$str.capitalize()$` → Solo il primo carattere della stringa in maiuscolo

In [15]:
s = "ciao mondo"
print(s.upper())       # CIAO MONDO
print(s.lower())       # ciao mondo
print(s.title())       # Ciao Mondo
print(s.capitalize())  # Ciao mondo

CIAO MONDO
ciao mondo
Ciao Mondo
Ciao mondo


### 🔍 Ricerca e sostituzione: `find()`, `replace()`

- `str.find(sub)` → Restituisce l’indice della **prima occorrenza** di `sub` o `-1` se non trovata  
- `str.replace(old, new)` → Restituisce una nuova stringa dove **tutte** le occorrenze di `old` sono sostituite con `new`

dove `sub`, `old` e `new` sono stringhe.

In [16]:
s = "programmare è divertente"
print(s.find("divertente"))  # 14
print(s.find("noioso"))      # -1
print(s.replace("divertente", "fighissimo"))  # programmare è una sfida

14
-1
programmare è fighissimo


### ✂️ Suddividere e unire stringhe: `split()`, `join()`

- `str.split(sep)` → Divide la stringa in una lista di sottostringhe usando `sep` come delimitatore  
- `sep.join(lista)` → Unisce una lista di stringhe in una singola stringa, separandole con `sep`

Quello che restituisce la funzione `split`, e che la funzione `join` prende in input, è una **lista**. La lista è una particolare struttura dati, molto importante, che approfondiremo più avanti.

In [17]:
s = "python,java,c++"
lista = s.split(",")
print(lista)  # ['python', 'java', 'c++']

# Oppure considerando gli spazi
s = "python java c++"
lista = s.split(" ")
print(lista)  # ['python', 'java', 'c++']

nuova = " | ".join(lista)
print(nuova)  # python | java | c++

['python', 'java', 'c++']
['python', 'java', 'c++']
python | java | c++


Per accedere all'elemento i-esimo della lista `lista` si usa la notazione `lista[i].`.

In [18]:
print(lista[0])
print(lista[1])
print(lista[2])

python
java
c++


### ✂️ Rimozione di spazi: `strip()`, `rstrip()`, `lstrip()`

- `str.strip()` → Rimuove spazi (e caratteri di nuova riga) da **entrambe** le estremità  
- `str.rstrip()` → Solo dalla **destra**  
- `str.lstrip()` → Solo dalla **sinistra**

In [19]:
s = "  \n  testo con spazi   "
print(s.strip())   # "testo con spazi"
print(s.lstrip())  # "testo con spazi   "
print(s.rstrip())  # "  \n  testo con spazi"

testo con spazi
testo con spazi   
  
  testo con spazi


### 🧪 Test di contenuto: `isalpha()`, `isdigit()`, `isalnum()`, `isspace()`

Questi metodi restituiscono **valori booleani**:

- `str.isalpha()` → True se tutti i caratteri sono **lettere**  
- `str.isdigit()` → True se tutti i caratteri sono **cifre**  
- `str.isalnum()` → True se tutti i caratteri sono lettere o cifre  
- `str.isspace()` → True se contiene **solo spazi o caratteri di spaziatura**

In [20]:
print("Python".isalpha())   # True
print("1234".isdigit())     # True
print("abc123".isalnum())   # True
print("   \n\t".isspace())  # True

True
True
True
True


## 🧾 Formattazione delle stringhe

Python offre diverse modalità per incorporare valori dinamici all'interno delle stringhe. Le principali tecniche di formattazione sono:

1. **Operatori con `%`** – vecchio stile, simile al C.
2. **Metodo `.format()`** – introdotto in Python 2.6/3.0, più leggibile e potente.
3. **f-string (formatted string literals)** – introdotte in Python 3.6, offrono una sintassi concisa e leggibile.

Vediamo ciascun metodo con esempi.

### 🎯 Formattazione con `%`

L'operatore `%` consente di inserire valori in una stringa utilizzando dei segnaposto:

- `%s` → stringa
- `%d` → intero
- `%f` → float

Questa tecnica è ancora usata (in C ad esempio), ma è considerata meno flessibile e più soggetta a errori rispetto ai metodi più moderni.

In [21]:
nome = "Alice"
età = 30
print("Mi chiamo %s e ho %d anni." % (nome, età))

Mi chiamo Alice e ho 30 anni.


### 🧩 Formattazione con `.format()`

Il metodo `.format()` consente di inserire valori nei segnaposto `{}` all'interno della stringa. È possibile:

- Usare l'ordine degli argomenti
- Specificare indici
- Usare argomenti nominati

È più leggibile e versatile del vecchio metodo con `%`.

In [22]:
nome = "Alice"
età = 30
print("Mi chiamo {} e ho {} anni.".format(nome, età))
print("Mi chiamo {0} e ho {1} anni. {0} è il mio nome.".format(nome, età))
print("Mi chiamo {nome} e ho {anni} anni.".format(nome="Alice", anni=30))

Mi chiamo Alice e ho 30 anni.
Mi chiamo Alice e ho 30 anni. Alice è il mio nome.
Mi chiamo Alice e ho 30 anni.


### ⚡ f-string (Formatted String Literals)

Le f-string sono stringhe che iniziano con `f` e permettono di inserire direttamente espressioni Python nei segnaposto `{}`.

Sono concise, efficienti e leggibili. Possono anche contenere espressioni complesse o chiamate a funzioni.

In [23]:
nome = "Alice"
età = 30
print(f"Mi chiamo {nome} e ho {età} anni.")
print(f"Tra 5 anni avrò {età + 5} anni.")

Mi chiamo Alice e ho 30 anni.
Tra 5 anni avrò 35 anni.


In [24]:
nome = "Mario"
eta = 30

print("Mi chiamo %s e ho %d anni." % (nome, eta))
print("Mi chiamo {} e ho {} anni.".format(nome, eta))
print(f"Mi chiamo {nome} e ho {eta} anni.")


Mi chiamo Mario e ho 30 anni.
Mi chiamo Mario e ho 30 anni.
Mi chiamo Mario e ho 30 anni.


### 📝 Il formattatore `!r` nelle f-string

In Python, quando usi le **f-string** (stringhe formattate con `f"..."`), puoi applicare un modificatore chiamato **`!r`** per ottenere la rappresentazione `repr()` dell'oggetto. 

- `!r` indica a Python di chiamare la funzione `repr()` sull'oggetto, che restituisce una rappresentazione “ufficiale” e dettagliata del valore.
- Questo è particolarmente utile per vedere stringhe con le virgolette, valori `None`, o per debug, perché mostra il contenuto esatto incluso il tipo e i caratteri speciali.

**Esempio:**

In [25]:
nome = "Alice"
print(f'Senza !r: {nome}')
print(f'Con !r: {nome!r}')

Senza !r: Alice
Con !r: 'Alice'


Qui, `nome!r` mostra la stringa con le virgolette incluse, evidenziando che si tratta di una stringa.

### 🔍 Altri formattatori in Python nelle f-string

Oltre a `!r`, ci sono altri due modificatori utili:

- `!s` — usa la funzione `str()` per ottenere una rappresentazione “leggibile” e user-friendly dell’oggetto (è il comportamento predefinito senza modificatori).
- `!a` — usa la funzione `ascii()`, che restituisce una stringa con tutti i caratteri non ASCII convertiti in sequenze di escape.

**Esempio:**

In [26]:
val = "Caffè"

print(f'Str (default): {val!s}')
print(f'Repr (!r): {val!r}')
print(f'Ascii (!a): {val!a}')

Str (default): Caffè
Repr (!r): 'Caffè'
Ascii (!a): 'Caff\xe8'


## 🔚 Inizio, Fine e Conteggio di Sottostringhe

Python offre metodi molto utili per controllare se una stringa **inizia**, **termina** o **contiene** una certa sottostringa, o per **contarne le occorrenze**.

### 🚀 `startswith()` e `endswith()`

- `s.startswith(prefix)` → restituisce `True` se la stringa `s` **inizia con** `prefix`
- `s.endswith(suffix)` → restituisce `True` se la stringa `s` **termina con** `suffix`

Entrambi accettano anche tuple di stringhe per controllare più alternative.

📌 **Esempi:**

In [27]:
frase = "ciao mondo"

# Inizia con...
print(frase.startswith("ciao"))        # True
print(frase.startswith("mondo"))       # False

# Finisce con...
print(frase.endswith("mondo"))         # True
print(frase.endswith("ciao"))          # False

# Controllo multiplo
file = "documento.pdf"
print(file.endswith((".pdf", ".docx")))  # True
print(file.endswith((".jpg", ".png")))   # False

True
False
True
False
True
False


### 🔍 `in` → Controllo di sottostringa

- `substr in s` → restituisce `True` se la sottostringa `substr` è **contenuta** nella stringa $s$

📌 **Esempi:**

In [28]:
testo = "intelligenza artificiale"

print("ai" in testo)     # False
print("robot" in testo)  # False
print("genza" in testo)  # True

False
False
True


### 🔢 `count()` → Conteggio di occorrenze

- `s.count(substr)` → restituisce **quante volte** `substr` appare in `s`

📌 **Esempi:**

In [29]:
parola = "banana"

print(parola.count("a"))     # 3
print(parola.count("na"))    # 2
print(parola.count("b"))     # 1
print(parola.count("x"))     # 0

3
2
1
0


## 📚 Ottenere aiuto e scoprire metodi

Python offre strumenti molto utili per esplorare gli oggetti e scoprire quali metodi o attributi possiedono.

- La funzione `dir()` restituisce una lista di tutti i metodi e attributi disponibili per un oggetto.
- La funzione `help()` fornisce la documentazione dettagliata su un metodo o un oggetto specifico.

Questi strumenti sono essenziali per imparare a usare efficacemente le librerie e i tipi di dato, specialmente quando si inizia a lavorare con nuovi oggetti o moduli.

In [30]:
import nbformat

with open("3_Stringhe.ipynb", "r", encoding="utf-8") as f:
    notebook = nbformat.read(f, as_version=4)

with open("solo_markdown.md", "w", encoding="utf-8") as out:
    for cell in notebook.cells:
        if cell.cell_type == "markdown":
            out.write(cell.source + "\n\n")
    out.close()

In [31]:
# Esempio di uso di dir() su una stringa
s = "Python"
print(dir(s))  # Mostra tutti i metodi e attributi disponibili per la stringa s

['__add__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mod__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__rmod__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'capitalize', 'casefold', 'center', 'count', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'format_map', 'index', 'isalnum', 'isalpha', 'isascii', 'isdecimal', 'isdigit', 'isidentifier', 'islower', 'isnumeric', 'isprintable', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'maketrans', 'partition', 'removeprefix', 'removesuffix', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition', 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill']


In [32]:
# Esempio di uso di help() su un metodo specifico
help(s.upper)  # Mostra la documentazione del metodo upper()

Help on built-in function upper:

upper() method of builtins.str instance
    Return a copy of the string converted to uppercase.



In [33]:
# Esempio di uso di help() sull'intero tipo stringa
help(str)  # Visualizza la documentazione completa della classe stringa

Help on class str in module builtins:

class str(object)
 |  str(object='') -> str
 |  str(bytes_or_buffer[, encoding[, errors]]) -> str
 |  
 |  Create a new string object from the given object. If encoding or
 |  errors is specified, then the object must expose a data buffer
 |  that will be decoded using the given encoding and error handler.
 |  Otherwise, returns the result of object.__str__() (if defined)
 |  or repr(object).
 |  encoding defaults to sys.getdefaultencoding().
 |  errors defaults to 'strict'.
 |  
 |  Methods defined here:
 |  
 |  __add__(self, value, /)
 |      Return self+value.
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __format__(self, format_spec, /)
 |      Return a formatted version of the string as described by format_spec.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  

## 🧵 Pattern Matching con il modulo `re` (regex)

Il modulo `re` permette di usare **espressioni regolari (regex)** per cercare, sostituire o verificare schemi all'interno di stringhe.

### ✨ Funzioni principali del modulo `re`:

- `re.search(p, s)` — Cerca la **prima corrispondenza** del pattern `p` nella stringa `s`.
- `re.findall(p, s)` — Restituisce **tutte le corrispondenze** trovate.
- `re.sub(p, r, s)` — Sostituisce in `s` tutte le corrispondenze di `p` con `r`.
- `re.match(p, s)` — Verifica se la stringa `s` **inizia** con il pattern `p`.

### 🔤 Alcuni simboli utili nei pattern:

- `\d` → una cifra (`0-9`)
- `\w` → un carattere alfanumerico (`a-z`, `A-Z`, `0-9`, `_`)
- `.` → qualunque carattere (eccetto newline)
- `^` → inizio stringa
- `$` → fine stringa
- `+` → uno o più elementi
- `*` → zero o più elementi

🧪 I pattern si scrivono spesso come **stringhe raw**: `r"..."`  
Così non serve raddoppiare i backslash (es: `r"\d+"` invece di `"\\d+"`).

In [34]:
import re

testo = "Il mio numero preferito è 42."

risultato = re.search(r"numero", testo)
if risultato:
    print("Trovato:", risultato.group())
else:
    print("Non trovato.")

Trovato: numero


In [35]:
testo = "Password123, codice 007 e stanza 404"
cifre = re.findall(r"\d+", testo)
print("Cifre trovate:", cifre)

Cifre trovate: ['123', '007', '404']


In [36]:
testo = "User123 - Accesso 2025"
modificato = re.sub(r"\d", "X", testo)
print("Testo modificato:", modificato)

Testo modificato: UserXXX - Accesso XXXX


### ℹ️ Nota

Le regex sono molto potenti anche solo con i costrutti di base.  
Per esplorare ed esercitarsi, si consiglia: [regex101.com](https://regex101.com)

## 🧮 Confronto tra Stringhe e Ordinamento

In Python è possibile **confrontare** due stringhe utilizzando gli operatori di confronto standard:  
`==`, `!=`, `<`, `>`, `<=`, `>=`.

### 🔤 Come funziona il confronto?

Python confronta le stringhe **carattere per carattere**, in base ai **codici Unicode** dei caratteri.  
Questo significa che:

- `"a" < "b"` perché il codice Unicode di `"a"` è minore di quello di `"b"`.
- `"abc" < "b"` perché il confronto parte dal primo carattere: `"a"` è minore di `"b"`.
- `"Z"` è **minore** di `"a"` perché le lettere maiuscole vengono **prima** delle minuscole in Unicode.

### 📚 Ordine Unicode

Ecco alcuni codici Unicode comuni:

- `"A"` → 65
- `"Z"` → 90
- `"a"` → 97
- `"z"` → 122

Puoi verificarli con `ord()`

### 🔢 Funzione `ord()`

La funzione `ord()` prende un singolo carattere (stringa di lunghezza 1) e restituisce il suo **codice Unicode** come numero intero.

Questo codice rappresenta la posizione del carattere nella tabella Unicode, che Python usa per confrontare e ordinare le stringhe.

📌 **Sintassi:**  
- `ord(carattere)` → restituisce il numero Unicode corrispondente a `carattere`

**Esempio:**

- `ord('A')` restituisce 65
- `ord('a')` restituisce 97

È molto utile per capire l'ordine lessicografico e fare confronti basati sui valori numerici dei caratteri.

In [37]:
# Esempi di confronto tra stringhe
print("a" < "b")          # True
print("abc" < "b")        # True
print("Z" < "a")          # True

# Verifica codici Unicode con ord()
print(ord("A"))  # 65
print(ord("Z"))  # 90
print(ord("a"))  # 97
print(ord("z"))  # 122
print(ord(" "))  # 32

True
True
True
65
90
97
122
32


### 🔣 Funzione `chr()`

La funzione `chr()` fa l’operazione inversa di `ord()`: prende un **numero intero** (codice Unicode) e restituisce il **carattere corrispondente**.

È utile quando vuoi convertire numeri in lettere, ad esempio nei cifrari o nei giochi con caratteri.

📌 **Sintassi:**  
- `chr(numero)` → restituisce il carattere Unicode corrispondente a `numero`

**Esempio:**

Usiamo `chr()` per ottenere i caratteri corrispondenti ai codici numerici.

In [38]:
# Conversione da codice Unicode a carattere con chr()
print(chr(65))   # 'A'
print(chr(90))   # 'Z'
print(chr(97))   # 'a'
print(chr(122))  # 'z'
print(chr(32))   # ' ' (spazio)

A
Z
a
z
 


## Tabella Unicode dei Caratteri Comuni

La tabella sottostante mostra alcuni caratteri comuni insieme ai loro codici Unicode (ASCII) in formato esadecimale e decimale, come visualizzati dalla funzione ord() in Python.
<br>
<img src="https://naveenr.net/content/images/2017/03/ascii-codes.gif" alt="Tabella Unicode" width="600"/>

Descrizione:

- La colonna `Char` mostra il simbolo visualizzato.

- Le colonne `Hex` e `Dec` rappresentanca il valore Unicode del carattere (es. `41` per 'A').

- La funzione `ord()` restituisce il codice Unicode in forma decimale (es. `65` per 'A').

- Unicode è uno standard che assegna un numero univoco a ogni carattere, indipendentemente dalla piattaforma, programma o lingua.

Questa tabella è utile per comprendere come Python rappresenta internamente i caratteri e come funziona la codifica Unicode.

## 📜 Stringhe Multilinea

In Python, le stringhe multilinea permettono di scrivere testi che si estendono su più righe, mantenendo la formattazione originale.

### Come si definiscono?

Si usano le **triple virgolette** (singole o doppie):

```python
'''testo 

su più 

righe

'''

"""
testo 
su più 
righe
"""

```

Questa sintassi è molto comoda per:

- Documentare funzioni (docstring)
- Scrivere blocchi di testo lunghi
- Includere caratteri di nuova linea senza usare `\n`

### Caratteristiche

- Mantengono gli spazi e i ritorni a capo esattamente come scritti.
- Possono contenere sia apici singoli che doppi senza bisogno di escape.
- Sono immutabili come tutte le stringhe in Python.

In [39]:
# Esempio di stringa multilinea con triple virgolette

testo_multilinea = """Questa è una stringa
che si estende
su più righe.

Include anche righe vuote e spazi."""

print(testo_multilinea)
print(type(testo_multilinea))

Questa è una stringa
che si estende
su più righe.

Include anche righe vuote e spazi.
<class 'str'>


In [40]:
# Con le triple virgolette singole funziona allo stesso modo

docstring = '''Questa è una docstring
per una funzione immaginaria.

Serve per spiegare cosa fa la funzione.'''

print(docstring)

Questa è una docstring
per una funzione immaginaria.

Serve per spiegare cosa fa la funzione.


## ✅ Conclusioni

In questo notebook abbiamo esplorato in profondità il mondo delle **stringhe** in Python, un tipo di dato fondamentale per la programmazione.

Abbiamo imparato:

- Come **definire** e **rappresentare** stringhe, anche su più righe con le **stringhe multilinea** (triple virgolette)
- A usare i **caratteri speciali** e le **stringhe raw** per gestire sequenze di escape e percorsi
- A lavorare con **indicizzazione** e **slicing** per accedere e manipolare sottostringhe in modo flessibile
- Le principali **operazioni** sulle stringhe: concatenazione (`+`), ripetizione (`*`), e gli operatori di confronto (`==`, `!=`, `<`, `>`, `<=`, `>=`)
- Il concetto di **immutabilità** delle stringhe, che implica che ogni modifica crea una nuova stringa
- I principali **metodi utili** per trasformazione, ricerca, suddivisione e verifica (`upper()`, `split()`, `replace()`, `isalpha()` ecc.)
- Le diverse **modalità di formattazione** delle stringhe: con l’operatore `%`, il metodo `.format()`, e le moderne f-string
- Le funzioni che permettono la traduzione di un carattere in un codice Unicode e viceversa
- Come ottenere **aiuto** e scoprire i metodi disponibili con le funzioni `dir()` e `help()`
- I fondamenti del **pattern matching** con il modulo `re`, per espressioni regolari semplici e potenti

💡 Le stringhe in Python sono strumenti estremamente potenti e versatili per lavorare con testi, dati strutturati, input/output e molto altro.

➡️ Continua con gli esercizi o il prossimo capitolo  per mettere in pratica quanto appreso!