Una stringa è una sequenza di caratteri. È uno dei tipi built-in di Python. 

In [1]:
s = "Hello world"

print(s)
print(type(s))


for c in s:
    print(c)
    
print('world' in s)

print('world' not in s)

Hello world
<class 'str'>
H
e
l
l
o
 
w
o
r
l
d
True
False


Una stringa è una sequenza di caratteri, e come ogni sequenza è possibile accedere al singolo elemento utilizzando le parentesi quadre. Inoltre essendo una sequenza, è possibile ottenere la sua lunghezza utilizzando la funzione `len`:

In [14]:
print(s)
print(s[4])
print(len(s))

Hello world
o
11


È possibile usare l'operatore `+` per concatenare fra loro due o più stringhe. Non è possibile concatenare fra loro una stringa e un altro tipo di dati. In questi casi si utilizza il metodo `str()` per convertire l'altro tipo di dato che si vuole concatenare in stringa:

In [25]:
s = "Hello"
t = "World"
u = "!"

print(s + t + u)

import math
# print("Il valore di Pi Greco è " + math.pi) # TypeError: can only concatenate str (not "float") to str
print("Il valore di Pi Greco è " + str(math.pi))

HelloWorld!
Il valore di Pi Greco è 3.141592653589793


È possibile utilizzare l'operatore `*` per ripetere una stringa per un certo numero di volte:

In [17]:
print("hello " * 4)

hello hello hello hello 


È possibile utilizzare le funzioni di formattazione di stringhe in Python per effettuare delle concatenazioni in maniera più agevole. È ad esempio possibile utilizzare la funzione `format()` su una stringa all'interno della quale ci sono dei placeholder. I caratteri placeholder sono le parentesi graffe aperte e chiuse (`{}`) ed è possibile assegnare ad ogni placeholder un argomento della funzione `format()`. 


In [72]:
first_name = "Giuseppe"
last_name = "Mastrandrea"
age = 19
print("{} {} is a nice guy and he's {} years old".format(first_name, last_name, age))

print("{0} {1} is a nice guy and he's {2} years old".format(first_name, last_name, age))

Giuseppe Mastrandrea is a nice guy and he's 19 years old
Giuseppe Mastrandrea is a nice guy and he's 19 years old


Nelle versioni più recenti di Python è possibile utilizzare le f-strings, ovvero delle stringhe che si fanno precedere ad una `f`. Questa `f` indica a Python che è possibile utilizzare nella stringa dei nomi di variabili direttamente nei placeholder `{}`:

In [73]:
print(f"{first_name} {last_name} is a nice guy and he's {age} years old.")

Giuseppe Mastrandrea is a nice guy and he's 19 years old.


Nelle stringhe Python ci sono dei caratteri "speciali". Un esempio di carattere speciale è il carattere **backslash** (`\`). Esso indica che il carattere immediatamente successivo al backslash assume un significato speciale. Ad esempio:
- `\n` stampa una nuova riga
- `\t` stampa una tabulazione

Esempi:

In [76]:
print("Ora andiamo \n a capo")
print("Ora stampiamo \t una tabulazione")

Ora andiamo 
 a capo
Ora stampiamo 	 una tabulazione


E se volessimo stampare proprio il carattere `\` in una stringa? Oppure i caratteri `\n`? In questo caso si può usare una stringa **raw**:


In [80]:
print(r'\n')
print(r'\t')

\n
\t


Oppure far precedere il gruppo "speciale" ad un **altro** backslash, in maniera che Python sappia che la sequenza di caratteri successiva è **escaped**:


In [79]:
print("\\n")
print("\\t")

\n
\t


La funzione `ord()` ritorna il valore intero corrispondente al carattere passato in input. Corrisponde al **code point** unicode convertito in decimale:

In [32]:
alphabet = "ABCDEFG"
accents  = "àèìòù"
emojis   = "😀😃😄😁"

for l in alphabet:
    print(l, ord(l))

for l in accents:
    print(l, ord(l))

for l in emojis:
    print(l, ord(l))


A 65
B 66
C 67
D 68
E 69
F 70
G 71
à 224
è 232
ì 236
ò 242
ù 249
😀 128512
😃 128515
😄 128516
😁 128513



La funzione `chr()` fa esattamente il contrario: prende in input un numero e restituisce in output un carattere:


In [35]:
print(chr(65))
print(chr(0x41))
print(chr(0x0000041))

A
A
A


È possibile convertire una stringa in numero utilizzando la forma della funzione `int(x, base)` con due parametri in input: il numero da convertire e la base numerica:

In [36]:
s = '0x000000041'

print(int(s, 16))

65


È anche possibile utilizzare i prefissi `\x`, `\u` o `\U` per stampare un code point come stringa. Rispettivamente bisogna usare:
- con `\x` due caratteri
- con `\u` quattro caratteri
- con `\U` otto caratteri

In [42]:
print('\x41')
print('\u0041')
print('\U00000041')


A
A
A


In Python, le stringhe sono di default **stringhe Unicode**. In Python2, per scrivere una stringa unicode bisognava esplicitamente far precedere alla stringa la lettera `u`:

    s = u"This is a Unicode String"

È possibile effettuare un **encoding** di una stringa utilizzando invece le stringhe di byte. Una stringa di byte in Python si crea facendo precedere la lettera `b` al momento della dichiarazione della stringa:

    s = b"This is a byte string"

È possibile usare le funzioni `encode(s, encoding)` e `decode(s, encoding)` per fare operazioni di encoding e decoding di una stringa.


In [63]:
us = u"Questa è una stringa Unicode"
bs = b"Hey, un unicorno!: \xF0\x9F\xA6\x84"


print(us.encode("UTF-32"))
print(bs.decode("UTF-8"))

print(bytes("è una stringa", 'utf-16').decode("UTF-16"))

b'\xff\xfe\x00\x00Q\x00\x00\x00u\x00\x00\x00e\x00\x00\x00s\x00\x00\x00t\x00\x00\x00a\x00\x00\x00 \x00\x00\x00\xe8\x00\x00\x00 \x00\x00\x00u\x00\x00\x00n\x00\x00\x00a\x00\x00\x00 \x00\x00\x00s\x00\x00\x00t\x00\x00\x00r\x00\x00\x00i\x00\x00\x00n\x00\x00\x00g\x00\x00\x00a\x00\x00\x00 \x00\x00\x00U\x00\x00\x00n\x00\x00\x00i\x00\x00\x00c\x00\x00\x00o\x00\x00\x00d\x00\x00\x00e\x00\x00\x00'
Hey, un unicorno!: 🦄
è una stringa


Chiaramente non tutti i caratteri sono presenti in ogni encoding. Ad esempio, vediamo che succede se inseriamo una in una stringa Unicode e proviamo a encodarla in ASCII (che ha 7 bit, quindi può rappresentare 128 caratteri al massimo):


In [65]:
s = "A slice of 🍕"

print(s.encode("ASCII"))

UnicodeEncodeError: 'ascii' codec can't encode character '\U0001f355' in position 11: ordinal not in range(128)