## Strings

Durant aquest curs, concretament en el tema 2, ja hem parlat dels _Strings_ com aquell tipus de dades que ens permet emmagatzemar informació textual. Formalment, un _String_ és una col·lecció **immutable** d'elements representats en format Unicode". 

Unicode és un estàndard universal per a la codificació, representació i manipulació de text en la majoria dels sistemes d'escriptura del món. Es va crear per proporcionar una forma única d'identificar cada caràcter, independentment del sistema operatiu, idioma o plataforma. ASCII és un subconjunt d’Unicode (els primers 128 caràcters coincideixen), bàsicament Unicode amplia ASCII per incloure caràcters de molts altres idiomes i sistemes d'escriptura.

A partir de la definició anterior podem resumir que els _Strings_ tenen les següents característiques:

- Es defineixen especificant els elements entre comes (simples, dobles o triples)
- Són immutables.
- Només poden contenir informació textual.


### Operacions bàsiques amb _Strings_

Els _Strings_ en Python permeten diverses operacions bàsiques que són fonamentals per a la seva manipulació. A continuació, es detallen les operacions més comunes:

**Concatenació**
Encara que ja havíem definit aquesta operació, la deixem aquí per completar la secció. La concatenació permet unir dues o més cadenes de text emprant l'operador `+`.

```python
s1 = "Hola"
s2 = " món"
resultat = s1 + s2
print(resultat)  # "Hola món"
```

**Repetició**
És possible repetir una cadena utilitzant l'operador `*`.

```python
s = "Hola "
resultat = s * 3
print(resultat)  # "Hola Hola Hola "
```

**Indexació i _Slicing_**
Els _Strings_ són seqüències indexades, on cada caràcter té una posició específica començant per `0`. Podem realitzar el mateix tipus d'indexació que explicat amb les llistes.

```python
s = "Python"
print(s[0])  # 'P'
print(s[-1])  # 'n' (índex negatiu per començar des del final)
```

També ens permet obtenir subcadenes mitjançant la sintaxi `[inici:fi:pas]`.

```python
s = "Programació"
print(s[0:4])   # "Prog" (del caràcter 0 al 3)
print(s[:5])    # "Progr" (del principi al 4)
print(s[3:])    # "gramació" (del 3 fins al final)
print(s[::-1])  # "cióamargorP" (cadena invertida)
```

Com és un tipus de dades no mutable, aquestes seleccions només serveixen per obtenir informació i no per modificar-ho.

**Longitud d'un _String_**
Amb la funció `len()` podem obtenir la quantitat de caràcters d'un _String_.

```python
s = "Python"
print(len(s))  # 6
```

Aquestes operacions bàsiques són fonamentals per treballar amb cadenes de text en Python. En els següents apartats es tractaran operacions més avançades com els mètodes de manipulació i formatació.


### Mètodes principals

Python proporciona diverses funcions i mètodes útils per manipular cadenes de text. És important fer notar que totes les operacions que modifiquen els _Strings_ el que fan és crear una nova còpia i modificar-la i això té un cert impacte en el rendiment dels nostres programes.
 
A continuació, es presenten els mètodes més comuns:

**Canvi de majúscules i minúscules**

```python
s = "Hola món"
print(s.upper())  # "HOLA MÓN"
print(s.lower())  # "hola món"
print(s.title())  # "Hola Món"
print(s.capitalize())  # "Hola món"
```

**Eliminació d'espais en blanc**

```python
s = "   Python   "
print(s.strip())  # "Python"
print(s.lstrip())  # "Python   "
print(s.rstrip())  # "   Python"
```
**Cerca i substitució**

```python
s = "Hola món, món!"
print(s.find("món"))  # 5 (índex de la primera aparició)
print(s.rfind("món"))  # 11 (última aparició)
print(s.replace("món", "terra"))  # "Hola terra, terra!"
```

**Verificació de contingut**

```python
s = "1234"
print(s.isdigit())  # True
print(s.isalpha())  # False Mira si els carácters són alfabètics
print("Python".isalpha())  # True
print(" ".isspace())  # True
```

A més dels mètodes d'exemple que es troben llistats a la documentació oficial podeu trobar-ne molts més: [enllaç](https://docs.python.org/3/library/stdtypes.html#string-methods).


### Contingut dels _Strings_

Els _Strings_ en Python són iterables, cosa que permet recórrer els seus caràcters fàcilment amb bucles, tal com passa amb les llistes, els bucles definits es troben especialment dissenyats per aquesta feina.

L'iteració sobre cadenes de caràcters és una tècnica essencial per al processament de text, sigui per cercar, modificar o analitzar dades.

**Iteració amb bucles definits**

```python
s = "Python"
for lletra in s:
    print(lletra)
```


**Iteració amb `while`**
En aquest cas haurem de definir la variable amb la qual indexarem i emprar els claudàtors per accedir als diferents elements. Bàsicament és un algorisme de recorregut.

```python
s = "Python"
i = 0
while i < len(s):
    print(s[i])
    i += 1
```

**Comprovació de caràcters en un String**

Tal com podem fer amb les llistes l'operador `in` permet comprovar si un element és a un _String_. Recordeu que també es pot emprar en combinació l'operador `not`.
```python
s = "Python"
if "y" in s:
    print("La lletra 'y' està present.")
```

**Transformació de Strings amb `list()` i `join()`**

En algunes ocasions ens interessarà realitzar transformacions (_castings_) entre llistes i _Strings_ podem fer-ho d'aquesta manera.

El mètode `join` concatena la llista que rep per paràmetre amb la cadena de caracters amb la que cridem al mètode (veure exemple).

```python
s = "Python"
llista = list(s)
print(llista)  # ['P', 'y', 't', 'h', 'o', 'n']

# Tornar a unir la llista en un String
nou_s = "-".join(llista)
print(nou_s)  # "P-y-t-h-o-n"
```


