<a href="https://colab.research.google.com/github/magjanvaz/curso-python-us/blob/main/notebooks/introduction-python/strings.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Strings

Las **cadenas** nos permiten almacenar un conjunto de caracteres ordenados. Podemos definir una cadena usando 
- comillas simples: `'Hello world'`
- comillas dobles: `"Hello world"`
- comillas triples: `'''Hello world'''` o `"""Hello world"""`

Por defecto, Python utiliza la [codificaci√≥n UTF-8](https://docs.python.org/3/howto/unicode.html#unicode-howto) para representar una amplia gama de caracteres, como pueden ser las tildes, nuestra `√±` o una letra del alfabeto chino

In [None]:
print("‰Ω†Â•Ω") 

‰Ω†Â•Ω


Al igual que pasaba con los tipos num√©ricos, las cadenas en Python son objetos **inmutables**, es decir, una vez creados no pueden ser modificados. El tipo correspondiente es `str`

In [None]:
type("Hello")

str

In [None]:
isinstance("42", str)

True

In [None]:
str(True)

'True'

Otra caracter√≠stica de las cadenas es que son objetos **secuenciales**, es decir, tienen un orden interno y podemos acceder a sus objetos a trav√©s de un entero empezando en 0. 

In [None]:
sentence = "En un lugar de la mancha de cuyo nombre no quiero acordarme"
print(sentence[0]) #siempre comenzamos en 0 a contar los √≠ndices
print(sentence[6:15])
print(sentence[-1])
print(sentence[6:])
print(sentence[:-5])

E
lugar de 
e
lugar de la mancha de cuyo nombre no quiero acordarme
En un lugar de la mancha de cuyo nombre no quiero acor


> Estas operaciones de indexado no son exclusivas de las cadenas, si no que se pueden aplicar a cualquier tipo que sea secuencial.

Podemos escribir saltos de l√≠neas y tabulaciones mediante los caracteres `\n` y `\t`, respectivamente. Si queremos obviar el comportamiento de estos caracteres, podemos utilizar la funci√≥n `repr` en lugar de `print`

In [None]:
x = "foo...\n...bar"
print(x)
repr(x)

foo...
...bar


"'foo...\\n...bar'"

Si queremos escribir una cadena a lo largo de varias l√≠neas, podemos utilizar comillas triples y ahorrarnos el `\n`

In [None]:
y = """
foo...
...bar
"""
print(y)


foo...
...bar



---
## Funciones para manipular cadenas
Python incorpora un gran n√∫mero de funciones y m√©todos para operar con cadenas. A continuaci√≥n mostramos algunas de las m√°s comunes

In [None]:
# Convierte la primera letra en may√∫scula
"hello".capitalize()

'Hello'

In [None]:
str.capitalize("hello") # es equivalente

'Hello'

In [None]:
# Convierte en may√∫scula y min√∫scula
"89fdsHJFjl43FD92".upper() #.lower()

'89FDSHJFJL43FD92'

In [None]:
# Une una lista de cadenas mediante otra cadena 
"...".join(["A", "B", "C"])

'A...B...C'

In [None]:
# Separa una cadena en una lista de cadenas 
"Universidad de Sevilla".split(" ")

['Universidad', 'de', 'Sevilla']

In [None]:
# reemplaza una parte de una cadena por otra
"Facultad de F√≠sica".replace("F√≠sica", "Matem√°ticas")

'Facultad de Matem√°ticas'

Muchas m√°s funciones pueden encontrarse en la [documentaci√≥n oficial](https://docs.python.org/3/library/stdtypes.html#string-methods)

---
## f-strings
Las cadenas formateadas o *f-strings* nos permiten incrustar variables en una cadena con una sintaxis muy c√≥moda. Para definir una cadena mediante este m√©todo, escribimos una `f` justo antes de las comillas (ya sean simples, dobles o triples). Ve√°moslo con un ejemplo

In [None]:
nombre = "Antonio"
edad = 45
msg = f"Me llamo {nombre} y tengo {edad} a√±os"
print(msg)

Me llamo Antonio y tengo 45 a√±os


No solo podemos incluir variables si no expresiones que son directamente evaluadas

In [None]:
x = 432
y = 17
msg = f"El cociente de dividir {x} entre {y} vale {x % y}"
print(msg)

El cociente de dividir 432 entre 17 vale 7


Las cadenas formatedas no est√°n disponibles en versiones de Python anteriores a la 3.6, en su lugar hay que usar la antigua sintaxis con la funci√≥n `format`. Para mostrar un n√∫mero concreto de decimales u otras opciones, existe la posibilidad de formatear las cadenas 

In [None]:
from math import pi
print(f"El n√∫mero ùúã con 7 decimales: {pi:0.7f}")

El n√∫mero ùúã con 7 decimales: 3.1415927


:::{exercise}
:label: strings-split

¬øEn qu√© se diferencian las funciones `split` y `rsplit`?

:::

In [None]:
?str.rsplit # seg√∫n la ayuda, rsplit trabaja de atr√°s a adelante
?str.split

In [None]:
print("Vamos a la calle".split(" ",1))
print("Vamos a la calle".rsplit(" ",1))

['Vamos', 'a la calle']
['Vamos a la', 'calle']


:::{exercise}
:label: strings-scape

Considera las siguientes cadenas 


```
x = "foo\nbar"
y = """
foo
bar
"""
```

¬øSe tiene que `x == y`? ¬øPor qu√©?

:::

In [None]:
x= "foo\nbar"
y="""
foo
bar
"""
x==y

False

In [None]:
z="""foo
bar"""
x==z

True

In [None]:
print(repr(y)) # vemos que la y tiene saltos de l√≠neas al principio y final
print(repr(x))
print(repr(z))

'\nfoo\nbar\n'
'foo\nbar'
'foo\nbar'


:::{exercise}
:label: strings-check-name

Utilizando la variable `ascii_lowercase` del m√≥dulo `string`, escribe una cadena formateada que indique si tu nombre contiene la decimosegunda letra del abecedario.

:::

In [None]:
import string
from string import ascii_lowercase

letra = ascii_lowercase[11]
name = "Magdalena"
cond = letra in name

msg = f""" ¬ø{name} contiene la letra {letra}? {cond}"""
msg

' ¬øMagdalena contiene la letra l? True'