<a href="https://colab.research.google.com/github/JavierAlvarezGlez/curso-python-us/blob/main/Copia_de_strings.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Strings

Las **cadenas** nos permiten almacenar un conjunto de caracteres ordenados. Podemos definir una cadena usando
- comillas simples: `'Hello world'`
- comillas dobles: `"Hello world"`
- comillas triples: `'''Hello world'''` o `"""Hello world"""`

Por defecto, Python utiliza la [codificación UTF-8](https://docs.python.org/3/howto/unicode.html#unicode-howto) para representar una amplia gama de caracteres, como pueden ser las tildes, nuestra `ñ` o una letra del alfabeto chino

In [1]:
print("你好")

你好


Al igual que pasaba con los tipos numéricos, las cadenas en Python son objetos **inmutables**, es decir, una vez creados no pueden ser modificados. El tipo correspondiente es `str`

In [2]:
type("Hello")

str

In [13]:
isinstance("42", str)

True

In [14]:
str(True)

'True'

In [11]:
s = "hola \n mundo"
print (s)
r = """hola
mundo"""
print(r)

hola 
 mundo
hola 
mundo


Otra característica de las cadenas es que son objetos **secuenciales**, es decir, tienen un orden interno y podemos acceder a sus objetos a través de un entero empezando en 0.

In [16]:
sentence = "En un lugar de la mancha de cuyo nombre no quiero acordarme"
print(sentence[0])
print(sentence[6:15])
print(sentence[-1])
print(sentence[6:])
print(sentence[:-5])

E
lugar de 
e
lugar de la mancha de cuyo nombre no quiero acordarme
En un lugar de la mancha de cuyo nombre no quiero acor


> Estas operaciones de indexado no son exclusivas de las cadenas, si no que se pueden aplicar a cualquier tipo que sea secuencial.

Podemos escribir saltos de líneas y tabulaciones mediante los caracteres `\n` y `\t`, respectivamente. Si queremos obviar el comportamiento de estos caracteres, podemos utilizar la función `repr` en lugar de `print`

In [17]:
x = "foo...\n...bar"
print(x)
repr(x)

foo...
...bar


"'foo...\\n...bar'"

Si queremos escribir una cadena a lo largo de varias líneas, podemos utilizar comillas triples y ahorrarnos el `\n`

In [None]:
y = """
foo...
...bar
"""
print(y)


foo...
...bar



---
## Funciones para manipular cadenas
Python incorpora un gran número de funciones y métodos para operar con cadenas. A continuación mostramos algunas de las más comunes

In [20]:
# Convierte la primera letra en mayúscula
"hello".capitalize()
# objeto.metodo()
# function(objeto)

'Hello'

In [22]:
# Convierte en mayúscula y minúscula
"89fdsHJFjl43FD92".upper() #.lower()

'89FDSHJFJL43FD92'

In [21]:
# Une una lista de cadenas mediante otra cadena
"...".join(["A", "B", "C"])

'A...B...C'

In [23]:
# Separa una cadena en una lista de cadenas
"Universidad de Sevilla".split(" ")

['Universidad', 'de', 'Sevilla']

In [24]:
# reemplaza una parte de una cadena por otra
"Facultad de Física".replace("Física", "Matemáticas")

'Facultad de Matemáticas'

Muchas más funciones pueden encontrarse en la [documentación oficial](https://docs.python.org/3/library/stdtypes.html#string-methods)

---
## f-strings
Las cadenas formateadas o *f-strings* nos permiten incrustar variables en una cadena con una sintaxis muy cómoda. Para definir una cadena mediante este método, escribimos una `f` justo antes de las comillas (ya sean simples, dobles o triples). Veámoslo con un ejemplo

In [25]:
nombre = "Antonio"
edad = 45
msg = f"Me llamo {nombre} y tengo {edad} años" # la f es para convertir los corchetes por los datos que tenga almacenados
print(msg)

Me llamo Antonio y tengo 45 años


No solo podemos incluir variables si no expresiones que son directamente evaluadas

In [26]:
x = 432
y = 17
msg = f"El cociente de dividir {x} entre {y} vale {x % y}"
print(msg)

El cociente de dividir 432 entre 17 vale 7


Las cadenas formatedas no están disponibles en versiones de Python anteriores a la 3.6, en su lugar hay que usar la antigua sintaxis con la función `format`. Para mostrar un número concreto de decimales u otras opciones, existe la posibilidad de formatear las cadenas

In [30]:
from math import pi
print(f"El número 𝜋 con 7 decimales: {pi:0.7f}")
print(f"El numero 10pi con 5 decimales: {pi:5g}")

El número 𝜋 con 7 decimales: 3.1415927
El numero 10pi con 5 decimales: 3.14159


:::{exercise}
:label: strings-split

¿En qué se diferencian las funciones `split` y `rsplit`?

:::

In [35]:
# La funcion split lo que hace es separar la cadenas en segmentos por la derecha y rsplit por la izquierda
"Hola mundo, me llamo Javi".split(" ", maxsplit = 2)

['Hola', 'mundo,', 'me llamo Javi']

In [36]:
"Hola mundo, me llamo Javi".rsplit(" ", maxsplit = 2)

['Hola mundo, me', 'llamo', 'Javi']

:::{exercise}
:label: strings-scape

Considera las siguientes cadenas


```
x = "foo\nbar"
y = """
foo
bar
"""
```

¿Se tiene que `x == y`? ¿Por qué?

:::

In [39]:
x = "foo\nbar"
y = """
foo
bar
"""
print (x)
print (y)

foo
bar

foo
bar



In [40]:
# no son iguales porque 1 tiene saltos de linea arriba y abajo y la otra no
print (x==y)

False


:::{exercise}
:label: strings-check-name

Utilizando la variable `ascii_lowercase` del módulo `string`, escribe una cadena formateada que indique si tu nombre contiene la decimosegunda letra del abecedario.

:::

In [49]:
import string
type(string.ascii_lowercase)
print(string.ascii_lowercase)
contains: bool = string.ascii_lowercase[9] in "Javier".lower()
f"Mi nombre contiene la novena letra del abecedario: {contains}"

abcdefghijklmnopqrstuvwxyz


'Mi nombre contiene la novena letra del abecedario: True'

In [43]:
"h" in "hola"

True