# **Cadenas de texto (Strings)**

Una de las áreas donde el lenguaje Python realmente destaca es en la manipulación de cadenas (strings).

Esta sección cubrirá algunos de los métodos integrados de cadenas de Python y las operaciones de formato. Estos patrones de manipulación de cadenas se presentan con frecuencia en el contexto del trabajo de ciencia de datos.

### Sintaxis de cadenas

Ya has visto muchas cadenas en ejemplos durante las lecciones anteriores, pero para recapitular, las cadenas en Python se pueden definir usando comillas simples o dobles. Son funcionalmente equivalentes.

In [None]:
x = 'Pluto is a planet'
y = "Pluto is a planet"
x == y

Las comillas dobles son útiles si tu cadena de texto contiene un carácter de comilla simple (por ejemplo, para representar un apóstrofo).

De manera similar, es sencillo crear una cadena que contenga comillas dobles si la envuelves en comillas simples.

In [None]:
print("Pluto's a planet!")
print('My dog is named "Pluto"')

Si intentamos poner un carácter de comilla simple dentro de una cadena de texto que ya está entre comillas simples, Python se confunde:

In [None]:
'Pluto's a planet!'

Podemos arreglar esto "escapando" la comilla simple con una barra invertida.

In [None]:
# 'Pluto\'s a planet!'

La siguiente tabla resume algunos usos importantes del carácter de barra invertida.

![image.png](attachment:image.png)

La última secuencia, `\n`, representa el carácter de salto de línea. Esto hace que Python comience una nueva línea.

In [None]:
# hello = "hello\nworld" 
# print(hello)

Además, la sintaxis de comillas triples de Python para las cadenas de texto nos permite incluir saltos de línea de forma literal (es decir, simplemente presionando "Enter" en nuestro teclado, en lugar de usar la secuencia especial \n). Ya hemos visto esto en las docstrings que usamos para documentar nuestras funciones, pero podemos usarlas en cualquier lugar donde queramos definir una cadena de texto.

In [None]:
triplequoted_hello = """hello
world"""
print(triplequoted_hello)
triplequoted_hello == hello

La función `print()` añade automáticamente un salto de línea a menos que especifiquemos un valor para el argumento de palabra clave end distinto de su valor predeterminado, que es `'\n'`.

In [None]:
print("hello")
print("world")
print("hello", end='')
print("pluto", end='')

### Las cadenas de texto (strings) son secuencias.

Las cadenas de texto pueden ser vistas como secuencias de caracteres. Casi todo lo que hemos visto que se puede hacer con una lista, también se puede hacer con una cadena de texto.

In [None]:
# Indexing
planet = 'Pluto'
planet[0]

In [None]:
# Slicing
planet[-3:]

In [None]:
# How long is this string?
len(planet)

In [None]:
# Yes, we can even loop over them
[char+'! ' for char in planet]

A pesar de ello, una de las principales diferencias con las listas es que las tuplas son inmutables. No podemos modificarlas.

In [None]:
planet[0] = B

# planet.append tampoco funciona

### Métodos de cadenas (String methods)

Al igual que las `list`, el tipo `str` tiene muchos métodos muy útiles. A continuación, te mostraré solo algunos ejemplos.

In [None]:
# Todas mayuscula
planeta = 'Marte, esta poblado!'
planeta.upper()

In [None]:
# Todas minusculas.
planeta.lower()

In [None]:
# Buscando el primer índice de una subcadena
planeta.index('pob')

In [None]:
planeta.startswith('Marte')

In [None]:
planeta.endswith('poblado')

Cambiando entre cadenas y listas: `.split()` y `.join()`

`str.split()` convierte una cadena de texto en una lista de cadenas más pequeñas, dividiéndola por espacios en blanco de manera predeterminada. Esto es muy útil para pasar de una cadena grande a una lista de palabras.

In [None]:
words = planeta.split()
words

De vez en cuando, querrás dividir por algo que no sea un espacio en blanco:

In [54]:
datestr = '2025-09-16'
year, month, day = datestr.split('-')

In [None]:
year, month, day

`str.join()` nos lleva en la dirección opuesta, uniendo una lista de cadenas de texto en una sola cadena larga, usando la cadena sobre la que se llama como un separador.

In [None]:
' ~> '.join([day, month, year])

In [None]:
# Sí, podemos poner caracteres unicode directamente en nuestros literales de cadena :)
' 👏 '.join([word.upper() for word in words])

Creación de cadenas con `.format()`

Python nos permite concatenar cadenas con el operador `+`.

In [None]:
planet + ', we miss you.'

Si queremos incluir objetos que no sean cadenas de texto, debemos tener cuidado de llamar primero a la función `str()` sobre ellos.

In [None]:
position = 9
planet + ", you'll always be the " + position + "th planet to me."

In [None]:
planet + ", you'll always be the " + str(position) + "th planet to me."

Esto se está volviendo difícil de leer y molesto de escribir. `str.format()` al rescate.

In [None]:
"{}, you'll always be the {}th planet to me.".format(planet, position)

¡Mucho más limpio! Llamamos a `.format()` en una "cadena de formato", donde los valores de Python que queremos insertar están representados con marcadores de posición `{}`.

Observa cómo ni siquiera tuvimos que llamar a `str()` para convertir position de un int. `format()` se encarga de eso por nosotros.

Si eso fuera todo lo que hiciera `format()`, aun así sería increíblemente útil. Pero resulta que puede hacer mucho más. Aquí tienes solo una muestra:

In [None]:
pluto_mass = 1.303 * 10**22
earth_mass = 5.9722 * 10**24
population = 52910390
#         2 decimal points   3 decimal points, format as percent     separate with commas
"{} weighs about {:.2} kilograms ({:.3%} of Earth's mass). It is home to {:,} Plutonians.".format(
    planet, pluto_mass, pluto_mass / earth_mass, population,
)

In [None]:
# Referring to format() arguments by index, starting from 0
s = """Pluto's a {0}.
No, it's a {1}.
{0}!
{1}!""".format('planet', 'dwarf planet')
print(s)

Podrías escribir un libro corto solo sobre str.format, así que me detendré aquí y te dirigiría a [pyformat.info](https://pyformat.info/) y a la [documentación oficial](https://docs.python.org/3/library/string.html#formatstrings) para que leas más.


# Diccionarios (Dictionaries)

Los diccionarios son una estructura de datos de Python que viene integrada y sirve para mapear claves a valores.

In [None]:
numbers = {'one':1, 'two':2, 'three':3}
numbers

En este caso, `'one'`, `'two'` y `'three'` son las **keys**, y 1, 2 y 3 son sus respectivos **values**.

Se accede a los valores mediante una sintaxis de corchetes, similar a cómo se indexan las listas y las cadenas de texto.

In [None]:
numbers['one']

Podemos usar la misma sintaxis para agregar otro par key-value.

In [None]:
numbers['twelve'] = 12
numbers

O para cambiar el valor asociado con una clave existente

In [None]:
numbers['one'] = 'Gato'
numbers

Python tiene comprensiones de diccionario *(dictionary comprehensions)* con una sintaxis similar a las comprensiones de lista *(list comprehensions)* que vimos en el tutorial anterior.

In [None]:
planets = ['Mercury', 'Venus', 'Earth', 'Mars', 'Jupiter', 'Saturn', 'Uranus', 'Neptune']
planet_to_initial = {planet: planet[0] for planet in planets}
planet_to_initial

El operador `in` nos indica si algo es una clave en el diccionario.

In [None]:
'Saturn' in planet_to_initial

In [None]:
'Betelgeuse' in planet_to_initial

Un bucle `for` sobre un diccionario recorrerá sus claves.

In [None]:
for k in numbers:
    print("{} = {}".format(k, numbers[k]))

Podemos acceder a una colección de todas las claves o de todos los valores con `dict.keys()` y `dict.values()`, respectivamente.

In [None]:
# Obtener todas las iniciales, ordenarlas alfabéticamente y colocarlas en una cadena separada por espacios.
' '.join(sorted(planet_to_initial.values()))

El muy útil método `dict.items()` nos permite iterar sobre las claves y los valores de un diccionario de forma simultánea. (En la jerga de Python, un "ítem" se refiere a un par de clave y valor).

In [None]:
for planet, initial in planet_to_initial.items():
    print("{} begins with \"{}\"".format(planet.rjust(10), initial))

Para leer un inventario completo de los métodos de los diccionarios, haz clic en el botón "output" (salida) de abajo para ver la página de ayuda completa, o consulta la [documentación oficial en línea](https://docs.python.org/3/library/stdtypes.html#dict).

In [None]:
help(dict)