# Cadenas

Las cadenas son un tipo de secuencias de Python, por lo que todo lo aplicable a las secuencias en cuanto a acceso y operadores, se aplica también a las cadenas.

Recordemos que las cadenas son **inmutables**. Por ello, todos los métodos devolverán una cadena con el resultado **pero no modificarán la cadena original**.

In [None]:
cadena = "Hola"

cadena[1] = 'a'

print()

Las cadenas se declaran utilizando las comillas simples ( `\'`) o dobles (`\"`).

## Métodos de capitalización



### `capitalize()`

Devuelve la misma cadena pero con la primera letra en mayúscula.

In [1]:
cadena = "hola"

print(cadena.capitalize())
print(cadena) # Vemos que la original no se modifica

Hola
hola


Si quisiéramos modificar la cadena, tendríamos que reasignar el resultado a la propia cadena:

In [None]:
cadena = "hola"

cadena = cadena.capitalize()

print(cadena)

### `lower()`

Devuelve una copia de la cadena con todos los caracteres en minúsculas.


In [3]:
cadena = "Привіт Світ"

print(cadena.lower())

привіт світ


In [4]:
cadena = "HOla"
print(cadena.lower())

hola


### `upper()`

Devuelve una copia de la cadena con todos los caracteres en mayúsculas.


In [5]:
cadena = "Привіт Світ"

print(cadena.upper())


ПРИВІТ СВІТ


In [6]:
cadena = "HOla"
print(cadena.upper())

HOLA



### `swapcase()`

Devuelve una copia de la cadena con los caracteres en mayúsculas convertidos a minúsculas y viceversa.

In [7]:
cadena = "HolA mUndO"

print(cadena.swapcase())

hOLa MuNDo


### `title()`

Cambia la primera letra de cada palabra a mayúsculas, convirtiendo todas las demás a minúsculas.


In [8]:
cancion = "we will rock you"

print(cancion.title())

We Will Rock You


### `casefold()`

Esta función está destinada a la comparación de cadenas sin tener en cuenta las diferencias de mayúsculas y minúsculas. Lleva a cabo una operación similar a str.lower(), pero va un poco más allá, ya que es más agresiva, y puede cambiar el tamaño de la cadena, no solo los caracteres en mayúsculas a minúsculas.

Por ejemplo, modifica la letra alemana 'ß' (que no tiene equivalente en mayúsculas) a 'ss'.


In [9]:

cadena = "Straße?"

print(cadena.casefold())

strasse?


## Métodos de comprobación de prefijo/sufijo



### `endswith(sufijo)`

Devuelve `True` si la cadena termina con el sufijo especificado, en caso contrario devuelve `False`.

In [10]:
cadena = "reir"

if cadena.endswith("ar"):
    print("Verbo 1ª conjugación")
elif cadena.endswith("er"):
    print("Verbo 2ª conjugación")
elif cadena.endswith("ir"):
    print("Verbo 3ª conjugación")
else:
    print("No es un verbo")

Verbo 3ª conjugación


### `startsswith(prefijo)`

Devuelve `True` si la cadena empieza con el prefijo especificado, en caso contrario devuelve `False`.


In [13]:
cadena = "886120464"

if cadena.startswith("886") or cadena.startswith("986"):
    print("El teléfono es de Pontevedra")

El teléfono es de Pontevedra


## Métodos de búsqueda y remplazo



### `count(subcadena[, inicio[, fin]])`

Este método está presente en todas las secuencias en Python.

En las cadenas, se utiliza para contar el número de veces que aparece una subcadena en la cadena.

Si se especifica el inicio y el fin, se buscará la subcadena en ese trozo de la cadena.

In [16]:
texto = '''Pido perdón a los niños por haber dedicado este libro a una persona mayor. Tengo una seria
excusa: esta persona mayor es el mejor amigo que tengo en el mundo. Tengo otra excusa: esta persona
mayor es capaz de entenderlo todo, hasta los libros para niños. Tengo una tercera excusa: esta persona
mayor vive en Francia, donde pasa hambre y frío. Verdaderamente necesita consuelo. Si todas esas
excusas no bastasen, bien puedo dedicar este libro al niño que una vez fue esta persona mayor. Todos
los mayores han sido primero niños. (Pero pocos lo recuerdan).'''

print(texto.count("mayor"))

4


### `index(subcadena[, inicio[, fin]])`

Este método está presente en todas las secuencias de Python.

En las cadenas, se utiliza para buscar la posición de una subcadena dentro de otra.

Si se indican los parámetros opcionales inicio y fin, la búsqueda se realiza dentro de un trozo de la cadena original, comenzando en el índice inicio y terminando en el índice fin.

In [2]:
cadena = "Hola Mundo"

print(cadena.index("Mundo"))
print(cadena.index("mundo"))

5


ValueError: substring not found

### `find(subcadena, [inicio], [fin])` y `rfind(subcadena, [inicio], [fin])`

`find()` Busca la subcadena dentro de la cadena y devuelve el índice de la primera aparición de la subcadena. Parecido a `index()` pero si no la encuentra devuelve -1.

Si se indican los parámetros opcionales inicio y fin, la búsqueda se realiza dentro de un trozo de la cadena original, comenzando en el índice inicio y terminando en el índice fin.

El método `rfind()` funciona igual pero empieza a buscar desde el final de la cadena.

In [18]:
cadena = "Hola Mundo"

print(cadena.find("Mundo"))
print(cadena.find("mundo"))
print(cadena.index("mundo"))

5
-1


ValueError: substring not found

Si queremos buscar todas las ocurrencias de la subcadena:

In [None]:
texto = '''Pido perdón a los niños por haber dedicado este libro a una persona mayor. Tengo una seria
excusa: esta persona mayor es el mejor amigo que tengo en el mundo. Tengo otra excusa: esta persona
mayor es capaz de entenderlo todo, hasta los libros para niños. Tengo una tercera excusa: esta persona
mayor vive en Francia, donde pasa hambre y frío. Verdaderamente necesita consuelo. Si todas esas
excusas no bastasen, bien puedo dedicar este libro al niño que una vez fue esta persona mayor. Todos
los mayores han sido primero niños. (Pero pocos lo recuerdan).'''

inicio = 0

indice = texto.find("mayor", inicio)

while indice != -1:
    print(indice)
    inicio = indice + 1
    indice = texto.find("mayor", inicio)


In [None]:
texto = '''Pido perdón a los niños por haber dedicado este libro a una persona mayor. Tengo una seria
excusa: esta persona mayor es el mejor amigo que tengo en el mundo. Tengo otra excusa: esta persona
mayor es capaz de entenderlo todo, hasta los libros para niños. Tengo una tercera excusa: esta persona
mayor vive en Francia, donde pasa hambre y frío. Verdaderamente necesita consuelo. Si todas esas
excusas no bastasen, bien puedo dedicar este libro al niño que una vez fue esta persona mayor. Todos
los mayores han sido primero niños. (Pero pocos lo recuerdan).'''

fin = len(texto)

indice = texto.rfind("mayor", 0, fin)

while indice != -1:
    print(indice)
    fin = indice
    indice = texto.rfind("mayor", 0, fin)


### `replace(origen, destino)`

Devuelve una copia de la cadena original en la que todas las apariciones del primer argumento han sido reemplazadas por el segundo argumento.

In [3]:
texto = '''Pido perdón a los niños por haber dedicado este libro a una persona mayor. Tengo una seria
excusa: esta persona mayor es el mejor amigo que tengo en el mundo. Tengo otra excusa: esta persona
mayor es capaz de entenderlo todo, hasta los libros para niños. Tengo una tercera excusa: esta persona
mayor vive en Francia, donde pasa hambre y frío. Verdaderamente necesita consuelo. Si todas esas
excusas no bastasen, bien puedo dedicar este libro al niño que una vez fue esta persona mayor. Todos
los mayores han sido primero niños. (Pero pocos lo recuerdan).'''

resultado = texto.replace("mayor", "menor")
resultado = resultado.replace("niños", "adultos")

print(resultado)

Pido perdón a los adultos por haber dedicado este libro a una persona menor. Tengo una seria
excusa: esta persona menor es el mejor amigo que tengo en el mundo. Tengo otra excusa: esta persona
menor es capaz de entenderlo todo, hasta los libros para adultos. Tengo una tercera excusa: esta persona
menor vive en Francia, donde pasa hambre y frío. Verdaderamente necesita consuelo. Si todas esas
excusas no bastasen, bien puedo dedicar este libro al niño que una vez fue esta persona menor. Todos
los menores han sido primero adultos. (Pero pocos lo recuerdan).


## Métodos de comprobación de dígitos, números, mayusculas, minúsculas...



### `isalnum()`

Devuelve `True` si la cadena contiene solo dígitos o caracteres alfabéticos (letras) y `False` en caso contrario.

In [4]:
print('DAW30'.isalnum())
print('DAW'.isalnum())
print('30'.isalnum())
print('@'.isalnum())
print('DAW_1'.isalnum())
print('DAW1º'.isalnum())
print('DAW1ª'.isalnum())
print('programación'.isalnum())
print(''.isalnum())

True
True
True
False
False
True
True
True
False


### `isalpha()`

Devuelve `True` si la cadena contiene solo caracteres alfabéticos (letras) y `False` en caso contrario.

In [5]:
print('DAW30'.isalpha())
print('DAW'.isalpha())
print('30'.isalpha())
print('@'.isalpha())
print('DAW_1'.isalpha())
print('DAW1º'.isalpha())
print('DAW1ª'.isalpha())
print('programación'.isalpha())
print(''.isalpha())

False
True
False
False
False
False
False
True
False


### `isdigit()`

Devuelve `True` si la cadena contiene solo dígitos y `False` en caso contrario.

In [6]:
print('DAW30'.isdigit())
print('DAW'.isdigit())
print('30'.isdigit())
print('@'.isdigit())
print('DAW_1'.isdigit())
print('DAW1º'.isdigit())
print('DAW1ª'.isdigit())
print('programación'.isdigit())
print(''.isdigit())

False
False
True
False
False
False
False
False
False


### `islower()`

Devuelve `True` si los caracteres alfabéticos (letras) de la cadena están en minúscula y `False` en caso contrario.

In [22]:
print('daw30'.islower())
print('DAW'.islower())
print('30'.islower())
print('@'.islower())
print('DAW_1'.islower())
print('daw1º'.islower())
print('DAW1ª'.islower())
print('programación'.islower())
print(''.islower())

True
False
False
True
False
True
False
True
False


### `isupper()`

Devuelve `True` si los caracteres alfabéticos (letras) de la cadena están en mayúscula y `False` en caso contrario.


In [None]:
print('daw30'.isupper())
print('DAW'.isupper())
print('30'.isupper())
print('@'.isupper())
print('DAW_1'.isupper())
print('daw1º'.isupper())
print('DAW1ª'.isupper())
print('programación'.isupper())
print(''.isupper())

### `isspace()`

Devuelve `True` si todos los caracteres de la cadena son espacios y `False` en caso contrario.

In [23]:
print(' \n '.isspace())
print(' \t '.isspace())
print(" ".isspace())
print("bla bla bla".isspace())

True
True
True
False


## Métodos para insertar y eliminar espacios



### `center(ancho [, relleno])`

Centra una cadena en otra de un ancho determinado en el parámetro `ancho`, añadiendo espacios antes y/o después.

El parámetro `relleno` es opcional e indica el carácter de relleno, por defecto es un espacio.

In [1]:
filas = 5
ancho_final = filas * 2 - 1

for i in range(filas):
    num_asteriscos = i * 2 + 1
    print(("*" * num_asteriscos).center(ancho_final))

    *    
   ***   
  *****  
 ******* 
*********


In [8]:
cadena = "Hola Mundo"

print(cadena.center(20, "-"))
print(cadena.center(21, "-"))

-----Hola Mundo-----
------Hola Mundo-----


### `rjust(ancho [, relleno])` y `ljust(ancho [, relleno])`

`rjust()` justifica una cadena a la derecha en otra de un ancho determinado en el parámetro `ancho`, añadiendo espacios antes.

`ljust()` justifica una cadena a la izquierda en otra de un ancho determinado en el parámetro `ancho`, añadiendo espacios después.

In [11]:
cadena1 = "Hola"
cadena2 = "Hasta luego"
print(cadena1.rjust(20))
print(cadena2.rjust(20))

                Hola
         Hasta luego


### `strip([carácter])`, `lstrip([carácter])` y `rstrip([carácter])`

Si se llaman sin parámetros, eliminan todos los espacios, los que estén a la izquierda o a la derecha (respectivamente) de una cadena.

In [3]:
cadena = "      Hola Mundo     "

print("*", cadena.strip(), "*", sep="")
print("*", cadena.lstrip(), "*", sep="")
print("*", cadena.rstrip(), "*", sep="")

*Hola Mundo*
*Hola Mundo     *
*      Hola Mundo*


Si se le pasa algún parámetro, en lugar de eliminar espacios elimina el primer carácter de la cadena que se le pasa.

In [4]:
cadena = "0000000000000000000Hola Mundo0000000000000000000"

print("*", cadena.strip("0"), "*", sep="")
print("*", cadena.lstrip("0"), "*", sep="")
print("*", cadena.rstrip("0"), "*", sep="")

*Hola Mundo*
*Hola Mundo0000000000000000000*
*0000000000000000000Hola Mundo*


## Métodos de conversión entre listas y cadenas

### `join(lista)`

Une todos los elementos de la lista que se le pasa (que contendrá únicamente cadenas) utilizando como separador la cadena desde la que se llama.


In [5]:
resultado = " ".join(["Hola", "Mundo"])

print(resultado)

ciudades = ["Vigo", "Coruña", "Lugo", "Ourense", "Pontevedra"]

cadena_ciudades = ", ".join(ciudades)

print(cadena_ciudades)

Hola Mundo
Vigo, Coruña, Lugo, Ourense, Pontevedra


### `split()`

Divide la cadena y crea una lista de todas las subcadenas detectadas.

El método asume que las subcadenas están delimitadas por espacios en blanco - los espacios no participan en la operación y no se copian en la lista resultante.

In [15]:
cadena = "En un lugar de la Mancha"

lista = cadena.split()
print(lista)

cadena2 = "En,un,lugar,de,la,Mancha"
lista = cadena2.split(",")
print(lista)


['En', 'un', 'lugar', 'de', 'la', 'Mancha']
['En', 'un', 'lugar', 'de', 'la', 'Mancha']


Para convertir la cadena en una lista de caracteres, utilizaremos la función `list()`, que convierte cualquier secuencia en una lista.

In [1]:
cadena = "Hola mundo"

lista = list(cadena)

print(lista)

['H', 'o', 'l', 'a', ' ', 'm', 'u', 'n', 'd', 'o']


Uso destas dos funciones para dar la vuelta a una cadena por palabras:

In [None]:
cadena = "En un lugar de la Mancha"
lista = cadena.split()
print(lista)
lista_revés = lista[::-1]
print(lista_revés)
resultado = " ".join(lista_revés)
print(resultado)

['En', 'un', 'lugar', 'de', 'la', 'Mancha']
['Mancha', 'la', 'de', 'lugar', 'un', 'En']
Mancha la de lugar un En


In [19]:
cadena = "En un lugar de la Mancha"
lista = cadena.split()
print(lista)
lista.reverse()
print(lista)
resultado = " ".join(lista)
print(resultado)

['En', 'un', 'lugar', 'de', 'la', 'Mancha']
['Mancha', 'la', 'de', 'lugar', 'un', 'En']
Mancha la de lugar un En


In [23]:
cadena = "En un lugar de la Mancha"
print(" ".join(cadena.split()[::-1]))

Mancha la de lugar un En


## Comparación de cadenas

Se pueden utilizar los operadores de comparación (`<`, `>`, `<=`, `>=`, `==`, `!=`) para comparar cadenas. 

Python solo compara valores de códigos correspondientes a las letras por lo que los resultados, fuera del alfabeto inglés, pueden no ser los esperados.

In [6]:
cadena1 = "Pérez"
cadena2 = "Rodríguez"

print(cadena1 < cadena2)

True


In [7]:
cadena1 = "Abeto"
cadena2 = "árbol"

print(cadena1 < cadena2)

True


In [None]:
# No ordena alfabéticamente con caracteres que no están en el alfabeto inglés

cadena1 = "amigo"
cadena2 = "ábaco"

print(cadena1 < cadena2)

True


In [8]:
cadena1 = "2"
cadena2 = "10"

print(cadena1 < cadena2)

False


In [None]:
# No ordena alfabéticamente cuando mezclo mayúsculas y minúsculas

cadena1 = "Amigo"
cadena2 = "abuelo"

print(cadena1 < cadena2)

True


## Conversión entre números y cadenas

Se utilizan los métodos `str()`, `int()` y `float()`.

Si una cadena no se puede convertir a un tipo numérico, se lanzará una excepción (error en tiempo de ejecución).

In [2]:
cadena = "10"
entero = 20
real = 3.5

entero_cadena = int(cadena)
print(entero_cadena)
float_cadena = float(cadena)
print(float_cadena)

cadena_entero = str(entero)
print(cadena_entero)
cadena_float = str(real)
print(cadena_float)

10
10.0
20
3.5


## Manejo de caracteres

### `ord()`

Recibe un carácter y devuelve su código Unicode.

In [9]:
print(ord("a"))

97


### `chr()`

Recibe un código Unicode y devuelve su carácter.

In [4]:
print(chr(65))

A


In [5]:
codigo_letra = ord("a")
codigo_siguiente_letra = codigo_letra + 1
siguiente_letra = chr(codigo_siguiente_letra)

print(siguiente_letra)

b


## f-strings

Las f-strings o *formatted string literals* son cadenas de texto que comienzan con la letra `f` o `F` antes de las comillas de apertura. Estas cadenas permiten incluir expresiones dentro de llaves `{}` que serán evaluadas en tiempo de ejecución y formateadas utilizando el formato predeterminado.

Por ejemplo:

In [None]:
nombre = "Pepe"
edad = 30
print(f"Hola, mi nombre es {nombre} y tengo {edad} años.")

### Modificadores de formato

Las expresiones dentro de las llaves `{}` pueden incluir especificadores de formato después de dos puntos `:`. Estos especificadores permiten controlar cómo se muestra el valor.

Estos son algunos ejemplos comunes:
- `:.2f` - Formatea un número de punto flotante con 2 dec
- `:,` - Añade separadores de miles a un número
- `:.2%` - Formatea un número como porcentaje con 2 decimales
- `:^10` - Centra el texto en un campo de ancho 10
- `:>10` - Alinea el texto a la derecha en un campo de ancho 10
- `:<10` - Alinea el texto a la izquierda en un campo de ancho 10
- `:.2e` - Formatea un número en notación científica con 2 decimales
- `:g`- Formatea un número en notación fija o científica, según sea más compacto, eliminando ceros innecesarios

In [1]:
numero = 1234.56789
print(f"{numero:.2f}")
print(f"{numero:,}")
print(f"{numero:,.2%}")
numero = 10.00
print(f"{numero:g}")

1234.57
1,234.56789
123,456.79%
10
