# 8.- Cadenas

## 8.2.- Dando formato a Cadenas

### 8.2.1.- Tipos de Presentación

Dale formato a 3.141592 a 3 decimales como cadena usando f'

In [None]:
num = 3.141592
formatted_num = f"{num:.3f}"
print(formatted_num)

3.142


Enteros, con el tipo de presentación d

In [None]:
num_entero = 42
print(f"{num_entero:d}")

42


Caracteres con el tipo de presentación c

In [None]:
num_caracter = 65
print(f"{num_caracter:c}")

A


Cadenas (strings) con el tipo de presentación s

In [None]:
cadena = "Hola"
print(f"{cadena:s}")

Hola


#### Por tu cuenta

Usa el tipo c para mostrar los caracteres que pertenecen a 58,45,41

In [None]:
print(f"{58:c} {45:c} {41:c}")

: - )


### 8.2.2.- Anchos y alineación

En una cadena f' puedes especificar la alineación y la cantidad de espacios al inicio y al final

In [None]:
num = 42
print(f"{num:10}")  # El número 42 ocupa al menos 10 espacios


        42


Pero además de especificar la longitud del campo y la cantidad de decimales, también puedes alinear a la cadena con los símbolos > y <.

In [None]:
texto = "Python"
print(f"[{texto:>10}]")  # Alineado a la derecha
print(f"[{texto:<10}]")  # Alineado a la izquierda
print(f"[{texto:^10}]")  # Centrado

[    Python]
[Python    ]
[  Python  ]


Y para centrar, tanto el texto como los valores

In [None]:
pi = 3.1415926535
print(f"{pi:.2f}")   # Redondea a 2 decimales
print(f"{pi:10.3f}") # Ocupa 10 espacios y muestra 3 decimales


3.14
     3.142


#### Por tu cuenta

Muestra el nombre "Daniel" en 3 filas diferentes alineados a la derecha, centro e izquierda en un campo de 10 caracteres. Encierra cada fila de resultado en brackets

In [None]:
nombre = "Daniel"
print(f"[{nombre:>10}]")  # Alineado a la derecha
print(f"[{nombre:^10}]")  # Centrado
print(f"[{nombre:<10}]")  # Alineado a la izquierda

[    Daniel]
[  Daniel  ]
[Daniel    ]


### 8.2.3.- Formato Númerico

En el caso particular de cadenas de números, si requieres mostrar el signo. Puedes agregarlo en
el f-string

In [None]:
num_pos = 42
num_neg = -42
print(f"{num_pos:+}")  # Muestra +42
print(f"{num_neg:+}")  # Muestra -42


+42
-42


Para agregar ceros en los espacios en blanco.

In [None]:
num = 42
print(f"{num:05}")  # Mínimo 5 caracteres, relleno con ceros


00042


Regularmente a los números positivos no se les agrega el signo +. Pero, si requieres dejar el espacio en blanco para este tipo de números, utiliza un código como el siguiente

In [None]:
num_pos = 42
num_neg = -42
print(f"{num_pos: }")  # Espacio en vez de +
print(f"{num_neg: }")  # -42 se muestra normal


 42
-42


#### Por tu cuenta

Imprime los valores 11483.528 y -4581.4413 cada uno precedido por su signo, en campos de 10 caracteres con separadores de miles, y su punto decimal alineado a 2 puntos de precisión.

In [None]:
num1 = 11483.528
num2 = -4581.4413

print(f"{num1:+10,.2f}")  # Signo positivo, ancho de 10, separador de miles, 2 decimales
print(f"{num2:+10,.2f}")  # Signo negativo, mismo formato


+11,483.53
 -4,581.44


### 8.2.5.- Concatenar Cadenas que se repiten

Anteriormente utilizaste el símbolo + para concatenar cadenas. Además de esta operación puedes
repetir una misma cadena

In [None]:
mensaje = "Hola "
print(mensaje * 3)  # Se repite 3 veces


Hola Hola Hola 


Si requieres repetir una cadena.

In [None]:
decoracion = "=" * 10  # Crea una línea de 10 signos =
titulo = " Python "
print(decoracion + titulo + decoracion)




---

## 8.3.- Otras opciones para las cadenas

### 8.3.1 - Quitar espacios en blanco

Observa el siguiente enunciado (cadena)

enunciado = '\t \n me gusta escuchar música alegre \t\t \n'

In [None]:
enunciado = '\t \n me gusta escuchar música alegre \t\t \n'
print(enunciado)

	 
 me gusta escuchar música alegre 		 



Requieres eliminar todos los espacios en blanco, el método strip realiza esta tarea

In [None]:
print(enunciado.strip())

me gusta escuchar música alegre


Para eliminar los espacios en blanco a la izquierda (inicio) de la cadena

In [None]:
print(enunciado.lstrip())

me gusta escuchar música alegre 		 



O los espacios de la derecha (final) de la cadena.

In [None]:
print(enunciado.rstrip())

	 
 me gusta escuchar música alegre


### 8.3.2 - Mayusculas y Minusculas

Usa el método capitalize para convertir esta oración a mayusculas

me gusta eschuchar música alegre

In [None]:
oracion = "me gusta escuchar música alegre"
print(oracion.capitalize())


Me gusta escuchar música alegre


Usa el metodo Title para ponerle mayuscula a cada letra de la oración

me gusta eschuchar música alegre. bailemos

In [None]:
print(oracion.title())

Me Gusta Escuchar Música Alegre


### 8.3.3 - Operadores de Comparación

Además de dar formato a las cadenas, Python permite compararlas. Esto se realiza con los valores numéricos que tiene cada carácter. Aquí algunos ejemplos.

In [None]:
print("a" > "b")  # False, porque "a" (97) es menor que "b" (98)
print("A" < "a")  # True, porque "A" (65) es menor que "a" (97)
print("abc" < "abd")  # True, porque "c" (99) es menor que "d" (100)

False
True
True


### 8.3.4 - Buscar Cadenas

Para contar el número de veces que aparece un trozo de cadena (substring) en una cadena más
grande, Python cuenta con el método count. Por ejemplo

Cuenta quizas en "quizás si quizás no quizás es una posibilidad"

In [None]:
frase = "quizás si quizás no quizás es una posibilidad"
print(frase.count("quizás"))  # Cuenta las veces que aparece "quizás"


3


Si añades un segundo argumento, éste indica el índice de inicio de la búsqueda (recuerda que los
índices inician en 0).

In [None]:
print(frase.count("quizás", 10))  # Empieza a contar desde el índice 10


2


El método index busca una subcadena dentro de una cadena, e indica el primer índice en donde
aparece.

In [None]:
print(frase.index("quizás"))  # Retorna el índice de la primera aparición


0


El método rindex realiza la misma tarea que index, pero inicia la búsqueda desde la parte final
de la cadena.

In [None]:
print(frase.rindex("quizás"))  # Última aparición de "quizás"


20


Si solo necesitas conocer si en la cadena se encuentra una subcadena, es posible utilizar los operadores in o not in

In [None]:
print("posibilidad" in frase)  # True
print("tal vez" not in frase)  # True


True
True


Los métodos startswith y endswith regresan True si la cadena inicia o termina

In [None]:
print(frase.startswith("quizás"))  # True
print(frase.endswith("posibilidad"))  # True


True
True


#### Por tu cuenta

Crea un bucle for que ubica y muestra cada palabra que comienza con "d" en "Por desenredar el enredo aque ayer enrede, hoy enredo el desenredo que desenredé ayer"

In [None]:
frase = "Por desenredar el enredo aque ayer enrede, hoy enredo el desenredo que desenredé ayer"

# Separar la frase en palabras y buscar las que empiezan con "d"
for palabra in frase.split():
    if palabra.lower().startswith("d"):
        print(palabra)


desenredar
desenredo
desenredé


### 8.3.5 - Reemplazar

Para reemplazar cadenas se usa el metoodo replace

In [1]:
texto = "Hola mundo"
nuevo_texto = texto.replace("mundo", "Python")
print(nuevo_texto)  # Output: Hola Python


Hola Python


### 8.3.6.- Separar y Unir Cadenas

Para tokenizar una cadena puedes utilizar un delimitador personalizado como una coma o un espacio en blanco.

letras='A,b,e,c,e,d,a,r,i,o'

In [2]:
letras = 'A,b,e,c,e,d,a,r,i,o'
lista_letras = letras.split(',')
print(lista_letras)

['A', 'b', 'e', 'c', 'e', 'd', 'a', 'r', 'i', 'o']


Si escribes un entero en la segunda parte del argumento, este, especifica el número máximo de
divisiones de la cadena

In [3]:
letras = 'A,b,e,c,e,d,a,r,i,o'
lista_letras = letras.split(',',4)
print(lista_letras)

['A', 'b', 'e', 'c', 'e,d,a,r,i,o']


El siguiente snippet une los elementos de una comprensión de lista.

In [4]:
lista = ['A', 'b', 'e', 'c', 'e', 'd', 'a', 'r', 'i', 'o']
cadena_unida = '-'.join(lista)
print(cadena_unida)


A-b-e-c-e-d-a-r-i-o


El método splitlines regresa una lista de cadenas que representan líneas de
texto. Como en el siguiente código.

In [5]:
texto = "Hola\nMundo\nPython"
lineas = texto.splitlines()
print(lineas)


['Hola', 'Mundo', 'Python']


Con el argumento True en splitlines, se muestran los respectivos saltos
de línea.

In [6]:
lineas_con_saltos = texto.splitlines(True)
print(lineas_con_saltos)


['Hola\n', 'Mundo\n', 'Python']


## 8.4.- Expresiones Regulares

### 8.4.1.- Modulo re y función Fullmatch

Para utilizar expresiones regulares es necesario importar el módulo re.


In [7]:
import re

La función más simple para expresiones regulares es fullmatch. A continuación, se muestran
algunos ejemplos de la forma en que se puede utilizar.

In [8]:
patron = r"\d{4}"  # Coincide con exactamente 4 dígitos
cadena = "2024"

if re.fullmatch(patron, cadena):
    print("Coincide")
else:
    print("No coincide")

Coincide


Las expresiones regulares, en general contienen símbolos especiales llamados meta caracteres como
\, @, #, $ * y signos de agrupación como [ ], { }, ( )
En consecuencia, resulta necesario utilizar los r-strings.

In [9]:
# Sin r-string (puede causar errores)
print("Ejemplo de uso incorrecto:", re.fullmatch("\d{4}", "2024"))

# Con r-string (correcto)
print("Ejemplo de uso correcto:", re.fullmatch(r"\d{4}", "2024"))


Ejemplo de uso incorrecto: <re.Match object; span=(0, 4), match='2024'>
Ejemplo de uso correcto: <re.Match object; span=(0, 4), match='2024'>


También es posible verificar si, por ejemplo, el nombre de las personas está bien escrito (letra mayúscula al inicio del nombre)

In [10]:
patron = r"[A-Z][a-z]+"
nombre = "Carlos"

if re.fullmatch(patron, nombre):
    print("Nombre válido")
else:
    print("Nombre no válido")


Nombre válido


Al escribir [^a-z], estarás verificando si algún caracter no coincide con las letras minúsculas

In [11]:
patron = r"[^a-z]"
texto = "Hola123"

if re.search(patron, texto):
    print("Contiene caracteres que no son minúsculas")
else:
    print("Solo contiene letras minúsculas")


Contiene caracteres que no son minúsculas


Si requieres verificar si al menos una letra minúscula aparece en el nombre, puedes utilizar [a-z]+


In [12]:
patron = r"[a-z]+"
cadena = "HELLOworld123"

if re.search(patron, cadena):
    print("Contiene al menos una letra minúscula")
else:
    print("No contiene letras minúsculas")


Contiene al menos una letra minúscula


Las siguientes expresiones regulares verifican si las expresiones contienen al menos cuatro dígitos.


In [13]:
patron = r"\d{4,}"
cadena = "ABC1234"

if re.search(patron, cadena):
    print("Contiene al menos 4 dígitos")
else:
    print("No cumple el requisito")


Contiene al menos 4 dígitos


Ahora, las expresiones regulares siguientes, verifican si las expresiones contienen entre 8 y 10 dígitos.


In [14]:
patron = r"\d{8,10}"
cadena = "12345678"

if re.fullmatch(patron, cadena):
    print("La cadena tiene entre 8 y 10 dígitos")
else:
    print("No cumple el requisito")


La cadena tiene entre 8 y 10 dígitos


#### Por tu cuenta

Crea y prueba una expresión regular que cuadra con una dirección de calle que consiste de un número con uno o más digitos seguido de 2 palabras de una o más caracteres. Por ejemplo 372 Callejón Rojo

In [15]:
import re

# Expresión regular
patron = r"^\d+\s+[A-Za-zÁÉÍÓÚáéíóúñÑ]+(?:\s+[A-Za-zÁÉÍÓÚáéíóúñÑ]+)?$"

# Direcciones de prueba
direcciones = [
    "372 Callejón Rojo",  # Válido
    "45 Avenida Principal",  # Válido
    "100 Calle",  # Válido
    "Calle 100",  # Inválido
    "Av. Revolución 200",  # Inválido
    "1234 Main St",  # Inválido (solo funciona para español)
]

# Prueba de las direcciones
for direccion in direcciones:
    if re.fullmatch(patron, direccion):
        print(f"✔ Válido: {direccion}")
    else:
        print(f"✖ Inválido: {direccion}")


✔ Válido: 372 Callejón Rojo
✔ Válido: 45 Avenida Principal
✔ Válido: 100 Calle
✖ Inválido: Calle 100
✖ Inválido: Av. Revolución 200
✔ Válido: 1234 Main St


### 8.4.2.- Reemplazar subcadenas y separar cadenas

Otras dos funcionalidades del módulo re, son sub y split. Observa estos ejemplos


In [16]:
cadena = "manzana, pera,  naranja,kiwi, uva"
resultado = re.split(r",\s*", cadena)  # Divide por coma seguida de espacios opcionales

print(resultado)


['manzana', 'pera', 'naranja', 'kiwi', 'uva']


Al final, obtienes una cadena nueva. También puedes declarar un número máximo de reemplazos.


In [17]:
resultado = re.split(r",\s*", cadena, maxsplit=2)
print(resultado)


['manzana', 'pera', 'naranja,kiwi, uva']


La función split puede tokenizar una cadena utilizando una expresión regular al especificar un
delimitador y regresar una cadena. Haremos una separación utilizando como delimitador, una
coma, o una coma seguida por espacios en blanco

In [21]:
texto = "Hola\nX\n\ncomo\n\n\nestas"
nuevo_texto = re.sub(r"\n+", ", ", texto)

print(nuevo_texto)


Hola, X, como, estas


Como en el caso de sub, puedes declarar un máximo de divisiones


In [20]:
import re

texto = "uno, dos, tres, cuatro, cinco"

# Separar solo en las dos primeras comas
resultado = re.split(r",\s*", texto, maxsplit=2)

print(resultado)


['uno', 'dos', 'tres, cuatro, cinco']


#### Por tu cuenta

Reemplaza cada ocurrencia de uno o mas caracteres de siguiente linea con un coma y un espacio

"W\nX\n\nY\n\n\nZ"

In [None]:
texto = "W\nX\n\nY\n\n\nZ"
nuevo_texto = re.sub(r"\n+", ", ", texto)

print(nuevo_texto)

### 8.4.3.- Otros métodos de búsqueda: accesar matches

Python tiene otras funciones de búsqueda. La función search busca en una cadena la primera


In [22]:
import re

cadena = "Esto es solo texto de prueba."
resultado = re.search(r"texto", cadena)


Coincidencia encontrada en la posición: 13


En este ejemplo, la función busca la subcadena 'texto' en la cadena 'Esto es solo texto
de prueba'.

In [23]:
if resultado:
    print(f"Coincidencia encontrada en la posición: {resultado.start()}")
else:
    print("No se encontró la coincidencia.")

Coincidencia encontrada en la posición: 13


El meta caracter ^ al principio de una cadena regular, es un ancla que indica a Python buscar la
expresión que coincide solo con el inicio de la cadena.

In [24]:
cadena = "Hola mundo"
if re.search(r"^Hola", cadena):
    print("La cadena empieza con 'Hola'.")
else:
    print("No empieza con 'Hola'.")


La cadena empieza con 'Hola'.


Para finalizar esta sección, utilizaremos un par de funciones de re, findall, que encuentra todas las subcadenas en una cadena y finditer que realiza la misma tarea que findall

In [25]:
cadena = "casa coche cepillo perro"
palabras = re.findall(r"\bc\w+", cadena)

print(palabras)


['casa', 'coche', 'cepillo']


Con finditer.


In [26]:
cadena = "Hola, esto es una prueba."
for match in re.finditer(r"[aeiou]", cadena):
    print(f"Vocal '{match.group()}' encontrada en la posición {match.start()}")


Vocal 'o' encontrada en la posición 1
Vocal 'a' encontrada en la posición 3
Vocal 'e' encontrada en la posición 6
Vocal 'o' encontrada en la posición 9
Vocal 'e' encontrada en la posición 11
Vocal 'u' encontrada en la posición 14
Vocal 'a' encontrada en la posición 16
Vocal 'u' encontrada en la posición 20
Vocal 'e' encontrada en la posición 21
Vocal 'a' encontrada en la posición 23


#### Por tu cuenta

Suponte que tienes la cadena

"14 + 8"

Usa una expresión regular para romper la cadena en 3 grupos representando los 2 operandos y el operador, luego muestra los grupos

In [27]:
import re

cadena = "14 + 8"

# Expresión regular para capturar los operandos y el operador
patron = r"(\d+)\s*([\+\-\*/])\s*(\d+)"
match = re.match(patron, cadena)

if match:
    print(f"Operando 1: {match.group(1)}")
    print(f"Operador: {match.group(2)}")
    print(f"Operando 2: {match.group(3)}")
else:
    print("No se encontraron coincidencias.")


Operando 1: 14
Operador: +
Operando 2: 8


## 8.5.- Pandas y Expresiones Regulares

El siguiente código crea una Series de Pandas con los RFC de dos usuarios. Intencionalmente
uno de ellos tiene un error. El objetivo es ver la forma en que Python lo identifica este error.

In [29]:
import pandas as pd
import re

# Crear una serie con RFCs
rfc_data = ['ABC123456XYZ', 'XYZ123456ZYX']  # El segundo tiene un error
rfc_series = pd.Series(rfc_data)

# Expresión regular para validar un RFC (simplificado)
rfc_pattern = r'^[A-Z]{3}\d{6}[A-Z]{3}$'


Para definir la expresión regular y determinar las coincidencias.


In [30]:
valid_rfc = rfc_series.apply(lambda x: bool(re.fullmatch(rfc_pattern, x)))

print(valid_rfc)


0    True
1    True
dtype: bool


Ahora crearemos una cadena que contiene los nombres de tres países, su código ISO 3 y el prefijo
telefónico.

In [31]:
# Crear una cadena con la información de tres países
pais_info = "México, MEX, +52; Estados Unidos, USA, +1; Canadá, CAN, +1"

# Imprimir la cadena
print(pais_info)


México, MEX, +52; Estados Unidos, USA, +1; Canadá, CAN, +1


#### Por tu cuenta

Arma un programa que tome 3 numeros telefonicos de 10 digitos y te los devuelva en el formato (###) ###-####

In [33]:
import re

def formatear_telefono(telefono):
    # Expresión regular para validar un número de teléfono de 10 dígitos
    telefono_pattern = r'(\d{3})(\d{3})(\d{4})'

    # Usamos la función sub para dar formato
    return re.sub(telefono_pattern, r'(\1) \2-\3', telefono)

# Solicitar tres números telefónicos al usuario
telefonos = []
for i in range(3):
    telefono = input(f"Ingrese el número telefónico {i+1} de 10 dígitos: ")
    if len(telefono) == 10 and telefono.isdigit():
        telefonos.append(telefono)
    else:
        print("Por favor, ingresa un número de 10 dígitos válido.")
        break

# Formatear los números
telefonos_formateados = [formatear_telefono(telefono) for telefono in telefonos]

# Mostrar los números formateados
print("\nNúmeros telefónicos formateados:")
for telefono in telefonos_formateados:
    print(telefono)


Ingrese el número telefónico 1 de 10 dígitos: 6475842659
Ingrese el número telefónico 2 de 10 dígitos: 559424758
Por favor, ingresa un número de 10 dígitos válido.

Números telefónicos formateados:
(647) 584-2659
