In [None]:
import warnings
from IPython.display import display, HTML
warnings.filterwarnings('ignore')
display(HTML("<style>.container { width:100% !important; }</style>"))

# Manejo de Textos

La clase `str` es la clase de objetos que representan cadenas de caracteres en Python. Las cadenas son una de las estructuras de datos más utilizadas en Python, ya que se utilizan para representar texto y otros datos en forma de caracteres.

Algunas de las operaciones que se pueden realizar con cadenas de texto en Python incluyen:

* Concatenación: se puede unir dos o más cadenas utilizando el operador `+`.

* Indexación: se puede acceder a un carácter en una cadena utilizando su índice. El primer carácter de una cadena tiene un índice de 0.

* Rebanado: se puede obtener una subcadena de una cadena utilizando la notación de rebanado. Por ejemplo, `cadena[1:4]` devuelve los caracteres desde el índice 1 hasta el índice 3 de la cadena.

* Métodos de cadenas: la clase `str` proporciona muchos métodos útiles para manipular cadenas, como `upper()` y `lower()` para convertir una cadena a mayúsculas o minúsculas, `split()` para dividir una cadena en una lista de subcadenas y `replace()` para reemplazar todas las ocurrencias de una subcadena en una cadena con otra subcadena.

Aquí hay algunos ejemplos de código para ilustrar estas operaciones:

In [None]:
# Concatenación de cadenas
nombre = "Juan"
apellido = "Pérez"
nombre_completo = nombre + " " + apellido
print(nombre_completo) # Imprime "Juan Pérez"

# Indexación de cadenas
cadena = "Python"
primer_caracter = cadena[0]
print(primer_caracter) # Imprime "P"

# Rebanado de cadenas
cadena = "Python es genial"
subcadena = cadena[0:6]
print(subcadena) # Imprime "Python"

Aquí hay una lista de algunas de las funciones de la clase `str` y cómo se pueden utilizar en Python:

1. `capitalize()`: Devuelve una copia de la cadena con la primera letra en mayúscula.

In [None]:
cadena = "hola, mundo!"
capitalizada = cadena.capitalize()
print(capitalizada) # Imprime "Hola, mundo!"

2. `center()`: Centra la cadena en un ancho determinado utilizando un carácter de relleno.

In [None]:
cadena = "Python"
centrada = cadena.center(10, "*")
print(centrada) # Imprime "**Python**"

3. `count()`: Devuelve el número de ocurrencias de una subcadena en una cadena.

In [None]:
cadena = "La lluvia en Sevilla es una maravilla"
ocurrencias = cadena.count("ll")
print(ocurrencias) # Imprime 3

4. `startswith()` y `endswith()`: Comprueba si una cadena comienza o termina con una subcadena determinada y devuelve True o False.

In [None]:
cadena = "Hola, mundo!"
empieza_con_hola = cadena.startswith("Hola")
termina_con_mundo = cadena.endswith("mundo!")
print(empieza_con_hola) # Imprime True
print(termina_con_mundo) # Imprime True

5. `find()` y `index()`: Encuentra la posición de una subcadena en una cadena y devuelve su índice. La función `find()` devuelve `-1` si la subcadena no se encuentra, mientras que `index()` lanza una excepción si la subcadena no se encuentra.

In [None]:
cadena = "Python es genial"
posicion_es = cadena.find("es")
posicion_no = cadena.find("no")
print(posicion_es) # Imprime 7
print(posicion_no) # Imprime -1

try:
    posicion_no = cadena.index("no")
except ValueError:
    print("La subcadena no se encuentra en la cadena")

6. `isalpha()`: Esta función devuelve `True` si la cadena contiene solo letras.

In [None]:
cadena1 = "Hola"
cadena2 = "Hola123"
cadena3 = "¡Hola!"
cadena4 = "hola"
cadena5 = "HOLA"
print(cadena1.isalpha()) # Imprime True
print(cadena2.isalpha()) # Imprime False
print(cadena3.isalpha()) # Imprime False
print(cadena4.isalpha()) # Imprime True
print(cadena5.isalpha()) # Imprime True

7. `isdigit()`: Esta función devuelve `True` si la cadena contiene solo dígitos.

In [None]:
cadena1 = "1234"
cadena2 = "1234A"
cadena3 = "1 2 3 4"
print(cadena1.isdigit()) # Imprime True
print(cadena2.isdigit()) # Imprime False
print(cadena3.isdigit()) # Imprime False

8. `isalnum()`: Esta función devuelve `True` si la cadena contiene solo letras y/o dígitos.

In [None]:
cadena1 = "Hola123"
cadena2 = "¡Hola!"
cadena3 = "1234"
print(cadena1.isalnum()) # Imprime True
print(cadena2.isalnum()) # Imprime False
print(cadena3.isalnum()) # Imprime True

9. `isspace()`: Esta función devuelve `True` si la cadena contiene solo espacios en blanco.

In [None]:
cadena1 = "   "
cadena2 = "  Hola  "
cadena3 = "Hola"
print(cadena1.isspace()) # Imprime True
print(cadena2.isspace()) # Imprime False
print(cadena3.isspace()) # Imprime False

10. `islower()`: Esta función devuelve `True` si todas las letras de la cadena están en minúsculas.

In [None]:
cadena1 = "hola mundo"
cadena2 = "Hola Mundo"
cadena3 = "HOLA MUNDO"
print(cadena1.islower()) # Imprime True
print(cadena2.islower()) # Imprime False
print(cadena3.islower()) # Imprime False

11. `isupper()`: Esta función devuelve `True` si todas las letras de la cadena están en mayúsculas.

In [None]:
cadena1 = "HOLA MUNDO"
cadena2 = "Hola Mundo"
cadena3 = "hola mundo"
print(cadena1.isupper()) # Imprime True
print(cadena2.isupper()) # Imprime False
print(cadena3.isupper()) # Imprime False

12. `join()`: Une una lista de cadenas en una sola cadena utilizando la cadena actual como separador.

In [None]:
lista = ["Juan", "Pérez", "1234"]
cadena_unida = "-".join(lista)
print(cadena_unida) # Imprime "Juan-Pérez

In [None]:
palabras = ["Hola", "mundo", "desde", "Python"]
separador = " "

frase = separador.join(palabras)
print(frase) # Imprime "Hola mundo desde Python"

13. `split()`: Esta función se utiliza para dividir una cadena en una lista de subcadenas utilizando un separador. Por defecto, el separador es un espacio en blanco.

In [None]:
cadena = "Hola mundo desde Python"
palabras = cadena.split()
print(palabras) # Imprime ['Hola', 'mundo', 'desde', 'Python']

correo = "usuario@dominio.com"
usuario, dominio = correo.split('@')
print(usuario) # Imprime "usuario"
print(dominio) # Imprime "dominio.com"

14. `replace()`: Esta función se utiliza para reemplazar una subcadena por otra en una cadena.

In [None]:
cadena = "Hola mundo desde Python"
nueva_cadena = cadena.replace("Python", "Java")
print(nueva_cadena) # Imprime "Hola mundo desde Java"

15. `strip()`: Esta función se utiliza para eliminar los caracteres especificados al principio y al final de una cadena. Si no se especifica ningún carácter, se eliminan los espacios en blanco por defecto.

In [None]:
cadena = "   Hola mundo   "
nueva_cadena = cadena.strip()
print(nueva_cadena) # Imprime "Hola mundo"

cadena = "----Hola mundo----"
nueva_cadena = cadena.strip("-")
print(nueva_cadena) # Imprime "Hola mundo"

16. `splitlines()`: Esta función se utiliza para dividir una cadena en una lista de subcadenas en función de los saltos de línea.

In [None]:
cadena = "Hola\nmundo\n"
lineas = cadena.splitlines()
print(lineas) # Imprime ['Hola', 'mundo']

17. `partition()`: Esta función se utiliza para dividir una cadena en tres partes en función de un separador y devuelve una tupla con las tres partes.

In [None]:
cadena = "Hola mundo desde Python"
partes = cadena.partition("desde")
print(partes) # Imprime ('Hola mundo ', 'desde', ' Python')

18. `rjust()` y `ljust()`: Estas funciones se utilizan para justificar una cadena a la izquierda o a la derecha, respectivamente, añadiendo espacios en blanco a la izquierda o a la derecha hasta alcanzar una longitud determinada.

In [None]:
cadena = "Hola mundo"
nueva_cadena = cadena.rjust(20)
print(nueva_cadena) # Imprime "         Hola mundo"

nueva_cadena = cadena.ljust(20, "-")
print(nueva_cadena) # Imprime "Hola mundo----------"

## Ejemplo 1

En este ejemplo, primero convertimos la primera letra de cada palabra en mayúscula utilizando la función `split()` y `capitalize()`. Luego, reemplazamos "Python" por "Java" utilizando la función `replace()`. Después, dividimos el texto en párrafos utilizando la función `split()` y los separamos con un punto y espacio utilizando la concatenación de cadenas y la función `join()`. Finalmente, imprimimos los párrafos resultantes en líneas separadas.

In [None]:
texto = "El manejo de cadenas o strings es un aspecto fundamental en la programación, especialmente en Python. Las cadenas son una secuencia de caracteres que se utilizan para representar texto. Python proporciona una gran cantidad de funciones que permiten manipular cadenas de diferentes maneras."

# Convertir la primera letra de cada palabra en mayúscula
palabras = texto.split()
palabras = [palabra.capitalize() for palabra in palabras]
texto = " ".join(palabras)

# Reemplazar "Python" por "Java"
texto = texto.replace("Python", "Java")

# Separar el texto en párrafos
parrafos = texto.split(". ")
parrafos = [parrafo + "." for parrafo in parrafos]

# Imprimir el resultado
for parrafo in parrafos:
    print(parrafo)

## Ejemplo 2

En este ejemplo, primero obtenemos el número de veces que aparece la palabra "algoritmo" en el texto utilizando la función `count()`. Luego, convertimos todas las letras a minúsculas utilizando la función `lower()`. Después, obtenemos la primera letra de cada palabra y las concatenamos utilizando la función `split()` y la concatenación de cadenas. Luego, reemplazamos "burbuja" por "inserción" utilizando la función `replace()`. Finalmente, imprimimos el número de veces que aparece "algoritmo" en el texto, las abreviaturas de las palabras y el texto con las palabras reemplazadas.

In [None]:
texto = "El algoritmo de ordenamiento de burbuja es un algoritmo sencillo que consiste en comparar elementos adyacentes y, si están en el orden incorrecto, intercambiarlos. Este algoritmo es ineficiente para listas grandes y suele utilizarse en casos específicos donde la cantidad de elementos a ordenar es pequeña."

# Obtener el número de veces que aparece la palabra "algoritmo"
num_algoritmo = texto.count("algoritmo")

# Convertir todas las letras a minúsculas
texto = texto.lower()

# Obtener la primera letra de cada palabra y concatenarlas
abreviaturas = [palabra[0] for palabra in texto.split()]
abreviaturas = "".join(abreviaturas)

# Reemplazar "burbuja" por "inserción"
texto = texto.replace("burbuja", "inserción")

# Imprimir el resultado
print(f"La palabra 'algoritmo' aparece {num_algoritmo} veces en el texto.")
print(f"Las abreviaturas de las palabras son: {abreviaturas}")
print(texto)