# Trabajando con Strings o Cadenas de Texto
___

Usaremos cadenas muy a menudo cuando programemos. Una cadena es una serie de letras rodeadas por comillas simples, dobles o triples. Python 3 define la cadena como un "Tipo de secuencia de texto". Puedes castear otros tipos de datos a cadenas usando la función str() incorporada.

En este notebook vamos a aprender:
* Crear Cadenas
*  Métodos de cadena
*  Concatenación de cadenas
* Cortar cadenas o String slicing  

¡Comencemos aprendiendo las diferentes formas de crear cadenas!

___
## 1. Crear Strings

In [5]:
nombre = 'Bilbo'
apellido = "Bolson"
#Haz un ejemplo empleando """""" y metiendo retornos de carro
direccion = "C\ Bolson cerrado. 10005, La Comarca"


print(nombre,apellido,direccion, sep="-")


Bilbo-Bolson-
Dirección:
C\ Bolson
cerrado. Cp 10005,
La Comarca


Es muy importante que entendamos un str como una cadena de caracteres concatenados. Vamos a verlo con una imagen:

![strings](strings.png)

Viendo la cadena de este modo, podemos encontrar una letra en una posición determinada, teniendo en cuenta que la posición inicial es 0.

In [1]:
texto = "Una cadena"
#muestra la letra d
letra = texto[5]
print(letra)

'd'

---
## 2. Operaciones con f-Strings


### 2.1 Número de decimales impresos con f-Strings

Si deseas limitar la cantidad de decimales que se imprimen, usa la cadena f como se muestra a continuación.

**Variable/numero_float:.numero_decimalesf**

La nomenclatura es la que se indica arriba, donde:

**Variable/numero_float** => es la variable donde o el decimal que queremos mostrar

**:** => dos puntos

**.** => punto

**numero_decimales** => número de decimales que queremos mostrar

**f** => de float

In [8]:
num = 2.3123

# Limitado a 1 decimal
num1 = f"{num:.1f}"
print(num1)

# Limitado a 2 decimales
num2 = f"{num:.2f}"
print(num2)

# Limitado a 3 decimales
num3 = f"{num:.3f}"
print(num3)


2.3
2.31
2.312



### 2.2 Formatear fechas en Python f-Strings 

Al imprimir una cadena de Python, las cadenas f te permiten formatear fecha y hora fácilmente con un corchete y sus formatos.

Encuentra todos los formatos [aquí.](https://docs.python.org/2/library/datetime.html#strftime-and-strptime-behavior)

In [9]:
from datetime import datetime

date = datetime(2022, 1, 1, 15, 30, 45)

#Completa la siguiente línea para que el mensaje sea
#Necesitas estar allí a las 03:30 PM el Saturday
print(f'Necesitas estar allí a las {date:%M %p} el {date:%A}')

Necesitas estar allí a las 03:30 PM el Saturday



### 2.3 Rellenar una cadena con ceros por la izquierda.

Si deseas rellenar una cadena con cero, use f-string.

In [2]:
hora1= 8

#Muestra el mensaje siguiente: Son las 08 AM! Levantate!
print(f'Son las {hora1:02d} AM! Levántate!')

Son las 08 AM! Levantate!


### 2.4. Depurar nuestro código Python con un signo igual en una cadena f 

Es común usarlo f"var={var}"para ver qué valores se están imprimiendo.

En Python 3.8 y superior, puede obtener los mismos resultados usando f"{var=}".

Le veremos más utilidad cuando estemos dentro de un bucle imprimiendo valores.

In [16]:
n1 = int(input("Introduce nº1:"))
n2 = int(input("Introduce nº2:"))
n3 = int(input("Introduce nº3:"))
media = (n1 + n2 + n3)/3
print(f"La media de {n1=}, {n2=} y {n3=} es: {media:.2f}")

Introduce nº1:3
Introduce nº2:4
Introduce nº3:5
La media de n1=3, n2=4 y n3=5 es: 4.00


---
## 3. Métodos de Strings

In [3]:
nombre = 'Antonio'
print(dir(nombre))#con dir vemos todos los atributos y métodos asociados de un objeto.
nombre.upper()

['__add__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mod__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__rmod__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'capitalize', 'casefold', 'center', 'count', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'format_map', 'index', 'isalnum', 'isalpha', 'isascii', 'isdecimal', 'isdigit', 'isidentifier', 'islower', 'isnumeric', 'isprintable', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'maketrans', 'partition', 'removeprefix', 'removesuffix', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition', 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill']


'ANTONIO'

Podemos consultar la documentación completa de todos estos métodos en:  

https://docs.python.org/es/3/library/stdtypes.html?highlight=split#str.split

Vamos a ver algunos ejemplos con varios de estos métodos.

---
### 3.1 find(...): encuentrar el índice de una subcadena en una cadena de Python.

Si deseamos encontrar el índice de una subcadena en una cadena, usamos el método <code>find()</code>. 

Este método **devolverá el índice de la primera aparición de la subcadena si se encuentra y devolverá de -1 en caso contrario.**

In [20]:
sentencia = "Hoy saldré a caminar"

#encuentra el indice de la primera ocurrencia de la subcadena "sal"
buscar = sentencia.find("sal")


4

También puedes proporcionar la posición inicial y final de la búsqueda:

In [22]:
#comienza la búsqueda de la subcadena a partir del indice 5.
sentencia = "Hoy saldré a caminar"

buscar = sentencia.find("sal", 5)

In [23]:
#ahora la primera aparición de sal no la tiene encuenta porque está 
#en el indice 4, muestra la segunda en la pos 26
sentencia = "Hoy saldré a caminar y no saldré mañana."
sentencia.find("sal", 5)


26

In [24]:
#aquí no puesta ninguna porque en el rango no está la subcadena
sentencia.find("sal", 5, 10)


-1

---
### 3.2 split(sep=None, maxsplit=- 1) - Dividir cadena

Retorna una lista con las palabras que componen la cadena de caracteres original, usando como separador el valor de sep. Si se utiliza el parámetro maxsplit, se realizan como máximo maxsplit divisiones.

In [25]:
mi_cadena = 'En un lugar de la mancha de cuyo nombre no quiero acordarme, no ha mucho tiempo que vivía un hidalgo...'

In [26]:
#Retorna una lista con las palabras que componen la cadena
palabras = mi_cadena.split()

print(palabras)

['En', 'un', 'lugar', 'de', 'la', 'mancha', 'de', 'cuyo', 'nombre', 'no', 'quiero', 'acordarme,', 'no', 'ha', 'mucho', 'tiempo', 'que', 'vivía', 'un', 'hidalgo...']


In [27]:
'1,2,3'.split(',')

['1', '2', '3']

In [34]:
lista = mi_cadena.split(',')
#muestra los elementos de la lista
print(f"Elementos de la lista: {len(lista)}")
print(lista)

# Accede a la 'u' de "lugar"
u_de_lugar = lista[0][6]
print(f"Ahora vamos a acceder a la u de lugar: {u_de_lugar}")

Elementos de la lista: 2
['En un lugar de la mancha de cuyo nombre no quiero acordarme', ' no ha mucho tiempo que vivía un hidalgo...']
Ahora vamos a acceder a la u de lugar: u


### 3.3 upper() - Poner texto en mayúsculas

In [35]:
#Pon mi_cadena en mayúsculas
mi_cadena = 'En un lugar de la mancha de cuyo nombre no quiero acordarme, no ha mucho tiempo que vivía un hidalgo...'

# Convierte la cadena a mayúsculas
mi_cadena_mayusculas = mi_cadena.upper()

# Imprime el resultado
print(mi_cadena_mayusculas)


'EN UN LUGAR DE LA MANCHA DE CUYO NOMBRE NO QUIERO ACORDARME, NO HA MUCHO TIEMPO QUE VIVÍA UN HIDALGO...'

### 3.4 title() - Poner texto formato título

In [36]:
#Pon mi_cadena con formato título
mi_cadena = 'En un lugar de la mancha de cuyo nombre no quiero acordarme, no ha mucho tiempo que vivía un hidalgo...'

# Convierte la cadena a formato título
mi_cadena_formato_titulo = mi_cadena.title()

# Imprime el resultado
print(mi_cadena_formato_titulo)


'En Un Lugar De La Mancha De Cuyo Nombre No Quiero Acordarme, No Ha Mucho Tiempo Que Vivía Un Hidalgo...'

---
### 3.5 Concatenación de Cadenas

Las cadenas también se pueden concatener. Podemos hacerlo de dos formas.
* Usando el +
* Mediante el método join()

In [40]:
primera_cadena = "Mi nombre es "
segunda_cadena = "Pedro"
cadena = primera_cadena + segunda_cadena
print(cadena)

'Mi nombre es Pedro'

---
### 3.6 join() - Unir cadenas

In [45]:
''.join([primera_cadena,segunda_cadena])


'Mi nombre es Pedro'

In [46]:
#Muestra el texto 'Mi nombre es --Pedro' usando join
primera_cadena = "Mi nombre es "
segunda_cadena = "Pedro"
cadena = '--'.join([primera_cadena, segunda_cadena])
print(cadena)

'Mi nombre es --Pedro'

### 3.7 replace(old, new, count) - Reemplazar cadenas.

Retorna una **copia de la cadena con todas las ocurrencias de la cadena old sustituidas por new.** Si se utiliza el parámetro count, solo se cambian las primeras count ocurrencias.

In [48]:
texto = "En un lugar de la mancha"

# Reemplazar "un lugar" con "in ligar" y "la mancha" con "la Extremadira"
texto_modificado = texto.replace("un lugar", "in ligar").replace("la mancha", "la Extremadira")

print(texto_modificado)


En in ligar de la Extremadira


In [49]:
#Muestra En in liger de le Extremadira

print(texto)

En in liger de le Extremadira


### 3.7 Cadenas multilínea

Si tu cadena de Python es muy larga, puede dividirla usando paréntesis o una barra invertida.

In [None]:
text = (
    "Es una frase muy "
    "larga que está "
    "hecha para probar.."
)

text

In [None]:
text ="Es una frase muy "\
    "larga que está "\
    "hecha para probar.."\

text

---
### 3.8 Detectar textos casi similares

Al analizar artículos, diferentes artículos pueden ser casi similares pero no 100% idénticos, tal vez debido a la gramática o al cambio en dos o tres palabras (como publicación cruzada). 

**¿Cómo podemos detectar los artículos “casi similares” y descartar uno de ellos?** Ahí es cuando difflib.SequenceMatcher es útil.



In [52]:
from difflib import SequenceMatcher

text1 = 'Soy Gandalf el Blanco y en los albores de la tempestad, vengo a vosotros.'
text2 = 'Soy Gandalf el Gris y en los albores de la tempestad, vengo a vosotros.'
#Muestra cómo de similares son los textos anteriores
similar = SequenceMatcher(None, text1, text2).ratio()

#Muestra lo mismo que antes pero sólo con 2 decimales
print(f"Similitud entre los textos (2 decimales): {similar:.2f}")

0.9305555555555556


---
### 3.9 Obtener mejores coincidencias de una palabra.

Si deseas obtener una lista de las mejores coincidencias para una determinada palabra, utiliza: 

**difflib.get_close_matches.**

In [53]:
from difflib import get_close_matches

tools = ['libreria', 'librero', 'estanteria', 'libro', 'librazo']
palabra_a_buscar = 'libro'

#Muestra las mejores coincidencias
mejores_coincidencias = get_close_matches(palabra_a_buscar, tools)

print(f"Las mejores coincidencias para '{palabra_a_buscar}' son: {mejores_coincidencias}")


['librazo', 'libro', 'librero']

Para obtener coincidencias más cercanas, **aumenta el valor del argumento cutoff(predeterminado 0.6).**

In [54]:
#aumenta el valor del argumento cutoff(predeterminado 0.6).
from difflib import get_close_matches

tools = ['libreria', 'librero', 'estanteria', 'libro', 'librazo']
palabra_a_buscar = 'libro'

# Aumenta el valor de cutoff para obtener coincidencias más cercanas
mejores_coincidencias = get_close_matches(palabra_a_buscar, tools, cutoff=0.8)

print(f"Las mejores coincidencias para '{palabra_a_buscar}' son: {mejores_coincidencias}")


['librazo', 'libro']

---
## 4. String Slicing

Para cortar cadenas hay que tener en cuenta lo que vimos al inicio de este notebook, que cada letra ocupa una posición determinada comenzando siempre desde el 0.
**Lo usaremos mucho con cadenas y Listas**

**secuencia[i:j:k]**

El primer parámetro **i indica el índice de comienzo del trozo** y el segundo **j el final, pero sin incluir**. El tercero **k** es opcional y, cuando está presente, indica el incremento con el que recorreremos el camino entre el principio y el fin, si no indicamos k, el incremento será de 1 en 1.

Veamos algunos ejemplos:


In [55]:
a="Pradera"
len(a)

7

Vamos a cortar un fragmento que abarca desde el carácter que tiene por índice 0 (es decir, el primero), hasta el que tiene 3 sin incluir (esto es, hasta el índice 2).

In [56]:
#Corta un fragmento que abarca desde el primer carácter hasta el 3º (sin incluir)
a = "Pradera"
resultado = a[0:3]
print(resultado)

'Pra'

Cortamos ahora un fragmento que va desde la posición 1 hasta la 6 sin incluirla

In [57]:
#Cortamos ahora un fragmento que va desde la posición 1 hasta la 6 sin incluirla
a = "Pradera"
resultado = a[1:6]
print(resultado)

'rader'

Y ahora recorremos la secuencia de dos en dos, empezando por el primero

In [59]:
print(a)
#Y ahora recorre la secuencia de dos en dos, empezando por el primero
a = "Pradera"
resultado = a[0:6:2]
print(resultado)

Pradera


'rdr'

In [60]:
a[6:1:-2]

'aea'

El siguiente ejemplo muestra la omisión del primer parámetro, indicando que comenzamos desde el principio

In [61]:
#vamos desde el inicio hasta el indice 4
a = "Pradera"
resultado = a[:4]
print(resultado)

'Prad'

Omitimos el segundo parámetro, lo que significa que sigue **hasta el final**

In [62]:
a[3:]#vamos desde el 3 hasta el final

'dera'

In [64]:
print(a)
a[5:1:-1]

Pradera


'reda'

**Analicemos esto con cuidado para asegurarnos de que lo entendemos bien:**

Pradera

Lo primero que quizás te llame la atención es que el primer parámetro es mayor que el segundo. Esto es así debido a que **estamos recorriendo la secuencia de derecha a izquierda. El índice de comienzo siempre será más alto (o al menos igual) que el índice de destino.**

Comenzamos el corte hacia atrás desde el carácter que tiene por **índice 5: ‘r’.**

¿Y dónde terminamos? En el inmediatamente anterior al indicado en el segundo parámetro. 

**Puesto que estamos recorriendo la secuencia al revés, el anterior del índice 1 no es el índice cero sino 2: ‘a’.**

---
**Recorrer cadena de principio a fin:**

In [65]:
a[::]

'Pradera'

---
**Recorrer cadena de forma inversa:**

In [66]:
a[::-1]

'aredarP'

---
## 5. Ejercicios

___
**1- Pide una cadena y un carácter por teclado (fuerza que sea un caracter) y muestra cuantas veces aparece el carácter en la cadena.**

In [2]:
cadena = input("Ingrese una cadena: ")

caracter = input("Ingrese un carácter: ")
while len(caracter) != 1:
    caracter = input("Por favor, ingrese solo un carácter: ")

contador = 0

for c in cadena:
    if c == caracter:
        contador += 1

print(f"El carácter '{caracter}' aparece {contador} veces en la cadena.")


El carácter 'l' aparece 1 veces en la cadena.


---
**2- Suponiendo que hemos introducido una cadena por teclado que representa una frase (palabras separadas por espacios), realiza un programa que cuente cuantas palabras tiene.**

In [None]:
frase = input("Introduce una frase: ")

palabras = frase.split()

cantidad_palabras = len(palabras)

print("La frase tiene {} palabras.".format(cantidad_palabras))

---
**3- Pide una cadena y dos caracteres por teclado (fuerza que sea un caracter), sustituye la aparición del primer carácter en la cadena por el segundo carácter.**


In [None]:
cadena = input("Introduce una cadena: ")
caracter1 = input("Introduce el primer carácter a reemplazar: ")[0]
caracter2 = input("Introduce el segundo carácter: ")[0] 

nueva_cadena = cadena.replace(caracter1, caracter2, 1)

print("Cadena original:", cadena)
print("Nueva cadena:", nueva_cadena)

---
**4- Escribir un programa que pida al usuario que introduzca una frase en la consola y 2 vocales, y después muestre por pantalla la misma frase pero con las vocales introducidas en mayúsculas.** 

In [None]:


frase_usuario = input("Introduce una frase: ")

vocal1_usuario = input("Introduce la primera vocal: ").lower()
vocal2_usuario = input("Introduce la segunda vocal: ").lower()

def cambiar_vocales_mayusculas(frase, vocal1, vocal2):
    nueva_frase = ""
    for caracter in frase:
        if caracter.lower() in [vocal1, vocal2]:
            nueva_frase += caracter.upper()
        else:
            nueva_frase += caracter

    return nueva_frase

if len(vocal1_usuario) == 1 and vocal1_usuario.isalpha() and vocal1_usuario in "aeiou" and \
   len(vocal2_usuario) == 1 and vocal2_usuario.isalpha() and vocal2_usuario in "aeiou":

    nueva_frase_con_mayusculas = cambiar_vocales_mayusculas(frase_usuario, vocal1_usuario, vocal2_usuario)

    print("Frase original:", frase_usuario)
    print("Nueva frase con vocales en mayúsculas:", nueva_frase_con_mayusculas)

else:
    print("Por favor, ingresa una única letra vocal válida para ambas vocales.")