# Clase 2 - Strings en Python

> **Definición:** 

En Python, las cadenas de caracteres (strings) son consideradas como objetos. Son instancias de la clase  str , lo que significa que tienen métodos y atributos asociados a ellas. Esto permite que se puedan manipular y formatear utilizando los métodos proporcionados por la clase  str . 

Además, las cadenas de caracteres en Python son inmutables, lo que significa que no se pueden modificar directamente. Sin embargo, se pueden realizar operaciones con ellas, como concatenación (+), repetición (*), indexación y segmentación.

## 1. Construcción
En Python las cadenas se construyen de maneras muy sencilla:

- `"` Con comillas dobles
- `'` Con comillas simples

### Asignación y presentación
Luego podemos asignarla a variables para reutilizarlas posteriormente.

In [2]:
cadena1 = "Hola"    #Con comillas dobles
cadena2 = 'Mundo'   #Con comillas simples

Las presentaremos mediante la función `print()` la cual es una función de la biblioteca estándar de Python:

In [2]:
print(cadena1)
print(cadena2)

Hola
Mundo


También será posible presentarlas pasándolas como parámetros de una sola función `print` separadas por "comas":

In [3]:
print(cadena1, cadena2)

Hola Mundo


### Cadenas multilínea

Así mismo, es factible crear cadenas multilínea de la siguiente forma:

In [4]:
multilinea = '''Esta es una sola cadena
con varias lineas, las cuales son muy útiles
y pueden servir para redactar comentarios elaborados.

Se pueden construir tanto con comillas simples y dobles.'''
print(multilinea)

Esta es una sola cadena
con varias lineas, las cuales son muy útiles
y pueden servir para redactar comentarios elaborados.

Se pueden construir tanto con comillas simples y dobles.


## 2. Operaciones con strings

### Operaciones Básicas:

   - Concatenación de cadenas:  `+` 
   - Repetición de cadenas:  `*` 
   - Comparación de cadenas: 
      - Igualdad: `==` 
      - Desigualdad: `!=` 

In [8]:
cadena = cadena1 + " " + cadena2
print('Concatenacion de cadenas:', cadena)
repetida = cadena * 3
print('Repeticion de cadenas:', repetida)

# Comparacion:
# - Igualdad
print('¿Las cadenas son iguales? ', cadena1 == cadena2)
# - Desigualdad
print('¿Las cadenas son diferentes? ', cadena1 != cadena2)


Concatenacion de cadenas: Hola Mundo
Repeticion de cadenas: Hola MundoHola MundoHola Mundo
¿Las cadenas son iguales?  False
¿Las cadenas son diferentes?  True


### Otras operaciones:

   - Indexación:  `[]` 
   - Slicing:  `[:]` 
   - Verificación de pertenencia:  `in` ,  `not in` 

In [4]:
primer_caracter = cadena[0]
print('Indexacion:', primer_caracter)
subcadena = cadena[0:4]
print('Slicing:', subcadena)

###    - Verificación de pertenencia:  `in` ,  `not in` 
"Mundo" in cadena

Indexacion: H
Slicing: Hola


True

##  3. Secuencias de escape:

 Existen varias secuencias de escape en Python que se utilizan para representar caracteres especiales. Algunas de las más comunes son:   
- `\n`: nueva línea 
- `\r`: retorno de carro 
- `\t`: tabulación horizontal 
- `\b`: retroceso 
- `\f`: avance de página 
- `\'`: comilla simple 
- `\"`: comilla doble 
- `\\`: barra invertida 
- `\a`: timbre o alerta 
- `\v`: tabulación vertical 
- `\ooo`: valor octal (reemplaza ooo por un número octal) 
- `\xhh`: valor hexadecimal (reemplaza hh por un número hexadecimal de dos dígitos) 
- `\uhhhh`: valor Unicode de 16 bits (reemplaza hhhh por un número hexadecimal de cuatro dígitos) 
- `\Uhhhhhhhh`: valor Unicode de 32 bits (reemplaza hhhhhhhh por un número hexadecimal de ocho dígitos) 
Estas secuencias de escape se utilizan para representar caracteres que de otra manera serían difíciles de incluir en una cadena de texto.

In [6]:
print("Hola\nMundo")  # Salida: 
print("Hola\rMundo")  # Salida: Mundo
print("Hola\tMundo")  # Salida: Hola     Mundo
print("Hola\bMundo")  # Salida: HolMundo
print("Hola\fMundo")  # Salida: 
print('Hola\'Mundo')  # Salida: Hola'Mundo
print("Hola\"Mundo")  # Salida: Hola"Mundo
print("Hola\\Mundo")  # Salida: Hola\Mundo
print("\aHola Mundo")  # Salida: (Sonido de alerta) Hola Mundo
print("Hola\vMundo")  # Salida: 
print("\123")  # Salida: S
print("\x48\x6f\x6c\x61")  # Salida: Hola
print("\u00A9")  # Salida: ©
print("\U0001F600")  # Salida: 😀

Hola
Mundo
Mundo
Hola	Mundo
HolMundo
HolaMundo
Hola'Mundo
Hola"Mundo
Hola\Mundo
Hola Mundo
HolaMundo
S
Hola
©
😀


## 4. Métodos de manipulación:

   -  `capitalize()` : Convierte el primer carácter en mayúscula y el resto en minúsculas.
   -  `casefold()` : Devuelve una versión en minúsculas de la cadena.
   -  `center(width[, fillchar])` : Devuelve una cadena centrada en un ancho dado.
   -  `count(sub[, start[, end]])` : Devuelve el número de ocurrencias de una subcadena.
   -  `encode([encoding[, errors]])` : Devuelve una versión codificada de la cadena.
   -  `endswith(suffix[, start[, end]])` : Verifica si la cadena termina con una subcadena dada.
   -  `expandtabs([tabsize])` : Reemplaza los caracteres de tabulación con espacios.
   -  `find(sub[, start[, end]])` : Devuelve el índice de la primera ocurrencia de una subcadena.
   -  `format(*args, **kwargs)` : Formatea la cadena con valores variables.
   -  `index(sub[, start[, end]])` : Devuelve el índice de la primera ocurrencia de una subcadena (lanza una excepción si no se encuentra).
   -  `isalnum()` : Verifica si la cadena contiene solo caracteres alfanuméricos.
   -  `isalpha()` : Verifica si la cadena contiene solo letras.
   -  `isdecimal()` : Verifica si la cadena contiene solo dígitos decimales.
   -  `isdigit()` : Verifica si la cadena contiene solo dígitos.
   -  `isidentifier()` : Verifica si la cadena es un identificador válido.
   -  `islower()` : Verifica si la cadena contiene solo caracteres en minúsculas.
   -  `isnumeric()` : Verifica si la cadena contiene solo caracteres numéricos.
   -  `isprintable()` : Verifica si todos los caracteres de la cadena son imprimibles.
   -  `isspace()` : Verifica si la cadena contiene solo espacios en blanco.
   -  `istitle()` : Verifica si la cadena sigue el formato de título.
   -  `isupper()` : Verifica si la cadena contiene solo caracteres en mayúsculas.
   -  `join(iterable)` : Une los elementos de un iterable con la cadena como separador.
   -  `ljust(width[, fillchar])` : Devuelve una cadena justificada a la izquierda en un ancho dado.
   -  `lower()` : Devuelve una versión en minúsculas de la cadena.
   -  `lstrip([chars])` : Elimina los caracteres iniciales de la cadena.
   -  `maketrans(x[, y[, z]])` : Devuelve una tabla de traducción para usar con el método  `translate()` .
   -  `partition(sep)` : Divide la cadena en una tupla basada en la primera aparición de una subcadena.
   -  `replace(old, new[, count])` : Reemplaza todas las apariciones de una subcadena con otra.
   -  `rfind(sub[, start[, end]])` : Devuelve el índice de la última ocurrencia de una subcadena.
   -  `rindex(sub[, start[, end]])` : Devuelve el índice de la última ocurrencia de una subcadena (lanza una excepción si no se encuentra).
   -  `rjust(width[, fillchar])` : Devuelve una cadena justificada a la derecha en un ancho dado.
   -  `rpartition(sep)` : Divide la cadena en una tupla basada en la última aparición de una subcadena.
   -  `rsplit([sep[, maxsplit]])` : Divide la cadena en una lista de subcadenas a partir de la derecha.
   -  `rstrip([chars])` : Elimina los caracteres finales de la cadena.
   -  `split([sep[, maxsplit]])` : Divide la cadena en una lista de subcadenas.
   -  `splitlines([keepends])` : Divide la cadena en una lista de líneas.
   -  `startswith(prefix[, start[, end]])` : Verifica si la cadena comienza con una subcadena dada.
   -  `strip([chars])` : Elimina los caracteres iniciales y finales de la cadena.
   -  `swapcase()` : Intercambia mayúsculas y minúsculas en la cadena.
   -  `title()` : Devuelve una versión en formato de título de la cadena.
   -  `translate(table)` : Devuelve una copia de la cadena traducida según una tabla de traducción.
   -  `upper()` : Devuelve una versión en mayúsculas de la cadena.
   -  `zfill(width)` : Rellena la cadena con ceros a la izquierda hasta alcanzar un ancho dado.

In [7]:
print('capitalize:', "hola mundo".capitalize())  # Salida: Hola mundo
print('casefold:', "HOLA MUNDO".casefold())  # Salida: hola mundo
print('center:', "hola".center(10, '-'))  # Salida: --hola---
print('count:', "hola mundo".count('o'))  # Salida: 2
print('encode:', "hola".encode('utf-8'))  # Salida: b'hola'
print('endswith:', "hola".endswith('a'))  # Salida: True
print('expandtabs:', "holamundo".expandtabs(10))  # Salida: hola      mundo
print('find:', "hola mundo".find('mundo'))  # Salida: 5
print('format:', "Hola {}, ¿cómo estás?".format("Mundo"))  # Salida: Hola Mundo, ¿cómo estás?
print('index:', "hola mundo".index('mundo'))  # Salida: 5
print('isalnum:', "hola123".isalnum())  # Salida: True
print('isalpha:', "hola".isalpha())  # Salida: True
print('isdecimal:', "123".isdecimal())  # Salida: True
print('isdigit:', "123".isdigit())  # Salida: True
print('isidentifier:', "hola".isidentifier())  # Salida: True
print('islower:', "hola".islower())  # Salida: True
print('isnumeric:', "123".isnumeric())  # Salida: True
print('isprintable:', "hola mundo".isprintable())  # Salida: True
print('isspace:', "   ".isspace())  # Salida: True
print('istitle:', "Hola Mundo".istitle())  # Salida: True
print('isupper:', "HOLA".isupper())  # Salida: True
print('join:', "-".join(["hola", "mundo"]))  # Salida: hola-mundo
print('ljust:', "hola".ljust(10, '-'))  # Salida: hola------
print('lower:', "HOLA".lower())  # Salida: hola
print('lstrip:', "   hola mundo".lstrip())  # Salida: hola mundo
trans = str.maketrans('aeiou', '12345')
print('partition:', "hola mundo".translate(trans))  # Salida: h4l1 m5nd4
print('replace:', "hola mundo".partition(' '))  # Salida: ('hola', ' ', 'mundo')
print('rfind:', "hola mundo".replace('hola', 'adios'))  # Salida: adios mundo
print('rindex:', "hola mundo mundo".rfind('mundo'))  # Salida: 10
print('rjust:', "hola mundo mundo".rindex('mundo'))  # Salida: 10
print('rpartition:', "hola".rjust(10, '-'))  # Salida: ------hola
print('rsplit:', "hola mundo mundo".rpartition('mundo'))  # Salida: ('hola mundo ', 'mundo', '')
print('rstrip:', "hola mundo mundo".rsplit(' '))  # Salida: ['hola', 'mundo', 'mundo']
print('split:', "hola mundo   ".rstrip())  # Salida: hola mundo
print('splitlines:', "hola mundo mundo".split(' '))  # Salida: ['hola', 'mundo', 'mundo']
print('startswith:', "hola\nmundo".splitlines())  # Salida: ['hola', 'mundo']
print('strip:', "hola".startswith('h'))  # Salida: True
print('swapcase:', "   hola mundo   ".strip())  # Salida: hola mundo
print('title:', "hOlA MuNdO".swapcase())  # Salida: HoLa mUnDo
print('translate:', "hola mundo".title())  # Salida: Hola Mundo
print('upper:', "hola".upper())  # Salida: HOLA
print('zfill:', "hola".zfill(10))  # Salida: 000000hola

capitalize: Hola mundo
casefold: hola mundo
center: ---hola---
count: 2
encode: b'hola'
endswith: True
expandtabs: holamundo
find: 5
format: Hola Mundo, ¿cómo estás?
index: 5
isalnum: True
isalpha: True
isdecimal: True
isdigit: True
isidentifier: True
islower: True
isnumeric: True
isprintable: True
isspace: True
istitle: True
isupper: True
join: hola-mundo
ljust: hola------
lower: hola
lstrip: hola mundo
partition: h4l1 m5nd4
replace: ('hola', ' ', 'mundo')
rfind: adios mundo
rindex: 11
rjust: 11
rpartition: ------hola
rsplit: ('hola mundo ', 'mundo', '')
rstrip: ['hola', 'mundo', 'mundo']
split: hola mundo
splitlines: ['hola', 'mundo', 'mundo']
startswith: ['hola', 'mundo']
strip: True
swapcase: hola mundo
title: HoLa mUnDo
translate: Hola Mundo
upper: HOLA
zfill: 000000hola


## 5. Formateo de cadenas:

- El método  `.format()`  es una manera común de formatear cadenas en Python. Permite combinar valores variables con una cadena utilizando marcadores de posición.
- Además del método  .format() , también hay otras formas de formatear cadenas en Python como:
    - Método `f-string` (disponible a partir de Python 3.6).
    - Método  `%`.

Veamos algunos ejemplos:

In [8]:
nombre = "Juan"
edad = 25

# Método format
mensaje = "Hola, mi nombre es {} y tengo {} años.".format(nombre, edad)
print(mensaje)

# Método f-string
mensaje = f"Hola, mi nombre es {nombre} y tengo {edad} años."
print(mensaje)
# Método  % :
mensaje = "Hola, mi nombre es %s y tengo %d años." % (nombre, edad)
print(mensaje)
# "%s" y "%d" son marcadores de formato que se utilizan para insertar valores variables en una cadena de texto.

Hola, mi nombre es Juan y tengo 25 años.
Hola, mi nombre es Juan y tengo 25 años.
Hola, mi nombre es Juan y tengo 25 años.


Aquí tienes una lista de los marcadores de formato más comunes en Python:
- %s: utilizado para cadenas de caracteres (strings).
- %d: utilizado para números enteros (integers).
- %f: utilizado para números de punto flotante (floats).
- %x: utilizado para números enteros en formato hexadecimal.
- %o: utilizado para números enteros en formato octal.
- %e: utilizado para números de punto flotante en notación científica.
- %c: utilizado para caracteres individuales.
- %r: utilizado para representaciones de cadenas de caracteres (strings) con comillas.
- %i: utilizado para números enteros (integers) (similar a %d).
- %u: utilizado para números enteros (integers) sin signo.
- %g: utilizado para números de punto flotante (floats), elige automáticamente entre %f y %e según la longitud del número.
- %%: utilizado para imprimir un signo de porcentaje (%).
 Estos marcadores de formato se utilizan en combinación con el operador de formato "%" o con el método de formato de cadenas ".format()".