<a href="https://colab.research.google.com/github/nspiter-creator/PC_Python_2025II/blob/main/clase_9/Python_strings.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Curso de Programación de Computadores en Python
## Creación de cadenas, Slicing y Manipulación de strings
#### Universidad Nacional de Colombia

---

## Objetivos

- Aprender las distintas formas de crear cadenas en Python.
- Entender y practicar slicing para extraer subcadenas.
- Conocer y aplicar operaciones comunes de manipulación: búsqueda, transformación, división y formateo.
- Resolver ejercicios prácticos dentro del notebook.

---


## 🔧 Cómo usar este notebook

- Ejecuta las celdas de código con `Shift+Enter`.
- Cada sección contiene explicación, ejemplos ejecutables y ejercicios.

¡Manos a la obra! 🚀


# 1️⃣ Creación de cadenas

Las cadenas en Python se representan con comillas simples (`'...'`) o dobles (`"..."`). Las triples comillas (`'''...'''` o `"""..."""`) permiten cadenas multilínea. También existen **raw strings** prefijadas con `r` para evitar interpretar escapes, y objetos `bytes` para datos binarios.

**Puntos clave:**
- Comillas simples y dobles son equivalentes: permiten incluir la otra sin escapar.
- Triple comilla: útil para documentación y cadenas multilínea.
- `r"..."` evita interpretar `\n`, `\t`, etc.
- Strings son inmutables.


In [None]:
# Ejemplos de creación de cadenas
s1 = 'hola'
s2 = "mundo"
s3 = """Esto es
una cadena
multilínea"""
s4 = r'C:\nno_se_interpreta_como_salto'
bytes_example = b"hola bytes"

print(type(s1), s1)
print(type(s3))
print(s3)
print(s4)
print(bytes_example)

# concatenación y repetición
print('hola' + ' ' + 'mundo')
print('eco! ' * 3)

# f-strings y formato
nombre = 'María'
edad = 23
print(f"Nombre: {nombre}, Edad: {edad}")
print("Formato con format: {} tiene {} años".format(nombre, edad))


<class 'str'> hola
<class 'str'>
Esto es
una cadena
multilínea
C:\nno_se_interpreta_como_salto
b'hola bytes'
hola mundo
eco! eco! eco! 
Nombre: María, Edad: 23
Formato con format: María tiene 23 años


### ✍️ Ejercicio 1 — Crear cadenas (Esqueleto)

Crea tres variables:
- `ruta_windows` como raw string que represente `C:\nuevacarpeta\archivo.txt` sin que `\n` se convierta en salto de línea.
- `mensaje_multilinea` con triple comillas que incluya al menos 2 líneas de texto.
- `saludo` usando f-string que combine `nombre` y `ciudad` (variables dadas).

Completa la celda de código siguiente.


In [None]:
# Esqueleto ejercicio 1
nombre = 'Carlos'
ciudad = 'Bogotá'

# TODO: crear ruta_windows como raw string
ruta_windows = None

# TODO: crear mensaje_multilinea con triple comillas
mensaje_multilinea = None

# TODO: crear saludo usando f-string
saludo = None

# Imprimir resultados (descomenta después de completar)
# print(ruta_windows)
# print(mensaje_multilinea)
# print(saludo)


Las operaciones efectuadas con variables numéricas, no son posibles de usar con _strings_:
  * ``"comida" - "rápida"``
  * ``"huevos" / "fritos"``

Pero existen dos excepciones:
  1. ``+`` que concatena o une dos o más cadenas.
  2. ``*`` que repite $n$ veces una cadena.

In [None]:
cadena = "hola :) "
print(cadena + cadena)

hola :) hola :) 


In [None]:
cadena = "hola :) "
print(cadena*4)

hola :) hola :) hola :) hola :) 


Igualmente, podemos realizar operaciones relacionales entre dos cadenas:

In [32]:
cadena_1 = "manzana"
cadena_2 = "banano"
cadena_3 = "manzana"

print(cadena_1 < cadena_2)
print(cadena_1 == cadena_3)

False
True


Y que incluyan operadores lógicos:

In [1]:
cadena_1 = "manzana"
cadena_2 = "banano"
cadena_3 = "manzana"

print(cadena_1 == cadena_2 or cadena_1 == cadena_3)
print(cadena_1 == cadena_2 and cadena_1 == cadena_3)

True
False


# 2️⃣ Slicing (rebanado) de cadenas


### Indexación

Como los _strings_ son una secuencia de caracteres, estos se pueden obtener por su índice con corchetes. Veámos un ejemplo:

<img src="https://greenteapress.com/thinkpython2/html/thinkpython2009.png" width="175"/>

In [30]:
fruta = "banana"
primera_letra = fruta[0]
print(primera_letra)

for indice in range(0, 6, 1):
    print("letra:", fruta[indice])

b
letra: b
letra: a
letra: n
letra: a
letra: n
letra: a


A lo anterior se le denomina indexación, e igualmente podemos realizarla con una variable numérica:

In [24]:
i = 2
print(fruta[i])

l


E incluso podemos utilizar una indexación negativa, que en este caso cuenta desde el último carácter:

In [25]:
id_negativa = fruta[-3]
print(id_negativa)

l


Si queremos conocer cuántos caracteres tiene nuestra cadena, solo debemos usar `len()`:

In [12]:
cadena = "esta es una cadena :)"
n_caracteres = len(cadena)
print(n_caracteres)

21


Pero debemos tener cuidado de usar ese valor como índice en nuestra cadena:

In [None]:
cadena = "esta es una cadena :)"
n_caracteres = len(cadena)
print(cadena[n_caracteres-1]) #debe ser n_caracteres-1

)


In [None]:
len(cadena)

8

### Seccionado de cadenas

* Muchas veces al realizar operaciones o manipular _strings_ se requiere seccionar o tomar parte de las cadenas.
* Eso se realiza con la misma indexación, pero utilizando `:` dentro de los corchetes, es decir de esta forma: `[a:b]`.
* Veámos un ejemplo con el caso anterior:

<img src="https://greenteapress.com/thinkpython2/html/thinkpython2009.png" width="175"/>

In [None]:
fruta = "banana"
seccion = fruta[:4] # Toma los cuatro primeros caracteres
print(seccion)

bana


Pero podemos tomar los caracteres desde cierto índice:

In [None]:
fruta = "banana"
seccion = fruta[4:] # Toma desde el cuarto carácter hacia adelante
print(seccion)

na


O definiendo ambos límites:

In [None]:
fruta = "banana"
seccion = fruta[1:3] # Toma desde el primer hasta el tercer carácter (sin incluir)
print(seccion)

an


También, podemos utilizar una indexación negativa:

In [None]:
fruta = "banana"
seccion = fruta[-4:-1] # Toma desde el caracter -4 hasta -1 (sin incluir)
print(seccion)

nan


In [None]:
# Ejemplos de slicing
s = 'abcdefghijkl'
print('s:', s)
print('s[0:5]:', s[0:5])
print('s[:5]:', s[:5])
print('s[5:]:', s[5:])
print('s[2:8:2]:', s[2:8:2])
print('s[-4:-1]:', s[-4:-1])
print('s[::-1] (invertida):', s[::-1])
print('s[::3]:', s[::3])


s: abcdefghijkl
s[0:5]: abcde
s[:5]: abcde
s[5:]: fghijkl
s[2:8:2]: ceg
s[-4:-1]: ijk
s[::-1] (invertida): lkjihgfedcba
s[::3]: adgj


### Inmutabilidad

Refiere a la incapacidad de mutar los valores de la cadena de caracteres. Es decir, no se puede modificar a los _strings_ mediante la indexación. Veámos un ejemplo:

In [36]:
cadena = "esta es una cadena :)"
cadena[0] = "u"
print(cadena)

TypeError: 'str' object does not support item assignment

Pero una forma de hacerlo es mediante la concatenación de cadenas (`+`) que ya habíamos visto:

In [37]:
cadena = "esta es una cadena :)"
nueva_cadena = "E" + cadena[1:]
print(nueva_cadena)

Esta es una cadena :)


### ✍️ Ejercicio 2 — Slicing (Esqueleto)

Dado `codigo = 'PYTHON-3.10-RELEASE'` extrae con slicing:
- `parte1`: 'PYTHON'
- `numero`: '3.10'
- `estado`: 'RELEASE'
- `salto`: caracteres cada 2 (desde inicio)
- `invertido`: cadena completa invertida

Completa la celda siguiente usando slicing solamente (sin métodos adicionales).


In [52]:
# Esqueleto ejercicio 2
codigo = 'PYTHON-3.10-RELEASE'


# TODO: extraer parte1
parte1 = codigo[0:6]
# TODO: extraer numero
numero = codigo[7:11]
# TODO: extraer estado
estado = codigo[12:]
# TODO: caracteres cada 2
salto = codigo[::2]
# TODO: invertida
invertido = codigo[:: -1]

partes = codigo.split("-")
parte1 = partes [0]
# print(parte1, numero, estado, salto, invertido)
print(f"parte1: {parte1}")
print(f"numero: {numero}")
print(f"estado: {estado}")
print(f"salto: {salto}")
print(f"invertido: {invertido}")


parte1: PYTHON
numero: 3.10
estado: RELEASE
salto: PTO-.0RLAE
invertido: ESAELER-01.3-NOHTYP


# 3️⃣ Manipulación de strings

Operaciones comunes:

- **Transformaciones de caso:** `lower()`, `upper()`, `title()`, `capitalize()`.
- **Eliminar espacios:** `strip()`, `lstrip()`, `rstrip()`.
- **Buscar y reemplazar:** `find()`, `rfind()`, `index()`, `replace()`.
- **Dividir y unir:** `split(sep)`, `join(iterable)`.
- **Comprobaciones:** `startswith()`, `endswith()`, `isalpha()`, `isdigit()`.
- **Formateo:** `f-strings`, `format()`, `%`.
- **Otras útiles:** `count()`, `partition()`, `zfill()`, `center()`.

Veamos ejemplos prácticos.


In [49]:
# Ejemplos de manipulación
texto = '   Hola Mundo, Python es genial!   '
print('Original ->', repr(texto))
print('strip ->', repr(texto.strip()))
print('lower ->', texto.lower())
print('upper ->', texto.upper())
print('title ->', texto.title())

# Buscar
print('find "Python" ->', texto.find('Python'))
print('count "o" ->', texto.count('o'))

# Reemplazar
print(texto.replace('Python', 'Py'))

# Split y join
palabras = texto.strip().split()
print('split ->', palabras)
print('join ->', '/'.join(palabras))

# startswith / endswith
s = 'informe_2025.txt'
print(s.endswith('.txt'))
print(s.startswith('info'))

# Partition
print('partition ->', s.partition('_'))

# zfill
print('zfill ->', '42'.zfill(5))

# center
print('center ->', 'titulo'.center(20, '-'))


Original -> '   Hola Mundo, Python es genial!   '
strip -> 'Hola Mundo, Python es genial!'
lower ->    hola mundo, python es genial!   
upper ->    HOLA MUNDO, PYTHON ES GENIAL!   
title ->    Hola Mundo, Python Es Genial!   
find "Python" -> 15
count "o" -> 3
   Hola Mundo, Py es genial!   
split -> ['Hola', 'Mundo,', 'Python', 'es', 'genial!']
join -> Hola/Mundo,/Python/es/genial!
True
True
partition -> ('informe', '_', '2025.txt')
zfill -> 00042
center -> -------titulo-------


### Uso conjunto de funciones

* Supongamos que tenemos un _string_ al que deseamos modificar para que todo sea en mayúscula, quitar todos los espacios en blanco al principio y final, y cambiar los `;` por `,`
* Para eso podemos utilizar cada función despúes de la otra en una sola línea, de la siguiente forma:

In [None]:
# Ejemplo de cadena -- Tomado de https://es.wikipedia.org/wiki/Python
cadena = "  Python es un lenguaje de alto nivel de programación; interpretado cuya filosofía; hace hincapié en la legibilidad de su código.  "

# Nueva cadena, en donde se usan múltiples funciones
nueva_cadena = cadena.upper().strip().replace(";", ",")

# Mostrar resultados
print(f"* Inicial -> '{cadena}' \n\n* Nueva -> '{nueva_cadena}'")

* Inicial -> '  Python es un lenguaje de alto nivel de programación; interpretado cuya filosofía; hace hincapié en la legibilidad de su código.  ' 

* Nueva -> 'PYTHON ES UN LENGUAJE DE ALTO NIVEL DE PROGRAMACIÓN, INTERPRETADO CUYA FILOSOFÍA, HACE HINCAPIÉ EN LA LEGIBILIDAD DE SU CÓDIGO.'


### ✍️ Ejercicio 3 — Manipulación (Esqueleto)

1. **Normalizar nombre:** implementar `normalizar_nombre(s)` que reciba una cadena `s` y retorne el nombre en formato `Nombre Apellido` (capitalizado y sin espacios extras).
2. **Extraer extensión:** implementar `extraer_extension(filename)` que retorne la extensión de un archivo (`'txt'`, `'csv'`, etc.) o cadena vacía si no tiene.
3. **Contar vocales:** implementar `contar_vocales(s)` que retorne el número total de vocales (a,e,i,o,u) en la cadena (ignorando mayúsculas/minúsculas).

Completa la celda de código siguiente.


In [None]:
# Esqueleto ejercicio 3

def normalizar_nombre(s):
    # TODO: eliminar espacios, separar, capitalizar y unir
    pass

def extraer_extension(filename):
    # TODO: usar rfind o partition para obtener la extensión
    pass

def contar_vocales(s):
    # TODO: recorrer la cadena y contar vocales (sin usar listas para almacenar)
    pass

# Pruebas sugeridas (descomentar después de implementar):
# print(normalizar_nombre('  ana maria  '))  # 'Ana Maria'
# print(extraer_extension('reporte.csv'))  # 'csv'
# print(contar_vocales('Hola Mundo'))  # 4


### Más y más funciones para _strings_

_Tabla tomada y traducida de la página oficial de [W3Schools](https://www.w3schools.com/python/python_strings_methods.asp). También puedes revisar la [documentación oficial de Python](https://docs.python.org/3/library/stdtypes.html#string-methods)_


| Método          | Descripción                                                                 |
|------------------|-----------------------------------------------------------------------------|
| capitalize()     | Convierte el primer carácter a mayúscula                                    |
| casefold()       | Convierte la cadena a minúsculas                                            |
| center()         | Devuelve una cadena centrada                                                |
| count()          | Devuelve el número de veces que un valor especificado ocurre en una cadena  |
| encode()         | Devuelve una versión codificada de la cadena                                |
| endswith()       | Devuelve verdadero si la cadena termina con el valor especificado           |
| expandtabs()     | Establece el tamaño de tabulación de la cadena                              |
| find()           | Busca un valor especificado en la cadena y devuelve la posición donde se encontró |
| format()         | Formatea valores especificados en una cadena                                |
| format_map()     | Formatea valores especificados en una cadena                                |
| index()          | Busca un valor especificado en la cadena y devuelve la posición donde se encontró |
| isalnum()        | Devuelve verdadero si todos los caracteres en la cadena son alfanuméricos   |
| isalpha()        | Devuelve verdadero si todos los caracteres en la cadena están en el alfabeto |
| isascii()        | Devuelve verdadero si todos los caracteres en la cadena son caracteres ASCII |
| isdecimal()      | Devuelve verdadero si todos los caracteres en la cadena son decimales      |
| isdigit()        | Devuelve verdadero si todos los caracteres en la cadena son dígitos        |
| isidentifier()   | Devuelve verdadero si la cadena es un identificador                         |
| islower()        | Devuelve verdadero si todos los caracteres en la cadena son minúsculas     |
| isnumeric()      | Devuelve verdadero si todos los caracteres en la cadena son numéricos      |
| isprintable()    | Devuelve verdadero si todos los caracteres en la cadena son imprimibles    |
| isspace()        | Devuelve verdadero si todos los caracteres en la cadena son espacios en blanco |
| istitle()        | Devuelve verdadero si la cadena sigue las reglas de un título              |
| isupper()        | Devuelve verdadero si todos los caracteres en la cadena son mayúsculas     |
| join()           | Une los elementos de un iterable al final de la cadena                      |
| ljust()          | Devuelve una versión justificada a la izquierda de la cadena               |
| lower()          | Convierte una cadena a minúsculas                                          |
| lstrip()         | Devuelve una versión recortada a la izquierda de la cadena                 |
| maketrans()      | Devuelve una tabla de traducción para ser utilizada en traducciones        |
| partition()      | Devuelve una tupla donde la cadena se divide en tres partes                |
| replace()        | Devuelve una cadena donde un valor especificado es reemplazado por otro valor especificado |
| rfind()          | Busca un valor especificado en la cadena y devuelve la última posición donde se encontró |
| rindex()         | Busca un valor especificado en la cadena y devuelve la última posición donde se encontró |
| rjust()          | Devuelve una versión justificada a la derecha de la cadena                 |
| rpartition()     | Devuelve una tupla donde la cadena se divide en tres partes                |
| rsplit()         | Divide la cadena en el separador especificado y devuelve una lista         |
| rstrip()         | Devuelve una versión recortada a la derecha de la cadena                   |
| split()          | Divide la cadena en el separador especificado y devuelve una lista         |
| splitlines()     | Divide la cadena en saltos de línea y devuelve una lista                   |
| startswith()     | Devuelve verdadero si la cadena comienza con el valor especificado         |
| strip()          | Devuelve una versión recortada de la cadena                                |
| swapcase()       | Intercambia mayúsculas y minúsculas, las minúsculas se convierten en mayúsculas y viceversa |
| title()          | Convierte el primer carácter de cada palabra a mayúscula                   |
| translate()      | Devuelve una cadena traducida                                              |
| upper()          | Convierte una cadena a mayúsculas                                          |
| zfill()          | Rellena la cadena con un número especificado de valores 0 al principio     |


### Librería `string`

Aunque las funciones predeterminadas de Python para el manejo de _strings_ son bastante útiles, ciertas acciones resultan complejas, por lo que la librería `string` ofrece mejores herramientas. Esta debe cargarse con la palabra clave `import`

In [None]:
# Librería
import string

#### `capwords()`

Una vez importada, podemos, por ejemplo, colocar mayúsculas al inicio de de cada letra en una cadena con :

In [None]:
cadena = "esta es una cadena solo con minúsculas en las letras iniciales"
cadena_mayus = string.capwords(cadena)
print(cadena_mayus)

Esta Es Una Cadena Solo Con Minúsculas En Las Letras Iniciales


#### `Formatter()`

También podemos formatear las cadenas de caracteres, siento este un símil a la función predefinida de `format()`:

In [None]:
frase = "El banano es una fruta que se utiliza en {}."
formato = string.Formatter()

nueva_cadena = formato.format(frase, "batidos")
print(nueva_cadena)

El banano es una fruta que se utiliza en batidos.


In [None]:
# Ahorrando líneas de código
frase = "El banano es una fruta que se utiliza en {}."
formato = string.Formatter().format(frase, "batidos")
print(nueva_cadena)

El banano es una fruta que se utiliza en batidos.


#### `Template()`

Al igual que `Formatter()` nos permite modificar el contenido de los _strings_, en este caso, mediante el uso de identificadores con `$` y con una plantilla:

In [None]:
plantilla = string.Template("El banano es una fruta que se utiliza en $preparacion.")
nueva_cadena = plantilla.substitute(preparacion="batidos")
print(nueva_cadena)

El banano es una fruta que se utiliza en batidos.


#### Constantes de librería `string`

Aparte de las funciones incorporadas, las librerías tienen constantes que pueden ser utilizadas. Estas son algunas relevantes:

In [None]:
# Digitos del cero al nueve
string.digits

'0123456789'

In [None]:
# Letras ASCII en minúscula y mayúscula
string.ascii_letters

'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'

In [None]:
# Letras ASCII en minúscula
string.ascii_lowercase

'abcdefghijklmnopqrstuvwxyz'

In [None]:
# Signos de puntuación
string.punctuation

'!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~'

## 4️⃣ Ejercicios combinados — casos de uso

Aquí hay un par de ejercicios que combinan slicing, manipulación y validaciones:

- **Parser simple de línea CSV:** recibe una línea como `'cadena,123, True, valor'` y debe separar campos, normalizar el primer campo y verificar que el segundo sea entero.
- **Plantilla de reporte:** completar una plantilla con datos usando f-strings y asegurar que los valores estén sanitizados.

Completa los esqueletos y prueba con las entradas sugeridas.


In [None]:
# Esqueleto: parser simple CSV

def parser_linea_csv(linea):
    # TODO: split por ',' -> obtener campo1, campo2, campo3
    # validar que campo2 sea entero (usar try/except)
    # retornar (campo1_normalizado, int(campo2), campo3_bool)
    pass

# Prueba sugerida:
# print(parser_linea_csv('  productoX  , 42 , True '))


In [None]:
# Solución de referencia parser simple CSV

def parser_linea_csv(linea):
    campos = [c.strip() for c in linea.split(',')]
    campo1 = ' '.join([p.capitalize() for p in campos[0].split()]) if campos[0] else ''
    try:
        campo2 = int(campos[1])
    except Exception:
        raise ValueError('El segundo campo no es un entero válido')
    campo3 = campos[2].lower() in ('true', '1', 'si', 'yes')
    return (campo1, campo2, campo3)

print(parser_linea_csv('  productoX  , 42 , True '))


### ✅ Tips y recomendaciones

- **Evita concatenar con `+` en bucles**: usa `str.join()` o acumuladores para eficiencia.
- **Usa f-strings** para formateo legible y eficiente (`f"{var:.2f}"`).
- **Cuidado con encoding**: en archivos usa `encoding='utf-8'` al abrir.
- **Strings inmutables**: cada operación crea una nueva cadena; para operaciones masivas considera `io.StringIO`.
- **Validación**: siempre valida entradas de usuario (tipo, longitud, caracteres permitidos).

Datos curiosos:
- En Python, `s[::-1]` es una forma muy usada para invertir cadenas.
- Las f-strings fueron introducidas en Python 3.6 y son más rápidas que `format()` en muchos casos.


### Recursos recomendados

- Documentación oficial: https://docs.python.org/3/library/stdtypes.html#text-sequence-type-str
- Artículos útiles: Real Python (búsqueda: Python strings) y W3Schools (sección strings)


## Ejercicios

#### a) Diseña un programa que lea una cadena y un número entero $k$ y nos diga si alguna de sus palabras tiene una longitud de $k$ caracteres

In [None]:
"""
Aquí debajo escribe tu solución
"""



#### b) Diseña un programa que lea una cadena y muestre por pantalla todas sus subcadenas de longitud 4

In [None]:
"""
Aquí debajo escribe tu solución
"""

