# Cadenas
Las **cadenas de texto** (*strings*) en Python son un tipo de dato fundamental, especialmente útiles en áreas como la **limpieza de datos**, el **análisis de texto** (*text mining*) y en tareas de **Procesamiento de Lenguaje Natural (NLP)**.
Aprender a manipular cadenas correctamente es crucial para trabajar con:
- Datos no estructurados (como encuestas, tweets, correos, etc.).
- Nombres de columnas en DataFrames.
- Preprocesamiento de texto antes de aplicar modelos de IA.
- Extracción de información útil en textos.

## Objetivos de esta sección:
- Entender qué es una cadena (*string*) en Python.
- Aprender cómo crear, acceder y modificar cadenas.
- Conocer los métodos más comunes para limpiar y procesar texto.
- Aplicar estos conocimientos en ejemplos orientados a datos reales.

> 📝 *Nota: Estas habilidades son clave para tareas como la tokenización de texto, análisis de sentimientos, detección de patrones y más.*



## Conceptos Básicos de Cadenas

### 1. Creación de Cadenas
Las cadenas en Python se pueden crear usando comillas simples (`'`), comillas dobles (`"`) o triples (`'''` o `"""`).

```python
# Ejemplos de creación de cadenas
cadena1 = 'Hola Mundo'
cadena2 = "Python es genial"
cadena3 = '''Esta es una cadena
que ocupa varias líneas'''

### 2. Indexación
Las cadenas son secuencias ordenadas, lo que significa que puedes acceder a sus elementos usando índices. Los índices comienzan en 0.

In [1]:
cadena = 'Python'
print(cadena[0])  # P
print(cadena[-1]) # n (índice negativo para acceder desde el final)

P
n


### 3. Modificación de Cadenas
Las cadenas en Python son inmutables, lo que significa que no se pueden modificar directamente. Sin embargo, puedes crear nuevas cadenas basadas en las existentes

In [2]:
cadena = 'Python'
nueva_cadena = cadena.replace('P', 'J')
print(nueva_cadena)  # Jython

Jython


### 4. Concatenación
Puedes unir cadenas usando el operador + o multiplicarlas con *.

In [3]:
cadena1 = 'Hola'
cadena2 = 'Mundo'
resultado = cadena1 + ' ' + cadena2
print(resultado)  # Hola Mundo

repetida = 'Python ' * 3
print(repetida)  # Python Python Python

Hola Mundo
Python Python Python 


## Métodos Comunes de Cadenas

### 1. Métodos para Modificar el Texto
- **`lower()`**: Convierte todos los caracteres a minúsculas.
- **`upper()`**: Convierte todos los caracteres a mayúsculas.
- **`capitalize()`**: Convierte el primer carácter a mayúscula.
- **`title()`**: Convierte el primer carácter de cada palabra a mayúscula.
- **`strip()`**: Elimina los espacios en blanco al inicio y al final de la cadena.
- **`replace(old, new)`**: Reemplaza todas las ocurrencias de `old` por `new`.



In [4]:

cadena = "  Hola Mundo  "
print(cadena.lower())      # "  hola mundo  "
print(cadena.upper())      # "  HOLA MUNDO  "
print(cadena.strip())      # "Hola Mundo"
print(cadena.replace("Hola", "Adiós"))  # "  Adiós Mundo  "

  hola mundo  
  HOLA MUNDO  
Hola Mundo
  Adiós Mundo  


### 2. Métodos para Buscar y Validar
- **`find(sub)`**: Devuelve el índice de la primera aparición de sub. Retorna -1 si no se encuentra.
- **`index(sub)`**: Similar a find(), pero lanza un error si no se encuentra.
- **`startswith(prefix)`**: Devuelve True si la cadena comienza con prefix.
- **`endswith(suffix)`**: Devuelve True si la cadena termina con suffix.
- **`isalpha()`**: Devuelve True si todos los caracteres son letras.
- **`isdigit()`**: Devuelve True si todos los caracteres son dígitos.
- **`isalnum()`**: Devuelve True si todos los caracteres son alfanuméricos.



In [5]:
cadena = "Python3"
print(cadena.find("3"))       # 6
print(cadena.startswith("Py"))  # True
print(cadena.isalpha())       # False
print(cadena.isdigit())       # False

6
True
False
False


### 3. Métodos para Dividir y Unir
- *split(sep)*: Divide la cadena en una lista usando sep como separador.
- *join(iterable)*: Une los elementos de un iterable en una cadena, usando la cadena actual como separador.

In [9]:
cadena = "Hola,Mundo,Python"
lista = cadena.split(",")  # ["Hola", "Mundo", "Python"]
print(lista)

nueva_cadena = " ".join(lista)  # "Hola Mundo Python"
print(nueva_cadena)
cadena = "banana"
print(cadena.count("a"))  # 3
print(len(cadena))        # 6

['Hola', 'Mundo', 'Python']
Hola Mundo Python
3
6


### Otros metodos útiles  
- **count(sub)**: Cuenta cuántas veces aparece sub en la cadena.
- **len()**: Devuelve la longitud de la cadena (no es un método, pero es muy usado).

In [10]:
cadena = "banana"
print(cadena.count("a"))  # 3
print(len(cadena))        # 6

3
6
