# üß© M√≥dulo 1 ‚Äì Expresiones Regulares en Python

En este m√≥dulo aprender√°s a utilizar **expresiones regulares** (Regex) con el m√≥dulo est√°ndar `re`.

Las expresiones regulares permiten **buscar, validar o reemplazar patrones en cadenas de texto**.

**Duraci√≥n estimada:** 2 horas.

---
## üéØ Objetivos
- Comprender la sintaxis b√°sica de las expresiones regulares.
- Buscar patrones en texto con `re.search`, `re.match`, `re.findall`.
- Realizar validaciones y reemplazos con `re.sub`.
- Aplicar regex a problemas reales (validaci√≥n de correos, matr√≠culas, etc.).

---
## üìò 1. Introducci√≥n al m√≥dulo `re`

El m√≥dulo `re` de Python proporciona funciones para trabajar con expresiones regulares:

- `re.match(patron, texto)` ‚Üí comprueba solo **al inicio** del texto.
- `re.search(patron, texto)` ‚Üí busca **en cualquier parte**.
- `re.findall(patron, texto)` ‚Üí devuelve **todas las coincidencias** en una lista.
- `re.sub(patron, reemplazo, texto)` ‚Üí reemplaza las coincidencias.

Vamos a probarlo:

In [1]:
import re

texto = "Mi n√∫mero es 654-321 y mi c√≥digo postal es 46011."
patron = r"\d+"  # uno o m√°s d√≠gitos
coincidencias = re.findall(patron, texto)
coincidencias

['654', '321', '46011']

‚úÖ **Resultado esperado:** `['654', '321', '46011']`

---
## üß† 2. Principales metacaracteres

| Patr√≥n | Significado |
|:------:|:------------|
| `\d` | D√≠gito (0‚Äì9) |
| `\w` | Car√°cter alfanum√©rico |
| `\s` | Espacio en blanco |
| `.` | Cualquier car√°cter (excepto salto de l√≠nea) |
| `^` | Inicio de la cadena |
| `$` | Fin de la cadena |
| `+` | Una o m√°s repeticiones |
| `*` | Cero o m√°s repeticiones |
| `?` | Cero o una repetici√≥n |
| `{n,m}` | Entre *n* y *m* repeticiones |
| `[abc]` | Cualquier car√°cter dentro de los corchetes |
| `[^abc]` | Cualquier car√°cter **excepto** los indicados |

Podemos experimentar con ellos:

In [None]:
texto = "abc 123 AAA zzz"
print(re.findall(r"[A-Z]+", texto))     # may√∫sculas consecutivas
print(re.findall(r"[^a-z\s]+", texto)) # no min√∫sculas ni espacios
print(re.findall(r"\d{2,3}", texto))   # 2 o 3 d√≠gitos consecutivos

---
## üîç 3. Funciones m√°s comunes

### `re.search`
Busca la **primera** coincidencia y devuelve un objeto `Match`:

In [None]:
m = re.search(r"\d+", "El valor es 42 unidades.")
print(m)
print(m.group(0))  # texto encontrado
print(m.start(), m.end())  # posiciones

### `re.sub`
Permite reemplazar patrones de texto:

In [None]:
texto = "Mi DNI es 12345678A"
re.sub(r"\d", "*", texto)

---
## üí° 4. Ejercicio guiado ‚Äì Extraer tel√©fonos

Dado el texto siguiente, extrae todos los **n√∫meros de tel√©fono** en formato `600-123-456`.

üí° *Pista:* usa el patr√≥n `\d{3}-\d{3}-\d{3}`

In [None]:
texto = "Contactos: Ana 600-123-456, Juan 622-999-888, Oficina 963-555-777"

# TODO: escribe aqu√≠ tu c√≥digo
# patron = ...
# re.findall(patron, texto)

# Esperado: ['600-123-456', '622-999-888', '963-555-777']

---
## ‚úÖ 5. Validaci√≥n de patrones (match vs search)

Usa `re.match()` para comprobar si **toda** la cadena cumple un patr√≥n, por ejemplo para validar un correo electr√≥nico:

In [2]:
correo = "david.pestana@example.com"
patron = r"^[\w\.-]+@[\w\.-]+\.\w+$"
bool(re.match(patron, correo))

True

---
## üß© 6. Reto final ‚Äì Validar matr√≠culas espa√±olas

Valida cadenas del tipo `1234-ABC`:
- 4 n√∫meros seguidos
- guion
- 3 letras may√∫sculas

Muestra ‚úÖ o ‚ùå seg√∫n el resultado.

In [None]:
matriculas = ["1234-ABC", "123-AB", "4321-XYZ", "12A4-ABC"]

patron = r"^\d{4}-[A-Z]{3}$"

for m in matriculas:
    print(m, "‚úÖ" if re.match(patron, m) else "‚ùå")

---
## üß† 7. Extra: visualizaci√≥n de coincidencias (opcional)

Podemos resaltar coincidencias en HTML para visualizar mejor los patrones (√∫til en clases interactivas):

In [None]:
from IPython.display import display, HTML

texto = "Correos: ana@gmail.com, juan@empresa.es"
patron = r"\b[\w\.-]+@[\w\.-]+\.\w+\b"

resaltado = re.sub(patron, lambda m: f"<b style='color:red'>{m.group(0)}</b>", texto)
display(HTML(resaltado))

---
## üìö 8. Resumen del m√≥dulo

- `re.findall()` ‚Üí devuelve todas las coincidencias.
- `re.search()` ‚Üí busca la primera.
- `re.match()` ‚Üí comprueba desde el inicio.
- `re.sub()` ‚Üí reemplaza coincidencias.
- Usa **raw strings** (`r"texto"`) para evitar escapes innecesarios.

üëâ Practica con tus propios textos y prueba a combinar varios metacaracteres.

---
**Fin del m√≥dulo 1 ‚Äì Expresiones Regulares.**