# 🎯 Ejercicios Prácticos de Expresiones Regulares en Python

**Instrucciones:**
- Completa cada ejercicio escribiendo el patrón regex correspondiente
- Ejecuta cada celda para ver si tu solución es correcta
- Usa la cheat sheet como referencia
- No te preocupes si no aciertas a la primera, ¡la práctica hace al maestro!

---

**Alumno**
- Juan Daniel Kao Pech

---

In [None]:
# Importar el módulo necesario
import re

---
## 📘 NIVEL BÁSICO - Caracteres y cuantificadores
---

### Ejercicio 1: Encontrar todos los números
Escribe un patrón que encuentre todos los números en el texto

In [None]:
texto1 = "Tengo 3 manzanas, 15 naranjas y 7 plátanos"
patron1 = r"\d+"  

resultado1 = re.findall(patron1, texto1)
print(f"Resultado: {resultado1}")
print(f"Esperado: ['3', '15', '7']")

Resultado: ['3', '15', '7']
Esperado: ['3', '15', '7']


### Ejercicio 2: Encontrar palabras que empiecen con 'p'
Escribe un patrón que encuentre todas las palabras que empiecen con 'p'

In [None]:
texto2 = "El perro y el pato juegan en el parque con la pelota"
patron2 = r"p+\w*"

resultado2 = re.findall(patron2, texto2)
print(f"Resultado: {resultado2}")
print(f"Esperado: ['perro', 'pato', 'parque', 'pelota']")

Resultado: ['perro', 'pato', 'parque', 'pelota']
Esperado: ['perro', 'pato', 'parque', 'pelota']


### Ejercicio 3: Encontrar palabras de exactamente 5 letras
Escribe un patrón que encuentre palabras de exactamente 5 letras

In [None]:
texto3 = "Las casas rojas están cerca de la playa bonita"
patron3 = r"\b\w{5}\b"

resultado3 = re.findall(patron3, texto3, re.IGNORECASE)
print(f"Resultado: {resultado3}")
print(f"Esperado: ['casas', 'rojas', 'están', 'cerca', 'playa']")

Resultado: ['casas', 'rojas', 'están', 'cerca', 'playa']
Esperado: ['casas', 'rojas', 'están', 'cerca', 'playa']


### Ejercicio 4: Encontrar vocales
Escribe un patrón que encuentre todas las vocales (a, e, i, o, u)

In [None]:
texto4 = "Hola mundo"
patron4 = r"[aeiouAEIOU]"

resultado4 = re.findall(patron4, texto4, re.IGNORECASE)
print(f"Resultado: {resultado4}")
print(f"Esperado: ['o', 'a', 'u', 'o']")

Resultado: ['o', 'a', 'u', 'o']
Esperado: ['o', 'a', 'u', 'o']


### Ejercicio 5: Encontrar palabras que terminen en 'ción'
Escribe un patrón que encuentre palabras terminadas en 'ción'

In [None]:
texto5 = "La educación y la comunicación son importantes para la nación"
patron5 = r"\w+ción"

resultado5 = re.findall(patron5, texto5)
print(f"Resultado: {resultado5}")
print(f"Esperado: ['educación', 'comunicación', 'nación']")

Resultado: ['educación', 'comunicación', 'nación']
Esperado: ['educación', 'comunicación', 'nación']


---
## 📗 NIVEL INTERMEDIO - Grupos y validación
---

### Ejercicio 6: Validar formato de fecha DD/MM/YYYY
Escribe un patrón que valide fechas en formato DD/MM/YYYY

In [None]:
fechas6 = ["25/12/2023", "05/08/1990", "32/13/2020", "15-07-2021"]
patron6 = r"(0[1-9]|[12][0-9]|3[01])/(0[1-9]|1[0-2])/\d{4}"

print("Validación de fechas:")
for fecha in fechas6:
    resultado = "✓ Válida" if re.fullmatch(patron6, fecha) else "✗ Inválida"
    print(f"  {fecha}: {resultado}")
print("\nEsperado: primeras dos válidas, últimas dos inválidas")

Validación de fechas:
  25/12/2023: ✗ Inválida
  05/08/1990: ✗ Inválida
  32/13/2020: ✗ Inválida
  15-07-2021: ✗ Inválida

Esperado: primeras dos válidas, últimas dos inválidas


### Ejercicio 7: Extraer código de área y número de teléfono
Extrae el código de área y el número por separado del formato: (XXX) XXX-XXXX

In [None]:
texto7 = "Mi teléfono es (555) 123-4567 y el de mi hermano es (999) 888-7777"
patron7 = r""  # COMPLETA AQUÍ (usa grupos de captura)

resultado7 = re.findall(patron7, texto7)
print(f"Resultado: {resultado7}")
print(f"Esperado: [('555', '123', '4567'), ('999', '888', '7777')]")

### Ejercicio 8: Validar dirección de email
Escribe un patrón que valide emails básicos (usuario@dominio.ext)

In [None]:
emails8 = ["usuario@ejemplo.com", "test.user@mail.co", "invalid@", "@invalid.com", "no-arroba.com"]
patron8 = r""  # COMPLETA AQUÍ

print("Validación de emails:")
for email in emails8:
    resultado = "✓ Válido" if re.fullmatch(patron8, email) else "✗ Inválido"
    print(f"  {email}: {resultado}")
print("\nEsperado: primeros dos válidos, últimos tres inválidos")

### Ejercicio 9: Extraer hashtags de un tweet
Encuentra todos los hashtags (palabras que empiezan con #)

In [None]:
texto9 = "Me encanta #Python y #RegEx! También uso #JavaScript #coding"
patron9 = r""  # COMPLETA AQUÍ

resultado9 = re.findall(patron9, texto9)
print(f"Resultado: {resultado9}")
print(f"Esperado: ['#Python', '#RegEx', '#JavaScript', '#coding']")

### Ejercicio 10: Extraer nombres y apellidos
Extrae nombres (Primera letra mayúscula) y apellidos por separado

In [None]:
texto10 = "Juan Pérez, María García y Carlos López están aquí"
patron10 = r""  # COMPLETA AQUÍ (usa grupos de captura)

resultado10 = re.findall(patron10, texto10)
print(f"Resultado: {resultado10}")
print(f"Esperado: [('Juan', 'Pérez'), ('María', 'García'), ('Carlos', 'López')]")

---
## 📙 NIVEL AVANZADO - Lookahead, Lookbehind y sustituciones
---

### Ejercicio 11: Extraer precios (números antes de €)
Usa lookahead para extraer solo los números que tienen € después

In [None]:
texto11 = "Manzanas: 2€, Naranjas: 3€, tengo 50 en el banco y Plátanos: 1€"
patron11 = r""  # COMPLETA AQUÍ (usa lookahead)

resultado11 = re.findall(patron11, texto11)
print(f"Resultado: {resultado11}")
print(f"Esperado: ['2', '3', '1']")

### Ejercicio 12: Extraer palabras que NO están seguidas de números
Usa negative lookahead para encontrar palabras no seguidas de dígitos

In [None]:
texto12 = "casa123 perro gato456 árbol montaña999 río"
patron12 = r""  # COMPLETA AQUÍ (usa negative lookahead)

resultado12 = re.findall(patron12, texto12, re.IGNORECASE)
print(f"Resultado: {resultado12}")
print(f"Esperado: ['perro', 'árbol', 'río']")

### Ejercicio 13: Censurar palabras malsonantes
Reemplaza las palabras 'tonto' y 'malo' con asteriscos

In [None]:
texto13 = "Eres muy tonto y malo, no seas tonto"
patron13 = r""  # COMPLETA AQUÍ

resultado13 = re.sub(patron13, "***", texto13)
print(f"Resultado: {resultado13}")
print(f"Esperado: 'Eres muy *** y ***, no seas ***'")

### Ejercicio 14: Formatear números de tarjeta de crédito
Convierte 1234567890123456 a 1234-5678-9012-3456

In [None]:
texto14 = "1234567890123456"
patron14 = r""  # COMPLETA AQUÍ (usa grupos)
replacement14 = r""  # COMPLETA el replacement (ej: r"\1-\2-\3-\4")

resultado14 = re.sub(patron14, replacement14, texto14)
print(f"Resultado: {resultado14}")
print(f"Esperado: '1234-5678-9012-3456'")

### Ejercicio 15: Validar contraseña segura
Mínimo 8 caracteres, al menos 1 mayúscula, 1 minúscula, 1 número y 1 símbolo

In [None]:
passwords15 = ["Pass123!", "weakpass", "STRONG123!", "Secure@Pass1", "short1!"]
patron15 = r""  # COMPLETA AQUÍ (usa lookahead múltiples)

print("Validación de contraseñas:")
for pwd in passwords15:
    resultado = "✓ Segura" if re.fullmatch(patron15, pwd) else "✗ Insegura"
    print(f"  {pwd}: {resultado}")
print("\nEsperado: primero y cuarto seguros, resto inseguros")

---
## 📕 NIVEL EXPERTO - Casos reales complejos
---

### Ejercicio 16: Extraer URLs de un texto
Encuentra todas las URLs (http:// o https://)

In [None]:
texto16 = """
Visita https://www.ejemplo.com y también http://test.org/pagina?id=123
No olvides https://github.com/usuario/repo#readme
"""
patron16 = r""  # COMPLETA AQUÍ

resultado16 = re.findall(patron16, texto16)
print("URLs encontradas:")
for url in resultado16:
    print(f"  {url}")
print("\nEsperado: 3 URLs")

### Ejercicio 17: Validar IPv4
Valida direcciones IP (4 números entre 0-255 separados por puntos)

In [None]:
ips17 = ["192.168.1.1", "255.255.255.0", "999.999.999.999", "192.168.1", "10.0.0.1"]
patron17 = r""  # COMPLETA AQUÍ

print("Validación de IPs:")
for ip in ips17:
    if re.fullmatch(patron17, ip):
        octetos = ip.split('.')
        if all(0 <= int(octeto) <= 255 for octeto in octetos):
            resultado = "✓ Válida"
        else:
            resultado = "✗ Inválida"
    else:
        resultado = "✗ Inválida"
    print(f"  {ip}: {resultado}")
print("\nEsperado: primera, segunda y quinta válidas")

### Ejercicio 18: Extraer menciones de Twitter (@usuario)
Encuentra todas las menciones que empiezan con @

In [None]:
texto18 = "Hola @juan_perez y @maria123, ¿vieron lo que dijo @admin?"
patron18 = r""  # COMPLETA AQUÍ

resultado18 = re.findall(patron18, texto18)
print(f"Resultado: {resultado18}")
print(f"Esperado: ['@juan_perez', '@maria123', '@admin']")

### Ejercicio 19: Convertir formato de fecha
Convierte DD/MM/YYYY a YYYY-MM-DD

In [None]:
texto19 = "La fecha es 25/12/2023 y otra es 01/01/2024"
patron19 = r""  # COMPLETA AQUÍ (usa grupos)
replacement19 = r""  # COMPLETA el replacement

resultado19 = re.sub(patron19, replacement19, texto19)
print(f"Resultado: {resultado19}")
print(f"Esperado: 'La fecha es 2023-12-25 y otra es 2024-01-01'")

### Ejercicio 20: Limpiar HTML
Elimina todas las etiquetas HTML de un texto

In [None]:
texto20 = "<p>Este es un <strong>texto</strong> con <a href='#'>etiquetas</a> HTML</p>"
patron20 = r""  # COMPLETA AQUÍ

resultado20 = re.sub(patron20, "", texto20)
print(f"Resultado: {resultado20}")
print(f"Esperado: 'Este es un texto con etiquetas HTML'")

---
## 🏆 DESAFÍOS FINALES
---

### Desafío 1: Parser de logs
Extrae timestamp, nivel y mensaje de líneas de log

In [None]:
log_lines = [
    "[2023-12-25 10:30:45] ERROR: Connection failed",
    "[2023-12-25 10:31:12] INFO: Server started",
    "[2023-12-25 10:31:50] WARNING: Low memory"
]
patron_desafio1 = r""  # COMPLETA AQUÍ

print("Parser de logs:")
for line in log_lines:
    match = re.search(patron_desafio1, line)
    if match:
        print(f"  Timestamp: {match.group(1)}, Nivel: {match.group(2)}, Mensaje: {match.group(3)}")

### Desafío 2: Validar número de tarjeta de crédito con espacios o guiones
Acepta formatos: 1234567890123456, 1234 5678 9012 3456, 1234-5678-9012-3456

In [None]:
tarjetas = ["1234567890123456", "1234 5678 9012 3456", "1234-5678-9012-3456", "1234567890", "abcd-efgh-ijkl-mnop"]
patron_desafio2 = r""  # COMPLETA AQUÍ

print("Validación de tarjetas:")
for tarjeta in tarjetas:
    resultado = "✓ Válida" if re.fullmatch(patron_desafio2, tarjeta) else "✗ Inválida"
    print(f"  {tarjeta}: {resultado}")

### Desafío 3: Extraer información de un CSV embebido
Extrae nombre, apellido, edad y ciudad de cada persona

In [None]:
csv_texto = "Juan,Pérez,30,Madrid;María,García,25,Barcelona;Carlos,López,35,Valencia"
patron_desafio3 = r""  # COMPLETA AQUÍ

resultado_desafio3 = re.findall(patron_desafio3, csv_texto)
print("Personas extraídas:")
for persona in resultado_desafio3:
    print(f"  Nombre: {persona[0]}, Apellido: {persona[1]}, Edad: {persona[2]}, Ciudad: {persona[3]}")

---
## ✅ ¡Ejercicios completados!


### Recursos adicionales:
- 📚 [Documentación oficial de Python - módulo re](https://docs.python.org/3/library/re.html)
- 🔧 [regex101.com](https://regex101.com) - Herramienta online para probar patrones
- 📖 [Cheat sheet de expresiones regulares](https://www.rexegg.com/regex-quickstart.html)

**¡Sigue practicando! 💪**