In [1]:
import re # Modulo de expresiones regualres

## **Ejercicios prácticos**

1️⃣ Validar correos electrónicos corporativos

- Solo aceptar correos que terminen en @empresa.com.

In [7]:
correos = ["ana@empresa.com", "pepe@gmail.com", "ventas@empresa.com.pe"]
patron = r"^[\w\.-]+@empresa\.com$"

print([c for c in correos if re.match(patron, c)])

['ana@empresa.com']


2️⃣ Extraer números de factura en un texto
- En un correo aparecen frases como "Factura #2024-009" y queremos el número.

In [18]:
texto = "Adjunto Factura ###2024-009 y la #2025-010"
regex = r"#(\d{4}-\d{3})"

re.findall(regex, texto)

['2024-009', '2025-010']

3️⃣ Reemplazar múltiple espacios por uno solo
- Normalizar cadenas con espacios “rebeldes”.

In [17]:
s = "Datos    desordenados     aquí"
regex = r"\s+"

re.sub(regex," ", s)

'Datos desordenados aquí'

4️⃣ Validar números de teléfono peruanos
- Aceptar formatos tipo +51 987654321 o 987654321.

In [33]:
telefonos = ["+51 987654321", "987654321", "51-987654321"]
regex = r'^(?:\+51\s?)(?:\d{9})$'

print([t for t in telefonos if re.match(regex, t)])

['+51 987654321']


5️⃣ Capturar URLs de un texto
- Extraer enlaces HTTP/HTTPS.

In [36]:
texto = "Mira https://openai.com o http://example.org"
regex = r"https?://[^\s]+"

print(re.findall(regex, texto))

['https://openai.com', 'http://example.org']


6️⃣ Comprobar contraseña segura
- Al menos 8 caracteres, una mayúscula, una minúscula, un dígito.

In [None]:
regex = r"^(?=.*[a-z])(?=.*[A-Z])(?=.*\d).{8,}$"

contraseñas = ["Hola1234", "todoenminus", "MAYUSCULA1"]
print([c for c in contraseñas if re.match(regex, c)])

['Hola1234']


7️⃣ Dividir log de Apache por IP y fecha
- Extraer IP y fecha de líneas de log.

In [42]:
log = '192.168.1.10 - - [20/Sep/2025:12:00:00 +0000] "GET /index.html" 200 1234'
regex = r'^(\d+\.\d+\.\d+\.\d+).*\[(.*?)\]'

print(re.findall(regex, log))
# ➜ [('192.168.1.10', '20/Sep/2025:12:00:00 +0000')]

[('192.168.1.10', '20/Sep/2025:12:00:00 +0000')]


8️⃣ Extraer menciones de Twitter/Instagram
- Encontrar usuarios tipo @usuario_99.

In [49]:
texto = "Gracias a @Yoshio y @data_science por el soporte!"
regex = r'@\w{1,15}'

print(re.findall(regex, texto))
# ➜ ['@Yoshio', '@data_science']

['@Yoshio', '@data_science']


9️⃣ Validar horas 24h (HH:MM)
- Aceptar 00:00 a 23:59.

In [55]:
horas = ["23:59", "7:30", "25:00", "00:00"]
regex = r"^(?:[01]\d|2[0-3]):[0-5]\d$"

print([h for h in horas if re.match(regex, h)])
# ➜ ['23:59', '00:00']

['23:59', '00:00']


🔟 Detectar enlaces Markdown
- De [texto](url) obtener texto y URL.

In [None]:
md = "Visita [OpenAI](https://openai.com) y [Docs](https://docs.python.org)"
regex = r"\[([^\]]+)\]\(([^)]+)\)"

print(re.findall(regex, md))

[('OpenAI', 'https://openai.com'), ('Docs', 'https://docs.python.org')]


: 

Dividir un CSV simple en campos

- Separar campos incluso si hay comillas.

In [None]:
linea = '123,"Juan, Pérez",5000'
patron = r'"[^"]*"|[^,]+'

print([c.strip('"') for c in re.findall(patron, linea)])
# ➜ ['123', 'Juan, Pérez', '5000']