# Soluciones Avanzadas: Expresiones Regulares

In [1]:
import re

## Nivel 1: El Limpiador de Fechas
Usamos Grupos `()` para capturar (Dia, Mes, Año) y reorganizarlos.

In [None]:
texto_fechas = "Las facturas vensen el 31/01/2023, el 05-02-2023 y el 15/03/2023."

def normalizar_fechas(texto):
    # Patron: (Dos digitos) separador (Dos digitos) separador (Cuatro digitos)
    # Usamos [/-] para que coincida con / o -
    patron = r"(\d{2})[/-](\d{2})[/-](\d{4})"
    
    # Reemplazo: Grupo 3 (Año) - Grupo 2 (Mes) - Grupo 1 (Dia)
    return re.sub(patron, r"\3-\2-\1", texto)

print("Solución 1:", normalizar_fechas(texto_fechas))

## Nivel 2: El Extractor de Logs
Aquí el truco es hacer el grupo de usuario OPCIONAL usando `?`.

In [None]:
logs = [
    "192.168.1.1 [admin] : Inició sesión correctamente",
    "10.0.0.1 : Error de conexión",
    "172.16.0.5 [invitado] : Timeout"
]

patron_log = r""" 
    (?P<ip>\d+(?:\.\d+){3})      # IP: Digitos punto Digitos... (el grupo interno es non-capturing)
    \s+
    (?:\[(?P<user>.*?)\]\s)?     # Grupo OPCIONAL (gracias al ? final). 
                                 # Intenta buscar [algo] pero si no esta, no pasa nada.
    :
    \s
    (?P<msg>.*)                  # El resto es el mensaje
"""

print("\nSolución 2:")
for l in logs:
   mach = re.search(patron_log, l, re.VERBOSE)
   if mach: 
       # Si user es None, ponemos 'Anonimo'
       data = mach.groupdict()
       if not data['user']:
           data['user'] = 'Anonimo'
       print(data)

## Nivel 3: El Validador de Passwords
Encadenamos Lookaheads al principio. Cada `(?=...)` comprueba una condición desde la posición 0.

In [None]:
passwords = ["Abc12345", "password", "Abc 12345", "A1bcd", "MuySegura99"]

patron_password = r""" 
    ^                       # Inicio de string
    (?=.*[A-Z])             # Lookahead: Debe haber al menos una mayuscula en algun lugar
    (?=.*\d)                # Lookahead: Debe haber al menos un digito
    (?!.*\s)                # Negative Lookahead: NO debe haber espacios
    .{8,}                   # Finalmente, debe tener 8 o mas caracteres cualesquiera
    $                       # Fin de string
"""

print("\nSolución 3:")
for p in passwords:
    es_valida = bool(re.match(patron_password, p, re.VERBOSE))
    print(f"{p}: {es_valida}")

## Nivel 4: Data Obfuscation
Usamos Lookbehind Negativo `(?<!...)`. "Si lo de atrás NO es 'Top ', entonces coincide".

In [None]:
textos = ["Este es un documento Top Secret del gobierno", "My Secret diary is here"]

# (?<!Top )Secret :: Coincide con 'Secret' solo si NO tiene 'Top ' detras
patron_secreto = r"(?<!Top )Secret"

print("\nSolución 4:")
for t in textos:
    print(re.sub(patron_secreto, "XXXX", t))