# Pruebas de regex en python
Este archivo sirve para poner en practica los comandos de regex explicados en `Regex.md`.

In [1]:
import re

#### Sintaxis: Literal
Verificamos como funciona el paquete `re` y sus funciones `findall`, `match`, `search` y `stub` con un ejemplo de regex con sintaxis literal.

In [None]:
texto = "El gato Michincho esta durmiendo en la cama de mi padre"

resultado1 = re.findall(r"gato", texto)
resultado2 = re.sub(r"gato", "perro", texto)
resultado3 = re.search(r"gato", texto)
resultado4 = re.match(r"gato", texto)

print("Resultado de findall:", resultado1)
print("Resultado de sub:", resultado2)
print("Resultado de search:", resultado3)
print("Resultado de match:", resultado4)

Resultado de findall: ['gato']
Resultado de sub: El perro Michincho esta durmiendo en la cama de mi padre
Resultado de search: <re.Match object; span=(3, 7), match='gato'>
Resultado de match: None


### Sintaxis: Metacaracteres

Estos nos permiten crear patrones más complejos y realizar búsquedas más flexibles.

#### Punto `.`

In [7]:
texto = "Abemous papab, abc, adc, a@c"
resultado1 = re.findall(r"a.c", texto)
print ("Resultado de findall con punto:", resultado1)

texto = "Abemous papab, abcc, adec, a@4c"
resultado2 = re.findall(r"a..c", texto)
print ("Resultado de findall con punto:", resultado2)

Resultado de findall con punto: ['abc', 'adc', 'a@c']
Resultado de findall con punto: ['abcc', 'adec', 'a@4c']


#### El caret `^`

In [None]:
cadenas = ["gatiñoo michincho", "perriñoo gatiñoo", "a1s8da6da6"]

# Imprime solamente el texto que tiene el inicio como gatiñño
for cadena in cadenas:
    resultado = re.findall(r"^gatiñoo", cadena)
    if(resultado != []):
        print(f"Resultado de findall en '{cadena}':", resultado)

Resultado de findall en 'gatiñoo michincho': ['gatiñoo']


#### El dolar `$`

In [12]:
cadenas = ["gatiñoo perriñoo", "perriñoo gatiñoo", "a1s8da6da6"]

# Imprime solamente el texto que tiene el final como perriñoo
for cadena in cadenas:
    resultado = re.findall(r"perriñoo$", cadena)
    if(resultado != []):
        print(f"Resultado de findall en '{cadena}':", resultado)

Resultado de findall en 'gatiñoo perriñoo': ['perriñoo']


#### Corchetes `[]`

In [14]:
texto = "gato, Gato, GATo, pato, Pato, cato"
resultado = re.findall(r"[gpGP]ato", texto)
print(resultado) 

['gato', 'Gato', 'pato', 'Pato']


#### Rango `-`

In [19]:
texto = "abc, 8BC, 123, D18"
resultado = re.findall(r"[A-Z][0-9]", texto)
print(resultado)


['D1']


#### Alternancia `|`

In [33]:
texto1 = "El gato y el pato están jugando."
texto2 = "El gato y el pez están jugando."
texto3 = "El perro y el pez están jugando."
resultado1 = re.findall(r"gato|perro|pato", texto1)
resultado2 = re.findall(r"gato|perro", texto2)
resultado3 = re.findall(r"gato|perro", texto3)
print(resultado1)
print(resultado2)
print(resultado3)    


['gato', 'pato']
['gato']
['perro']


### Sintaxis: Cuantificadores

Los cuantificadores en Regex nos permiten especificar cuántas veces debe ocurrir un patrón determinado.

#### Asterisco `*`

In [29]:
texto = "haber, anoabejitaaa, aaaaaaaaab, bestia"
resultado = re.findall(r"a*b", texto)
print(resultado)


['ab', 'ab', 'aaaaaaaaab', 'b']


#### Mas `+`

In [30]:
texto = "haber, anoabejitaaa, aaaaaaaaab, bestia, b"
resultado = re.findall(r"a+b", texto)
print(resultado)

['ab', 'ab', 'aaaaaaaaab']


#### Corchetes `{}`

In [45]:
texto = "ab, aab, aaab, aaaab"
resultado1 = re.findall(r"a{3}b", texto)
resultado2 = re.findall(r"a{2,4}b", texto)
print(resultado1)
print(resultado2)


['aaab', 'aaab']
['aab', 'aaab', 'aaaab']


### Lookaheads y Lookbehinds

#### Lookahead positivo `(?=pattern)`

In [None]:
texto = "gato perro, gato tigre, gato perro"
resultado = re.findall(r"gato(?= perro)", texto)
print(resultado)

['gato', 'gato']


#### Lookahead negativo `(?!pattern)`

In [59]:
texto = "gato perro, gato tigre, gato perro"
resultado = re.findall(r"gato(?! perro)", texto)
print(resultado)

['gato']


#### Lookbehind positivo `(?<=pattern)`

In [60]:
texto = "gato perro, tigre perro, gato león"
resultado = re.findall(r"(?<=gato )perro", texto)
print(resultado)  # ['perro']


['perro']


#### Lookbehind `(?<!pattern)`

In [62]:
texto = "gato perro, tigre perro, león perro"
resultado = re.findall(r"(?<!gato )perro", texto)
print(resultado)  # ['perro']


['perro', 'perro']


## Ejercicios

In [None]:
# Ejercicio 1:Validar la direccion de correo que sigan la siguiente 
# estructura "usuario@dominio.com". Donde **@** y **.com** deben estar 
# obligatoriamente.

correo = input("Escriba su correo electronico (usuario@dominio.com): ")

regex = r"^[a-zA-Z0-9_.+-/*]+@[A-Za-z0-9]+\.com$"

resultado = re.findall(regex, correo)

if resultado != []:
    print("El correo "+resultado[0]+" es valido")
else:
    print("El correo no es valido")

El correo no es valido


In [56]:
# Ejercicio 2: Escribe una expresión regular que valide números de 
# teléfono en formato (XXX) XXX-XXXX donde X es un dígito.

telefono = input("Escriba su telefono (XXX) XXX-XXXX: ")

regex = r"^\(\d{3}\) \d{3}-\d{4}$"

resultado = re.findall(regex, telefono)

if resultado != []:
    print("El telefono "+resultado[0]+" es valido")
else:
    print("El telefono no es valido")

El telefono (123) 123-4567 es valido


In [64]:
# 3. Validar una contraseña, considerando que cumpla lo siguiente
#       Debe tener al menos una letra mayúscula.
#       Debe tener al menos un número.
#       Debe tener al menos un carácter especial (por ejemplo, !, @, #, $).
#       Debe contener minimo 10 caracteres.

contraseña = input("Escriba su contraseña: ")

regex = r"^(?=.*[A-Z])(?=.*[a-z])(?=.*\d)(?=.*[@$!%*?&])[A-Za-z\d@$!%*?&]{10,}$"

resultado = re.findall(regex, contraseña)

if resultado != []:
    print("La contraseña "+resultado[0]+" es valida")
else:
    print("La contraseña no es valida")



La contraseña no es valida


In [103]:
# Ejercicio 4: Crear una expresión regular que extraiga precios 
# con sus símbolos de moneda, usando lookaheads y lookbehinds.

texto = """
Los precios son: $150.99, €200, 50.50 USD, 75€, ¥10000, 
solo texto, 123, $invalid.99, 99.99
"""

regex = r"(?:[$€¥€])\d+(?:\.\d{2})|(?:[$€¥€])\d+|\d+(?:\.\d{2})(?: USD)|\d+(?:[$€¥€])"
resultado = re.findall(regex, texto)
print(resultado)  # ['150.99', '200', '50.50', '75', '10000']

['$150.99', '€200', '50.50 USD', '75€', '¥10000']


In [9]:
texto="""
La casa es grande. Mi casa tiene jardín. Casamiento es diferente de casa.
"""
regex = r"(?i)(casa|CASA)"
resultado = re.findall(regex, texto)
print(resultado) 

['casa', 'casa', 'Casa', 'casa']


In [10]:
texto="""
Tengo 3 gatos, 2 perros y 15 peces.
"""
regex = r"[0-9]"
resultado = re.findall(regex, texto)
print(resultado) 

['3', '2', '1', '5']


In [11]:
texto="""
Aprender Expresiones regulares Es muy útil.
"""
regex = r"[aeiouAEIOU]"
resultado = re.findall(regex, texto)
print(resultado) 

['A', 'e', 'e', 'E', 'e', 'i', 'o', 'e', 'e', 'u', 'a', 'e', 'E', 'u', 'i']


In [25]:
texto="""
Juan y María fueron a París. Compraron Pan en la Panadería.
"""
regex = r"\b([A-Z][a-z]+)"
resultado = re.findall(regex, texto)
print(resultado) 

['Juan', 'Mar', 'Par', 'Compraron', 'Pan', 'Panader']


In [31]:
texto="""
123-456-7890 ✓
1234567890 ✗
123-45-6789 ✗
abc-def-ghij ✗
"""
regex = r"\d{3}-\d{3}-\d{4}"
resultado = re.findall(regex, texto)
print(resultado) 

['123-456-7890']


In [38]:
texto="""
Contacta con juan@example.com o maria_lopez@correo.es para más información.
También puedes escribir a soporte123@empresa.com.mx
"""
regex = r"[A-Za-z0-9_.]+@[a-z]+\.[a-z\.]+"
regex = r"[\w.-]+@[\w.-]+\.[\w.-]+"
resultado = re.findall(regex, texto)
print(resultado) 

['juan@example.com', 'maria_lopez@correo.es', 'soporte123@empresa.com.mx']


In [39]:
texto="""
La reunión es el 15/03/2024. Nació el 01/12/1990.
El evento fue el 32/13/2023 (inválido, pero debe coincidir con el patrón).
"""
regex = r"\d{2}/\d{2}/\d{4}"
resultado = re.findall(regex, texto)
print(resultado) 

['15/03/2024', '01/12/1990', '32/13/2023']


In [43]:
texto="""
El desarrollo de software requiere práctica constante y dedicación.
"""
regex = r"\b\w{10,}\b"
resultado = re.findall(regex, texto)
print(resultado) 

['desarrollo', 'dedicación']


In [45]:
texto="""
Los precios son: 19.99, 5.50, 100.00 y 0.99 euros.
También hay enteros como 42 y 7.
"""
regex = r"\b(\d+\.\d+|\d+)\b"
resultado = re.findall(regex, texto)
print(resultado) 

['19.99', '5.50', '100.00', '0.99', '42', '7']


In [48]:
texto="""
<p>Este es un párrafo</p>
<div>Contenido del div</div>
<span>Texto en span</span>
"""
regex = r"(<\w+>|</\w+>)"
regex = r"<\w+>.*?</\w+>"
resultado = re.findall(regex, texto)
print(resultado) 

['<p>Este es un párrafo</p>', '<div>Contenido del div</div>', '<span>Texto en span</span>']


In [None]:
texto="""
asaSsword123!
"""
regex = r"(?=.*[A-Z])(?=.*[a-z])(?=.*\d)(?=.*[@#$%^&+=!]).{8,}"
resultado = re.findall(regex, texto)
print(resultado) 

['asaSsword123!']


In [135]:
texto="""https://www.example.com/path/to/page?id=123&name=test"""
regex = r"^[a-z]+://[\w.-]+[:\d]*/[\w./?=&-]+"
resultado = re.findall(regex, texto)
print(resultado) 

['https://www.example.com/path/to/page?id=123&name=test']


In [154]:
texto="""¡Hola @usuario1! Mira este #tutorial sobre #regex. 
Compártelo con @amigo_2 y @maria-lopez
"""
regex = r"[#@][\w_.\-!]+"
resultado = re.findall(regex, texto)
print(resultado) 

['@usuario1!', '#tutorial', '#regex.', '@amigo_2', '@maria-lopez']


In [None]:
texto="""¡Hola @usuario1! Mira este #tutorial sobre #regex. 
Compártelo con @amigo_2 y @maria-lopez
"""
regex = r"[#@][\w_.\-!]+"
resultado = re.findall(regex, texto)
print(resultado) 