# RegEx  
Nava del Río José Antonio  
Ojeda Contreras Braulio Melquisedec  
Suárez Pérez Juan Pablo

In [1]:
import re
import numpy as np

## 1) Email

**Regex: ^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z\.]{2,}$**

**Nombre del usuario:** [a-zA-Z0-9._-]+:

Permite letras mayúsculas y minúsculas, números y algunos caracteres especiales como el punto ".", guión bajo "_" y guión normal "-". El + al final del conjunto nos dice que este conjunto de caracteres se puede repetir 1 o más veces

**Arroba:** "@"

Indica que tiene que después del nombre del usuario forzosamente deberá existir un @.

**Nombre de dominio:** [a-zA-Z0-9.-]+

Similarmente al nombre del usuario, permitimos mayúsculas y minúsculas, números, pero de caracteres especiales solo el punto "." y el guión normal "-". Con esto garantizamos múltiples combinaciones de dominios.

**Punto después del dominio**: "."

Al igual que el arroba, el punto implica una aparición forzosa después del dominio.

**Dominio de nivel superior**: [a-zA-Z\.]{2,}

Indica que cuando menos el dominio de nivel superior (TLD) deberá tener dos letras, lo cual posibilita más TLDs aparte del .com, como bien pueden ser el .net, .io, .org, etc."

**NOTA**: La razón de permitir mayúsculas es que la sintaxis de la dirección de correo electrónico no distingue entre mayúsculas y minúsculas.

In [2]:
def validate_email(email):
    regex = r'^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z\.]{2,}$'
    if re.search(regex, email):
        print("Tu correo es válido")
    else:
        print("Tu correo NO es válido")

In [3]:
print("Inserte un correo electrónico:")
email = input()
print("Su correo es: " + email)
validate_email(email)

Inserte un correo electrónico:
ejemplito@gmail.com
Su correo es: ejemplito@gmail.com
Tu correo es válido


## 2) Fecha y hora (dd/mm/yyyy HH:MM)

**Regex: ^(?:3[01]|[12][0-9]|0?[1-9])([/])(0?[1-9]|1[0-2])([/])\d{4}\s([01]?[0-9]|2[0-3]):[0-5][0-9]$**

**Caracteres especiales:** /, :, \s

La diagonal nos sirve para delimitar la fecha, los dos puntos para delimitar la hora y \s representa el espacio entre fecha y hora.

**Día del mes:** 3[01]|[12][0-9]|0?[1-9])

Permite tres posibles opciones: la primera acepta los números 30 y 31, la segunda los números del 10 al 29 y la última un dígito del 1 al 9. Esta última con el detalle que puede o no aparecer un cero antes de alguno de estos dígitos.

**Número de mes:** 0?[1-9]|1[0-2]

Permite dos posibles opciones: aceptar un dígito del 1 al 9, con la posibilidad de que aparezca antes un cero o no, mientras que la otra opción involucra números del 10 al 12.

**Año:** \d{4}

La letra \d involucra el conjunto de dígitos del 1 al 9, y los corchetes nos indican que deben aparecer exactamente 4 de estos dígitos.

**Horas:** [01]?[0-9]|2[0-3]

Permite dos posibles opciones: aceptar números del 0 al 19 con la posibilidad de escribir las horas como '09' o equivalentemente como '9', y por otro lado acepta números del 20 al 23.

**Minutos:** [0-5][0-9]

Permite insertar números del 0 al 59, donde similarmente como en el caso de las horas se puede escribir '05' o '5' de forma equivalente.

In [4]:
def validate_datetime(datetime):
    regex = r'^(?:3[01]|[12][0-9]|0?[1-9])([/])(0?[1-9]|1[0-2])([/])\d{4}\s([01]?[0-9]|2[0-3]):[0-5][0-9]$'
    if re.search(regex, datetime):
        print("Tu fecha y hora es válida")
    else:
        print("Tu fecha y hora NO es válida")

In [5]:
datetime = input()
print("Su datetime es: " + datetime)
validate_datetime(datetime)

15/01/2007 21:00
Su datetime es: 15/01/2007 21:00
Tu fecha y hora es válida


## 3) URL

**Regex: ^(https?|ftp):\/\/(?:www\.)?[a-zA-Z0-9\.][a-zA-Z0-9-\.]{0,61}[a-zA-Z0-9\.]\.[a-zA-Z0-9\.\:]{2,}\b(?:[-a-zA-Z0-9()@:%_\+.~#?&\/=]*)$**

**Protocolo de transferencia de hipertexto:** (https?|ftp):\/\/
Indica que la URL tiene que empezar con https://, http:// y ftp://

**World Wide Web:** (?:www\.)?

Posibilita que luego aparezca o no el 'www.', esto ya que no siempre las URLs muestran explícitamente este fragmento.

**Dominio:** [a-zA-Z0-9\.][a-zA-Z0-9-\.]{0,61}[a-zA-Z0-9\.]

Acepta mínimo 2 y máximo 63 caracteress alfanuméricos además de guiones medios. Aunque cabe mencionar que los guiones medios no pueden aparecer ni al inicio ni al final del dominio.

**Dominio de nivel superior**: [a-zA-Z0-9\.\:]{2,}

Indica que cuando menos el dominio de nivel superior (TLD) deberá tener dos letras, lo cual posibilita más TLDs aparte del .com, como bien pueden ser el .net, .io, .org, etc."

**Fin de palabra:** \b

Representa el límite de palabra al final de la URL, lo cual asegura que una URL no continúe más allá del TLD.

**Caracteres adicionales:** (?:[-a-zA-Z0-9()@:%_\+.~#?&\/=]*)

Implica todos los caracteres después del TLD.


In [6]:
def validate_url(url):
    regex = r'^(https?|ftp):\/\/(?:www\.)?[a-zA-Z0-9\.][a-zA-Z0-9-\.]{0,61}[a-zA-Z0-9\.]\.[a-zA-Z0-9\.\:]{2,}\b(?:[-a-zA-Z0-9()@:%_\+.~#?&\/=]*)$'
    if re.search(regex, url):
        print("Tu URL es válida")
    else:
        print("Tu URL NO es válida")

In [7]:
print("Inserta una URL:")
url = input()
print("Su URL es: " + url)
validate_url(url)

Inserta una URL:
https://www.ejemplito.com
Su URL es: https://www.ejemplito.com
Tu URL es válida


## 4) CURP

**Regex: ^([A-Z]{4})(\d{2})(0[1-9]|1[0-2])(?:3[01]|[12][0-9]|0?[1-9])([A-Z]{6})([A-Z0-9]{2})$**

**Primeros cuatro dígitos alfabéticos:** [A-Z]{4}

Acepta los primeros dígitos que son generados a partir de tu nombre y apellidos.

**Dígitos abreviados de año de nacimiento:** \d{2}

Acepta los dos dígitos que corresponden al año de tu nacimiento, por ejemplo: 2002 implica 02

**Dígitos de mes de nacimiento:** 0[1-9]|1[0-2]

Acepta dos opciones: la primera implica los dígitos del 1 al 9 antecedidos por un cero, mientras que la otra opción implica los valores de 10, 11 y 12.

**Dígitos de mes de nacimiento:** 3[01]|[12][0-9]|0[1-9]

Acepta tres opciones: Permite tres posibles opciones: la primera acepta los números 30 y 31, la segunda los números del 10 al 29 y la última un dígito del 1 al 9. Esta última con el detalle que puede o no aparecer un cero antes de alguno de estos dígitos.

**6 dígitos alfabéticos**: ([A-Z]{6})

En estos 6 dígitos se comprende 1 para el género, otros dos para la clave de entidad de nacimiento, luego la segunda consonante del primer apellido, la segunda consonante del segundo apellido e igualmente la segunda consonante del primer nombre.

**Homoclave**: [A-Z0-9]{2}

Comprende dos dígitos alfanuméricos.

In [8]:
def validate_curp(curp):
    regex = r'^([A-Z]{4})(\d{2})(0[1-9]|1[0-2])(?:3[01]|[12][0-9]|0[1-9])([A-Z]{6})([A-Z0-9]{2})$'
    if re.search(regex, curp):
        print("Tu CURP es válido")
    else:
        print("Tu CURP NO es válido")

In [9]:
print("Inserta tu CURP:")
curp = input()
print("Su CURP es: " + curp)
validate_curp(curp)

Inserta tu CURP:
SUPJ010217HDFRRNA5
Su CURP es: SUPJ010217HDFRRNA5
Tu CURP es válido


## 5) RFC

**Regex: ^([A-Z]{4})(\d{2})(0[1-9]|1[0-2])(?:3[01]|[12][0-9]|0?[1-9])([A-Z0-9]{3})$**

**Primeros cuatro dígitos alfabéticos:** [A-Z]{4}

Acepta los primeros dígitos que son generados a partir de tu nombre y apellidos.

**Dígitos abreviados de año de nacimiento:** \d{2}

Acepta los dos dígitos que corresponden al año de tu nacimiento, por ejemplo: 2002 implica 02

**Dígitos de mes de nacimiento:** 0[1-9]|1[0-2]

Acepta dos opciones: la primera implica los dígitos del 1 al 9 antecedidos por un cero, mientras que la otra opción implica los valores de 10, 11 y 12.

**Dígitos de mes de nacimiento:** 3[01]|[12][0-9]|0[1-9]

Acepta tres opciones: Permite tres posibles opciones: la primera acepta los números 30 y 31, la segunda los números del 10 al 29 y la última un dígito del 1 al 9. Esta última con el detalle que puede o no aparecer un cero antes de alguno de estos dígitos.

**Homoclave**: [A-Z0-9]{3}

Comprende tres dígitos alfanuméricos.

In [10]:
def validate_rfc(rfc):
    regex = r'^([A-Z]{4})(\d{2})(0[1-9]|1[0-2])(?:3[01]|[12][0-9]|0[1-9])([A-Z0-9]{3})$'
    if re.search(regex, rfc):
        print("Tu RFC es válido")
    else:
        print("Tu RFC NO es válido")

In [20]:
print("Inserta tu RFC:")
rfc = input()
print("Su RFC es: " + rfc)
validate_rfc(rfc)

Inserta tu RFC:
GOMA930320ABC
Su RFC es: GOMA930320ABC
Tu RFC es válido


## 6) Boleta

**Regex: ^(\d{10})$**

**Dígitos numéricos:** \d{10}

Acepta 10 dígitos numéricos

In [12]:
def validate_school_id(school_id):
    regex = r'^(\d{10})$'
    if re.search(regex, school_id):
        print("Tu boleta es válida")
    else:
        print("Tu boleta NO es válida")

In [13]:
print("Inserta tu boleta:")
boleta = input()
print("Su boleta es: " + boleta)
validate_school_id(boleta)

Inserta tu boleta:
2025630203
Su boleta es: 2025630203
Tu boleta es válida


## 7) Número telefónico

**Regex: ^(\d{10})$**

**Dígitos numéricos:** \d{10}

Acepta 10 dígitos numéricos

In [14]:
def validate_telephone(tel):
    regex = '^(\d{10, 11})$'
    if re.search(regex, tel):
        print("Tu teléfono es válido")
    else:
        print("Tu teléfono NO es válido")

In [15]:
print("Inserta tu número de teléfono:")
tel = input()
print("Su teléfono es: " + tel)
validate_telephone(tel)

Inserta tu número de teléfono:
5558575254
Su teléfono es: 5558575254
Tu teléfono NO es válido


## 8) Dirección IP
**Regex:** ^(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)$  

**Patrón de octeto:** (25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?): Este es el patrón para cada octeto en la dirección IPv4. Se divide en tres partes:

1) **Primer fragmento:** 25[0-5]:

Esto coincide con valores de 250 a 255.

2) **Segundo fragmento:** 2[0-4][0-9]:

Esto coincide con valores de 200 a 249.

3) **Tercer fragmento:** [01]?[0-9][0-9]?

Esto coincide con valores de 0 a 199, con la 4. posibilidad de uno o dos dígitos (por ejemplo, 09 o 123).

**Punto entre octetos:** \.

Esto coincide con el punto (.) que separa cada octeto en la dirección IP.

In [16]:
def validate_ip(ip_text):
    regex = r'^(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)$'
    if re.search(regex, ip_text):
        print("Tu ip es válido")
    else:
        print("Tu ip NO es válido")

In [19]:
print("Inserta tu ip:")
ip_text = input()
print("Su ip es: " + ip_text)
validate_ip(ip_text)

Inserta tu ip:
192.168.1.1
Su ip es: 192.168.1.1
Tu ip es válido
