### REGEX

Realizar con regex los siguientes expresiones regulares --> 

- Número Telefónico
- RFC
- Horario y Fecha
- URL
- CURP
- Boleta
- Direcciones IP



1. **Símbolos básicos:**
   - `.`: Coincide con cualquier carácter excepto una nueva línea.
   - `^`: Coincide con el inicio de una línea.
   - `$`: Coincide con el final de una línea.
   - `*`: Coincide con 0 o más repeticiones del carácter anterior.
   - `+`: Coincide con 1 o más repeticiones del carácter anterior.
   - `?`: Coincide con 0 o 1 repetición del carácter anterior.

2. **Clases de caracteres:**
   - `[abc]`: Coincide con 'a', 'b' o 'c'.
   - `[^abc]`: Coincide con cualquier carácter que no sea 'a', 'b' o 'c'.
   - `[a-z]`: Coincide con cualquier letra minúscula.
   - `[A-Z]`: Coincide con cualquier letra mayúscula.
   - `[0-9]`: Coincide con cualquier dígito.

3. **Secuencias especiales:**
   - `\d`: Coincide con cualquier dígito (equivalente a `[0-9]`).
   - `\D`: Coincide con cualquier carácter que no sea un dígito.
   - `\s`: Coincide con cualquier espacio en blanco (espacio, tabulación, nueva línea, etc.).
   - `\S`: Coincide con cualquier carácter que no sea un espacio en blanco.
   - `\w`: Coincide con cualquier carácter alfanumérico (letras y dígitos).
   - `\W`: Coincide con cualquier carácter que no sea alfanumérico.

4. **Repeticiones:**
   - `{n}`: Coincide exactamente con n repeticiones del carácter anterior.
   - `{n,}`: Coincide con al menos n repeticiones del carácter anterior.
   - `{n,m}`: Coincide con entre n y m repeticiones del carácter anterior.

5. **Operadores lógicos:**
   - `|`: Operador OR. Por ejemplo, `(a|b)` coincidirá con 'a' o 'b'.
   - `()`: Agrupa expresiones regulares. Por ejemplo, `(ab)+` coincidirá con 'ab', 'abab', etc.

6. **Funciones principales de re:**
   - `re.match(pattern, string)`: Busca un patrón al principio de una cadena.
   - `re.search(pattern, string)`: Busca un patrón en toda la cadena.
   - `re.findall(pattern, string)`: Encuentra todas las coincidencias del patrón en la cadena.
   - `re.finditer(pattern, string)`: Encuentra todas las coincidencias del patrón y devuelve un iterador.
   - `re.sub(pattern, repl, string)`: Reemplaza todas las coincidencias del patrón con una cadena de reemplazo.

__CURP__

La Clave Única de Registro de Población, mejor conocida como CURP, es un instrumento que sirve para registrar en forma individual a todos los habitantes de México, nacionales y extranjeros, así como a las mexicanas y mexicanos que radican en otros países.

La CURP contiene 18 elementos de un código alfanumérico; 16 de ellos son la primer letra y primer vocal interna del primer apellido, primer letra del segundo apellido, primer letra del primer nombre, año, mes y día de la fecha de nacimiento; género, las dos letras del lugar de nacimiento de acuerdo al código de la Entidad Federativa.

Después, las primeras consonantes internas de cada uno de los apellidos y nombre  y por último, los dos últimos dígitos que son asignados por el Registro Nacional de la Población.

In [22]:
import re

pattern = r'^[A-Z]{4}[0-9]{6}[H,M][A-Z]{2}[A-Z]{3}[0-9]{2}$'

curp = "HURM991219HDFRMC00"

if re.match(pattern, curp):
    print(f"El CURP {pattern} es  válido.")
else:
    print(f"El CURP {pattern} no es válido.")

El CURP ^[A-Z]{4}[0-9]{6}[H,M][A-Z]{2}[A-Z]{3}[0-9]{2}$ es  válido.


__Número de telefono__

El prefijo internacional de México que debes marcar en las llamadas desde el extranjero es el +52. En el caso de que llames a un teléfono móvil deberás añadir un 1 después del +52.

Los números de teléfono mexicanos tienen diez dígitos (dos de prefijo más ocho de número o tres de prefijo más siete de número). Para conocer los prefijos de cada ciudad puedes consultar la web Country Code. Los únicos que tienen dos dígitos son Ciudad de México, Monterrey y Guadalajara, el resto son de tres.

In [23]:

pattern = r'\+52\d{10}$'

num = "+525548701797"  # Móvil

if re.match(pattern, num):
    print (f"{num} es un número de teléfono válido en México.")
else:
    print (f"{num} no es un número de teléfono válido en México.")



+525548701797 es un número de teléfono válido en México.


__RFC__

__¿Cómo se construye?__

 __RFC de personas físicas__
* Primera y segunda letra del apellido paterno
* Primera letra del segundo apellido
* Inicial del primer nombre del contribuyente
* Fecha de nacimiento en el siguiente orden: año, mes, día.
* Homoclave asignada por el SAT
 

 __RFC de personas morales__
* Primeras letras de las palabras que componen el nombre de la empresa. Por ejemplo, si el nombre de la empresa está formado así: Grupo Industrial Mexicano, S. de R.L. se toman en cuenta las letras “GIM”, mientras que las abreviaturas del tipo de sociedad se omiten.
* Fecha de constitución de la empresa en el siguiente orden: año, mes, día.
* Homoclave asignada por el SAT

In [24]:


pattern_persona_fisica = r'^[A-Z]{4}[0-9]{6}[A-Z0-9]{3}$'

rfc_persona_fisica = "HURM991219C00"

if re.match(pattern_persona_fisica, rfc_persona_fisica):
    print(f"El RFC {rfc_persona_fisica} es válido para una persona física.")
else:
    print(f"El RFC {rfc_persona_fisica} no es válido para una persona física.")


El RFC HURM991219C00 es válido para una persona física.


In [25]:


pattern_persona_moral = r'^[A-Z]{3}[0-9]{6}[A-Z0-9]{3}$'

rfc_persona_moral = "ISB840628IB2"

if re.match(pattern_persona_moral, rfc_persona_moral):
    print(f"El RFC {rfc_persona_moral} es válido para una persona moral.")
else:
    print(f"El RFC {rfc_persona_moral} no es válido para una persona moral.")


El RFC ISB840628IB2 es válido para una persona moral.


__URL__

In [26]:


pattern_url = r'^(https?|http)://[^\s/$.?#].[^\s]*$'

url = "https://www.ipn.com.mx/666?search=python&name=juan&age=20&email=juan@ipn"

if re.match(pattern_url, url):
    print(f"La URL {url} es válida.")
else:
    print(f"La URL {url} no es válida.")


La URL https://www.ipn.com.mx/666?search=python&name=juan&age=20&email=juan@ipn es válida.


__Boleta del IPN__

Una boleta del ipn se conforma mediante estos datos ->

2016090319

2016 -> Año de ingreso
09 -> Unidad academica
03 -> Carrera
19 -> Numeros aletorios


In [27]:


pattern_boleta_ipn = r'^\d{4}(0[1-9]|1[0-2])(0[1-9]|1[0-9]|2[0-4])\d{2}$'

boleta = "2016090319"

if re.match(pattern_boleta_ipn, boleta):
    print(f"La boleta {boleta} es válida.")
else:
    print(f"La boleta {boleta} no es válida.")


La boleta 2016090319 es válida.


__Fecha y Hora__

Decidi utilizar el siguiente formato de fecha dd/MM/yyyy HH:mm:ss 

In [28]:

pattern_fecha_hora = r'^(0[1-9]|[12]\d|3[01])/(0[1-9]|1[0-2])/\d{4} (?:[01]\d|2[0-3]):[0-5]\d:[0-5]\d$'

fecha_hora = "15/09/2023 14:30:45"

if re.match(pattern_fecha_hora, fecha_hora):
    print(f"La fecha y hora {fecha_hora} es válida.")
else:
    print(f"La fecha y hora {fecha_hora} no es válida.")


La fecha y hora 15/09/2023 14:30:45 es válida.


__Direcciones I.P__



ipv4

In [29]:
pattern_ipv4 = r'^(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)$'

ip = "192.168.1.1"

if re.match(pattern_ipv4, ip):
    print(f"La dirección IP {ip} es válida.")
else:
    print(f"La dirección IP {ip} no es válida.")


La dirección IP 192.168.1.1 es válida.


ipv6

In [30]:
import re

pattern_ipv6 = r'^([0-9a-fA-F]{1,4}:){7}[0-9a-fA-F]{1,4}$'

ip = "2001:0db8:85a3:0000:0000:8a2e:0370:7334"

if re.match(pattern_ipv6, ip):
    print(f"La dirección IPv6 {ip} es válida.")
else:
    print(f"La dirección IPv6 {ip} no es válida.")


La dirección IPv6 2001:0db8:85a3:0000:0000:8a2e:0370:7334 es válida.
