
# Ejemplos de expresiones regulares en Python

## 3. Validar direcciones de correo electr√≥nico:


### Explicaci√≥n:

- Se define un patr√≥n complejo que valida la estructura de un correo electr√≥nico:
    - `[a-z0-9]+`: Una o m√°s letras min√∫sculas o n√∫meros.
    - `[\._]?`: Un opcional punto o gui√≥n bajo.
    - `[a-z0-9]`+: Una o m√°s letras min√∫sculas o n√∫meros.
    - `[@]`: Car√°cter literal "@".
    - `\w+`: Uno o m√°s caracteres alfanum√©ricos o guiones bajos.
    - `\.`: Car√°cter literal ".".
    - `\w{2,3}`: Dos o tres caracteres alfanum√©ricos (c√≥digo de pa√≠s) com, net , cr , us.
- La funci√≥n `re.match()` verifica si el patr√≥n coincide al inicio de la cadena.
- Si el patr√≥n coincide, se imprime un mensaje indicando que el correo es v√°lido.
- Si el patr√≥n no coincide, se imprime un mensaje indicando que el correo no es v√°lido.

In [2]:
import re

#correo = "andres.mena@una.cr"
correo = 'salazarkarla@hotmail.go.com'

# Patr√≥n para validar email
patron = r'[a-z0-9]+[._]?[a-z0-9]+[@]\w+\.\w{2,3}'  #el signo ? es para solo un caracter
# patron = r'^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,3}$' # Generado por IA %+- (significa que se puede repetir)
patron = r'[a-z0-9]+[._]?[a-z0-9]+[@]\w+(\.\w+)+' # propuesta del IA, elimina el + luego del primer ? y propone la repetici√≥n de la √∫ltima parte para tener varios niveles de dominio

if re.match(patron, correo):
    print("Correo electr√≥nico v√°lido:", correo)
else:
    print("Correo electr√≥nico no v√°lido:", correo)
    
    
    
"""
Expresi√≥n completa:

r'[a-z0-9]+[._]?+[a-z0-9]+[@]\w+\.\w{2,3}'

Esta expresi√≥n parece estar dise√±ada para validar direcciones de correo electr√≥nico. Veamos cada parte en detalle:
1. [a-z0-9]+

    [a-z0-9] ‚Üí Coincide con cualquier letra min√∫scula (a-z) o n√∫mero (0-9).
    + ‚Üí Debe haber al menos un car√°cter de este tipo, y puede haber m√°s.

‚úÖ Coincide con: john123, user, abc99

‚ùå No coincide con: _user, .admin
2. [._]?+

    [._] ‚Üí Permite un punto (.) o un guion bajo (_).
    ? ‚Üí Opcional, puede aparecer cero o una vez.
    + ‚Üí Error en la expresi√≥n. No deber√≠a estar aqu√≠, ya que ?+ no tiene sentido en este contexto.
        Probablemente el + despu√©s del ? es un error tipogr√°fico. Deber√≠a ser solo ?.

üìå Correcci√≥n sugerida:

r'[a-z0-9]+[._]?[a-z0-9]+[@]\w+\.\w{2,3}'

‚úÖ Coincide con: user.name, john_doe, test99
‚ùå No coincide con: user..name, _user, .admin
3. [a-z0-9]+ (de nuevo)

    Otra secuencia de letras min√∫sculas o n√∫meros.
    Esto asegura que, si hay un . o _, no sea al final ni el √∫nico car√°cter.

‚úÖ Coincide con: john123, user1, test9

‚ùå No coincide con: user., john_, test.
4. [@]

    Coincide exactamente con @.

‚úÖ Coincide con: @gmail.com, @yahoo.com

‚ùå No coincide con: usergmail.com (falta @)
5. \w+

    \w ‚Üí Coincide con cualquier letra (a-zA-Z), n√∫mero (0-9) o guion bajo (_).
    + ‚Üí Debe haber al menos una letra, n√∫mero o _.

‚úÖ Coincide con: gmail, yahoo, outlook

‚ùå No coincide con: @.com, @123.abc
6. \.

    Coincide con un punto (.) antes del dominio.

‚úÖ Coincide con: gmail.com, yahoo.co

‚ùå No coincide con: gmailcom, yahoo,com
7. \w{2,3}

    \w ‚Üí Cualquier letra, n√∫mero o _.
    {2,3} ‚Üí Debe haber entre 2 y 3 caracteres.

‚úÖ Coincide con: .com, .net, .org, .co

‚ùå No coincide con: .technology (m√°s de 3 letras), .x (solo una letra)
Correcci√≥n de la expresi√≥n

Si eliminamos el error de ?+, la expresi√≥n corregida ser√≠a:

r'[a-z0-9]+[._]?[a-z0-9]+[@]\w+\.\w{2,3}'

Ejemplos que coinciden

‚úÖ john.doe@gmail.com
‚úÖ user_123@yahoo.co
‚úÖ test99@outlook.net
Ejemplos que NO coinciden

‚ùå .user@gmail.com (No puede empezar con .)
‚ùå user..name@gmail.com (No puede haber dos puntos consecutivos)
‚ùå user@.com (Falta el dominio)
‚ùå user@gmail.technology (Extensi√≥n demasiado larga)

"""
    


Correo electr√≥nico v√°lido: salazarkarla@hotmail.go.com


  """


"\nExpresi√≥n completa:\n\nr'[a-z0-9]+[._]?+[a-z0-9]+[@]\\w+\\.\\w{2,3}'\n\nEsta expresi√≥n parece estar dise√±ada para validar direcciones de correo electr√≥nico. Veamos cada parte en detalle:\n1. [a-z0-9]+\n\n    [a-z0-9] ‚Üí Coincide con cualquier letra min√∫scula (a-z) o n√∫mero (0-9).\n    + ‚Üí Debe haber al menos un car√°cter de este tipo, y puede haber m√°s.\n\n‚úÖ Coincide con: john123, user, abc99\n\n‚ùå No coincide con: _user, .admin\n2. [._]?+\n\n    [._] ‚Üí Permite un punto (.) o un guion bajo (_).\n    ? ‚Üí Opcional, puede aparecer cero o una vez.\n    + ‚Üí Error en la expresi√≥n. No deber√≠a estar aqu√≠, ya que ?+ no tiene sentido en este contexto.\n        Probablemente el + despu√©s del ? es un error tipogr√°fico. Deber√≠a ser solo ?.\n\nüìå Correcci√≥n sugerida:\n\nr'[a-z0-9]+[._]?[a-z0-9]+[@]\\w+\\.\\w{2,3}'\n\n‚úÖ Coincide con: user.name, john_doe, test99\n‚ùå No coincide con: user..name, _user, .admin\n3. [a-z0-9]+ (de nuevo)\n\n    Otra secuencia de letras min

### Ejemplo 3.2
Se solicita al usuario su nombre y correo electr√≥nico, y luego se valida si el correo electr√≥nico proporcionado es v√°lido utilizando una funci√≥n que utiliza expresiones regulares:

In [3]:
import re

#Crear Funci√≥n Para validar Correo
def validar_correo(correo):
    # patron para validar el email
    patron = r'^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,3}$'
    
    if re.match(patron,correo):
        return True
    else:
        return False
    


nombre = input("Por favor, ingresa tu nombre: ")
correo = input("Por favor, ingresa tu correo electr√≥nico: ")

if validar_correo(correo):
    print("Hola {}, tu correo electr√≥nico {} es v√°lido.".format(nombre, correo))
else:
    print("Lo siento {}, el correo electr√≥nico {} no es v√°lido.".format(nombre, correo))



Hola ksalazar@fomuvel.com, tu correo electr√≥nico ksalazar@fomuvel.com es v√°lido.


##  Reto 

El patr√≥n de expresi√≥n regular utilizado para validar correos electr√≥nicos tiene una limitaci√≥n que causa que el correo `andres.mena.abarca@una.ed.cr` sea considerado inv√°lido. Para corregir esta limitante y permitir correos electr√≥nicos con extensiones de dominio de m√°s de tres caracteres, necesitamos mejorar la expresi√≥n regular utilizada para la validaci√≥n.

> PISTA :  El asterisco `(*)` en expresiones regulares se utiliza para indicar que el elemento al que se aplica puede aparecer cero o m√°s veces. Es un cuantificador que modifica el elemento o grupo al que sigue, permitiendo que ese elemento se repita cualquier n√∫mero de veces, incluso cero veces.

 Por ejemplo, si tenemos el patr√≥n `a*`, esto coincidir√° con:

- Cadena vac√≠a: `""`.
- Una sola `"a": "a"`.
- Varias `"a"` consecutivas: `"aa"`, `"aaa"`, etc.
- En resumen, el asterisco `(*)` significa **"cero o m√°s repeticiones"** del elemento al que se aplica.

In [6]:
import re

correo = "andres.mena.abarca@una.ed.cr"

# Patr√≥n para validar email a mejorar
# patron = r"[a-z0-9]+[\._]?[a-z0-9]+[@]\w+[.]\w{2,3}"

patron = r'[a-z0-9]+([._][a-z0-9]+)*[@]\w+(\.\w+)+' # mejorado por IA

if re.match(patron, correo):
    print("Correo electr√≥nico v√°lido:", correo)
else:
    print("Correo electr√≥nico no v√°lido:", correo)
    
# Salida esperada -> Correo electr√≥nico v√°lido: andres.mena.abarca@una.ed.cr    

Correo electr√≥nico v√°lido: andres.mena.abarca@una.ed.cr
