# Extrae los dominios de los correos con una expresión regular

In [7]:
import re

emails = '''
hegoi.garitaonandia@thebridgeschool.es
hegoi.garitaonandia@thebridgeschool.tech
'''

In [8]:
domain = re.findall(r'@([\w.-]+)', emails)
domain

['thebridgeschool.es', 'thebridgeschool.tech']

Puedes ayudarte con los siguientes enlaces [RegEx101](https://regex101.com/) y [RegEx Python guide](https://docs.python.org/3/howto/regex.html)

Es decir.. 
* @thebridgeschool.es
* @thebridgeschool.tech


In [9]:

emails = [
    "hegoi.garitaonandia@thebridgeschool.es",
    "hegoi.garitaonandia@thebridgeschool.tech"
]

pattern = r'@([^@]+)$'

for email in emails:
    match = re.search(pattern, email)
    if match:
        domain = match.group(1)
        print(f"Dominio: {domain}")

Dominio: thebridgeschool.es
Dominio: thebridgeschool.tech


In [10]:
'''
Claro, voy a explicar el patrón de expresión regular r'@([^@]+)$':

1. r' : Esto indica que es una cadena raw en Python, lo que significa que las barras invertidas se tratan literalmente.

2. @ : Busca el símbolo @ literalmente.

3. ( : Comienza un grupo de captura.

4. [^@]+ : Esta parte es crucial:
   - [^@] es una clase de caracteres negada que coincide con cualquier carácter que NO sea @.
   - El + después significa "uno o más de estos caracteres".

5. ) : Cierra el grupo de captura.

6. $ : Indica el final de la cadena.

En conjunto, este patrón hace lo siguiente:

- Busca el último @ en la cadena.
- Captura todo lo que viene después de ese @ hasta el final de la cadena.
- Asegura que no haya otro @ después del que encontró.

Por lo tanto, en una dirección de correo electrónico como "usuario@dominio.com", este patrón capturará "dominio.com".

Es particularmente útil porque:
- Funciona con subdominios (ej. "usuario@sub.dominio.com").
- No se confunde con direcciones que puedan tener @ en la parte del usuario (ej. "usuario+etiqueta@dominio.com").
- Captura el dominio completo, incluyendo el TLD (.com, .org, etc.).

Este patrón es eficaz para extraer el dominio de una dirección de correo electrónico, independientemente de la complejidad de la parte del usuario o del dominio.

Citations:
[1] https://en.wikipedia.org/?title=Regular_expression
[2] https://www3.ntu.edu.sg/home/ehchua/programming/howto/Regexe.html
[3] https://www.thisdot.co/blog/understanding-regex
[4] https://developer.mozilla.org/en-US/docs/Web/JavaScript/Guide/Regular_expressions.
[5] https://coderpad.io/blog/development/the-complete-guide-to-regular-expressions-regex/
[6] https://www.mobzystems.com/online/explain-regular-expression/
[7] https://www.javatpoint.com/regex
[8] https://regexr.com
'''

'\nClaro, voy a explicar el patrón de expresión regular r\'@([^@]+)$\':\n\n1. r\' : Esto indica que es una cadena raw en Python, lo que significa que las barras invertidas se tratan literalmente.\n\n2. @ : Busca el símbolo @ literalmente.\n\n3. ( : Comienza un grupo de captura.\n\n4. [^@]+ : Esta parte es crucial:\n   - [^@] es una clase de caracteres negada que coincide con cualquier carácter que NO sea @.\n   - El + después significa "uno o más de estos caracteres".\n\n5. ) : Cierra el grupo de captura.\n\n6. $ : Indica el final de la cadena.\n\nEn conjunto, este patrón hace lo siguiente:\n\n- Busca el último @ en la cadena.\n- Captura todo lo que viene después de ese @ hasta el final de la cadena.\n- Asegura que no haya otro @ después del que encontró.\n\nPor lo tanto, en una dirección de correo electrónico como "usuario@dominio.com", este patrón capturará "dominio.com".\n\nEs particularmente útil porque:\n- Funciona con subdominios (ej. "usuario@sub.dominio.com").\n- No se confunde